Vous êtes sur la page 1sur 308

Élaboration d’un cours de

« Statistique et Probabilités »

pour la classe de 1D
Par la présente, je déclare avoir réalisé ce travail par mes propres moyens.

Jerry MAGAR

2
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Jerry MAGAR

Élaboration d’un cours de

« Statistique et Probabilités »

pour la classe de 1D

Candidat en sciences économiques et sociales au


Lycée Josy Barthel Mamer
2013

3
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Résumé

En analysant le manuel actuellement au programme pour le cours de


« Statistique et Probabilités » en classe de 1D et en considérant les
nombreuses critiques d’autres enseignants de sciences économiques et
sociales ainsi que les souhaits de la Commission Nationale pour les
Programmes en Sciences Economiques et Sociales – Enseignement
secondaire, la nécessité d’élaborer un nouveau manuel pour ce cours
apparaît évidente.

En effet, la dernière édition du manuel actuellement prévu par les


« Horaires et programmes » date des années 1990. En dehors des lacunes
qu’il présente au niveau pédagogique et au niveau de la structure, les
données des exemples, applications et exercices sont donc obsolètes et ne
reflètent absolument plus le contexte socio-économique actuel, ce qui rend
aussi difficile l’interprétation des résultats dans un contexte interdisciplinaire.
L’élaboration d’une proposition d’un nouveau manuel scolaire de « Statistique
et Probabilités » consistait donc avant tout à restructurer, reformuler,
compléter, actualiser et, le cas échéant, approfondir la matière couverte par le
manuel actuellement au programme.

Avant d’entamer la rédaction du manuel de cours, j’ai rafraîchi et


approfondi mes connaissances concernant la démarche à suivre pour réaliser
la rédaction d’un manuel scolaire ainsi que celles concernant la matière
couverte par le manuel. De plus, j’ai collecté des informations quant au
contenu du futur manuel auprès de la Commission Nationale pour les
Programmes en Sciences économiques et Sociales – Enseignement
secondaire et auprès de la grande majorité des enseignants du cours. Le
présent travail de candidature se compose par conséquent de deux parties
principales : la première partie, qui est d’ordre théorique et pédagogique,
concerne le processus d’élaboration d’un manuel scolaire tandis que la
deuxième partie, pratique, contient la proposition d’un manuel scolaire
conforme au programme et aux besoins du cours de « Statistique et
Probabilités » en classe de 1D du Grand-Duché de Luxembourg. En

4
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

complément, j’ai jugé utile de rajouter une troisième partie comprenant une
proposition de mise en page sur base d’un extrait de chapitre du manuel de
cours proposé.

5
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Remerciements

Je souhaite adresser mes remerciements les plus sincères aux


personnes qui m’ont apporté leur aide et qui ont contribué à l’élaboration de
ce travail de candidature.

Je tiens à remercier spécialement Monsieur Giancarlo De Toffoli, mon


patron de recherche, qui s’est toujours montré à l’écoute et était très
disponible tout au long de la réalisation de ce travail de candidature, de
m’avoir accompagné et dirigé dans l’élaboration de ce travail ainsi que pour
toutes ses critiques constructives.

Mes remerciements s’adressent également à tous les praticiens et


professionnels externes, notamment Madame Tessy Kremer, qui m’a aidé lors
de la conception d’une proposition de mise en page d’un extrait de chapitre
ainsi que Messieurs Jean-Claude Delagardelle et David Marcus, professeurs
de mathématiques, et Monsieur Jean-Marie Fischer, professeur de sciences
économiques et sociales, pour tous les conseils précieux et toutes les
informations obtenues.

J’aimerais également exprimer ma profonde gratitude à tous ceux et


toutes celles qui m’ont soutenu et apporté leur précieuse aide tout au long de
ce travail de candidature, surtout aux collègues ayant eu l’aimable gentillesse
de remplir le questionnaire que je leur ai fait parvenir.

7
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Table des matières

Résumé ...................................................................................................4
Remerciements .......................................................................................7
Table des matières ..................................................................................9
Introduction............................................................................................15
1. L’objectif principal du travail de candidature ................................17
2. La démarche et les méthodes utilisées ........................................18
3. La structure du travail de candidature ..........................................18
I. Partie pédagogique ............................................................................21
Chapitre 1 : Le « manuel scolaire » : définitions, fonctions, types .........23
1. Définitions du terme de « manuel scolaire » ................................23
2. Fonctions du manuel scolaire ......................................................24
2.1. Fonctions du manuel scolaire pour les élèves ......................25
2.2. Fonctions du manuel scolaire pour les enseignants .............27
3. Types de manuels scolaires.........................................................28
3.1. Manuels fermés ....................................................................28
3.2. Manuels ouverts....................................................................29
Chapitre 2 : Les étapes de l’élaboration d’un manuel scolaire ..............31
1. Introduction ..................................................................................31
2. L’élaboration du cours de « Statistique et Probabilités » pour la
classe de 1D ................................................................................34
2.1. L’analyse des besoins...........................................................34
2.2. L’explicitation du projet .........................................................41
2.3. L’explicitation de la conception de l’apprentissage ...............44
2.4. La délimitation du contenu et l’élaboration de sa structure ...46
2.5. La confrontation au programme ............................................46
2.6. Des consultations de praticiens, mais aussi de scientifiques 47
2.7. La constitution d’un dossier ..................................................47
2.8. La rédaction d’un chapitre.....................................................48
2.9. Une confrontation de structure et de ton général ..................48
2.10. Un essai de mise en page ....................................................49
2.11. Une expérimentation du chapitre ..........................................49

9
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.12. Le traitement du contenu brut ...............................................50


2.13. La définition technique du manuel ........................................51
2.14. La rédaction de l’ensemble ...................................................52
2.15. L’élaboration des illustrations................................................52
2.16. Une lecture de contenu et de cohérence générale ...............53
3. Analyse critique............................................................................53
Conclusion.............................................................................................57
Bibliographie..........................................................................................61
Annexes ................................................................................................65
1. Annexe : Structure de l’enseignement luxembourgeois ...............67
2. Annexe : Rapport de la CNP-SCIES-ES du 28 juin 2011.............69
3. Annexe : Modèle du questionnaire d’enquête ..............................71
4. Annexe : Synthèse des réponses ................................................73
5. Annexe : Extraits du manuel actuellement au programme...........77
6. Annexe : Branches enseignées en classe de 3ème, 2ème et 1ère de
la section D de l’enseignement secondaire luxembourgeois........95
7. Annexe : Programme du cours d’« Economie de gestion » en
classe de 1D ................................................................................97
II. Partie pratique .................................................................................101
Introduction..........................................................................................105
1. Le mot « statistique » .................................................................105
2. Les différentes branches de la statistique ..................................105
Partie I .................................................................................................107
Éléments de statistique descriptive .....................................................107
Chapitre 1 : Séries statistiques ............................................................109
1. Notions de base .........................................................................109
1.1. Terminologie .......................................................................109
1.2. La collecte de données .......................................................111
1.3. Les différents types de variables (de données)...................114
1.4. Les opérateurs Σ et Π et leurs propriétés .........................115
2. Présentation de séries statistiques à une variable sous forme de
tableau .......................................................................................118
2.1. Variables qualitatives ..........................................................118

10
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.2. Variable quantitatives..........................................................119


3. Représentation graphique de séries statistiques à une variable 122
3.1. Variables qualitatives et variables quantitatives discrètes ..122
3.2. Variables quantitatives continues........................................124
4. Les valeurs de localisation et de dispersion et les mesures de
concentration .............................................................................136
4.1. Les valeurs de localisation (ou bien : valeurs centrales).....137
4.2. Les valeurs de dispersion ...................................................155
4.3. Les mesures de concentration ............................................170
5. Exercices ...................................................................................177
Chapitre 2 : La régression linéaire.......................................................183
1. Introduction ................................................................................183
2. La covariance.............................................................................185
3. Le coefficient de corrélation linéaire...........................................187
4. La régression linéaire : méthode des moindres carrés ordinaires
...................................................................................................189
5. La régression non linéaire : méthode des moindres carrés
ordinaires ..................................................................................198
6. Application résolue.....................................................................200
7. Exercices ...................................................................................204
Chapitre 3 : Les nombres indices ........................................................207
1. Introduction ................................................................................207
2. Les indices simples ....................................................................207
2.1. Définition.............................................................................207
2.2. Propriétés des indices simples............................................209
3. Les indices synthétiques ............................................................213
3.1. Les indices synthétiques avec pondération ........................213
3.2. Les indices synthétiques avec pondération : l’indice des
valeurs globales et les indices de Fisher ............................219
4. Application résolue.....................................................................221
5. Exercices ...................................................................................224
Partie II ................................................................................................227
Éléments du calcul des probabilités ....................................................227

11
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 4 : Calcul des probabilités .....................................................229


1. Introduction ................................................................................229
2. Événements et opérations sur les événements .........................230
2.1. Événements ........................................................................230
2.2. Opérations sur les événements ..........................................231
3. Mesure de la probabilité.............................................................234
4. Dénombrements.........................................................................235
4.1. Les permutations ................................................................235
4.2. Les arrangements sans répétitions .....................................237
4.3. Les combinaisons ...............................................................239
4.4. Les arrangements avec répétitions .....................................241
4.5. Tableau récapitulatif............................................................243
5. Théorie des probabilités.............................................................243
5.1. Axiomes de la théorie des probabilités ...............................243
5.2. Conséquences des axiomes de la théorie des probabilités 244
5.3. Evénements dépendants et indépendants..........................248
6. Applications résolues .................................................................258
6.1. Tirages successifs sans remise ..........................................258
6.2. Tirages successifs avec remise ..........................................258
6.3. Tirages simultanés..............................................................259
6.4. Événements complémentaires, incompatibles et non
incompatibles ......................................................................259
6.5. Événements dépendants et indépendants..........................260
6.6. Théorème de Bayes............................................................261
7. Exercices ...................................................................................261
7.1. Dénombrements .................................................................261
7.2. Calcul des probabilités........................................................262
Chapitre 5 : Les variables aléatoires discrètes ....................................271
1. Introduction ................................................................................271
2. Caractéristiques d’une variable aléatoire discrète......................271
2.1. Loi de probabilité.................................................................272
2.2. Fonction de répartition ........................................................273
2.3. Valeurs centrales et valeurs de dispersion d’une variable

12
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

aléatoire discrète.................................................................276
3. Application résolue.....................................................................280
4. Exercices ...................................................................................283
Chapitre 6 : Loi binomiale....................................................................287
1. Les expériences aléatoires de Bernoulli.....................................287
2. Répétition d’une expérience de Bernoulli et loi binomiale ..........287
3. Espérance mathématique de la loi binomiale.............................289
4. Variance et écart type de la loi binomiale...................................291
5. Application résolue.....................................................................293
6. Exercices ...................................................................................294
Bibliographie........................................................................................297
III. Proposition de mise en page ..........................................................301

13
Introduction

15
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1. L’objectif principal du travail de candidature

L’objectif de ce travail de candidature est l’élaboration d’une proposition


d’un manuel de cours de « Statistique et Probabilités » pour la classe de 1D1.
Il s’agit avant tout de compléter, de reformuler, d’actualiser et d’approfondir le
cas échéant la matière couverte par le manuel actuellement au programme.

Ce travail d’ordre pédagogique consiste à élaborer un cours flexible


dans son utilisation et facilement adaptable aux besoins changeants dans les
milieux scolaire et universitaire. Les parties théoriques du cours doivent avoir
une validité à long terme. Elles sont complétées par des applications résolues
et des exercices faisant dans la mesure du possible le lien avec l’actualité en
se basant sur des données issues de la réalité socio-économique européenne
et surtout luxembourgeoise. Le but est d’élaborer un cours suffisamment
complet, comprenant toutes les parties que la Commission Nationale pour les
Programmes en Sciences Economiques et Sociales – Enseignement
secondaire (dénommée CNP-SCIES-ES par après) ainsi que la majorité des
enseignants du cours jugent indispensables. Il faut néanmoins veiller à éviter
d’introduire trop de détails qui ne sont pas utiles pour les élèves à ce stade.
De plus, étant donné que le volume hebdomadaire d’heures de cours s’élève
seulement à deux heures, l’introduction de trop de nouvelles parties au cours
sera évitée. Ces parties supplémentaires risquent de ne pas pouvoir être
traitées, faute de temps (et faute de connaissances préalables des élèves en
mathématiques ou en informatique), ce qui aura comme effet possible que le
manuel sera perçu comme un ensemble discontinu et non cohérent
d’éléments indépendants. Le but est donc de fournir aux élèves un manuel
dans lequel les différents éléments sont présentés de manière continue,
structurée en cohérente. Il ne s’agit donc pas d’élaborer un manuel universel,
comprenant tous les détails imaginables et dont la plupart ne pourront de
toute façon pas être traités pendant les heures de cours à disposition.

1
La classe de 1D correspond à la classe terminale de l’enseignement secondaire
luxembourgeois, section « sciences économiques et mathématiques » ; pour une liste des
classes et sections de l’enseignement secondaire au Luxembourg, voir annexe 1 ou
www.men.public.lu.

17
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2. La démarche et les méthodes utilisées

Afin de réaliser le présent travail de candidature, il m’était indispensable


de me documenter sur le sujet en question. Je me suis donc basé sur des
ouvrages, des articles et des sites Internet issus des domaines pédagogique,
économique et de la statistique, afin de recouvrir les différents aspects
auxquels touche l’élaboration d’une proposition d’un manuel de « Statistique
et Probabilités », principalement la conception et la rédaction de manuels
scolaires et la théorie relative aux différentes parties du manuel élaboré. Ceci
rend bien compte d’une difficulté spécifique au métier de l’enseignant, qui
selon Przybyl2, ne se limite pas à la transmission du savoir, mais nécessite
une réflexion sur la manière de combiner le savoir disciplinaire et les
connaissances pédagogiques afin de favoriser l’apprentissage des élèves. La
recherche en relation avec le présent travail de candidature m’a donc permis
d’un côté d’assembler les connaissances et informations nécessaires à la
réalisation de ce travail et, d’un autre côté, d’évoluer personnellement grâce à
une réflexion continue, un approfondissement de mes connaissances dans
tous les domaines affectés par le présent travail et des initiatives personnelles.

Outre les informations obtenues au cours du processus de


documentation décrit ci-dessus, j’ai encore reçu d’autres informations
indispensables à travers divers entretiens avec mes collègues, certains
membres de la CNP-SCIES-ES, des experts du domaine pédagogique et
finalement moyennant une enquête que j’ai menée auprès des enseignants
du cours de « Statistique et Probabilités ».

3. La structure du travail de candidature

Le travail de candidature se compose de trois parties :

La première partie, qui est d’ordre théorique et pédagogique, définit tout


d’abord la notion du « manuel scolaire » en expliquant ses différentes

2
PRZYBYL, Petra, Élaboration d’un concept permettant d’utiliser les résultats d’études et de
recherches scientifiques réalisées au Luxembourg à des fins ludiques et pédagogiques –
Présentation didactique de ces résultats permettant ainsi leur intégration dans le cours de
sciences économiques et sociales, Travail de candidature, 2011

18
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

fonctions et en en présentant différents types. En outre, elle contient une


description du processus d’élaboration du manuel scolaire, en commençant
par l’analyse des besoins et en terminant sur la réalisation de la version finale
de la proposition de manuel.

La deuxième partie comprend la proposition du cours de « Statistique et


Probabilités » pour la classe de 1D. Cette proposition comprend deux
grandes parties, chacune composée de trois chapitres. La première partie
illustre certains « Éléments de statistique descriptive » tandis que la deuxième
explique certains « Éléments du calcul des probabilités ». Chaque chapitre
contient en outre des applications résolues et se termine par des exercices.

La troisième partie contient une brève proposition de mise en page,


basée sur un extrait de chapitre.

19
I. Partie pédagogique

21
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 1 : Le « manuel scolaire » : définitions,


fonctions, types

Comme le présent travail de candidature a comme objectif principal


l’élaboration d’un cours, et plus précisément la proposition d’un manuel
scolaire, il convient de donner d’abord quelques définitions du terme de
« manuel scolaire », d’en expliquer les fonctions les plus importantes, tant
pour les élèves que pour les enseignants, et d’en présenter les principaux
types.

1. Définitions du terme de « manuel scolaire »

Selon le degré de spécialisation ou le type de sources consultées, on


peut distinguer différentes définitions des termes de « manuel » ou de
« manuel scolaire » :

« Ouvrage didactique qui présente sous un format pratique, maniable,


les notions essentielles d’une science, d’une technique, d’un art … et,
spécialement, les connaissances exigées par les programmes scolaires. »3

« Sont considérés comme livres scolaires, (…), les manuels et leur


mode d'emploi, ainsi que les cahiers d’exercices et de travaux pratiques qui
les complètent ou les ensembles de fiches qui s’y substituent, régulièrement
utilisés dans le cadre de l’enseignement (…), et conçus pour répondre à un
programme préalablement défini ou agréé par les ministres concernés. »4

« Un manuel scolaire papier développe le contenu des connaissances à


acquérir dans une discipline d’enseignement pour un niveau donné. Il
propose un cours complété par des documents (photographies, schémas,
cartes, textes, références bibliographiques, …) produits spécifiquement ou

3
Le Grand Robert sur http://gr.bvdep.com/version-1/gr.asp
4
http://www.legifrance.gouv.fr/WAspad/UnTexteDeJorf?numjo=MCCB0400545D

23
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

issus d’une reproduction. Des exercices permettant d’évaluer les acquis. Il


adopte une démarche didactique spécifique. »5

« Outil imprimé, intentionnellement structuré pour s’inscrire dans un


processus d’apprentissage, en vue d’en améliorer l’efficacité. »6

Les définitions ci-dessus permettent de rendre compte de la grande


variété de manuels scolaires et de la complexité de l’élaboration d’un tel
manuel. De plus, elles donnent un aperçu préliminaire des fonctions qu’un tel
manuel doit accomplir.

2. Fonctions du manuel scolaire

Les manuels scolaires sont utilisés principalement par deux acteurs : les
élèves et les enseignants. Le manuel scolaire « en tant que dispositif
d’enseignement-apprentissage, constitue l’espace transitionnel et
transactionnel où se rencontrent … l’élève et l’enseignant. » 7 Selon ces
mêmes auteurs, les fonctions principales du matériel didactique, parmi lequel
il faut aussi compter le manuel scolaire, sont les suivantes :

o « médiation entre le programme et les enseignants,

o soutien à l’enseignement,

o support à l’apprentissage,

o référent pour l’élève et ses « aidants »,

o rehaussement culturel,

o promotion de valeurs sociétales. »8

Sur base de l’énumération précédente, on peut clairement conclure que


les manuels ne remplissent pas les mêmes fonctions pour chacun des deux

5
GOSSIN, Pascale, Le manuel numérique, in BELISLE, Claire, La lecture numérique :
réalités, enjeux et perspectives, Presses de l’ENSSIB, 2004 ;
ou bien : http://www.educnet.education.fr/dossier/manuel/notions/manuel-scolaire
6
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009
7
LEBRUN, Johanne, BEDARD, Johanne, HASNI, Abdelkrim, GRENON, Vincent, Le matériel
didactique et pédagogique : soutien à l’approbation ou déterminant de l’intervention éducative,
Les presses de l’Université de Laval, Saint-Nicolas (Québec), 2006
8
ibidem

24
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

acteurs. Le manuel scolaire doit donc par exemple en même temps soutenir
l’action de l’enseignant et le processus d’apprentissage des élèves. Il convient
donc, dans la partie suivante, d’analyser les fonctions des manuels scolaires
de manière plus détaillée et pour chacun des deux acteurs pris isolément.

2.1. Fonctions du manuel scolaire pour les élèves

Selon Lafortune et Massé, « les élèves structurent leurs connaissances


en interaction avec leurs pairs, leur enseignant ou enseignante, mais aussi en
étant influencé par leurs expériences et les documents qu’ils utilisent. »9 Ceci
illustre bien l’importance du rôle du manuel scolaire dans le processus
d’apprentissage des élèves, surtout étant donné que le manuel agit souvent
comme intermédiaire, réalise le lien entre les élèves et l’enseignant, ou sert
de base de départ commune à un débat ou une activité inter-élèves ou entre
les élèves et l’enseignant.

Ainsi, comme le but du système éducatif ne se limite pas seulement à la


transmission de connaissances scolaires mais consiste aussi en la
préparation de l’élève à la vie quotidienne et professionnelle, il convient de
distinguer, selon Gerard et Roegiers, entre « fonctions relatives à
l’apprentissage » 10 et « fonctions d’interface avec la vie quotidienne et
professionnelle »11.

2.1.1 Fonctions relatives à l’apprentissage

D’après Gerard et Roegiers, les fonctions relatives à l’apprentissage


sont au nombre de 4 :

o fonction de transmission de connaissances : il s’agit de la transmission


de connaissances en vue d’une acquisition « de certaines données, de

9
LAFORTUNE, Louise, MASSÉ Bernard, La conception et la rédaction de manuels scolaires
dans une perspective socioconstructiviste – Un exemple en mathématiques, in LEBRUN,
Monique, Le manuel scolaire – Un outil à multiples facettes, Presses de l’Université du
Québec, 2006
10
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009
11
ibidem

25
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

concepts, de règles, de formules, de faits, d’une terminologie, … » 12


dans le but d’exercer un certain savoir-redire ;

o fonction de développement de capacités et de compétences 13 : cette


deuxième fonction relative à l’apprentissage des élèves a comme but
« de faire acquérir des méthodes et des attitudes, voire des habitudes
de travail et de vie »14 ; on vise donc ici l’intégration de différents savoirs
et savoir-faire dans des situations déterminées ;

o fonction de consolidation des acquis : cette fonction est assurée par


l’exercice des savoirs et savoir-faire acquis à travers des applications,
des exercices, des travaux pratiques, … ;

o fonction d’évaluation de l’acquis : le manuel devrait permettre de réaliser


une évaluation formative.

2.1.2 Fonctions d’interface avec la vie quotidienne et


professionnelle

Gerard et Roegiers distinguent entre :

o fonction d’aide à l’intégration des acquis : cette fonction est


complémentaire à celle de développement de capacités et de
compétences, comme elle vise l’application des savoirs et des savoir-
faire acquis dans des situations différentes ;

o fonction de référence : le manuel peut être utilisé comme un outil de


recherche d’informations précises ;

o fonction d’éducation sociale et culturelle : cette fonction qui, visée de


manière secondaire par la plupart des manuels, « concerne tous les
acquis liés au comportement, aux relations avec l’autre, à la vie en

12
ibidem
13
Remarquons que Gerard et Roegiers définissent une compétence comme « la possibilité,
pour un individu, de mobiliser de manière intériorisée un ensemble intégré de ressources –
notamment des capacités – en vue de résoudre une famille de situations-problèmes » et une
capacité comme « le pouvoir, l’aptitude à faire quelque chose », comme « une activité que
l’on exerce ».
14
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009

26
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

société en général, (…), permettant à l’élève de trouver progressivement


sa place dans son cadre social, familial, culturel, national … »15.

2.2. Fonctions du manuel scolaire pour les enseignants

Vargas constate que, « chez un très grand nombre d’enseignants, le


manuel est perçu comme une valeur sûre, le lieu où sont déposées des
vérités incontestables » 16 . Il soutient son propos en citant d’autres auteurs
dont les recherches ont mené aux conclusions que « le manuel scolaire fait
foi, avec la même infaillibilité que celle qu’on prête aux dictionnaires »17 et
que « pour les enseignants [les manuels] sont des références fiables quant
aux savoirs qui y sont présentés. Ils sont donc un outil précieux pour la
préparation des leçons au plan des contenus enseignés et des pistes
pédagogiques proposées. »18 Vargas considère donc le manuel comme « la
béquille de l’enseignant » 19 , qui peut s’y appuyer soit à cause d’une
insuffisance de « sa maîtrise des savoirs de référence, des savoirs à
enseigner, des démarches didactico-pédagogiques »20, soit « parce que ses
charges d’enseignement sont trop lourdes pour lui permettre de créer son
enseignement, trouver les matériaux dont il aurait besoin, se tenir informé de
l’évolution des savoirs, des innovations, etc. »21

Gerard et Roegiers partagent un point de vue plus nuancé en identifiant


les fonctions suivantes, qui sont aussi principalement des fonctions de
formation :

15
ibidem
16
VARGAS, Claude, Les manuels scolaires – Imperfections nécessaires, imperfections
inhérentes et imperfections contingentes, in LEBRUN, Monique, Le manuel scolaire – Un outil
à multiples facettes, Presses de l’Université du Québec, 2006
17
PLANE, S., Le manuel, outil d’enseignement, outil d’apprentissages, CRDP Basse-
Normandie, 1999
18
BUCHETON, D., Les manuels : un lien entre l’école, la famille, l’élève et les savoirs, CRDP
Basse-Normandie, 1999
19
VARGAS, Claude, Les manuels scolaires – Imperfections nécessaires, imperfections
inhérentes et imperfections contingentes, in LEBRUN, Monique, Le manuel scolaire – Un outil
à multiples facettes, Presses de l’Université du Québec, 2006
20
ibidem
21
ibidem

27
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o fonction d’information scientifique et générale : comme un enseignant ne


peut pas tout connaître, les manuels scolaires constituent des sources
d’informations (complémentaires) ;

o fonction de formation pédagogique liée à la discipline : « le manuel peut


remplir un rôle de formation continue en apportant à l’enseignant une
série de pistes de travail aptes à améliorer ou même à renouveler sa
pratique pédagogique (…) »22 ;

o fonction d’aide aux apprentissages et à la gestion des cours : le manuel


peut soit contenir des propositions de pistes à suivre en laissant tant aux
enseignants qu’aux élèves une grande liberté d’action, soit fournir toutes
les informations (procédure, conseils, matériel, …) nécessaires à la
réalisation d’une activité ;

o fonction d’aide à l’évaluation des acquis : le manuel peut proposer des


outils d’évaluation (formative) ainsi que les remédiations appropriées.

3. Types de manuels scolaires

Comme l’objectif du présent travail de candidature est l’élaboration d’un


manuel de cours pour les élèves et non la rédaction d’un guide pédagogique
ou d’un livre du maître, nous allons nous limiter dans ce qui suit aux différents
types de manuels destinés aux élèves. Selon Gerard et Roegiers, on
distingue deux grands types de manuels :

3.1. Manuels fermés

Un « manuel fermé » est un support que l’on peut considérer « comme


un tout complet et suffisant en lui-même »23 qui regroupe « tous les éléments
nécessaires à l’apprentissage : de l’information, une méthode, des exercices,
des évaluations, etc. »24.

22
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009
23
ibidem
24
ibidem

28
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3.2. Manuels ouverts

Contrairement au manuel fermé, un « manuel ouvert » est un support de


cours qui n’est pas complet. Selon le cas, l’ouverture peut se faire soit du
point de vue du contenu, soit du point de vue de la méthode.

3.2.1 Manuels ouverts du point de vue du contenu

Lorsqu’un manuel est ouvert du point de vue du contenu, ce dernier doit


être complété à travers des notes, des recherches ou des réflexions
personnelles de la part des élèves.

3.2.2 Manuels ouverts du point de vue de la méthode

Les manuels ouverts du point de vue de la méthode laissent une grande


liberté à l’élève et à l’enseignant concernant la méthode à utiliser afin
d’organiser l’apprentissage. Ce type de manuel remplit donc principalement la
« fonction de référence » et constitue une source d’informations.

Il reste à remarquer qu’« un manuel n’est jamais entièrement fermé ou


ouvert. Il présente un caractère plus ou moins fermé, sur le plan des contenus
ou sur celui des méthodes »25.

25
ibidem

29
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 2 : Les étapes de l’élaboration d’un manuel


scolaire

1. Introduction

Avant de commencer la rédaction d’un manuel scolaire, il faut d’abord se


poser la question de savoir comment cette entreprise peut être réalisée au
mieux. Selon les auteurs, différentes étapes peuvent être distinguées dans
l’élaboration d’un manuel.

Selon Magnan, il faut d’abord « analyser la situation d’enseignement,


c'est-à-dire chercher à connaître le plus possible la situation générale dans
laquelle se trouve un cours afin de mieux le préparer »26. Dans ce contexte, il
y a trois grandes étapes qu’il faut parcourir.

La première de ces étapes consiste en une réflexion sur l’origine de


l’introduction du cours dans un programme. La détermination et l’analyse des
motifs « est utile au professeur qui cherche à faire correspondre son cours à
l’ensemble plus global que constitue un programme de formation ». Ainsi, il se
peut qu’un cours doive être conçu de manière à ce qu’il soit conforme à
certaines exigences du marché du travail ou d’organismes d’autorité ou
d’accréditation. D’autre part, il peut tout simplement s’agir d’actualiser certains
contenus ou de développer davantage certains contenus qui ont gagné en
importance étant donné l’évolution générale des exigences et des modes de
vie.

Lors de la deuxième étape, il faut déterminer le contexte dans lequel le


cours doit être préparé. Pour réaliser ceci, Magnan propose sommairement
les sous-étapes suivantes :

o « la recherche d’information et de personnes ;

o la tenue de rencontres avec certaines de ces personnes (directeur de


programme, collègues actuels, collègues qui ont déjà donné le cours) ;

26
MAGNAN, Claude, http://www.cefes.umontreal.ca/ressources/guides/Plan_cours/avant.htm,
2003

31
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o la mise à jour des connaissances et leur organisation dans l’ensemble


de la matière du cours ;

o la création ou la révision de travaux, d’examens, d’exercices, de


laboratoires, etc. ;

o l’embauche de personnes (assistants, techniciens, agents de secrétariat)


et de leur formation, s’il y a lieu ;

o la préparation de présentations, de manuels, de guides, de grilles ou de


barèmes de correction ;

o l’utilisation de technologies particulières (logiciels, environnements


particuliers, etc.) ;

o etc. »27

Finalement, la troisième étape proposée par Magnan consiste à


analyser les conditions dans lesquelles l’enseignement sera réalisé. Lors de
cette analyse, il s’agit de tenir compte des éléments suivants :

o « le nombre d’inscriptions (la taille du groupe classe, car celle-ci


influence fortement le choix des activités à organiser, leur réalisation, les
impacts sur l’évaluation des examens et des travaux, etc.) ;

o la nature du cours (cours obligatoire ou optionnel, de première année ou


de terminale, etc.) ;

o la fréquence du cours ;

o le profil des étudiants inscrits au cours (la faculté, le département, l’école


ou la discipline d’origine, le cheminement scolaire, leur âge, leur genre,
leurs attentes personnelles et professionnelles, leur degré de motivation,
s’ils se connaissent ou ont déjà travaillé ensemble, s’il s’agit de cohortes,
etc.) ;

o etc. »28

27
ibidem
28
ibidem

32
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Gerard et Roegiers29 procèdent de manière plus détaillée et proposent


une vingtaine d’étapes à parcourir lors de l’élaboration d’un manuel scolaire,
rendant ainsi compte de la complexité de la procédure :

o l’analyse des besoins ;

o l’explicitation du projet ;

o l’explicitation de la conception de l’apprentissage ;

o la délimitation du contenu et l’élaboration de sa structure ;

o la confrontation aux programmes ;

o des consultations de praticiens (surtout), mais aussi de scientifiques ;

o la constitution d’un dossier ;

o la rédaction d’un chapitre ;

o une confrontation de structure et de ton général ;

o un essai de mise en page ;

o une expérimentation du chapitre ;

o le traitement du contenu brut ;

o la définition technique du manuel ;

o la rédaction de l’ensemble ;

o l’élaboration des illustrations ;

o une lecture de contenu et de cohérence générale ;

o la composition et la mise en page ;

o l’expérimentation de l’ensemble ;

o l’élaboration de facilitateurs techniques ;

o la correction des épreuves ;

o l’impression ;

29
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009

33
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o l’expérimentation du manuel terminé.

Gerard et Roegiers insistent aussi sur le fait que ces différentes étapes
ne constituent pas un processus linéaire, mais qu’il est souvent important de
revenir en arrière ou de faire des aller-retour entre certaines de ces étapes.

En ce qui concerne la description de la démarche poursuivie dans


l’élaboration de la proposition du manuel du cours, je me suis surtout tenu au
modèle plus détaillé de Gerard et Roegiers, tout en tenant compte aussi de
propositions faites par d’autres auteurs. Cependant, certaines des étapes
décrites par Gerard et Roegiers dépassent le cadre du présent travail. Dans
ce qui suit, je vais donc brièvement décrire les étapes les plus importantes qui
ont été parcourues lors de l’élaboration de la proposition d’un manuel de
« Statistique et Probabilités ».

2. L’élaboration du cours de « Statistique et Probabilités »


pour la classe de 1D

2.1. L’analyse des besoins

Cette première étape consiste à déterminer « l’écart entre l’existant et le


souhaité » 30 . Elle peut aussi se faire en l’absence de la volonté explicite
d’élaborer un nouveau manuel scolaire, mais elle y conduit bien souvent.

2.1.1 Les souhaits de la CNP-SCIES-ES

Dans ce cas précis, la nécessité d’élaborer un nouveau manuel de cours


découle tout simplement du fait de l’obsolescence générale du manuel
actuellement au programme. La nécessité d’élaborer un nouveau manuel de
cours spécialement conçu pour les besoins de l’enseignement secondaire
luxembourgeois a été formellement ré-exprimée par les membres de la
Commission Nationale pour les Programmes en Sciences Economiques et
Sociales – Enseignement secondaire31, lors de leur réunion officielle du 28
juin 2011. Ainsi, « A l’unanimité des membres présents, la CNP exprime et

30
ibidem
31
nommée « CNP-SCIES-ES » par après

34
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

réitère son souhait de trouver un autre manuel qui soit actualisé et adapté aux
besoins ainsi qu’au niveau de nos classes de 1D. La CNP souhaite
également que ce manuel soit élaboré par nos propres soins, si possible »32.
Dans la même optique que les autres supports de cours mis au programme
par la CNP-SCIES-ES, la proposition du nouveau support pour le cours de
« Statistique et Probabilités » doit comprendre au moins tout ce que la CNP-
SCIES-ES estime indispensable.

2.1.2 Les souhaits et les critiques des enseignants du cours de


« Statistique et Probabilités »

En tant qu’élève ayant suivi les cours de 1D mais surtout en tant


qu’enseignant de sciences économiques et sociales chargé, entre autres, du
cours de statistiques et probabilités en classe de 1D, j’ai découvert moi-même
un certain nombre de manques didactiques et de fautes dans l’ancien manuel
de cours. De plus, les nombreuses critiques de mes collègues ainsi que mon
intérêt personnel pour la matière m’ont amené à entamer le présent travail.
Pour que le contenu du nouveau manuel de cours réponde le mieux aux
exigences de la CNP-SCIES-ES et des enseignants du cours de « Statistique
et probabilités » au Luxembourg, j’ai demandé à mes collègues, enseignant
ou ayant enseigné ce cours, de remplir un questionnaire, consultable en
annexe33.

Parmi les 13 lycées du Luxembourg où le cours de « Statistique et


Probabilités » a été enseigné au moment de la rédaction de ce travail, 11
lycées ont renvoyé au moins une réponse. Étant donné que j’étais moi-même
titulaire du cours dans deux lycées, je me suis abstenu. Seulement deux
lycées n’ont pas répondu au questionnaire. Étant donné que les lycées n’ont
souvent qu’une ou deux classes de 1D, le nombre de questionnaires remplis
que j’ai effectivement reçus est de 16. Les résultats de l’enquête seront
analysés ci-dessous34.

32
Voir annexe 2 pour une copie du rapport officiel du 10 juillet 2011.
33
Voir annexe 3 pour le modèle du questionnaire envoyé aux enseignants du cours.
34
Voir annexe 4 pour une synthèse des réponses des différents questionnaires.

35
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Tout d’abord, il faut constater que parmi les 16 enseignants ayant


répondu au questionnaire, il n’y a aucun qui utilise de manière exclusive le
manuel de cours actuellement au programme. Parmi ces 16 personnes, 15
n’utilisent le manuel que partiellement et ceci dans la plupart des cas
uniquement pour faire les exercices obligatoires. Il y a même un enseignant
qui n’utilise le manuel pas du tout.

En ce qui concerne les parties du manuel que les enseignants utilisent


telles quelles en classe, on remarque que seulement un tiers des enseignants
utilisent le livre pour fournir des explications aux élèves. De plus, une très
petite minorité utilise les développements mathématiques et les illustrations
graphiques du support de cours actuel. Quant aux exercices, la grande
majorité des enseignants utilisent le manuel actuel, ce qui n’est cependant
que dû au fait que ces exercices doivent obligatoirement être traités. Ces
résultats témoignent donc déjà bien du fait que le manuel de cours actuel
n’est plus adapté aux besoins des enseignants et des élèves. Ceci est encore
confirmé par le fait que 15 enseignants utilisent des notes personnelles et 9
enseignants utilisent des extraits d’autres manuels en tant que support de
cours. De plus, 6 enseignants « souhaitent » qu’un nouveau cours soit
élaboré et 9 autres jugent l’élaboration d’un nouveau manuel de cours
carrément « nécessaire ».

Étant donné que la majorité des enseignants utilisent d’autres


ressources en tant que support de cours, il en résulte un enseignement
disparate du cours de « Statistique et Probabilités ». Des divergences
peuvent ainsi exister au niveau des explications du contenu, des notations, de
la terminologie, de l’application pratique des méthodes statistiques, de
l’interprétation, …, ce qui peut défavoriser les élèves de certains lycées par
rapport à d’autres. La disponibilité d’un manuel de base utilisable et utilisé par
l’ensemble des enseignants du cours aiderait ainsi à instaurer plus d’équité
au niveau pédagogique et à réduire encore davantage les écarts de notes à
l’examen. De plus, un manuel de base communément utilisé constituerait une
référence générale en cas de désaccord, par exemple lors d’une réunion de
divergence des notes d’examen.

36
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Les raisons invoquées par les enseignants interrogés pour expliquer


pourquoi ils n’utilisent pas le manuel actuellement au programme seront
illustrées ci-dessous à l’aide d’extraits tirés de ce manuel35.

En ce qui concerne les explications fournies par le manuel actuellement


au programme, les critiques les plus importantes exprimées par les
enseignants interrogés sont qu’elles sont insuffisantes (12)36 (voire absentes)
ou trop compliquées (9).

Quant aux explications manquantes, on peut par exemple citer l’exemple


des polygones des effectifs (ou des fréquences) cumulé(e)s croissants et
décroissants. Comme on peut le voir en consultant les extraits du manuel
présentés en annexe (page 19 jusqu’à la page 21 du livre), les auteurs se
limitent à décrire sommairement la construction de ces polygones. Ils ne
fournissent cependant aucune explication quant à la lecture, à l’interprétation
et à l’utilité du graphique. Sur ces mêmes pages, ils expliquent aussi
comment se construit le polygone des effectifs (ou des fréquences) dans le
cas de classes à amplitudes égales, sans pour autant faire de même pour
une distribution comprenant des classes à amplitudes inégales, dont ils
présentent cependant l’histogramme à la page 19. Les explications
concernant la variance, l’écart type et le coefficient de dispersion (aux pages
38 jusqu’à 40) sont également insuffisantes ou incomplètes.

Le fait que certains enseignants jugent trop compliquées certaines


explications du manuel actuel découle souvent d’un manque, surtout en ce
qui concerne les raisonnements mathématiques, d’étapes intermédiaires dont
les élèves auraient besoin, ou bien, d’un niveau d’abstraction trop élevé des
explications (voir par exemple les explications aux pages 38 jusqu’à 40 quant
à la variance, à l’écart type et au coefficient de dispersion, ou bien encore, la
partie sur la probabilité conditionnelle aux pages 117 jusqu’à 119). En effet,
suite à l’évolution des technologies et des modes de vie, les jeunes n’ont
souvent plus les mêmes facilités qu’il y a certaines années pour bien assimiler
certains concepts sans avoir à l’appui un exemple concret ou une

35
Voir annexe 5 pour les extraits du manuel commentés ci-dessous.
36
nombre d’enseignants (parmi les 16) qui ont invoqué cette critique

37
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

représentation graphique ou schématique, permettant de visualiser des


notions abstraites.

D’autres enseignants critiquent la présentation obsolète (11) et le fait


que les données ne soient pas actualisées (8). Toutes les unités monétaires
sont encore exprimées en FLUX. De plus, les données des tableaux chiffrés
datent encore des années 1980, comme l’illustrent bien les tableaux à la page
17 du manuel. En outre, on a évoqué le fait que le manuel manque de liens
avec le contenu des autres cours d’économe enseignés en classe de 1D.

Finalement, le cours comprend bon nombre de fautes (8) et d’erreurs ce


qui risque de créer de la confusion auprès des élèves. Ainsi, on remarque par
exemple à la page 16 que bien que les auteurs insistent sur le fait que dans le
cas d’une série continue groupée en classes, la représentation graphique
doive se faire sous forme d’histogramme dont l’aire des rectangles représente
l’effectif de la classe, le graphique correspondant à la page 18 n’est rien
d’autre qu’un diagramme en bâtons. Un autre exemple nous est fourni à la
page 19 où les hauteurs du premier et du dernier rectangle de l’histogramme
ne correspondent pas aux hauteurs calculées juste au-dessus. Citons encore
entre autres par exemple le graphique à la page 32 censé représenter la
détermination graphique de la médiane à travers l’intersection des polygones
des effectifs cumulés croissants et décroissants, aux pages 63-64 l’absence
de la dérivée première partielle de S par rapport à β, à la page 110 les
événements E = {obtenir les numéros 1, 3, et 4} et E’ = {3, 4 et 5} lorsqu’il
s’agit de lancer un dé à six faces une fois, ou bien encore, à la page 119 en
haut, l’opérateur U au lieu de ∩ dans la formule de calcul d’une probabilité
conditionnelle.

D’autres raisons invoquées sont par exemple le fait que les exercices
sont inadaptés, ne sont pas assez variés et ne demandent quasiment pas
d’interprétation des résultats calculés. En outre, selon certains titulaires, le
manuel comprend trop d’éléments qui ne figurent pas au programme, est
inadapté aux besoins du cours et du programme et devrait être élaboré de
manière plus didactique. Finalement, certains enseignants jugent que le
niveau de complexité général du manuel est trop élevé.

38
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Ainsi, la grande majorité des enseignants souhaitent qu’un nouveau


manuel de cours apporte des améliorations au niveau des explications
fournies, de la structure, des exercices, des liens interdisciplinaires et des
illustrations graphiques et schématiques. Seulement une minorité des
enseignants juge nécessaire une amélioration au niveau des développements
mathématiques, ce qui peut être dû au fait qu’un certain nombre
d’enseignants n’insistent pas sur ces développements. La raison en est que
de tels développements théoriques ne peuvent actuellement pas faire l’objet
d’une question lors d’un devoir en classe ou d’un examen. J’ai cependant
jugé utile d’adapter, de compléter ou de remplacer certains développements
du manuel actuel afin de rendre leur compréhension ainsi que celle des
concepts sous-jacents plus facile pour les élèves.

2.1.3 Améliorations à apporter au nouveau manuel

De manière générale, on peut donc dire que le contenu et surtout la


structure du support de cours existant en « Statistique et Probabilités », bien
qu’il fût adapté aux besoins de l’époque où il a été conçu, ne répondent plus
aux besoins actuels de notre société moderne. Selon Lebrun, lors de la
rédaction de manuels, deux tensions sont à l’œuvre. « D’un côté se manifeste
un certain conservatisme : on voudrait ne retenir que ce qui a bien fonctionné
avec les générations précédentes. De l’autre, on est poussé par les avancées
des disciplines elles mêmes, par les théories de l’apprentissage émergentes,
de même par un contexte socioculturel en mutation. » Ainsi, bien que, pour
des raisons de conformité au programme officiel du cours de « Statistique et
Probabilités » 37 , le contenu du manuel proposé ne puisse pas différer
substantiellement de la matière actuellement au programme, la proposition
d’un nouveau manuel doit différer de la conception de l’ancien manuel du
point de vue de la structure et de l’approche pédagogique.

Tout d’abord, il convient de mieux expliquer aux élèves l’utilité et les


objectifs du cours. Ainsi, il faut leur expliquer les relations existant entre les

37
LEBRUN, Monique, Le manuel scolaire – Un outil à multiples facettes, Presses de
l’Université du Québec, 2006

39
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

différentes parties du cours, notamment entre la partie I « Éléments de


statistique descriptive » et la partie II « Éléments du calcul des probabilités ».
En fait, dans le manuel actuellement au programme, aucune référence n’est
faite quant à la relation entre les différents chapitres qui ne sont même pas
regroupés en grandes parties. Afin de combler ce manque, j’ai donc
brièvement expliqué aux élèves l’utilité (le pourquoi) des différents éléments
du cours ainsi que les liens qui existent entre ces différentes parties. Ceci
devrait permettre de rendre le cours plus cohérent pour les élèves et de les
rendre conscients de l’utilité et de l’importance de ce type de cours, non
seulement dans leur cursus scolaire, mais aussi pour leur vie quotidienne
(analyse et interprétation de données et de graphiques présentés par les
médias). De plus, il leur sera plus facile de comprendre et d’étudier les
différentes parties s’ils sont conscients de la place qu’elles occupent dans le
cours.

Comme déjà mentionné plus haut, l’ancien support de cours présente


certaines lacunes au niveau pédagogique ainsi que du point de vue du
contenu et de la structure. Les auteurs n’insistent par exemple pas sur les
différences qui peuvent survenir dans le calcul des valeurs de localisation et
de dispersion selon que l’on calcule ces paramètres à partir d’une simple
série de données non groupées ou d’une série répartie en classes. Un autre
exemple en est que le cours ne rend pas compte de la relation entre les
notions de fréquence statistique et de probabilité, ce qui rend difficile
l’établissement d’un lien entre les différentes parties du cours pour les élèves.
Le cours manque de schémas illustratifs ou de tableaux récapitulatifs qui sont
cependant indispensables afin de mieux visualiser certains problèmes ou de
présenter les points essentiels de manière condensée. L’ancien manuel
apparaît souvent trop abstrait, trop théorique et ne s’avère pas assez explicite.
Il convient donc de concevoir le nouveau cours de manière à ce que la
structure du cours apparaisse plus claire et cohérente, tout en ajoutant des
explications plus détaillées dans une optique d’une transposition didactique et
d’une vulgarisation plus poussées des concepts abstraits.

40
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

De plus, les données des exemples et exercices présentés dans ce


cours doivent absolument être actualisées. En effet, il n’est pas très efficace,
dans une optique interdisciplinaire, de résoudre des exercices et d’interpréter
les résultats obtenus si les données datent des années 1980 et sont encore
exprimées en francs luxembourgeois. J’ai donc essayé d’intégrer dans le
nouveau cours, dans la mesure du possible, des données issues de la réalité
socio-économique luxembourgeoise et européenne récente. En outre, il
s’avère indispensable d’intégrer davantage d’exercices portant sur
l’interprétation des résultats dans le nouveau cours. Dans la même optique,
pour les exercices du chapitre traitant le calcul des probabilités, il convient
d’intégrer davantage d’exercices « réels ». Les exercices doivent donc être
plus variés, en vue d’une meilleure préparation aux cours de probabilités
universitaires.

Malheureusement, il sera impossible de remédier à une des plus


grandes lacunes du cours existant, qu’est l’absence de l’utilisation de l’outil
informatique qui s’explique simplement par l’âge du manuel. Bien que
l’intégration de l’outil informatique dans un cours de « Statistique et
Probabilités » soit de grande importance, le volume assez réduit d’heures de
cours, le manque d’infrastructures adaptées et surtout de connaissances
prérequises auprès des élèves 38 dans le domaine de l’informatique me
contraignent à négliger cet élément crucial dans le présent travail.

2.2. L’explicitation du projet

D’après Gerard et Roegiers, « cette étape fait suite à la naissance d’un


projet dans l’esprit d’un (ou des) auteur(s), ou encore à la demande d’un
éditeur » 39 . Ainsi, suite à l’étude préalable des besoins, j’ai pris, en
collaboration étroite avec mon patron, M. Giancarlo De Toffoli, professeur en
sciences économiques et sociales et président de la CNP-SCIES-ES, les
décisions concernant l’élaboration du cours de « Statistique et Probabilités »

38
En ce qui concerne l’enseignement secondaire, les « Horaires et programmes » ne
prévoient actuellement aucun cours d’informatique, sauf pour les classes de 2B et de 1B.
39
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009

41
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

en fonction des objectifs à atteindre en tenant compte des programmes


d’enseignement et de l’importance du cours dans le parcours des élèves et
futurs étudiants.

2.2.1 Les objectifs principaux

Les parties théoriques du cours doivent être reformulées, complétées et


approfondies, en les rédigeant de manière à ce qu’elles gardent une validité à
long terme. Ces parties théoriques doivent être complétées par des exemples,
des applications résolues et des exercices dont les données doivent, le cas
échéant, être mises à jour de manière régulière. Ces mises à jour pourraient
se faire ultérieurement par exemple à travers des liens sur www.myschool.lu40,
permettant aux enseignants d’accéder directement aux sources actualisées
des données. Le langage du cours, la terminologie et le degré de difficulté
doivent à la fois être adaptés au niveau des connaissances préalablement
atteint par les élèves à travers d’autres disciplines41, tout en les préparant de
manière adéquate aux études universitaires.

Dans cette même optique, la création de liens interdisciplinaires s’avère


importante, étant donné que « l’interdisciplinarité peut être appréhendée
comme un moyen de lutter contre la segmentation des savoirs et prendre en
compte des questions que se posent les élèves. Elle est alors perçue comme
un moyen privilégié pour motiver les élèves. Dans cette approche, on prend
en considération les dimensions affectives, personnelles, sociales de la
personne et on laisse se manifester des talents, compétences et
connaissances peu ou pas sollicités dans l’ordinaire des cours »42. D’après
Seguin, l’intégration dans un même manuel d’éléments de plusieurs
disciplines « permet de relier entre eux des faits, des événements ou des
phénomènes de nature complexe que le point de vue d’une seule discipline
ne peut expliquer d’une manière satisfaisante. C’est ainsi que des contenus

40
Plateforme accessible aux enseignants et aux élèves et permettant la mise en commun et
la diffusion de ressources pédagogiques, de supports de cours, …
41
Comme par exemple les cours d’économie de gestion, d’économie politique et de
mathématiques, cours que les élèves suivent en classe de 1D ou ont déjà suivis en classe de
2D ou de 3D (voir liste des cours en annexe 6)
42
HUGON, Marie-Anne, Travailler en interdisciplinarité au collège et au lycée: obstacles et
aide, Poitiers, 2002 http://ww3.ac-poitiers.fr/tpi/b2i/documents/pourpilot/interdisciplinarite.pdf

42
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

(…) peuvent s’intégrer pour mieux expliquer et faire comprendre des


événements ou des phénomènes. (…) Cette intégration de contenus
contribue à développer, chez l’élève, l’aptitude à établir des relations entre
des matières d’enseignement qui sont habituellement isolées les unes des
autres ou entre des faits apparemment éloignés les uns des autres. »43 Ainsi,
un objectif supplémentaire est de favoriser le développement de compétences
transversales en accentuant les liens avec d’autres disciplines.

2.2.2 Le choix de la stratégie pédagogique

Raynal et Rieunier définissent la stratégie pédagogique comme « un


ensemble de méthodes et de démarches, qui vont déterminer des choix de
techniques, de matériels et de situations pédagogiques, par rapport à l’objet
d’apprentissage »44.

Lors de la rédaction du manuel, j’ai eu recours à deux grandes


démarches pédagogiques, à savoir la démarche déductive, encore appelée
« démarche hypothético-déductive »45, et la démarche inductive. Chacune de
ces deux méthodes, qui peuvent le cas échéant aussi être combinées,
présente des avantages et des désavantages. Selon Aublin, Rubaud et
Taraud, le choix de la méthode se fait en fonction :

o « de l’objet de l’apprentissage, (savoir cognitif et/ou méthodologique,


savoir-faire, savoir être) ;

o de la complexité et de la criticité du savoir visé, (mobilise-t-il de


nombreuses entrées? est-il pré-requis de nombreux autres savoirs?) ;

o du niveau de performance attendu, (reproduire, réciter, retrouver une loi,


appliquer, transférer, inventer, créer, choisir, argumenter, …) ;

43
SEGUIN, R., L’élaboration des manuels scolaires : Guide méthodologique, UNESCO,
http://www.unesco.org/education/pdf/55_16_f.pdf
44
RAYNAL, F., RIEUNIER, A., Pédagogie : dictionnaire des concepts clés, ESF, Paris, 1997
45
BEITONE, Alain, DECUGIS, Marie-Ange, DOLLO, Christine, RODRIGUES, Christophe,
Les sciences économiques et sociales – Enseignement et apprentissages, De Boeck,
Bruxelles, 2004

43
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o des caractéristiques individuelles et collectives de l’apprenant. » 46

La démarche déductive, utilisée souvent en relation avec des « objets


simples et non critiques »47, présente la particularité que l’enseignant introduit
d’abord une formule, une règle ou une loi, pour l’illustrer ensuite à travers des
exemples, des applications ou des exercices avec comme but de « renforcer
la mémorisation et la compréhension » 48 . Le raisonnement va donc du
général au particulier. Cette démarche a surtout été utilisée au cours de la
première partie du manuel présentant les « Éléments de statistique
descriptive ».

La démarche inductive, souvent associée à des objets d’apprentissage


plus complexes, a plutôt été utilisée dans la deuxième partie du cours, traitant
les « Éléments du calcul des probabilités ». Cette démarche consiste en un
raisonnement qui part de cas particuliers pour en tirer des règles générales.
Ainsi, à partir d’exemples, on construit des formules, des règles ou des lois.
Cette méthode est supposée, d’après Aublin, Rubaud et Taraud, favoriser de
développement de stratégies cognitives (réflexion sur l’origine, le pourquoi de
connaissances factuelles), de l’autonomie et de la responsabilité des élèves,
étant donné que ces derniers apprennent à appliquer des méthodes pour
résoudre des problèmes. Elle permet « de former des schémas conceptuels à
même de fonctionner dans des situations variées. »49

2.3. L’explicitation de la conception de l’apprentissage

Cette étape consiste principalement dans le choix de la méthode selon


laquelle le cours devrait être enseigné ainsi que dans le choix du type de
manuel.

46
AUBLIN, Michel, RUBAUD, Marc, TARAUD, Dominique, Élaborer une stratégie
pédagogique, http://perso.crans.org/brun/AGREG/Aublin/strat_peda.ppt
47
ibidem
48
ibidem
49
DE CORTE, E., GEERLIGS, T., PETERS, J., LAGERWEIJ, N., VANDENBERGHE, R., Les
fondements de l’action didactique, De Boeck, Bruxelles, 1990

44
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

En ce qui concerne les méthodes d’enseignement, Genard et Odrovic50


distinguent entre les méthodes transmissives (méthode expositive, frontale,
ex-cathédra), la méthode socratique (méthode interrogative), les méthodes
actives (enseignement orienté vers l’action) et les méthodes permissives
(enseignement à distance). Bien que le choix de la démarche pédagogique
puisse influencer le choix de la méthode d’enseignement, je suis d’avis que la
méthode d’enseignement doit être choisie aussi en fonction des compétences
et des approches favorisées par les enseignants chargés du cours ainsi que
du niveau des connaissances et des compétences préalables des élèves.
Pour cette raison, j’ai décidé de limiter mon travail à la proposition d’un
manuel assez complet et clairement structuré au niveau du contenu, en
laissant à l’enseignant le libre choix de la méthode afin de favoriser des
conditions de travail propices à l’apprentissage. Ainsi, le manuel devrait
comprendre les éléments essentiels visant à préparer les élèves de manière
adéquate à leur vie future, surtout à celle d’étudiant. En outre la conception
de la structure du cours devrait permettre à la CNP-SCIES-ES d’adapter
assez librement le programme aux besoins, en ajoutant ou en laissant de côté
certaines parties du manuel au programme à traiter.

Pour les élèves, le manuel est donc assez fermé du point de vue du
contenu et remplit de manière prépondérante les différentes « fonctions
relatives à l’apprentissage » 51 , sans pour autant négliger les « fonctions
d’interface avec la vie quotidienne et professionnelle »52. En même temps, il
est assez ouvert du point de vue de la méthode, étant donné qu’il permet
d’aborder la matière selon différentes manières, en lisant par exemple les
parties plus théoriques ou abstraites, en s’inspirant des applications résolues
ou en résolvant les exercices.

Comme l’objectif du présent travail de candidature est l’élaboration d’un


manuel de cours destiné aux élèves et non la rédaction d’un guide
pédagogique ou d’un livre du maître, et comme je veux laisser aux

50
GENARD, Alain, ODROVIC, Michel, Méthodologie de l’enseignement des sciences
économiques, De Boeck, Bruxelles, 1994
51
voir chapitre 1, point 2.1.
52
ibidem

45
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

enseignants le libre choix de la méthode d’enseignement, le manuel, en ce


qui concerne les enseignants, remplit principalement la « fonction
d’information scientifique et générale »53.

2.4. La délimitation du contenu et l’élaboration de sa structure

Selon Gerard et Roegiers, cette étape consiste souvent à tracer une


première table des matières sommaire. Concernant l’élaboration du présent
cours, cette première table des matières se basait de manière prépondérante
sur le contenu du programme en « Statistique et Probabilités » actuellement
en vigueur 54 , sur les résultats de l’analyse des besoins, notamment les
suggestions des enseignants du cours concernant certains nouveaux
éléments à inclure dans le cours qui ne figurent actuellement pas au
programme ainsi que sur le contenu des cours de premier cycle de certaines
universités. La structure de cette table des matières préliminaire a été établie
suite à certaines discussions avec d’autres enseignants et avec mon patron,
M. De Toffoli ainsi que sur base de critiques personnelles ou venant d’autres
enseignants concernant la structure du manuel actuel. Cette structure
préliminaire a cependant dû être adaptée pendant la rédaction du manuel,
étant donné qu’il s’avérait profitable à l’apprentissage de modifier la structure
et le contenu de certains chapitres.

2.5. La confrontation au programme

Comme déjà mentionné ci-dessus, la table des matières du manuel de


cours proposé se base entre autres sur le contenu actuel du programme en
« Statistique et Probabilités » et mes concertations avec mon patron M. De
Toffoli, président de la CNP-SCIES-ES. De ce fait, il n’y pas d’écart entre la
matière traitée dans ce cours et celle prévue par les « Horaires et
programmes » et il n’y aura par conséquent pas de problèmes pour traiter la
matière actuellement au programme pendant le volume d’heures prévu.

53
voir chapitre 1, point 2.2.
54
voir annexe 7 pour le contenu exact pour le cours d’ « Économie de gestion » en classe de
1D, consultable aussi sur http://www.men.public.lu/sys_edu/postprimaire/index.html

46
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Néanmoins, j’ai jugé utile de rajouter à la matière certaines parties qui


ne figuraient pas au programme jusqu’à présent, en me basant surtout sur les
suggestions que les enseignants du cours de statistique et probabilités m’ont
fait parvenir à travers le questionnaire que je leur ai distribué ainsi que sur le
contenu des cours de statistique et de probabilités dispensés au premier
cycle universitaire. Ceci devrait d’un côté laisser à la CNP-SCIES-ES la
flexibilité d’adapter le programme aux besoins afin de garantir une préparation
optimale de nos élèves aux études supérieures et d’un autre côté permettre à
l’élève intéressé d’approfondir ses connaissances. Cependant, comme déjà
mentionné plus haut, il faut éviter d’intégrer dans la proposition de manuel
trop de détails et de parties qui, faute de temps, ne pourraient pas être
traitées et qui risquent ainsi que le manuel soit perçu comme une suite
discontinue d’éléments non liés entre eux.

2.6. Des consultations de praticiens, mais aussi de


scientifiques

L’étape de consultation de praticiens consistait principalement en une


enquête ayant comme but de déterminer les attentes et les besoins des
enseignants qui ont déjà été chargés du cours. Cette enquête se faisait sur
base d’un questionnaire que j’ai distribué à ces enseignants ainsi que sur
certaines rencontres avec des collègues lors desquelles ils m’ont rendu
conscient des principales lacunes du cours actuel et lors desquelles ils m’ont
fait part de leurs propositions d’amélioration et de restructuration. De plus, ils
m’ont averti de certains éléments du cours, posant le plus de problèmes aux
élèves. En outre, je me suis concerté avec des collègues d’autres disciplines,
notamment des professeurs de mathématiques de l’enseignement secondaire,
afin de garantir que les notions utilisées dans certaines parties du cours
soient adaptées au vocabulaire mathématique dont disposent les élèves.

2.7. La constitution d’un dossier

Lors de cette étape, il s’agit de rassembler tout type d’information et de


documents utiles à la rédaction du cours. Des exemples en sont le
programme actuellement en vigueur pour le cours de « Statistique et

47
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Probabilités », les programmes proposés par certaines universités, des


ouvrages de référence, des préparations de leçons d’autres enseignants, des
critiques et suggestions d’autres enseignants, des sources de données
statistiques, … Il faut remarquer que ce dossier n’a pas été entièrement
constitué avant de débuter la rédaction, mais a été complété tout au long du
processus d’élaboration du présent manuel.

2.8. La rédaction d’un chapitre

Selon Gerard et Roegiers, cette étape consiste en « la rédaction d’un


chapitre « martyr », qui reflète l’ensemble des particularités que l’on souhaite
introduire dans le manuel »55. Il s’agit de définir ainsi la structure générale des
chapitres ainsi que les différents éléments que l’on veut laisser y figurer
(résumés, applications résolues, exercices théoriques ou pratiques, …). Ainsi,
en concertation avec mon patron, la rédaction d’une première version d’un
chapitre m’a permis, de définir une sorte de fil conducteur selon lequel les
différents chapitres seront rédigés.

2.9. Une confrontation de structure et de ton général

Le ton général a été déterminé principalement à travers les


concertations avec mon patron lors de l’explicitation du projet et après la
rédaction d’un premier chapitre. Ainsi, le niveau du langage, de la complexité
et de l’approfondissement de la matière ont été déterminés.

En ce qui concerne la structure du manuel de cours, j’ai opté pour une


subdivision en deux grandes parties :

o partie I « Éléments de statistique descriptive » ;

o partie II « Éléments du calcul des probabilités ».

La raison en est que ces différentes parties constituent souvent des


cours isolés au niveau universitaire. A travers cette subdivision, je voulais
rendre compte du fait que, bien qu’il existe un lien étroit entre les deux parties,

55
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009

48
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

les matières traitées sont assez différentes. En effet les chapitres de la


première partie se basent sur des faits observés, donc des variables
réellement observables tandis que les chapitres de la deuxième partie se
concentrent sur la préparation à l’étude des caractéristiques de variables
soumises au hasard.

En ce qui concerne la subdivision des chapitres, afin de garantir que la


structure du cours reste bien claire et ne devienne pas trop compliquée, j’ai
opté pour une subdivision qui s’arrête au troisième niveau. En outre, les
chapitres sont structurés de manière à ce qu’ils commencent avec les parties
théoriques comprenant des exemples et se terminent par des applications
résolues (sauf pour le premier chapitre) et des exercices.

2.10. Un essai de mise en page

En ce qui concerne la mise en page, j’ai décidé d’illustrer le chapitre du


manuel concernant les « Variables aléatoires » et ceci en collaboration étroite
avec la graphiste Madame Tessy Kremer. J’ai choisi ce chapitre précis étant
donné que son contenu est le plus diversifié. En effet, il comprend des
éléments différents comme du texte, des formules, des tableaux et des
graphiques. Étant donné le niveau de difficulté de la matière et la place du
cours dans le parcours scolaire des élèves, j’ai opté pour une mise en page
reflétant le sérieux et l’importance de la matière, en évitant les illustrations
ludiques, risquant de distraire des élèves.

La mise en page des autres chapitres a été réalisée par mes propres
soins en « MS WORD », tout en utilisant « MS EXCEL » pour les
représentations graphiques.

2.11. Une expérimentation du chapitre

Cette étape, qui selon Gerard et Roegiers conditionne tout l’ouvrage, ne


se limitait dans ce cas précis pas seulement à l’expérimentation d’un chapitre

49
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

déterminé (le « chapitre martyr »56). Cette expérimentation a été réalisée à


deux niveaux.

D’une part, l’expérimentation se faisant à travers la relecture des


chapitres par mon patron, M. De Toffoli, lui-même professeur de sciences
économiques et sociales et disposant donc des compétences et
connaissances scientifiques et pratiques nécessaires pour juger de la
conception des différents chapitres. Cette étape se faisait donc, en partie, en
même temps que celles de la « consultations de praticiens, mais aussi de
scientifiques » et de la « confrontation de structure et de ton général ».

D’autre part, étant moi-même titulaire du cours de « Statistique et


Probabilités » au Lycée Classique de Diekirch et au Lycée Josy Barthel à
Mamer, j’ai eu l’occasion d’expérimenter certaines parties du cours sur le
terrain. Ceci m’a aidé à déterminer les parties du cours qui, étant donné leur
niveau de difficulté, devaient être expliquées de manière plus détaillée. De
plus, j’étais en mesure d’adapter certains passages aux besoins et aux
capacités des élèves.

2.12. Le traitement du contenu brut

Cette étape établit le lien entre la phase de « délimitation du contenu et


d’élaboration de la structure » et celle de la « rédaction de l’ensemble ». En
fait, elle ne se résume pas à une étape bien délimitée et franchie à un
moment précis, mais consiste en un processus de réflexion plutôt continu tout
au long de la rédaction du manuel. Il s’agit de définir jusqu’à quel niveau la
matière sera approfondie et ceci tant quant à la quantité de matière à traiter
que par rapport au niveau de complexité et le nombre de détails à fournir. Ces
choix ont bien sûr été faits en tenant compte à la fois du niveau des
connaissances acquises par les élèves jusqu’à ce moment et du niveau de
connaissances à atteindre pour garantir une bonne préparation aux études
universitaires.

56
ibidem

50
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.13. La définition technique du manuel

Lors de cette étape on décide de divers aspects concernant la


présentation physique du manuel, comme le nombre de pages, le format, les
couleurs à utiliser, … Tous ces paramètres ne déterminent pas seulement le
coût d’impression du manuel, mais se répercutent aussi sur la manière selon
laquelle les élèves perçoivent le manuel, ce qui à son tour influence leur
faculté à assimiler la matière ainsi que leur motivation.

Bien que la décision finale concernant les différents aspects de la


présentation matérielle du manuel incombe à la CNP-SCIES-ES, j’ai jugé utile
de concevoir une proposition de mise en page. Comme déjà indiqué plus haut,
j’ai opté, en collaboration avec la graphiste, Mme Kremer, pour une mise en
page rendant compte du niveau de difficulté de la matière, en évitant les
illustrations risquant de détourner l’attention des élèves. Le format choisi est
le DinA4, ce dernier permettant une présentation bien aérée de la matière.
Afin de faciliter la lecture, les polices ont été choisies de manière à ce que l’on
puisse bien distinguer le texte des paramètres, variables et formules. Afin de
rendre la présentation plus claire et accueillante, j’ai décidé d’intégrer la
couleur bleue, tout en voulant profiter des effets bénéfiques de cette dernière
sur les facultés cognitives des élèves. En effet, d’après Goldstein, « the colors
green and (…) blue are experienced as quieting and agreeable and focus
individuals inward. Accordingly, red (and yellow) relative to green (and blue)
was posited to impair performance on activities in which exactness is
required. » 57 et, selon Soldat et al., « blue is associated with sadness and
evokes systematic processing that facilitates cognitive performance. »58

57
GOLDSTEIN, K., in ELLIOT, Andrew J., MOLLER, Arlen C., FRIEDMAN, Ron, MAIER,
Markus A., MEINHARDT, Jörg, Color and Psychological Functioning: The Effect of Red on
Performance Attainment, Journal of Experimental Psychology, 2007
58
SOLDAT, A. S., SINCLAIR, R. C., MARK, M. M., in ELLIOT, Andrew J., MOLLER, Arlen C.,
FRIEDMAN, Ron, MAIER, Markus A., MEINHARDT, Jörg, Color and Psychological
Functioning: The Effect of Red on Performance Attainment, Journal of Experimental
Psychology, 2007

51
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.14. La rédaction de l’ensemble

Les différentes étapes présentées par Gerard et Roegiers ne constituent


pas une séquence linéaire, mais un processus circulaire pendant lequel « il
est bon d’effectuer de fréquents aller-retour entre plusieurs de ses étapes. »59
Ainsi, comme les différentes étapes du processus d’élaboration du manuel
scolaire sont le plus souvent imbriquées les unes dans les autres, on peut
dire que la phase de rédaction s’étendait sur toute la durée du processus
d’élaboration du manuel.

2.15. L’élaboration des illustrations

Comme déjà mentionné plus haut, j’ai opté pour une présentation
clairement structurée et sans illustrations risquant de dévier l’attention des
élèves des faits essentiels. Ceci tient compte de la critique de Vargas qui
constate qu’au cours des années, « la part des connaissances a été réduite
au profit des illustrations, des exercices, de documents divers, comme si un
manuel scolaire devait s’inscrire dans le paradigme des publications du
monde extrascolaire. » 60 Dans cette même optique, selon Bucheton, « les
contenus de savoirs sont […] souvent rendus très opaques par des pratiques
éditoriales qui privilégient la dimension attractive, décorative par rapport à la
dimension pédagogique. »61 De plus, étant donné que la matière théorique
présentée dans le manuel de cours a le plus souvent un caractère plutôt
absolu et ne peut que très difficilement être sujet de discussions entamées à
travers des points de vues différents, des illustrations déclenchant des
réflexions critiques auprès des élèves ne s’avèrent que peu utiles. En tenant
compte de ces différents aspects, les illustrations faisant partie de la
proposition de manuel se limitent à des graphiques, tableaux et schémas dont
le but est de fournir des explications ou des représentations complémentaires

59
GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour apprendre, De
Boeck Université, Bruxelles, 2009
60
VARGAS, Claude, Les manuels scolaires – Imperfections nécessaires, imperfections
inhérentes et imperfections contingentes, in LEBRUN, Monique, Le manuel scolaire – Un outil
à multiples facettes, Presses de l’Université du Québec, 2006
61
BUCHETON, D., Les manuels : un lien entre l’école, la famille, l’élève et les savoirs, CRDP
Basse-Normandie, 1999

52
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

aux explications littéraires ou formalisées, avec comme but de faciliter


l’assimilation de la matière auprès des élèves, surtout ceux qui ont plus de
facilités à appréhender la matière de manière visuelle.

2.16. Une lecture de contenu et de cohérence générale

La relecture continue des différents chapitres, qui sont souvent


interdépendants ou qui constituent une suite logique progressive, s’avérait de
grande importance afin de garantir la cohérence du manuel concernant les
définitions, les notations, les formules, … Cette relecture a été réalisée par
moi-même et par mon patron M. De Toffoli, ce qui m’a permis d’éviter
certaines erreurs et d’améliorer la qualité du manuel. Une relecture finale a
été réalisée afin de repérer les dernières erreurs.

Étant donné que les dernières six étapes proposées par Gerard et
Roegiers dépassent le cadre du présent travail de candidature comme elles
concernent surtout les aspects techniques de la publication et les étapes
préliminaires à l’impression du manuel, mon analyse s’arrête avec cette
dernière phase de la conception et de rédaction.

3. Analyse critique

La présente proposition de manuel pour le cours de « Statistique et


Probabilités » en classe de 1D ne se veut pas parfaite. Il faut même bien
reconnaître qu’aucun manuel n’est parfait et qu’il présente nécessairement,
tôt ou tard, des imperfections, étant donné qu’il s’agit d’un objet statique. Ainsi,
selon Vargas, « comme il possède une certaine durée de vie, le temps peut
altérer la pertinence de ses contenus ; son caractère figé le rend difficilement
adaptable à toute une série de phénomènes dynamiques, qu’il s’agisse de
certaines recommandations de textes officiels, du problème de la diversité
culturelle des élèves, ou de l’évolution des médias, ce qui pose le problème
de sa fonctionnalité didactico-pédagogique. » 62 Ce problème est souvent

62
VARGAS, Claude, Les manuels scolaires – Imperfections nécessaires, imperfections
inhérentes et imperfections contingentes, in LEBRUN, Monique, Le manuel scolaire – Un outil
à multiples facettes, Presses de l’Université du Québec, 2006

53
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

rencontré en sciences économiques et sociales où « un manuel est


condamné à présenter, au bout d’un certain temps, du savoir mort. »63
Une autre critique pourrait être formulée quant au degré de difficulté ou
de pertinence des exemples de base choisis afin d’illustrer les nouveaux
concepts théoriques et de donner des explications. Ces exemples, bien qu’ils
soient souvent très simplifiés64, ont été choisis spécialement en raison de leur
simplicité et de leur familiarité pour les élèves. Ainsi, comme les élèves
connaissent déjà bien le contexte de ces exemples, ils peuvent, lors du
processus d’apprentissage, se concentrer de manière exclusive sur les
nouveaux contenus et méthodes relatifs aux domaines de la statistique et du
calcul des probabilités. Ceci est bien confirmé par Lafortune et Massé pour
lesquels « On ne saurait assez insister sur le fait qu’il est important d’activer
les connaissances antérieures. Les connaissances à venir pour être viables
se greffent à des connaissances qui sont déjà présentes, sinon les élèves
accumulent des connaissances de façon parallèle ou parcellaires. » 65 On
évite ainsi les difficultés liées au fait de devoir d’abord comprendre et
assimiler un nouveau contexte avant de pouvoir commencer l’étude des
nouveaux éléments, bien plus importante à ce stade.
D’autres parties66 auraient bien sûr encore pu être incluses dans cette
proposition de manuel. Mais, comme déjà mentionné plus haut, il a été jugé
préférable de ne pas traiter trop de nouveaux éléments à ce stade en raison
du volume hebdomadaire d’heures de cours assez réduit, du manque de
connaissances des élèves dans d’autres domaines comme en
mathématiques, en informatique ou même en sciences économiques et par
souci pédagogique de cohérence entre les différentes parties des chapitres.
En effet, la présence de trop de détails dans un manuel destiné à couvrir un
volume de cours de seulement deux heures par semaine doit se traduire

63
ibidem
64
comme par exemple « les 20 notes en ECOPO », « le modèle keynésien de base », les
« séries de PIB », …
65
LAFORTUNE, Louise, MASSÉ Bernard, La conception et la rédaction de manuels scolaires
dans une perspective socioconstructiviste – Un exemple en mathématiques, in LEBRUN,
Monique, Le manuel scolaire – Un outil à multiples facettes, Presses de l’Université du
Québec, 2006
66
tableaux à double entrée, binomiale bivariée, variables aléatoires continues, … il est
impossible d’établir une liste exhaustive

54
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

inévitablement dans une désélection d’un grand nombre de parties qui ne


pourraient pas être traitées, faute de temps. Cette manière de procéder risque
de faire apparaître tout manuel scolaire comme un ensemble disparate
d’éléments indépendants, alors que le but est de fournir aux élèves un
manuel dans lequel les différents éléments sont présentés de manière
continue, structurée et cohérente. Un choix très réduit d’éléments
supplémentaires (par rapport à la matière actuellement au programme) a
donc été fait, surtout sur base des recommandations des enseignants du
cours. La proposition de manuel contient ainsi tous les éléments actuellement
au programme ainsi que certaines nouvelles parties dont les enseignants du
cours ont jugé l’ajout utile, mais pas nécessairement indispensable. Les
nouvelles parties, ne pouvant probablement pas être traitées en détail, ont
pour la plupart du temps, par souci de continuité de la matière actuellement
au programme, été présentées en fin de chapitre 67 . Ces nouvelles parties
pourront néanmoins servir de remarques à faire par les enseignants ou
d’approfondissements aux élèves intéressés. D’autres parties 68 qui ont été
rajoutées servent principalement à expliquer de manière plus détaillée et
approfondie la matière actuellement au programme. Ces parties ont surtout
pour but d’améliorer les capacités d’interprétation des résultats, et feront donc
principalement l’objet de questions d’interprétation, genre de questions sur
lequel la CNP-SCIES-ES insiste de plus en plus. Le manuel proposé devrait
donc être suffisamment complet pour répondre aux exigences actuelles de la
CNP-SCIES-ES, à laquelle incombe le choix final des parties à mettre au
programme, ou, le cas échéant, à inclure ou à rajouter à la version définitive
du manuel.
De même, en ce qui concerne la mise en page du manuel définitif, ce
sera finalement la CNP-SCIES-ES qui prendra les décisions appropriées.
Comme il ne s’agit ici que de l’élaboration d’une proposition de manuel, on a
préféré une mise en page peu sophistiquée, en fournissant cependant en
annexe une proposition de mise en page réalisée par une spécialiste du

67
comme par exemple le coefficient de Gini et la courbe de Lorenz, la régression non linéaire,
le théorème de Bayes, …
68
comme par exemple les graphiques et explications relatives aux valeurs centrales et de
dispersion, la covariance et le coefficient de corrélation, …

55
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

domaine. Cet essai de mise en page, destiné à inspirer la CNP-SCIES-ES, a


été réalisé en tenant compte de l’effet propice à l’apprentissage de la couleur
bleue ainsi que d’une mise en page aérée et reflétant le sérieux. Ainsi, la mise
en page définitive de l’ensemble sera à faire par des spécialistes mandatés
par la CNP-SCIES-ES et ayant à disposition les outils informatiques adaptés.
Comme il ne s’agit que d’une proposition de manuel, et pas de la version
définitive du manuel à mettre au programme, des parties du cours peuvent
encore être adaptées plus tard après que le manuel ait été testé sur le terrain
par des « enseignants aguerris »69, ou bien, sur recommandation de la CNP-
SCIES-ES. Dans ce contexte, il faut rappeler que la mise en pratique
complète de cette proposition de manuel de cours était légalement impossible,
étant donné que le présent manuel ne figure pas officiellement au programme.
Seulement certaines parties actuellement au programme et dont le contenu
ne diverge pas de manière substantielle de celles de l’ancien manuel ont pu
être testées en pratique et adaptées, le cas échéant.

Il est cependant regrettable qu’il me fût impossible d’intégrer l’utilisation


en classe de l’outil informatique dans le présent manuel. Le nombre trop
réduit de leçons hebdomadaires n’en était pas la seule raison. Étant donné
que le logiciel « MS EXCEL » s’est avéré trop peu pratique pour les besoins
de ce cours, il est peu recommandable de l’utiliser à ce niveau. En outre,
étant donné qu’aucun cours d’informatique n’est prévu par les « Horaires et
programmes » pour le parcours scolaire entier des élèves du secondaire
luxembourgeois 70 , l’utilisation d’autres logiciels n’est pour l’instant pas
praticable non plus. Bien que certains élèves aient déjà certaines
connaissances dans le domaine de l’informatique, la disparité des
connaissances de base en la matière ne permet pas l’utilisation d’un logiciel
spécialisé, requérant souvent la maîtrise d’un certain langage de
programmation. Finalement, il reste à noter que tous les établissements ne
disposent pas des infrastructures informatiques et du personnel technique
nécessaires afin d’organiser un examen en salle informatique.

69
ibidem
70
sauf pour les élèves de 2B et 1B

56
Conclusion

57
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La conception et la rédaction d’un nouveau manuel scolaire pour le


cours de « Statistique et Probabilités » n’était pas chose facile. Les différents
choix qu’il fallait effectuer quant aux démarches pédagogiques, à la
structuration et au contenu du cours, au niveau de la complexité et de
l’avancement de la matière étaient plus problématiques que je ne l’aurais cru
au moment du choix du sujet de mon travail de candidature. Cependant, sur
base de longues réflexions et en tenant compte des concertations avec mon
patron, M. De Toffoli, ces problèmes ont bien pu être surmontés.

En outre, en cours de route, de nombreux petits problèmes entravaient


la progression du travail. Tout d’abord, il était bien difficile de trouver des
données issues de la réalité socio-économique qui étaient facilement
manipulables. Ainsi, la plupart des données présentaient des effectifs trop
élevés ou étaient difficilement compréhensibles pour les élèves. J’ai donc dû
les adapter avant de pouvoir les intégrer dans le manuel. Une fois les
données collectées, leur traitement avec « MS EXCEL » s’avérait beaucoup
moins facile que prévu, étant donné que ce programme ne permet ni de
manipuler facilement des séries de données groupées en classes à l’aide des
formules usuelles proposées par le logiciel, ni de produire de manière directe
les représentations graphiques prévues par les « Horaires et programmes ».

Néanmoins, malgré les inconvénients rencontrés en cours de route,


j’espère que le manuel de « Statistique et Probabilités » satisfera les besoins
de la CNP-SCIES-ES et contribue à une amélioration de la compréhension de
la matière et à une augmentation de la capacité à analyser et à interpréter
des données auprès des élèves, et ceci tant au niveau de ce cours qu’au
niveau interdisciplinaire. Je me tiendrais bien sûr à disposition de la CNP-
SCIES-ES afin d’effectuer d’éventuelles adaptations.

59
Bibliographie

61
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

AUBLIN, Michel, RUBAUD, Marc, TARAUD, Dominique, Élaborer une


stratégie pédagogique,
http://perso.crans.org/brun/AGREG/Aublin/strat_peda.ppt

BEITONE, Alain, DECUGIS, Marie-Ange, DOLLO, Christine, RODRIGUES,


Christophe, Les sciences économiques et sociales – Enseignement et
apprentissages, De Boeck, Bruxelles, 2004

BUCHETON, D., Les manuels : un lien entre l’école, la famille, l’élève et les
savoirs, CRDP Basse-Normandie, 1999

DE CORTE, E., GEERLIGS, T., PETERS, J., LAGERWEIJ, N.,


VANDENBERGHE, R., Les fondements de l’action didactique, De Boeck,
Bruxelles, 1990

EICHLER, Andres, VOGEL, Markus, Leitidee Daten und Zufall ; Von


konkreten Beispielen zur Didaktik der Stochastik, Vieweg+Teubner,
Wiesbaden, 2009

GENARD, Alain, ODROVIC, Michel, Méthodologie de l’enseignement des


sciences économiques, De Boeck, Bruxelles, 1994

GERARD, François-Marie, ROEGIERS, Xavier, Des manuels scolaires pour


apprendre, De Boeck Université, Bruxelles, 2009

GOLDSTEIN, K., in ELLIOT, Andrew J., MOLLER, Arlen C., FRIEDMAN, Ron,
MAIER, Markus A., MEINHARDT, Jörg, Color and Psychological Functioning:
The Effect of Red on Performance Attainment, Journal of Experimental
Psychology, 2007

GOSSIN, Pascale, Le manuel numérique, in BELISLE, Claire, La lecture


numérique : réalités, enjeux et perspectives, Presses de l’ENSSIB, 2004 ;
http://www.educnet.education.fr/dossier/manuel/notions/manuel-scolaire

HUGON, Marie-Anne, Travailler en interdisciplinarité au collège et au lycée:


obstacles et aide, Poitiers, 2002
http://ww3.ac-poitiers.fr/tpi/b2i/documents/pourpilot/interdisciplinarite.pdf

LEBRUN, Johanne, BEDARD, Johanne, HASNI, Abdelkrim, GRENON,


Vincent, Le matériel didactique et pédagogique : soutien à l’approbation ou
déterminant de l’intervention éducative, Les presses de l’Université de Laval,
Saint-Nicolas (Québec), 2006

LEBRUN, Monique, Le manuel scolaire – Un outil à multiples facettes,


Presses de l’université du Québec, 2006

MAGNAN, Claude,
http://www.cefes.umontreal.ca/ressources/guides/Plan_cours/avant.htm, 2003

63
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

PLANE, S., Le manuel, outil d’enseignement, outil d’apprentissages, CRDP


Basse-Normandie, 1999

PRZYBYL, Petra, Élaboration d’un concept permettant d’utiliser les résultats


d’études et de recherches scientifiques réalisées au Luxembourg à des fins
ludiques et pédagogiques – Présentation didactique de ces résultats
permettant ainsi leur intégration dans le cours de sciences économiques et
sociales, Travail de candidature, 2011

RAYNAL, F., RIEUNIER, A., Pédagogie : dictionnaire des concepts clés, ESF,
Paris, 1997

SEGUIN, Roger, L’élaboration des manuels scolaires : Guide méthodologique,


UNESCO, http://www.unesco.org/education/pdf/55_16_f.pdf

SOLDAT, A. S., SINCLAIR, R. C., MARK, M. M., in ELLIOT, Andrew J.,


MOLLER, Arlen C., FRIEDMAN, Ron, MAIER, Markus A., MEINHARDT, Jörg,
Color and Psychological Functioning: The Effect of Red on Performance
Attainment, Journal of Experimental Psychology, 2007

Le Grand Robert sur http://gr.bvdep.com/version-1/gr.asp

http://www.legifrance.gouv.fr/WAspad/UnTexteDeJorf?numjo=MCCB0400545
D

http://www.men.public.lu/sys_edu/postprimaire/index.html

64
Annexes

65
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1. Annexe : Structure de l’enseignement luxembourgeois

67
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Enseignement secondaire

L’enseignement secondaire est dispensé dans les lycées. Dans certains cas, l’enseignement aux
classes inférieures est également offert dans les établissements des lycées techniques.
L’enseignement secondaire comprend 7 années d’études réparties sur deux divisions :

• la division inférieure de 3 années, comportant les classes de septième (7e), de sixième (6e)
et de cinquième (5e);
• la division supérieure de 4 années, comportant une classe polyvalente (classe de quatrième
- 4e) et un cycle de spécialisation (classes de troisième - 3e; classes de deuxième - 2e;
classes de première - 1re).

La division inférieure

La classe de 7e doit permettre à l’élève de s’adapter aux études secondaires. La langue


d’enseignement est l’allemand, sauf pour les mathématiques, qui sont enseignées en français.
L’enseignement des langues comprend le français, l’allemand et le luxembourgeois.
Dans certains lycées, des classes d’allemand renforcé (classes Allet) sont proposés aux élèves qui ont
un niveau suffisant en français et en mathématiques, mais qui présentent des lacunes en allemand.
Deux leçons d’allemand supplémentaires sont offertes en guise de renforcement du cours normal.

À son entrée en classe de 6e, l’élève opte soit pour l’enseignement classique (avec le latin comme
troisième langue) soit pour l’enseignement moderne (avec l’anglais comme 3e langue). Pour les autres
branches, le programme est le même pour les deux régimes. L’élève qui choisit le latin comme troisième
langue commence l’apprentissage de l’anglais en classe de 5e.

La division supérieure

La classe polyvalente (classe de 4e) a pour but la consolidation des savoirs acquis et l’orientation de
l’élève vers une des sept sections du cycle de spécialisation. Le cours de latin mis à part, le programme
est le même pour tous les élèves. Des cours d’initiation (chimie, physique et économie) aident les
élèves à s’orienter vers une des 7 sections de spécialisation à la fin de la classe de 4e.
À la fin de la classe de 4e, le conseil de classe, en collaboration avec le Service de Psychologie et
d’Orientation Scolaires (SPOS), conseille, sous forme d’avis écrit, les élèves dans le choix de leur
spécialisation. Cet avis, élaboré pour chaque élève sur la base de tous les éléments dont disposent le
conseil de classe et le SPOS, constitue une recommandation et n’a pas de caractère contraignant.

La spécialisation des études intervient au niveau de la classe de 3e, où l’élève choisit, en fonction de
ses capacités et de ses intérêts, une des 7 sections proposées, à savoir:

• section A : langues vivantes


• section B : mathématiques et informatique
• section C : sciences naturelles et mathématiques
• section D : sciences économiques et mathématiques
• section E : arts plastiques
• section F : sciences musicales
• section G : sciences humaines et sociales

Les branches spécifiques qui caractérisent les différentes sections prennent une place importante dans
les horaires. L’enseignement de base est complété par des cours à option qui peuvent varier d’un
établissement à l’autre.

À l’élève ayant réussi la classe de 3e est délivré un certificat intermédiaire qui mentionne la réussite de
cinq années d’enseignement secondaire. Le diplôme de fin d’études secondaires est délivré après
l’accomplissement du cycle de spécialisation et après réussite de l’examen de fin d’études secondaires
correspondant.

68
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2. Annexe : Rapport de la CNP-SCIES-ES du 28 juin 2011

69
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

70
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3. Annexe : Modèle du questionnaire d’enquête

71
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

72
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4. Annexe : Synthèse des réponses

1. Utilisez-vous le manuel de « Statistique et probabilités en économie » qui est


actuellement au programme ?

0 toujours 15 partiellement 1 jamais (en classe)

2. Quelles sont les parties que vous utilisez telles-quelles dans le cours ?

Ch. 1 : Eléments de statistique descriptive Ch. 2 : Régression et corrélation

6 explications 4 explications
2 développements mathématiques 3 développements mathématiques
1 illustrations graphiques 3 illustrations graphiques
16 exercices 14 exercices
0 autres : _____________________ 0 autres : _____________________

Ch. 4 : Eléments du calcul des


Ch. 3 : Les nombres-indices
probabilités

6 explications 5 explications
3 développements mathématiques 1 développements mathématiques
1 illustrations graphiques 1 illustrations graphiques
14 exercices 16 exercices
1 autres : aucune 0 autres : _____________________

Ch. 6 : Lois de probabilités


Ch. 5 : Les variables aléatoires
fondamentales

5 explications 4 explications
2 développements mathématiques 2 développements mathématiques
1 illustrations graphiques 0 illustrations graphiques
16 exercices 16 exercices
0 autres : _____________________ 0 autres : _____________________

73
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3. Y a-t-il des parties ou des éléments dont vous jugez un remaniement indispensable ?

11 cours entier
1 statistique descriptive, indices, probabilités
2 interprétation des résultats obtenus, liaison à des statistiques réelles

4. Quelles sont les raisons pour lesquelles vous n’utilisez le manuel que partiellement
ou pas du tout ?

8 données non actualisées 12 explications insuffisantes


5 niveau de complexité trop élevé 9 explications trop compliquées
11 présentation obsolète 2 exercices inadaptés
8 fautes 6 manque de liens avec les cours
d’économie enseignés en 1D

autres : trop d’éléments dans le manuel qui ne figurent pas au programme


variété insuffisante des exercices

Vos commentaires ou critiques :


manuel inadapté aux besoins du cours et du programme
manuel devrait être élaboré de manière plus didactique

5. Quel est le support que vous utilisez à la place du manuel au programme ?

15 notes personnelles 9 extraits d’autres manuels / notes

6. En donnant le cours, quels sont les aspects sur lesquels vous insistez ?

importance :
concepts 12 élevée 3 moyenne 0 faible
développements mathématiques 5 élevée 3 moyenne 7 faible
résolution d’exercices 15 élevée 0 moyenne 0 faible
interprétation des résultats 10 élevée 5 moyenne 0 faible
autres : présentation soignée 1 élevée 0 moyenne 0 faible
autres : liens avec l’économie 1 élevée 0 moyenne 0 faible

74
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

7. Pensez-vous que l’élaboration d’un nouveau manuel est … ?

9 nécessaire 6 souhaitable 1 superflue

8. Dans quels domaines souhaiteriez-vous qu’un nouveau manuel apporte des


améliorations ?

13 explications 3 développements mathématiques


10 illustrations graphiques 13 exercices
11 interdisciplinarité 12 structure
autres : analyse critique des données,
plus grande variété des exercices,
applications pratiques / interprétations

9. Pensez-vous qu’un nouveau cours devrait inclure des éléments nouveaux qui ne
figurent actuellement pas au programme ?

12 relation entre moyenne, médiane et 7 concentration (courbe de Lorenz et


mode (forme de la distribution) indice de Gini)
4 cas particuliers de moyennes (moy. 9 covariance et coefficient de corrélation
arithmétique pondérée, quadratique, linéaire
géométrique, harmonique)
2 coefficient de détermination 1 régression non linéaire
4 arrangements avec répétition 4 théorème de Bayes
2 loi binomiale négative et loi 3 loi de Poisson
géométrique

autres : loi normale


interprétation des résultats

10. Seriez-vous d’accord de lire certaines parties d’un nouveau manuel destiné à
remplacer le manuel actuel et d’en évaluer la qualité (par rapport au manuel actuel) ?

10 non 6 oui partie(s) : _____________________________________________

75
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

11. Pensez-vous que l’utilisation effective d’un nouveau manuel pourrait rendre
l’enseignement de la « Statistique et probabilités » en classe de 1D moins disparate,
évitant ainsi des écarts de notes importants à l’examen ?

8 non 6 oui 2 pas de rép.

12. Selon vous, à quoi doit servir la calculatrice dans le cours de « Statistique et
probabilités » en classe de 1D ?

14 calculs élémentaires (lors de la 12 calcul des permutations, arrangements


résolution des exercices) et combinaisons
7 calcul direct de certaines valeurs 0 autres : _________________________
(valeurs centrales, de dispersion,
régression, …) _________________________

13. Pensez-vous que l’intégration de l’outil informatique (tableur ou programme


spécialisé) dans le cours de « Statistique et probabilités » en classe de 1D
serait … ?

0 nécessaire 4 réalisable
4 pas nécessaire 1 réalisable mais pas souhaitable
1 pas assez de temps 6 pas de réponse

76
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5. Annexe : Extraits du manuel actuellement au programme

77
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

78
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

79
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

80
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

81
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

82
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

83
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

84
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

85
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

86
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

87
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

88
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

89
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

90
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

91
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

92
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

93
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

94
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

6. Annexe : Branches enseignées en classe de 3ème, 2ème et


1ère de la section D de l’enseignement secondaire
luxembourgeois

95
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

96
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

7. Annexe : Programme du cours d’« Economie de gestion »


en classe de 1D

97
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

98
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

99
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

100
II. Partie pratique

101
Statistique et Probabilités

1D

103
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Introduction

1. Le mot « statistique »

Le mot statistique vient du mot italien « statista », signifiant « homme


d’État ». Ainsi, le mot statistique désignait à l’origine « la collecte et
l’évaluation des données concernant un État. Cette science de l’État était une
représentation purement descriptive de faits géographiques et sociaux
comme le climat, la population, les coutumes, les organisations économiques,
etc., à l’usage des hommes d’État »71.

Aujourd’hui, le mot statistique est employé dans un sens beaucoup plus


large. Ainsi, le Robert définit la statistique comme « science et techniques
d’interprétation de données trop complexes et trop nombreuses pour être
appréciées sans calcul ». Elle est ainsi définie en tant que discipline scolaire
ou universitaire. Cependant, une statistique désigne un tableau chiffré ou un
graphique relatif à un ensemble de données relatives à un même phénomène,
ou bien encore une grandeur calculée à partir des données observées et
permettant de résumer les informations contenues dans cet ensemble de
données.

2. Les différentes branches de la statistique

Tout d’abord, avant de pouvoir étudier un phénomène économique,


social, biologique, physique, …, il faut recueillir un ensemble de données à
travers des sondages, observations, mesures, … Ces données doivent
ensuite être traitées, agencées et représentées d’une manière cohérente afin
de pouvoir en tirer des informations et de formuler des interprétations. Ce sont
les instruments de la statistique descriptive (beschreibende Statistik) qui
permettent de réaliser ce travail. La statistique descriptive, qui sera l’objet
d’étude de la première partie de ce cours, est donc constituée d’un ensemble
de méthodes permettant de décrire des données. Cette description peut se

71
LINDENBERG Andreas, WAGNER Irmgard, Statistiques - Les Stats en Bulles, Terminales,
re
Licence 1 année, Pearson Education France, 2007

105
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

faire à travers des tableaux, des graphiques ou le calcul de certaines valeurs


numériques qui résument ou condensent les informations contenues dans le
vaste ensemble des données collectées.

Ces informations peuvent ensuite être utilisées afin d’élaborer des


modèles mathématiques (souvent simplifiés) des phénomènes que l’on veut
étudier. A l’aide de ces modèles, on peut faire des prévisions sur l’évolution
future d’un certain phénomène ou bien analyser les effets probables de
variations de certaines données sur un phénomène, tout en mesurant les
marges d’incertitude liées à ces estimations. Ceci est l’objet de la statistique
mathématique ou inférentielle (Inferenzstatistik). Cette dernière se base sur
les principes du calcul des probabilités (Wahrscheinlichkeitsrechnung), dont
les bases seront étudiées dans la deuxième partie de ce cours. La statistique
inférentielle elle-même ne sera traitée de manière plus approfondie qu’au
cours des études supérieures.

En résumé, on peut donc caractériser la relation entre la statistique


descriptive et la statistique inférentielle comme suit : lors d’une première
étape, on collecte et travaille sur des données réelles à partir desquelles on
construit un modèle mathématique représentatif des faits observés ; ceci
permet ensuite, dans une deuxième étape, de créer des « données »
calculées à l’aide de ce modèle mathématique, qui permet de prévoir ou de
simuler la réalisation de faits probables. Ainsi, on peut par exemple collecter
des informations sur différents faits de la vie économique (exemples : le taux
d’activité, le coût salarial, …) pour déterminer la relation qui existe entre ces
faits et le PIB. Cette relation peut être décrite par un modèle mathématique
que l’on peut ensuite utiliser pour prévoir les effets probables d’un
changement des faits observés sur le PIB. On pourrait ainsi par exemple
estimer les effets probables d’une augmentation du taux de l’assurance
maladie sur le niveau du PIB.

106
Partie I

Éléments de statistique descriptive

107
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 1 : Séries statistiques

1. Notions de base

Avant de pouvoir entamer la présentation, le traitement et l’analyse de


données, nous devons d’abord nous doter d’un certain vocabulaire technique
et de certaines notations propres à la statistique.

1.1. Terminologie

Comme déjà indiqué plus haut, la statistique descriptive a comme objet


le traitement et l’analyse de données. Ces données peuvent concerner
l’ensemble de tous les éléments, encore appelés unités statistiques ou
individus, relatifs au phénomène que l’on veut étudier. L’ensemble
comprenant toutes les unités statistiques est encore appelé la population. En
tant qu’exemples de populations, on peut citer entre autres la population de
tous les élèves de 1D du Luxembourg, la population de tous les salariés du
Luxembourg, la population de toutes les ampoules électriques produites par
une entreprise, … En parlant d’individus, on ne parle donc pas
nécessairement de personnes, mais aussi d’animaux, d’objets, de faits,
d’agrégats économiques, … Il s’agit donc de données que l’on peut
dénombrer et observer. Afin de recueillir des données concernant une
population entière, on procède à un recensement 72 , qui est une étude
réalisée sur l’ensemble des individus d’une population.

Comme il est souvent très couteux ou pratiquement impossible de


recueillir des informations sur une population entière, il faut souvent se
contenter d’étudier un sous-ensemble de la population d’intérêt, encore
appelé échantillon, et d’en tirer ensuite les conclusions utiles sur la
population. Cependant, afin que ces conclusions tirées à partir de l’analyse de
l’échantillon sur la population soient valables, il faut que cet échantillon
présente une structure de caractéristiques similaire à celle de la population

72
« Volkszählung ». Au Luxembourg, un recensement a lieu tous les 10 ans. Le dernier
recensement a eu lieu en 2011, le prochain est donc prévu pour 2021.

109
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

(structure d’âge, de sexe, de profession, de revenu, de religion, …) qu’il est


censé représenter. En d’autres mots, l’échantillon doit être représentatif de la
population que l’on veut étudier. Dans le cas où la collecte de données ne
concerne qu’un échantillon d’une population, on parle de sondage 73 .
Différentes possibilités de constituer un échantillon sont décrites dans la
section suivante.

En collectant des données concernant les individus d’une population ou


d’un échantillon, on s’intéresse à une ou plusieurs variables ou caractères
statistiques. Il s’agit de traits communs à tous les individus. En reprenant
l’exemple de la population des élèves de 1D du Luxembourg, des variables
que l’on pourrait observer concernant ces individus sont entre autres leur
lycée, leur âge, leur sexe, leurs notes en économie politique (ou dans d’autres
branches), leurs notes en application ou en conduite, … A travers cet
exemple, on remarque bien qu’il existe différents types de variables, que nous
allons étudier dans une des prochaines sections. L’ensemble des variables
observées pour un même individu est encore appelé une observation. Dans
la suite du cours74, nous allons nous concentrer sur l’étude d’observations qui
ne sont constituées que d’une seule variable, désignée par le symbole75 x .

En collectant des observations concernant différents individus, on


remarque que les variables observées auront des valeurs différentes d’un
individu à l’autre. On appelle modalités les différentes valeurs que peut
prendre une variable statistique selon les individus. Ces modalités sont
désignées par le symbole xi . Ainsi, en reprenant l’exemple des élèves de 1D

du Luxembourg, si x désigne la variable « note des élèves en économie


politique », alors la variable peut prendre des modalités xi dont les valeurs

sont comprises dans l’intervalle [01 ; 60]. Si chaque modalité comprise entre
01 et 60 a été attribuée à au moins un élève, alors on peut dire x1 = 01, x2 =

73
Il se peut que les individus statistiques ne soient pas des êtres humains, mais des pièces
produites, des données issues de la comptabilité de l’entreprise, … Dans ces cas, la collecte
de données se fait par des prélèvements de pièces, l’analyse des données disponibles, …
74
Au chapitre 2, où nous allons étudier la relation existant entre 2 variables concernant une
même année, la deuxième variable sera désignée par le symbole y .
75
On peut tout aussi bien utiliser d’autres symboles pour désigner les variables d’une
observation.

110
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2, …, x36 = 36 et que x60 = 60. Ainsi, i = 1, 2, …, 60. Par contre au cas où

certaines notes n’ont été attribuées à aucun élève et lorsqu’on décide de


laisser de côté des modalités théoriquement observables mais non observées
en réalité, alors le nombre i de modalités différentes observées est inférieur à
60. Si par exemple les notes 02 et 35 n’ont été attribuées à aucun élève, alors
i = 1, 2, …, 58. Dans ce cas, x3 = 4, x36 = 38 et x58 = 60.

Souvent, une même modalité d’une certaine variable est observée


auprès de plusieurs individus. On entend par effectif statistique ou
fréquence absolue d’une modalité, le nombre d’individus d’une population ou
d’un échantillon dont la modalité de la variable est la même. On note ni

l’effectif de la modalité xi . Ainsi, si la modalité x36 = 36 a été observée auprès

de 39 élèves, alors n36 = 39, avec i = 1, 2, …, 60.

Le nombre total d’individus (et d’observations) d’une population ou d’un


échantillon est appelé effectif total, noté N . En ce qui concerne par exemple
la population d’élèves de 1D du Luxembourg76 N = 326.

De manière générale, on appelle série statistique (à une variable) un


ensemble de K couples ( xi ; ni ) avec i = 1, 2, …, K , où xi est la i ème

modalité de la variable x et ni représente l’effectif ou la fréquence absolue

correspondante. Notons encore qu’en additionnant les effectifs n1 , n2 , …, nK ,


on retrouve l’effectif total N .

1.2. La collecte de données

Si les données à analyser ne sont pas immédiatement disponibles


(données comptables, informations sur les salariés d’une entreprise,
recensements ou sondages précédents, …), il faut procéder à un
recensement ou à un sondage.

Le recensement permet des collecter des données sur l’ensemble des


individus d’une population. Ainsi, l’analyse des données recueillies sur base

76
Selon « Les chiffres clés de l’éducation nationale – Statistiques et indicateurs 2010 –
2011 », MENFP

111
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

d’un recensement permet de fournir les résultats les plus exacts possibles.
Cependant, comme déjà indiqué plus haut, la réalisation d’un recensement
est souvent très coûteuse et nécessite beaucoup de temps, par exemple
lorsqu’il s’agit de populations de grande taille. Un recensement peut aussi
être pratiquement impossible. Ainsi, par exemple, pour étudier la durée de vie
de certains biens de consommation ou de production, comme les ampoules
électriques, les voitures, les machines, …, il est impossible de tester tous les
individus.

Dans les cas où un recensement n’est pas praticable, il faut procéder à


un sondage afin de recueillir des données sur un échantillon de la population.
L’analyse des données de l’échantillon permettra ensuite de tirer, souvent
avec quelques réserves, des conclusions sur la population. Cependant,
comme déjà mentionné ci-dessus, l’échantillon doit être choisi de manière à
ce qu’il soit représentatif de la population. Pour réaliser ceci, le choix des
individus composant l’échantillon, encore appelé méthode
d’échantillonnage, doit se faire de manière appropriée.

Pour effectuer par exemple des tests de qualité ou de durée de vie de


certains biens, la méthode de prélèvement des individus est assez facile à
mettre en œuvre. Dans la plupart des cas, il s’agit tout simplement de choisir
au hasard un certain nombre d’unités produites, en fonction de la taille de la
population. Cette méthode d’échantillonnage probabiliste est appropriée
au cas où les individus de la population présentent des caractéristiques
homogènes.

Néanmoins, en sciences économiques et sociales, les individus de la


population ont souvent des caractéristiques très hétérogènes. Pour réaliser
par exemple des études de marché ou des enquêtes d’opinion, afin d’obtenir
des résultats satisfaisants étant donné que le comportement et les opinions
des individus dépendent souvent de leurs caractéristiques (âge, sexe, revenu,
nationalité, …), il est plus utile d’avoir recours à des méthodes
d’échantillonnage non probabilistes ou empiriques. La méthode
empirique la plus la plus répandue est celle de l’échantillonnage par

112
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

quotas77. Cette méthode consiste à choisir un certain nombre d’individus de


la population de manière à ce que l’échantillon composé par ces individus
présente une structure similaire à celle de la population. Ainsi, si un sondage
sur un certain thème est réalisé au Luxembourg et si pour ce thème les
modalités de la variable à observer sont censées varier d’un individu à l’autre
selon le sexe et l’âge, l’échantillon devrait répondre aux caractéristiques
suivantes :

Répartition dans la Composition de


population78 l’échantillon79

Hommes 49,746 % 249

Femmes 50,254 % 251

Enfants (0 à 14 ans) 17,6 % 88

Âge actif (15 à 64 ans) 68,5 % 343

3ème âge (> 65 ans) 13,9 % 69

Souvent, la répartition jointe de différents critères sur la population est


plus utile. Ainsi, il peut par exemple être nécessaire de connaître les
proportions d’hommes et de femmes à l’intérieur des différentes catégories
d’âge (ce que le tableau précédent ne permet pas de déduire).

Pour les sondages réalisés au Luxembourg, d’autres critères importants


permettant de décomposer la population, à part l’âge et le sexe, sont la
nationalité, le fait d’être actif ou inactif et le lieu de résidence (répartition
géographique). On peut bien encore rajouter d’autres critères comme l’état
civil, le revenu, la composition des ménages, …. Mais il faut noter que plus on
rajoute des critères, plus la construction de l’échantillon devient compliquée,
car il devient de plus en plus difficile de repérer des individus répondant aux

77
pourcentages, proportions
78
Selon « Le Luxembourg en chiffres, 2011 », STATEC, Septembre 2011
79
Pour des questions globales, l’institut TNS-ILRES utilise des échantillons comportant au
moins 500 personnes pour des sondages au Luxembourg, dont la population était d’environ
er
511 800 personnes au 1 janvier 2011.

113
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

caractéristiques requises80. Il va de soi qu’une enquête plus fine ou sur un


échantillon de taille plus grande revient plus chère aux mandants de l’enquête,
ce qui incite ces derniers à limiter le plus possible le nombre de critères et
d’individus compris dans l’échantillon.

Il faut donc encore noter que les données et résultats d’enquêtes


publiées par les médias sont à considérer avec un certain recul étant donné
que l’échantillon peut ne pas être représentatif de la population. Il convient
donc de vérifier si les sources des données sont fiables et si les méthodes
utilisées répondent aux critères de représentativité requis.

1.3. Les différents types de variables (de données)

Les variables observées dans une population ou dans un échantillon


peuvent être regroupées en fonction de leur nature. Ainsi, les variables
peuvent ou bien représenter des qualités des individus observés, ou bien des
quantités.

1.3.1 Les variables qualitatives (ou catégorielles)

Les variables qualitatives reflètent des grandeurs non quantifiables, des


caractéristiques relatives aux individus observés (nationalité, sexe, couleur
des yeux, état civil, …). Dans la plupart des cas, l’individu observé ne peut
être classé que dans une seule modalité de la variable. Par exemple, pour la
variable « état civil », les modalités possibles seraient : célibataire, pacsé,
marié, veuf, divorcé et pour la variable « sexe », les seules modalités sont
masculin et féminin.

On distingue entre variables qualitatives nominales et variables


qualitatives ordinales. Une variable qualitative est dite nominale, si les
différentes catégories ne peuvent pas être ordonnées (sexe, couleur des yeux,
état civil, …) tandis qu’une variable est dite ordinale si les différentes
catégories peuvent être ordonnées (qualité d’un produit : mauvaise, moyenne,
bonne, excellente)

80
L’institut TNS-ILRES réalise ses sondages par téléphone. L’enquêteur, en posant les
questions appropriées, permet de déterminer si l’individu interrogé fera partie de l’échantillon
ou non.

114
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1.3.2 Les variables quantitatives

Les variables quantitatives expriment des grandeurs quantifiables,


pouvant être décrites par des nombres entiers ou réels.

On distingue entre variables quantitatives discrètes, dont les valeurs


numériques prennent exclusivement des nombres entiers (nombre de
personnes, nombre d’enfants à charge d’un ménage) et les variables
quantitatives continues, dont les valeurs numériques peuvent prendre
n’importe quelle valeur à l’intérieur d’un certain intervalle (taille, salaires,
revenus, …).

1.4. Les opérateurs Σ et Π et leurs propriétés

1.4.1 L’opérateur de sommation Σ

La lettre grecque Σ 81 représente un opérateur de sommation qui permet


de simplifier l’écriture de sommes de séries de nombres.

Considérons par exemple la série suivante de N nombres :


x1 , x 2 , ... , x N −1 , x N . La somme x1 + x 2 + ... + x N −1 + x N de ces N nombres peut
N
être réécrite de manière plus condensée sous la forme suivante : ∑x
i =1
i . Cette

expression se lit « somme des valeurs xi , i variant de 1 à N ».

Afin d’illustrer l’utilisation de cette formule, prenons l’exemple de la série


de valeurs suivante :

i 1 2 3

xi 2 4 6

3
Ainsi, ∑x
i =1
i = x1 + x2 + x3 = 2 + 4 + 6 = 12 .

81
Σ : lettre grecque « sigma » majuscule

115
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1.4.2 Propriétés de l’opérateur Σ

Soit une constante a :


N N
a) ∑ axi = a∑ xi ,
i =1 i =1

N
car ∑ ax
i =1
i = ax1 + ax 2 + ... + ax N −1 + ax N

N
= a ( x1 + x 2 + ... + x N −1 + x N ) = a ∑ xi
i =1

N N
b) ∑ (a + xi ) =
i =1
Na + ∑ xi ,
i =1

N
car ∑ (a + x ) = (a + x ) + (a + x ) + ... + (a + x ) + (a + x )
i =1
i 1 2 N −1 N

N
= (a + a + ... + a + a ) + ( x1 + x 2 + ... + x N −1 + x N ) = Na + ∑ xi
144 42444 3 i =1
N fois

Soit la série y1 , y 2 , ... , y N −1 , y N .

N N N
c) ∑ ( xi + y i ) = ∑ x i + ∑ y i ,
i =1 i =1 i =1

N
car ∑ (x i + y i ) = ( x1 + y1 ) + (x 2 + y 2 ) + ... + ( x N −1 + y N −1 ) + ( x N + y N )
i =1

N N
= ( x1 + x 2 + ... + x N −1 + x N ) + ( y1 + y 2 + ... + y N −1 + y N ) = ∑ xi + ∑ y i
i =1 i =1

Remarques :

Soit la série x12 , x 22 , ... , x N2 −1 , x N2 .

N
o La somme des ses éléments s’écrit alors ∑x
i =1
2
i .

2
 N  N
o Attention : ∑ x ≠  ∑ xi  2
i
i =1  i =1 

116
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Soient les séries x1 , x 2 , ... , x N −1 , x N et y1 , y 2 , ... , y N −1 , y N .

o La somme x1 y1 + x 2 y 2 + ... + x N −1 y N −1 + x N y N s’écrit en écriture condensée


N
comme ∑x y
i =1
i i .

N
o Attention : ∑x y
i =1
i i ne correspond pas au produit des sommes des

N N N
éléments des deux séries : ∑ xi y i ≠
i =1
∑ xi ⋅ ∑ y i
i =1 i =1

o De même :
N

∑y i N
yi
o i =1
N
≠ ∑x
∑x
i =1
i
i =1 i

N N

∑ xi y i
i =1
∑y i =1
i
o N
≠ N

∑x
i =1
2
i ∑x i =1
i

2
 N  N N N
o  ∑ xi y i  ≠ ∑ xi2 yi2 ≠ ∑ xi2 ⋅ ∑ yi2
 i =1  i =1 i =1 i =1

1.4.3 L’opérateur de multiplication Π


82
La lettre grecque Π représente un opérateur de multiplication,
permettant de simplifier l’écriture de produits de séries de nombres.

Considérons par exemple la série suivante de N nombres :


x1 , x 2 , ... , x N −1 , x N . Le produit x1 ⋅ x 2 ⋅ ... ⋅ x N −1 ⋅ x N de ces N nombres peut être
N
réécrit de manière plus condensée sous la forme suivante : ∏x i =1
i . Cette

expression se lit « produit des valeurs xi , i variant de 1 à N ».

82
Π : lettre grecque « pi » majuscule

117
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Remarque :

Afin de faciliter les calculs, il est souvent pratique de transformer ce


produit en une somme en procédant à la transformation suivante :

 N 
ln ∏ xi  = ln( x1 ⋅ x 2 ⋅ ... ⋅ x N −1 ⋅ x N )
 i =1 
N
= ln x1 + ln x 2 + ... + ln x N −1 + ln x N = ∑ ln x
i =1
i

N
On retrouve finalement ∏x
i =1
i à l’aide de la transformation suivante :

N
 N 
∏ x i = exp ∑ ln xi 
i =1  i =1 

Comme nous n’allons pas rencontrer cet opérateur très souvent dans ce
cours, nous renonçons ici à insister sur ses propriétés.

2. Présentation de séries statistiques à une variable sous


forme de tableau

2.1. Variables qualitatives

Pour représenter une variable qualitative à l’aide d’un tableau, on


indique, pour chaque modalité de la variable, l’effectif y correspondant.
L’exemple suivant permet d’illustrer le cas de la variable qualitative nominale
« état civil » et de ses différentes modalités.

Le recensement de la population du Luxembourg de l’année 2001 a


fourni les résultats suivants concernant l’état civil :

118
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Nombre de
État civil
personnes

célibataire 185256

marié(e) 202252

divorcé(e) 22219

veuf(ve) 28026

sans indication 1786

population totale : 439539


Source : www. statec.public.lu

2.2. Variable quantitatives

2.2.1 Variables discrètes

La représentation sous forme de tableau des variables quantitatives


discrètes se fait de manière analogue à celle des variables qualitatives. Pour
chaque modalité de la variable, on indique l’effectif y correspondant.
L’exemple suivant illustre le cas de la variable « nombre d’enfants de moins
de 15 ans dans le ménage83 », dont les modalités ne peuvent prendre que
des valeurs entières :

Nombre d'enfants âgés Nombre de


de moins de 15 ans ménages

0 125069

1 22315

2 18234

3 5259

4 925

5 et plus 151

nombre total de ménages: 171953


Source : www. statec.public.lu

83
selon le recensement de la population du Luxembourg de l’année 2001

119
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.2.2 Variables continues

Bien que les variables continues puissent prendre toute valeur réelle,
prenons un exemple fictif, afin d’illustrer leur traitement.

Considérons les notes obtenues par 20 élèves d’une classe de 1D en


économie politique :

50 08 20 31 16

42 22 36 52 26

34 45 16 38 30

26 42 36 20 42

Présentées sous cette forme, les notes ne se prêtent guère à une


interprétation de la performance des élèves. Il convient donc de réaménager
les données afin de mieux en pouvoir tirer des informations.

a) Présentation selon l’effectif (ou bien : fréquence absolue) (ni )

Une possibilité pour mieux présenter ces 20 données est de les répartir
sur différentes classes (ou intervalles) de longueur (ou amplitude) égale et
d’indiquer pour chaque classe le nombre de notes y comprises, c'est-à-dire,
son effectif ni .

La répartition des notes sur 6 classes d’amplitude 10 mène à la


présentation suivante84,85 :

84
Pour des raisons de simplification, on néglige le fait qu’il est impossible d’obtenir une note
égale à 0.
85
Tuyau : Lorsque vous résolvez des exercices, commencez à tracer vos tableaux toujours le
plus à gauche possible afin de disposer d’assez de place pour rajouter des colonnes !

120
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Notes Nombre d’élèves


i
xi ni

1 [0 ; 10[ 1

2 [10 ; 20[ 2

3 [20 ; 30[ 5

4 [30 ; 40[ 6

5 [40 ; 50[ 4

6 [50 ; 60] 2
6
Total : ∑n
i =1
i = 20 = N

On remarque la somme des effectifs ni de chaque classe est égale à

l’effectif total N .

Remarque :

Bien qu’on n’ait pas procédé de la manière pour des raisons de


simplification, pour déterminer le nombre K de classes sur lesquelles il s’agit
de répartir les N observations, on peut avoir recours à la formule suivante :

ln N
2K ≥ N ⇔ K ≥
ln 2

où K est un entier naturel.

b) Présentation selon la fréquence relative ( f i )

Souvent, on s’intéresse à une présentation des observations qui


apparaît plus indépendante de la taille de l’échantillon. Il convient alors
d’exprimer les données sous forme de pourcentages. Ceci est souvent utile
lorsqu’il s’agit de tirer des conclusions sur une population à partir des
informations fournies par l’analyse d’un échantillon. Afin de réaliser cette
transformation des effectifs en fréquences relatives, on divise l’effectif ni de

chaque classe par l’effectif total N afin d’obtenir les fréquences relatives f i

correspondantes.

121
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

ni ni
fi = K
=
N
∑n
i =1
i

Notons quelques propriétés de f i :

o 0 ≤ fi ≤ 1

K
o ∑f
i =1
i =1

La série transformée des notes se présente alors comme suit :

Notes Nombre d’élèves Fréquence relative

xi ni fi

[0 ; 10[ 1 0,05

[10 ; 20[ 2 0,1

[20 ; 30[ 5 0,25

[30 ; 40[ 6 0,3

[40 ; 50[ 4 0,2

[50 ; 60] 2 0,1


6 6
Total : ∑ ni = 20 = N
i =1
∑f
i =1
i =1

Remarque :

Les fréquences peuvent aussi être calculées pour les différentes


modalités des variables qualitatives ou quantitatives discrètes.

3. Représentation graphique de séries statistiques à une


variable

3.1. Variables qualitatives et variables quantitatives discrètes

La représentation graphique de variables qualitatives et de variables


quantitatives discrètes se fait souvent sous forme de diagrammes en bâtons
ou de diagrammes circulaires. Le diagramme en bâtons est le plus souvent
utilisé pour visualiser les effectifs de chaque modalité, tandis que les

122
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

diagrammes circulaires permettent de mieux illustrer l’importance d’une


certaine modalité par rapport à l’effectif total. Afin d’illustrer les deux cas,
reprenons les données de l’exemple précédant concernant l’état civil des
ménages luxembourgeois :

Diagramme en bâtons

250000

202252
nombre de personnes

200000 185256

150000

100000

50000 28026
22219
1786
0
célibataire marié(e) divorcé(e) veuf(ve) sans indication
état civil

Diagramme circulaire

6% 0%
5%
célibataire
marié(e)
42% divorcé(e)
veuf(ve)
sans indication

47%

Pour illustrer la représentation graphique d’une variable quantitative


discrète, reprenons les données de l’exemple concernant le nombre d’enfants
de moins de 15 ans dans les ménages luxembourgeois :

123
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Diagramme en bâtons

140000
125069
120000
nombre de ménages

100000

80000

60000

40000
22315
18234
20000
5259
925 151
0
0 1 2 3 4 5 et plus
nombre d'enfants de moins de 15 ans

On remarque que cette représentation est quasiment identique à celle


de la variable qualitative illustrée plus haut. Par conséquent, la représentation
sous forme de diagramme circulaire se fera de manière analogue.

Finalement, on peut noter que pour chacun des deux types de variables
représentés ci-dessus, il est possible de transformer les effectifs
correspondant à chaque modalité en fréquences relatives dans le but de
construire un diagramme en bâtons par fréquence relative, représentant les
données initiales sous forme de pourcentages.

3.2. Variables quantitatives continues

Dans le cas de variables continues, la représentation graphique


ponctuelle 86 des effectifs pour chaque modalité isolée n’est plus possible,
étant donné que les modalités peuvent prendre n’importe quelle valeur réelle
à l’intérieur d’un certain intervalle. En admettant pour simplifier que les
effectifs soient répartis de manière homogène sur la longueur des intervalles,
ils doivent par conséquent être représentés par des surfaces rectangulaires.
Le graphique résultant de la réunion des rectangles représentant les effectifs
de chaque classe est appelé « histogramme » des effectifs.

86
bâton au dessus d’un point précis de l’axe des abscisses

124
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

a) Histogramme et polygone des effectifs

L’histogramme des effectifs est un graphique qui représente chaque


effectif ni par une surface d’aire S i = ai ⋅ hi , où ai est l’amplitude de la classe

et hi la hauteur du rectangle. Il faut donc déterminer d’abord la hauteur hi

des rectangles de l’histogramme, connaissant l’effectif ni et l’amplitude ai .

S i ni
hi = =
ai ai

Reprenons la série des notes de 20 élèves en économie politique afin de


déterminer les hauteurs hi des différents rectangles :

Notes Nombre d’élèves Amplitudes des classes Hauteurs des rectangles


xi ni ai hi
[0 ; 10[ 1 10 0,1
[10 ; 20[ 2 10 0,2

[20 ; 30[ 5 10 0,5

[30 ; 40[ 6 10 0,6


[40 ; 50[ 4 10 0,4

[50 ; 60] 2 10 0,2


6
Total : ∑n
i =1
i = 20 = N

L’histogramme des effectifs se présente alors comme suit :

125
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Histogramme des effectifs

0,7
0,6

0,5
0,4
hi
0,3
0,2

0,1
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Remarquons que la surface totale de l’histogramme des effectifs


correspond à l’effectif total N :

K K

∑ S i = ∑ ni = N
i =1 i =1

Le polygone des effectifs se construit à partir de l’histogramme, en


joignant les milieux des bases supérieures des rectangles (donc les points de
coordonnées (ci ; hi ) où ci correspond au centre de la i ème classe) de

l’histogramme par des lignes, de manière à ce que la surface en dessous du


polygone des effectifs corresponde à la surface totale de l’histogramme.

Pour que l’aire du polygone corresponde effectivement à l’aire de


l’histogramme, il faut commencer à tracer le polygone à partir du milieu d’une
classe (fictive) d’amplitude ai précédant la première classe (donc au point

de coordonnées (c0 ; 0 ) , c0 étant le centre de la classe (fictive) précédant la

première classe).

( )
En ce qui concerne le dernier K ème rectangle, il faut relier le milieu de
sa base supérieure (point (cK ; hK ) ) au milieu d’une classe (fictive) d’amplitude
ai suivant la dernière classe (point (cK +1; 0) ).

126
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Le graphique complet aura alors l’allure suivante :

Histogramme et polygone des effectifs

0,7
0,6

0,5
0,4
hi
0,3
0,2

0,1
0
-5 0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Remarques :

Il se peut que les observations soient regroupées en classes


d’amplitudes différentes (ai ≠ a j ) . Illustrons ce cas sur base des mêmes notes

obtenues par les élèves de 1D en économie politique, mais réparties sur des
intervalles correspondant aux « mentions » à obtenir lors de l’examen de fin
d’études secondaires :

Hauteurs des
Notes Nombre d’élèves Amplitudes des classes
rectangles
xi ni ai
hi

[0 ; 30[ 8 30 8/30 = 0,2 6

[30 ; 36[ 3 6 3/6 = 0,5

[36 ; 40[ 3 4 3/4 = 0,75

[40 ; 48[ 4 8 4/8 = 0,5

[48 ; 52[ 1 4 1/4 = 0,25

[52 ; 60] 1 8 1/8 = 0,125


6
Total : ∑n
i =1
i = 20

127
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Dans ce cas, l’histogramme des effectifs prend une forme plus


particulière :

Histogramme des effectifs

0,8
0,7
0,6
0,5
hi 0,4
0,3
0,2
0,1
0
0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
notes xi

De plus, la construction du polygone des effectifs se fait de manière


différente. Il faut d’abord déterminer le plus grand commun diviseur (pgcd)
des amplitudes des différentes classes. Pour notre exemple, le pgcd de 30, 6,
4 et 8 vaut 2. Ensuite, il faut subdiviser chacune des classes en sous-classes
fictives d’amplitude égale au pgcd trouvé. Le polygone des effectifs sera alors
tracé en fonction des milieux de ces sous-classes fictives.

Il faut donc commencer à tracer le polygone à partir du milieu d’une


classe (fictive) d’amplitude 2 précédant la première classe. Le point de
départ a donc comme coordonnées (− 1; 0) , -1 étant le centre de la classe
(fictive) précédant la première classe. Ce point doit être relié au point de
coordonnées (1; 0,2 6 ) correspondant au milieu de la deuxième classe fictive
d’amplitude 2. Ensuite, on relie ce deuxième milieu fictif au point de
( )
coordonnées 3; 0,2 6 , représentant le 3ème milieu fictif et ainsi de suite.

128
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Le graphique correspondant aura alors l’allure suivante :

Histogramme et polygone des effectifs

0,8
0,7
0,6
0,5
hi 0,4
0,3
0,2
0,1
0
-4 0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
notes xi

Remarque :

Afin de faciliter la construction des histogrammes à la main, il convient


d’exprimer la hauteur des classes en fonction d’une même échelle ou en
fonction de l’amplitude d’une certaine classe, choisie comme amplitude de
base.

Reprenons les données de l’exemple précédent et exprimons les


hauteurs en dixièmes :

Notes Nombre d’élèves Amplitudes des classes Hauteurs des rectangles

xi ni ai hi

[0 ; 30[ 8 30 8/30 = 2, 6 /10

[30 ; 36[ 3 6 3/6 = 5/10

[36 ; 40[ 3 4 3/4 = 7,5/10

[40 ; 48[ 4 8 4/8 = 5/10

[48 ; 52[ 1 4 1/4 = 2,5/10

[52 ; 60] 1 8 1/8 = 1,25/10


6
Total : ∑n
i =1
i = 20

129
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La construction de l’histogramme (à la main) peut être facilitée en fixant,


par exemple, la graduation de l’axe des ordonnées de manière à ce que 1 cm
= 1/10 :

Histogramme des effectifs

8/10
7/10
6/10
5/10
hi 4/10
3/10
2/10
1/10
0
0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
notes xi

b) Histogramme et polygone des fréquences relatives

De manière analogue à l’histogramme des effectifs, l’histogramme des


fréquences relatives représente chaque fi par une surface d’aire S i = ai ⋅ hi ,

où ai est l’amplitude de la classe et hi la hauteur du rectangle. Il faut donc de

nouveau déterminer d’abord la hauteur hi des rectangles de l’histogramme

des fréquences relatives.

Si f
hi = = i
ai ai

130
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Reprenons la série concernant les notes de 20 élèves en économie


politique afin de déterminer les hauteurs hi des différents rectangles :

Fréquences Amplitudes des Hauteurs des


Notes Nombre d’élèves
relatives classes rectangles
xi ni ai hi
fi

[0 ; 10[ 1 0,05 10 0,005

[10 ; 20[ 2 0,1 10 0,01

[20 ; 30[ 5 0,25 10 0,025

[30 ; 40[ 6 0,3 10 0,03

[40 ; 50[ 4 0,2 10 0,02

[50 ; 60] 2 0,1 10 0,01


6 6
Total : ∑n
i =1
i = 20 = N ∑f
i =1
i =1

L’histogramme des fréquences relatives se présente alors comme suit :

Histogramme des fréquences relatives

0,035
0,03

0,025
0,02
hi
0,015
0,01

0,005
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Remarquons que la surface totale de l’histogramme des fréquences


relatives est égale à 1 :
K K

∑ Si = ∑ fi = 1
i =1 i =1

131
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Remarques :

Dans le cas où les observations sont regroupées en classes


d’amplitudes différentes (ai ≠ a j ) , il faut de nouveau adapter les hauteurs hi

des rectangles aux amplitudes ai qui y correspondent. L’histogramme des

fréquences relatives aura alors l’allure suivante :

Histogramme des fréquences relatives

0,04
0,035
0,03
0,025
hi 0,02
0,015
0,01
0,005
0
0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
notes xi

Le polygone des fréquences relatives est construit de manière analogue


à celle décrite au point a).

On peut encore noter que, dans ce cas précis, l’aire en dessous du


polygone des fréquences (donc l’aire de l’histogramme) mesurée entre deux
notes xi et x j différentes donne le pourcentage de notes comprises entre ces

deux notes.

c) Polygones des effectifs cumulés

Il existe deux types de polygones des effectifs cumulés, à savoir le


polygone des effectifs cumulés croissants et le polygone des effectifs cumulés
décroissants.

Avant de pouvoir construire ces deux polygones, il faut d’abord établir


les séries des effectifs cumulés croissants et décroissants de la série
statistique :

132
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Effectifs cumulés Effectifs cumulés


87
Notes Nombre d’élèves croissants décroissants
i i
xi ni
∑n
j =1
j N − ∑ n j −1
j =1

[0 ; 10[ 1 1 20

[10 ; 20[ 2 3 19

[20 ; 30[ 5 8 17

[30 ; 40[ 6 14 12

[40 ; 50[ 4 18 6

[50 ; 60] 2 20 2
6
Total : ∑n
i =1
i = 20 = N

Dans ce cas précis, l’effectif cumulé croissant relatif au i ème intervalle


indique le nombre de notes strictement inférieures à la valeur de la borne
supérieure de l’intervalle en question.

L’effectif cumulé décroissant relatif au i ème intervalle indique le nombre


de notes supérieures ou égales à la valeur de la borne inférieure de
l’intervalle en question.

A titre d’exemple, les effectifs cumulés relatifs au 3ème intervalle


indiquent que 8 élèves ont une note strictement inférieure à 30 et 17 élèves
ont une note supérieure ou égale à 20.

Le polygone des effectifs cumulés croissants se construit en reliant les


points ayant comme abscisse les bornes supérieures de chaque intervalle et
comme ordonnée les effectifs cumulés croissants qui y correspondent, tout en
commençant par le point ayant comme abscisse la borne inférieure du
premier intervalle et comme ordonnée 0 :

87
on suppose que n0 = 0

133
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Polygone des effectifs cumulés croissants

25

20
eff. cum. croiss.

15

10

0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Cette courbe permet, pour une note quelconque, d’indiquer de manière


approximative le nombre de notes qui y sont inférieures.

Le polygone des effectifs cumulés décroissants se construit en reliant


les points ayant comme abscisse les bornes inférieures de chaque intervalle
et comme ordonnée les effectifs cumulés décroissants qui y correspondent (le
dernier point a comme abscisse la borne supérieure du dernier intervalle et
comme ordonnée 0) :

Polygone des effectifs cumulés décroissants

25

20
eff. cum. décroiss.

15

10

0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

134
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Cette courbe permet, pour une note quelconque, d’indiquer de manière


approximative le nombre de notes qui y sont supérieures.

Remarque :

La présence de classes à amplitudes inégales ne change rien à la


procédure de construction des polygones des effectifs cumulés.

d) Polygones des fréquences relatives cumulées

Les polygones des fréquences relatives cumulées se construisent de


manière analogue à celle décrite ci-dessus, concernant les polygones des
effectifs cumulés. Il faut donc tout d’abord établir les séries des fréquences
cumulées croissantes et décroissantes de la série statistique :

Fréquences Fréquences
Fréquences cumulées cumulées
Notes Nombre d’élèves 88
relatives croissantes décroissantes
xi ni i i
fi

j =1
fj 1 − ∑ f j −1
j =1

[0 ; 10[ 1 0,05 0,05 1

[10 ; 20[ 2 0,1 0,15 0,95

[20 ; 30[ 5 0,25 0,4 0,85

[30 ; 40[ 6 0,3 0,7 0,6

[40 ; 50[ 4 0,2 0,9 0,3

[50 ; 60] 2 0,1 1 0,1


6 6
Total : ∑n
i =1
i = 20 = N ∑f
i =1
i =1

L’interprétation des fréquences cumulées croissantes se fait de manière


analogue à celle des effectifs cumulés croissants, la seule différence est
qu’elle se fait en pourcentages. Ainsi, à titre d’exemple, les fréquences
cumulées relatives au 3ème intervalle indiquent que 40 % des élèves ont une
note strictement inférieure à 30 et 85 % des élèves ont une note supérieure
ou égale à 20.

88
on suppose que f0 = 0

135
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Les polygones des fréquences relatives cumulées se construisent aussi


de manière analogue à celle décrite au point c). Représentés sur un même
graphique, les deux polygones se présentent comme suit :

Polygones des fréquences relatives cumulées


croissantes et décroissantes

1,1
1
0,9
croiss. et décr.
fréq. rel. cum.

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Ces courbes permettent, pour une note quelconque, d’indiquer de


manière approximative le pourcentage de notes qui y sont inférieures,
respectivement le pourcentage de notes qui y sont supérieures.

4. Les valeurs de localisation et de dispersion et les mesures


de concentration

Les séries statistiques sont surtout utilisées pour faire des comparaisons
de certaines caractéristiques de populations dans l’espace ou dans le temps.

Cependant, les séries statistiques sont souvent basées sur les


observations relatives à un nombre très élevé d’individus (effectif total N
grand). Afin de pouvoir effectuer des comparaisons de séries statistiques, il
est nécessaire de résumer les informations qu’elles contiennent au moyen de
certaines valeurs précises. Parmi ces valeurs, on distingue les « valeurs de
localisation » (ou bien « valeurs centrales »), les « valeurs de dispersion » et
les mesures de concentration.

136
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4.1. Les valeurs de localisation (ou bien : valeurs centrales)

Ces valeurs permettent de décrire de manière résumée la « partie


centrale » de séries statistiques, ce qui facilite la comparaison rapide de
séries différentes.

4.1.1 Le mode ( M o , la dominante)

a) Variables qualitatives et variables quantitatives discrètes

Dans le cas de variables qualitatives ou de variables quantitatives


discrètes, on appelle mode la valeur de la variable correspondant à l’effectif le
plus élevé.

b) Variables quantitatives continues

En ce qui concerne les variables quantitatives continues, il s’agit plutôt


de déterminer la classe modale. De manière générale, on choisit comme
ni
classe modale celle qui présente le rapport le plus élevé.
ai

Dans le cas d’une série statistique continue subdivisée en classes de


même amplitude, la classe modale correspond par conséquent à celle
présentant l’effectif le plus élevé. On choisit souvent le centre de la classe
modale en tant que valeur modale.

Notes Nombre d’élèves

xi ni

[0 ; 10[ 1

[10 ; 20[ 2

[20 ; 30[ 5

classe modale  [30 ; 40[ 6

[40 ; 50[ 4

[50 ; 60] 2
6
Total : ∑n
i =1
i = 20 = N

137
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La note modale est donc de 35 points.

Au cas où il s’agit d’une série continue subdivisée en classes à


amplitudes différentes, il faut choisir comme classe modale celle qui présente
ni
le rapport le plus élevé.
ai

Amplitudes
Notes Nombre d’élèves ni
des classes
xi ni ai
ai

[0 ; 30[ 8 30 8/30 = 0,26

[30 ; 36[ 3 6 3/6 = 0,5

classe modale  [36 ; 40[ 3 4 ¾ = 0,75

[40 ; 48[ 4 8 4/8 = 0,5

[48 ; 52[ 1 4 ¼ = 0,25

[52 ; 60] 1 8 1/8 = 0,125


6
Total : ∑n
i =1
i = 20

La note modale serait donc de 38 points dans ce cas.

Remarques :

On remarque donc qu’une subdivision en classes d’amplitudes autres


que celles choisies en haut mène à une note modale différente, étant donné
que le centre de la classe modale peut ne pas être le même dans chaque cas.
Ainsi, sur base des mêmes 20 notes en économie politique, selon les
amplitudes des classes choisies, on trouve des notes modales différentes.
Bien que la détermination du mode soit très facile, il présente le grand
désavantage d’être dépendant de la répartition des valeurs sur les différents
intervalles, comme on peut facilement le remarquer ci-dessus.

Le mode peut ne pas être unique (classes à amplitudes et effectifs


égaux).

138
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4.1.2 La médiane (M e )

La médiane est la valeur de la variable qui partage la série statistique en


deux parties de taille égale (taille = N /2). De manière simplifiée, on peut dire
que la médiane est la valeur qui laisse 50 % des observations à sa gauche et
50 % des observations à sa droite.

a) Variables quantitatives discrètes

Afin de pouvoir déterminer la médiane d’une série statistique discrète, il


faut tout d’abord arranger les modalités de manière croissante.

Ensuite, il faut distinguer deux cas :

  N − 1   ème
o si l’effectif N est impair, la médiane correspond à la    + 1
 2  
observation ;

o si l’effectif N est pair, la médiane correspond à la moyenne arithmétique


N N 
simple de la   ème et de la  + 1 ème observation.
2 2 

Reprenons en tant qu’exemple les notes isolées obtenues par 20 élèves


en économie politique :

08 16 16 20 20 22 26 26 30 31 34 36 36 38 42 42 42 45 50 52
 N  ème  20 
  observation =   ème obs. = 10ème obs. = 31
2  2 

N  ème  20  ème
 + 1 observation =  + 1 obs. = 11ème obs. = 34
2   2 

31 + 34
Me = = 32,5 points
2

Dans ce cas précis, la note médiane de 32,5 points est telle que 10
élèves (la moitié, 50 %) ont une note qui y est inférieure et 10 élèves ont une
note qui y est supérieure.

139
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b) Variables quantitatives continues

Afin de pouvoir déterminer la médiane d’une série statistique continue


groupée en classes, il faut d’abord établir l’effectif cumulé croissant
correspondant à chacune des classes. Ensuite, il faut déterminer la classe
médiane (ou bien : l’intervalle médian), c'est-à-dire, la classe comprenant la
N
valeur associée à la   ème observation, c'est-à-dire la valeur de la variable
2
qui partage la série statistique en deux parties de tailles égales. Illustrons la
détermination de la classe médiane à travers la série des 20 notes en
économie politique :

Notes Nombre d’élèves Effectif cumulé


croissant
xi ni

[0 ; 10[ 1 1

[10 ; 20[ 2 3

[20 ; 30[ 5 8
N
[30 ; 40[ 6 14  effectif cumulé croissant ≥ = 10
2
[40 ; 50[ 4 18

[50 ; 60] 2 20

6
Total : ∑n
i =1
i = 20

N 20
Comme = = 10 , et que 10 est encadré par les valeurs 8 et 14 de
2 2
l’effectif cumulé croissant, nous savons que l’intervalle [30 ; 40[ correspond à
la classe médiane. La médiane est donc comprise entre 30 et 40.

Le polygone des effectifs cumulés croissants ci-dessous permet de


visualiser la notion de médiane. Dans ce cas précis, la médiane correspond à
la note qui partage l’effectif total ( N = 20) en deux parties de tailles égales à
10 notes. On peut donc parler dans ce cas ci de la « note médiane ».

140
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Polygone des effectifs cumulés croissants

24
22
20
18
16
eff. cum.

14
croiss.

12
10
8
6
4
2
0
0 10 20 30 Me 40 50 60 70
notes xi

Afin de déterminer la valeur médiane de manière plus précise, nous


procédons comme suit. Sur le polygone des effectifs cumulés croissants ci-
dessus, nous voyons que la valeur de la médiane correspond à l’abscisse du
N 20
point ayant comme ordonnée = = 10 et se trouvant sur le segment de
2 2
droite délimité par les points de coordonnées (30 ; 8) et (40 ; 14). Nous
14-8
voyons aussi que la valeur de la pente de ce segment est égale à .
40-30

A partir de ce même graphique, nous voyons encore que la valeur de la


pente du segment de droite délimité par les points de coordonnées (30 ; 8) et
N
-8
N 10-8
( Me ; = 10 ) est égale à 2 = .
2 M e -30 M e -30

En outre, on constate clairement que la valeur de la pente de ce


segment de droite est la même que la valeur de la pente du segment délimité
par les points de coordonnées (30 ; 8) et (40 ; 10).

141
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Comme les valeurs des deux pentes sont égales, nous pouvons établir
10-8 14-8
l’égalité suivante : = . En transformant cette égalité, nous
M e -30 40-30
pouvons déterminer la valeur exacte de la médiane :

 40 − 30 
M e = 30 + (10 − 8)  = 33, 3 points
 14 − 8 

La note médiane est donc telle que 50 % des élèves ont obtenu une
note inférieure à 33, 3 points et que 50 % des élèves ont obtenu une note

supérieure à 33, 3 points. Le graphique suivant permet de bien vérifier les


calculs :

Polygone des effectifs cumulés croissants

24
22
20
18
16
eff. cum.
croiss.

14
12
10
8
6
4
2
0
0 10 20 30 33,33 40 50 60 70
notes xi

A partir de l’expression précédente, essayons ensuite de dégager une


formule générale permettant de calculer la médiane. Pour faire ceci,
définissions d’abord les symboles suivants :

o xinf est la limite inférieure de la classe médiane ;

o xsup est la limite supérieure de la classe médiane ;

o yinf est l’effectif cumulé croissant correspondant à la classe précédant la


classe médiane ;

142
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N
o est la moitié de l’effectif total ;
2

o ysup est l’effectif cumulé croissant correspondant à la classe médiane.

Dans l’exemple précédent, ces symboles prenaient les valeurs


suivantes :

N
xinf = 30 xsup = 40 yinf = 8 = 10 ysup = 14
2

En remplaçant les valeurs par leurs symboles respectifs dans la formule


 40 − 30 
M e = 30 + (10 − 8)  , nous trouvons la formule générale suivante :
 14 − 8 

N  xsup − xinf 
M e = xinf +  − yinf  
2  ysup − yinf 

Le graphique ci-dessous permet de visualiser cette formule :

Polygone des effectifs cumulés croissants

24
22
20
18
16
eff. cum.

14 ysup
croiss.

12
10
8 yinf
6
4
2 xinf xsup
0
0 10 20 30 Me 40 50 60 70
notes xi

Remarques :

La médiane est utilisée par de nombreux instituts de statistique pour


déterminer le seuil de pauvreté monétaire inhérent à la population d’une
certaine région ou d’un certain pays. Ainsi, au Luxembourg, le seuil de risque

143
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

de pauvreté est défini comme le revenu équivalent à 60 % du revenu médian


des ménages.

La médiane peut tout aussi bien être déterminée sur base des
N
fréquences relatives cumulées croissantes, en remplaçant la valeur de par
2
0,5 (50 % de l’effectif total) et en substituant dans les symboles yinf et ysup les

valeurs des fréquences relatives cumulées croissantes encadrant la valeur


0,5.

La médiane présente l’avantage de ne pas dépendre de valeurs


aberrantes (exagérément basses ou hausses) de la variable.

On peut aussi déterminer graphiquement la médiane en traçant les


courbes des effectifs (ou des fréquences relatives) cumulés croissants et
décroissants. La médiane correspond alors à l’abscisse du point d’intersection
des deux courbes.

Polygones des effectifs cumulés croissants et


décroissants

25
eff. cum. croissants

20
et décroissants

15

10

0 33,33
0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

La médiane, en la reportant sur l’histogramme des effectifs


(respectivement des fréquences relatives), divise ce dernier en deux parties
d’aires égales, représentant chacune la moitié des effectifs (respectivement
50 % des valeurs de la variable).

144
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Histogramme des effectifs

0,9
0,8
0,7
0,6
0,5
hi
0,4
0,3
0,2
0,1
0 33,33
-5 0 5 10 15 20 25 30 35 40 45 50 55 60 65
notes xi

Remarquons encore que, comme on suppose que les modalités soient


réparties de manière homogène sur la longueur des intervalles et comme on
ne connaît donc plus les valeurs exactes de la variable, on ne peut donner
qu’une approximation de la médiane qui était de 32,5 points au point a), où on
l’a calculée sur base des valeurs exactes.

4.1.3 La moyenne arithmétique simple (x )

a) Variables quantitatives discrètes

La moyenne arithmétique simple, notée x , de N valeurs isolées se


calcule de la manière suivante :

x1 + x 2 + ... + x N 1 N
x=
N
=
N
∑x
i =1
i

Afin d’illustrer ce cas, considérons la série des 20 notes (isolées)


obtenues en économie politique comme une série de variables discrètes.
Dans ce cas, la moyenne des 20 notes se calcule comme suit :

1
x= (50 + 08 + 20 + ... + 36 + 20 + 42) = 31,6
N

145
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b) Variables quantitatives continues

En présence d’une série statistique continue comprenant N valeurs


réparties sur K classes, le calcul de la moyenne se fait sur base des centres
de classe ci et de l’effectif ni de chaque classe

K
1
x=
N
∑nc
i =1
i i

Calculons ensuite la moyenne des notes obtenues en économie


politique, groupées en classes :

Notes Nombre d’élèves Centre de classe


ni ci
xi ni ci

[0 ; 10[ 1 5 5

[10 ; 20[ 2 15 30

[20 ; 30[ 5 25 125

[30 ; 40[ 6 35 210

[40 ; 50[ 4 45 180

[50 ; 60] 2 55 110

6 6
Total : ∑ ni = 20
i =1
∑nc
i =1
i i = 660

660
x= = 33
20

Étant donné que les fréquences relatives f i de chaque classe

ni
correspondent à , la moyenne peut encore se calculer de la manière
N
suivante :

K
x = ∑ f i ci
i =1

Remarques :

Tout comme pour la médiane, pour des données groupées en classes,


la moyenne ne peut être déterminée que de manière approximative, étant

146
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

donné que l’on ne connaît pas les valeurs exactes de la variable (la moyenne
trouvée au point a) était de 31,6 points).

La moyenne arithmétique simple présente, contrairement à la M e , le

désavantage d’être dépendante de valeurs aberrantes.

c) Propriétés de la moyenne arithmétique simple

1. La somme des écarts entre les N observations xi d’une série statistique et

leur moyenne x est égale à 0.

Démonstration :
N N N
1
∑ (xi − x ) = ∑ xi − Nx = N ⋅ ∑ xi = Nx − Nx = 0
i =1 i =1 N i =1
1 4243 1
42 43
voir propriété b) =x
de l'opérateur Σ

Notons que cette propriété reste valable pour des séries statistiques
continues groupées en K classes.

2. La somme des carrés des écarts entre les N observations xi d’une série

statistique et un nombre quelconque xo est minimale lorsque xo = x .

Démonstration :
N
Posons S = ∑ ( xi − xo )
2

i =1

Afin de minimiser l’expression S , prenons d’abord sa dérivée première89


par rapport à xo :

 N  N
S ' = 2 ∑ ( xi − x0 )(− 1) = −2∑ ( xi − x0 )
 i =1  i =1

Ensuite, nous allons annuler S ' pour trouver la valeur de xo pour

laquelle S atteint un extremum :

∑ (x − x ) N termes ( xi − x0 )
89 2 2
Dériver l’expression i 0 revient à calculer les dérivées des
i =1
avec i = 1, 2, … N et d’additionner ensuite ces dérivées.

147
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N N
− 2∑ ( xi − xo ) = 0 ⇔ ∑ (x − x ) = 0
i o
i =1 i =1

 N 
En considérant la propriété (1)  ∑ ( xi − x ) = 0  , nous pouvons conclure
 i =1 
qu’une solution possible à l’équation précédente est xo = x .

Comme la dérivée seconde de S est toujours strictement positive


(S ' ' = 2 ) , on peut finalement conclure que la solution xo = x minimise

l’expression S .

d) Calcul de la moyenne arithmétique simple par changement d’origine


et d’échelle

En fonction de l’ordre de grandeur des valeurs de la variable d’une série


statistique continue, il peut s’avérer utile de transformer la série statistique
dans le but d’alléger les calculs de la moyenne. Afin de réaliser cette
transformation, on a recours à ce que l’on appelle un « changement d’origine
et d’échelle ». Il s’agit ici tout simplement d’une transformation linéaire des
différents centres de classe ci , ce qui entraîne que leur moyenne x subira la

même transformation linéaire.

A partir des centres de classe ci , nous allons créer une nouvelle série

de valeurs dont les éléments sont notés zi et que nous obtenons en

retranchant de chaque ci un nombre quelconque x0 et en divisant ce résultat

par un certain paramètre a (a et x0 ∈ R ) . Les nombres a et x0 sont choisis en

fonction des caractéristiques des données90. La série simplifiée devient alors :


ci − x0
zi = . On peut donc dire que cette transformation linéaire des ci permet
a
de « centrer et de réduire » la série statistique.

Ensuite, on calcule la moyenne des données transformées z à travers


les formules usuelles. A partir de la moyenne z de la série transformée, on

90
x0 peut par exemple correspondre au centre de la classe modale, de la classe
Le nombre
centrale ou de la classe médiane et le paramètre a peut par exemple correspondre à
l’amplitude d’une des classes.

148
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

peut facilement trouver la moyenne de la série initiale x . Comme on sait que


la moyenne des données observées x subit la même transformation que les
x − x0
observations, on peut en tirer que z = . En retransformant cette
a
expression, on peut trouver x à travers l’expression suivante : x = az + x0

Reprenons les données de l’exemple précédent avec x0 = 35 et a = 10

Centre de
Notes Nombre d’élèves
classe ni ci zi ni zi
xi ni ci
[0 ; 10[ 1 5 5 -3 -3

[10 ; 20[ 2 15 30 -2 -4

[20 ; 30[ 5 25 125 -1 -5

[30 ; 40[ 6 35 210 0 0

[40 ; 50[ 4 45 180 1 4

[50 ; 60] 2 55 110 2 4

6 6 6
Total : ∑ ni = 20
i =1
∑ nici = 660
i =1
∑nz
i =1
i i = −4

−4
z= = −0,2
20

x = x0 + az = 35 + 10 ⋅ (− 0,2 ) = 35 − 2 = 33 points

4.1.4 Cas particuliers de moyennes

a) La moyenne arithmétique pondérée ( xw )

Dans le calcul de la moyenne arithmétique simple, on attribue un poids


1
(ou bien : une importance) identique égal à à chacune des N
N
observations. Cependant, on peut juger utile d’attribuer des poids wi (weights)

différents à certaines observations, en fonction de leur importance ou de la


fiabilité des données.

La moyenne arithmétique pondérée notée (de N observations discrètes)


xw se calcule alors comme suit :

149
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N
1
xw =
W
∑w x
i =1
i i

N
avec ∑w
i =1
i =W

Ce type de moyenne est par exemple utilisé pour calculer la moyenne


annuelle pondérée des notes d’un élève, où on attribue des poids différents
aux différentes branches.

b) La moyenne quadratique Q 2 ( )
Le calcul de la moyenne quadratique est utile lors de la détermination de
certaines « valeurs de dispersion », comme par exemple la variance ou l’écart
type (voir point 4.2.).

Pour une série statistique discrète à N observations, la moyenne


quadratique se calcule comme suit :
N
1
Q2 =
N
∑x
i =1
2
i

ou bien :

N
1
Q=2
N
∑x
i =1
2
i

Pour une série statistique continue, groupée en K classes de centre ci

et d’effectif ni , la moyenne quadratique est déterminée par la formule

suivante :

K
1
Q2 =
N
∑n c
i =1
2
i i

ou bien :

K
1
Q=2
N
∑n c
i =1
2
i i

ou bien, en utilisant les fréquences relatives :

150
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

K
Q = ∑ f i ci2
2

i =1

ou bien :

K
Q=2 ∑fc
i =1
2
i i

c) La moyenne géométrique (G )

La moyenne géométrique est surtout utilisée lors du calcul de taux de


croissance moyens, du calcul de moyennes de coefficients multiplicateurs ou
bien lorsque la série statistique observée présente une évolution
exponentielle (dans ce cas, l’utilisation de la moyenne arithmétique peut
mener à des conclusions/résultats bizarres). La moyenne géométrique nous
sera utile au cours du chapitre 3, traitant le calcul des indices.

La moyenne géométrique d’une série statistique composée de N


observations est calculée à l’aide de la formule suivante :

N
G = N x1 ⋅ x2 ⋅ ... ⋅ xN = N ∏ xi
i =1

Afin de faciliter les calculs, on procède à une linéarisation de cette


formule à travers une transformation logarithmique :

1 1 1
ln G = ln N x1 ⋅ x2 ⋅ ... ⋅ xN = ln x1 + ln x2 + ... + ln x N
N N N
N
1
= (ln x1 + ln x2 + ... + ln xN ) = 1 ∑ ln x i
N N i =1

Dans le cas d’une série continue à K classes de centres ci et d’effectifs

ni , la formule s’écrit comme suit :

N
G = N c1n1 ⋅ c2n2 ⋅ ... ⋅ cKnK = N ∏ cini
i =1

La transformation logarithmique mène ensuite à la formule suivante :


n1 n n
ln G = ln N c1n1 ⋅ c2n2 ⋅ ... ⋅ cknk = ln c1 + 2 ln c2 + ... + K ln cK
N N N

151
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

K
1
= (n1 ln c1 + n2 ln c2 + ... + nK ln cK ) = 1 ∑ ni ln ci
N N i =1
Illustrons le calcul de cette moyenne à travers un exemple simplifié.

Sur les 3 dernières années, le CHIDA d’une entreprise a augmenté de


10 %, puis de 20 % et finalement de 40 %. Quel est l’accroissement annuel
moyen du CHIDA de cette entreprise ?

3
1,1 ⋅ 1,2 ⋅ 1,4 ≈ 1,2272
Le taux de croissance annuel moyen du CHIDA de cette entreprise est
donc de 22,72 %.

d) La moyenne harmonique (H )

La moyenne harmonique est utilisée pour calculer des moyennes de


rapports ou de pourcentages (exemples : vitesses moyennes, productivités
horaires moyennes du travail, rendements moyens de la terre, taux de
change moyens, …). En outre, cette moyenne sera utilisée lors du calcul des
indices au chapitre 3.

Pour une série statistique de N observations, elle se calcule d’après la


formule suivante :

1 N
H= N
= N
1 1 1
N
∑x
i =1
∑x
i =1
i i

Souvent, on utilise l’inverse de cette formule, plus facile à manipuler


1
pour calculer d’abord , ce qui permet ensuite de déterminer H :
H

1 1 N 1
= ∑
H N i =1 xi
Illustrons l’utilisation de cette moyenne à travers un exemple concret.

Pour un certain trajet, on fait 30 km/h en moyenne à l’aller et 60 km/h en


moyenne au retour. Quelle a été la vitesse moyenne de l’aller et du retour ?

152
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

 
1 1  1 1  3 1
= + = =
H 2  30 km 60 km  120 km 40 km
 
 h h  h h
Ainsi, H = 40 km/h91.

4.1.5 Valeurs centrales et symétrie d’une série statistique

La forme de l’histogramme d’une série statistique peut révéler des


informations sur la distribution des observations. Sur base de trois séries de
données unimodales, dont l’effectif total de 80 est à chaque fois réparti sur 7
classes d’amplitude 10, nous allons dégager une relation empirique entre les
valeurs des principales valeurs centrales, à savoir le mode, la médiane et la
moyenne arithmétique simple. La relation y dégagée permet de rendre
compte de la symétrie de la distribution des observations.

série statistique symétrique


ci ni
2,5
5 5

15 10 2
25 15
1,5
35 20 hi
1
45 15

55 10 0,5

65 5 0
5 15 25 35 45 55 65
M o = 35
xi
M e = 35
x = 35
Mo = Me = x

91
Supposons que le trajet soit de 60km. On a donc besoin de 2h pour l’aller et de 1h pour le
retour, en total donc 3h pour 120km, ce qui fait une moyenne de 120km/3h = 40km/h.

153
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

série statistique asymétrique à gauche


ci ni
2,5
5 12

15 23 2
25 17
1,5
35 12 hi
1
45 8

55 5 0,5

65 3 0
5 15 25 35 45 55 65
M o = 15
xi
M e = 22,94
x = 26
Mo < Me < x

série statistique asymétrique à droite


ci ni
2,5
5 3

15 5 2

25 8
1,5
35 12 hi
1
45 17

55 23 0,5

65 12 0
5 15 25 35 45 55 65
M o = 55
xi
M e = 47,09
x = 44
Mo > Me > x

On remarque donc que pour une série asymétrique, la moyenne toute


seule est une mesure insuffisante pour résumer les caractéristiques de la
série. Dans bon nombre de cas (séries de revenus, richesse, …), il faut bien

154
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

tenir compte de ce fait, étant donnée que la répartition des valeurs se fait
souvent de manière inégale autour de la moyenne.

Appliquons encore les notions vues ci-dessus à la distribution des notes


des 20 élèves en économie politique. Nous savons que M o = 35, M e = 33, 3

et que x = 33. Comme M o > M e > x , nous pouvons en conclure que la série

est très légèrement asymétrique à droite.

4.2. Les valeurs de dispersion

Pour mieux pouvoir comparer la structure (c’est-à-dire la répartition des


observations à l’intérieur) de différentes séries statistiques, on a recours aux
« valeurs de dispersion ».

4.2.1 Les quantiles (q p )

A côté de la médiane, on peut s’intéresser à d’autres valeurs qui


partagent l’effectif d’une série statistique en sous-ensembles comprenant
p %, respectivement (100 − p ) % de l’effectif.

Ainsi, on définit le quantile q p comme la valeur de la variable qui laisse

p % de l’effectif total à sa gauche et (100 − p ) % à sa droite.

En distinguant différentes valeurs de p , on peut définir :

o les quartiles

p = 25 q25  premier quartile


p = 50 q 50  deuxième quartile = la médiane
p = 75 q 75  troisième quartile

o les déciles

p = 10 q10  premier décile


p = 20 q 20  deuxième décile  premier quintile
p = 30 q 30  troisième décile
p = 40 q 40  quatrième décile  deuxième quintile
p = 50 q 50  cinquième décile = la médiane
p = 60 q 60  sixième décile  troisième quintile

155
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

p = 70 q 70  septième décile
p = 80 q80  huitième décile  quatrième quintile
p = 90 q 90  neuvième décile

o les centiles (ou percentiles)

p =1 q1  premier centile
p =2 q2  deuxième centile

p = 50 q 50  cinquantième centile = la médiane

p = 99 q 99  dernier centile

Les quantiles sont déterminés de manière analogue à la médiane.


Déterminons, à titre d’exemple, le 3ème quartile (q75 ) de la série des notes en

économie politique. Dans ce cas, q75 est la note telle que 75 % des élèves

(ou bien : 0,75 N élèves) ont une note qui y est inférieure et 25 % ont une
note qui y est supérieure.

Appliquons donc une formule similaire à celle utilisée lors du calcul de la


médiane :

 xsup − xinf 
q75 = xinf + (0,75 N − yinf ) 
y −y 
 sup inf 
où :

o xinf est la limite inférieure de la classe comprenant la valeur de la


variable associée à la (0,75 N ) ème observation (respectivement la valeur
de la variable associée à la fréquence cumulée de 0,75) ;

o xsup est la limite supérieure de la classe en question ;

o yinf est l’effectif cumulé croissant correspondant à la classe précédant la


classe en question ;

o ysup est l’effectif cumulé croissant correspondant à la classe en question.

Les valeurs à remplacer dans la formule ci-dessus peuvent être


déterminées à l’aide du tableau suivant :

156
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Notes Nombre d’élèves Effectif cumulé


croissant
xi ni

[0 ; 10[ 1 1

[10 ; 20[ 2 3

[20 ; 30[ 5 8

[30 ; 40[ 6 14
 effectif cumulé croissant ≥ 0,75N = 15
[40 ; 50[ 4 18

[50 ; 60] 2 20

6
Total : ∑n
i =1
i = 20

Comme 0,75 N = 0,75 ⋅ 20 = 15 , l’intervalle [40 ; 50[ correspond à classe


comprenant la (0,75 N ) ème observation. Ainsi, les autres symboles de la
formule énoncée ci-dessus seront à remplacer par les valeurs suivantes :

xinf = 40 xsup = 50 yinf = 14 ysup = 18

 50 − 40 
On trouve alors que q75 = 40 + (15 − 14 )  = 42,5 points. On peut
 18 − 14 
donc dire que 75 % des notes sont inférieures à 42,5 points et que 25 % des
notes y sont supérieures.

De manière analogue, le 1er quartile (q25 ) de la série des notes en

 30 − 20 
économie politique vaut q25 = 20 + (5 − 3)  = 24, ce qui signifie que
 8−3 
25 % des notes sont inférieures à 24 points et que 75 % des notes y sont
supérieures.

Remarques :

Certains quantiles, comme par exemple les déciles ou les quintiles, sont
souvent utilisés par les instituts de statistique pour évaluer la distribution des
revenus dans une région ou un pays et de rendre compte ainsi des inégalités
de revenus ou sociales. Dans une optique similaire, certains quantiles sont
utilisés pour calculer d’autres valeurs de dispersion comme par exemple
l’écart interquartile ou le rapport interdécile.

157
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Les quartiles peuvent être utiles afin de déterminer le degré de symétrie


d’une série. Ainsi, le statisticien anglais Udny Yule a développé un coefficient
basé sur q25 , M e et q75 , permettant de mesurer le degré d’asymétrie d’une

série statistique. Ce coefficient se calcule d’après la formule suivante :

cY =
(q75 − M e ) − (M e − q25 )
(q75 − M e ) + (M e − q25 )
Le coefficient peut prendre différentes valeurs selon les distances
séparant les différents quartiles :

o si (q75 − M e ) = (M e − q25 ) , c'est-à-dire, si (q75 − M e ) − (M e − q25 ) = 0, alors

cY = 0 et la série est distribuée de manière symétrique ; en effet les


intervalles contenant chacun 25 % de l’effectif total situés de part et
d’autre de la médiane sont de longueurs égales ;

o si (q75 − M e ) > (M e − q25 ) , c'est-à-dire, si (q75 − M e ) − (M e − q25 ) > 0, alors

cY > 0 et la série est distribuée de manière asymétrique à gauche ;


l’intervalle contenant les 25 % de l’effectif total situés à droite de la
médiane est plus long que l’intervalle contenant les 25 % de l’effectif
total situés à gauche de la médiane ; ainsi les colonnes de
l’histogramme devraient apparaître plus hautes à gauche de la médiane
qu’à droite de la médiane ;

o si (q75 − M e ) < (M e − q25 ) , c'est-à-dire, si (q75 − M e ) − (M e − q25 ) < 0, alors

cY < 0 et la série est distribuée de manière asymétrique à droite ;


l’intervalle contenant les 25 % de l’effectif total situés à droite de la
médiane est plus court que l’intervalle contenant les 25 % de l’effectif
total situés à gauche de la médiane ; ainsi les colonnes de
l’histogramme devraient apparaître plus hautes à droite de la médiane
qu’à gauche de la médiane ;

On peut encore noter que la valeur de cY est toujours comprise entre -1


et 1. En effet, si q75 ≈ M e , alors cY ≈ -1 et lorsque q25 ≈ M e , alors cY ≈ 1.

158
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Notons que ce coefficient ne constitue pas une mesure très précise de la


symétrie d’une série statistique, étant donné qu’il ne considère que la moitié
centrale des observations, distribuées à parts égales autour de la médiane.

Afin de simplifier les calculs, la formule précédente peut être


transformée. On obtient alors la formule suivante92 :

cY =
(q25 + q75 − 2M e )
(q75 − q25 )
Appliquons encore cette formule à la série des notes de 20 élèves en
économie politique. Nous savons que q25 = 24, M e = 33, 3 et que q75 = 42,5.

En introduisant ces valeurs dans la formule de cY , nous obtenons

cY =
(24 + 42,5 − 2 ⋅ 33,3 ) = -0,009. Nous constatons donc une très légère
(42,5 − 24 )
asymétrie à droite (comme nous l’avions déjà remarqué à la section 4.1.5.).

4.2.2 L’écart interquartile (eiq ) 93

L’intervalle ou écart interquartile est la distance entre le troisième et le


premier quartile. Il mesure la longueur de l’intervalle qui contient 50 % des
valeurs de la variable, réparties en deux parties égales autour de la médiane.

eiq = q75 − q25

Quant à notre exemple des notes en économie politique, eiq = q75 − q25 =
42,5 – 24 = 18,5 points. Cela signifie que la note la plus faible des 25 % des
notes les plus élevées est de 18,5 points supérieure à la meilleure note des
25 % des notes les plus faibles. On peut donc dire en même temps que les
25 % des élèves ayant obtenu les meilleures notes ont au moins 18,5 points
de plus que les 25 % des élèves ayant les notes les plus basses.

92
Remarquons que cette formule fait apparaître l’intervalle interquartile (voir section 4.2.2.)
au dénominateur.
On peut aussi calculer un écart interdécile q90 − q10 ou un écart interquintile q80 − q20 .
93

159
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4.2.3 Le rapport interdécile (rid ) 94

Pour mesurer l’inégalité de la distribution d’une variable, on peut calculer


le rapport entre le 9ème et le 1er décile.
q90
rid =
q10

Ce rapport est souvent utilisé pour mesurer des inégalités de revenu.


Dans ce cas, le rid est le rapport entre le revenu maximal des 10 % des
ménages les plus pauvres et le revenu minimal des 10 % des ménages les
plus riches. En d’autres mots, le rid permet d’exprimer le niveau de vie
minimal des 10 % des ménages les plus aisés en un pourcentage du niveau
de vie maximal des 10 % des ménages les moins favorisés.

4.2.4 La variance (σ x2 )

a) Définition et formules

La variance est la moyenne arithmétique simple des carrés des écarts


des valeurs xi de la variable à la moyenne x (ou bien : c’est la moyenne

quadratique des écarts des valeurs xi du caractère à la moyenne x )

Selon la nature de la série statistique, la variance se calcule comme suit :

o série discrète à N valeurs95 :

1 N
1 N
 2
σ = ∑ (x − x) ∑x
2
2
x i = 2
i −x
N i =1 N i =1 

94 q75 q
On peut aussi calculer un rapport interquartile ou un rapport interquintile 80 .
q25 q20
Appliqué à la série des notes de 20 élèves en économie politique, le rapport interquartile est
ème
de 1,7708 ce qui veut dire que la note du 15 élève (note minimale des 25 % des élèves
ayant les notes les plus élevées) est de 77,08 % supérieure à (ou bien : vaut 1,7708 fois)
ème
celle du 5 élève (note maximale des 25 % des élèves ayant les notes les plus basses).
95
Voici les étapes intermédiaires menant à l’expression simplifiée de la formule de σ x2 :

∑ (xi − x ) = ∑ (xi2 − 2 xi x + x 2 ) =
N N N
1 1 1 1 N 1 N 2
∑ xi2 + ∑ − + ∑
2
2 xi x x
N i =1 N i =1 N i =1 N i =1
14243 1 N i =1
424 3
N 1
1
−2 x ∑
N i=1
x i = −2 x 2 =
N
⋅ Nx 2 = x 2
1
424 3
x

160
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o série continue à N valeurs, groupées en K classes de centre ci :

1 K
1 K 
σ = ∑ ni (ci − x ) =  ∑ ni ci2  − x 2
2 2
x
N i =1  N i =1 

ou bien, en utilisant les fréquences relatives :


K
 K

σ x2 = ∑ f i (ci − x ) =  ∑ fi ci2  − x 2
2

i =1  i =1 

Afin de calculer la variance, il convient d’établir d’abord la série ni ci2 .

Illustrons le calcul de la variance sur base des notes des 20 élèves en


économie politique :

Centre de
Notes Nombre d’élèves
classe
ci2 ni ci2
xi ni ci

[0 ; 10[ 1 5 25 25

[10 ; 20[ 2 15 225 450

[20 ; 30[ 5 25 625 3125

[30 ; 40[ 6 35 1225 7350

[40 ; 50[ 4 45 2025 8100

[50 ; 60] 2 55 3025 6050

6 6
Total : ∑ ni = 20
i =1
∑nc
i =1
2
i i = 25100

x = 33  x 2 = 1089
 1 
σ x2 =  25100  − 1089 = 166
 20 

b) Calcul de la variance par changement d’origine et d’échelle

Les raisons pour effectuer un changement d’origine et d’échelle pour


calculer la variance sont identiques à celles citées plus haut, lors du calcul de
la moyenne. Ainsi, nous allons d’abord calculer la variance de la série
1 K 
transformée : σ z2 =  ∑ ni zi2  − z 2 .
 N i =1 

161
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Le calcul de la variance des notes des 20 élèves en économie politique


par changement d’origine et d’échelle se fait sur base des données du
tableau suivant :

Centre de
Notes Nombre d’élèves
classe
zi zi2 ni zi2
xi ni ci

[0 ; 10[ 1 5 -3 9 9

[10 ; 20[ 2 15 -2 4 8

[20 ; 30[ 5 25 -1 1 5

[30 ; 40[ 6 35 0 0 0

[40 ; 50[ 4 45 1 1 4

[50 ; 60] 2 55 2 4 8

6 6
Total : ∑ ni = 20
i =1
∑n z
i =1
2
i i = 34

z = − 0,2  z 2 = 0,04

 1 
σ z2 =  34  − 0,04 = 1,66
 20 

Pour déterminer la variance de la série initiale σ x2 à partir de la variance

de la série transformée σ z2 , nous devons d’abord trouver la relation qui existe


entre ces deux variances. Afin de réaliser ceci, remplaçons zi et z par leurs

xi − x0 x − x0 1 K
 2
expressions respectives
a
et
a
dans σ z2 = 
N
∑nz
i =1
2
i i  − z . En

1 2
développant l’expression trouvée, nous constatons finalement que σ z2 = σx .
a2
De ceci, nous pouvons déduire que σ x2 = a 2σ z2 .

Ainsi, comme a = 10, σ x2 = 10 2 σ z2 = 100 ⋅ 1,66 = 166

162
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4.2.5 L’écart type (σ x )

a) Définition et formules

L’écart type est la racine carrée positive de la variance :

σ x = σ x2

L’écart type mesure la dispersion des valeurs xi de la variable autour de

la moyenne arithmétique simple x :

o si σ x est faible, la concentration des xi autour de x est forte (les xi

sont proches de x ) ;

o si σ x est élevé, la concentration des xi autour de x est faible.

b) Ecart type, dispersion et concentration

Illustrons l’utilité de cette notion importante à travers trois séries


statistiques symétriques96 et identiques en ce qui concerne leur effectif total et
leurs valeurs centrales mode, médiane et moyenne arithmétique :

1er cas :
4,5
ci ni 4
5 5 3,5
3
15 10
2,5
hi
25 15 2
1,5
35 20
1
45 15 0,5
55 10 0
5 15 25 35 45 55 65
65 5
xi
M o = 35

M e = 35 σ x = 15,8114
x = 35

96
Notons que la notion d’écart type s’applique aussi dans le cadre de distributions non
symétriques. Les distributions symétriques n’ont été choisies que pour faciliter l’illustration.

163
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2ème cas :
4,5
ci ni 4
5 0 3,5
3
15 8
2,5
hi
25 18 2
1,5
35 28
1
45 18 0,5
55 8 0
5 15 25 35 45 55 65
65 0
xi
M o = 35

M e = 35 σ x = 11,1803
x = 35

3ème cas :
4,5
ci ni 4
5 0 3,5
3
15 0
2,5
hi
25 20 2
1,5
35 40
1
45 20 0,5
55 0 0
5 15 25 35 45 55 65
65 0
xi
M o = 35

M e = 35 σ x = 7,0711
x = 35

On remarque donc que plus les observations sont concentrées autour


de la moyenne, plus la valeur de l’écart type diminue.

c) La « cloche gaussienne »

Une série statistique distribuée sous forme de « cloche gaussienne » est


une série statistique continue, distribuée de manière symétrique autour de la

164
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

moyenne x 97. De manière générale, la représentation graphique d’une telle


série prend l’allure suivante :

hi

xi

Une telle distribution est encore appelée « distribution normale », étant


donné qu’un grand nombre de phénomènes de la vie quotidienne comme par
exemple la taille des adultes dans une population, le quotient intellectuel, le
degré d’usure de pneus après une même distance, … se présentent, au
moins approximativement, sous cette forme.

Si une série statistique est distribuée sous forme d’une cloche


gaussienne, alors on peut dire, de manière générale que

o l’intervalle [x − σ x ; x + σ x ] contient 2/3 de l’effectif total ;

o l’intervalle [x − 2σ x ; x + 2σ x ] contient environ 95 % de l’effectif total ;

o l’intervalle [x − 3σ x ; x + 3σ x ] contient quasiment la totalité de l’effectif, à 1

ou 2 % près.

Illustrons ces propriétés à l’aide de la série statistique symétrique


suivante :

97
avec x = Mo = Me (voir point 4.1.5. ci-dessus)

165
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3,5
ci ni
3
5 1
2,5
15 6 2
hi
25 17 1,5
35 32 1

45 17 0,5

55 6 0
5 15 25 35 45 55 65
65 1
xi
M o = 35

M e = 35 σ x = 11,1803
x = 35

Transformons ensuite l’histogramme afin de faire apparaître le polygone


des effectifs :

3,5
3
2,5
2
hi
1,5
1
0,5
0
-5 5 15 25 35 45 55 65 75
xi

Cette représentation repose sur l’hypothèse de la distribution homogène


des effectifs à l’intérieur de chaque intervalle. En levant cette hypothèse (un
peu irréaliste) la représentation graphique prendra l’allure suivante :

166
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3,5
3
2,5
2
hi
1,5
1
0,5
0
-5 5 15 25 35 45 55 65 75
xi

On remarque donc que le polygone des effectifs est une représentation


approximative d’une courbe dont l’allure est très proche d’une cloche
gaussienne. Vérifions ensuite les propriétés énoncées plus haut :

o l’intervalle [x − σ x ; x + σ x ] = [23,8197 ; 46,1803] contient environ 66,26 %

de l’effectif total ;

o l’intervalle [x − 2σ x ; x + 2σ x ] = [12,6394 ; 57,3606] contient environ

93,54 % de l’effectif total ;

o l’intervalle [x − 3σ x ; x + 3σ x ] = [1,4591 ; 68,5409] contient environ

99,63 % de la totalité de l’effectif.

4.2.6 Le coefficient de variation (cv )

Afin de comparer la dispersion de séries statistiques exprimées en


unités de mesure différentes, il convient d’avoir recours au coefficient de
variation, qui s’exprime en tant que rapport (pourcentage) de l’écart type à la
moyenne :

σx
cv =
x

Il permet de quantifier l’importance des écarts des modalités d’une


variable par rapport à leur moyenne. Un faible pourcentage de l’écart type par
rapport à la moyenne arithmétique simple indique donc que la population

167
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

étudiée est assez homogène (peu de dispersion par rapport à la moyenne, ce


qui permet de dire que cette dernière est bien représentative). Dans le cas
contraire, la population est considérée comme hétérogène (grande dispersion
par rapport à la moyenne). De manière générale, on considère qu’un cv
inférieur à 15 % indique une bonne homogénéité des données.

Calculons le cv pour les trois séries à moyennes identiques x = 35 de


la section précédente, pour lesquelles nous avons déjà calculé σ x :

1er cas : 2ème cas : 3ème cas :

15,8114 11,1803 7,0711


cv = = 0,4518 cv = = 0,3194 cv = = 0,202
35 35 35

On remarque donc bien que la série la plus dispersée est la moins


homogène et vice versa98.

Le cv peut par exemple être utilisé pour comparer des disparités


salariales, de revenu, de richesse, … entre différents pays ou entre
différentes époques.

4.2.7 Autres valeurs de dispersion

a) L’étendue ( ét ; ou bien : l’intervalle de variation)

Pour des données classées de manière croissante


(x1 ≤ x2 ≤ ... ≤ xN −1 ≤ xN ) , l’étendue correspond à la différence (la distance)

entre la dernière modalité de la variable et la première modalité de la variable :

ét = x N − x1

Si les données ne sont pas classées de manière croissante, l’étendue


est la différence entre les valeurs maximale et minimale de la série statistique :

ét = xmax − xmin

Pour notre exemple, ét = 52 – 8 = 44

98
En calculant la valeur du cv pour la série des 20 notes en économie politique, on trouve
que cv = 0,3904. La classe est donc assez hétérogène.

168
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Pour des séries statistiques groupées en classes, l’étendue correspond


à la différence entre la borne supérieure de la dernière classe et la borne
inférieure de la première classe, ce qui donnerait une étendue de 60 – 0 =
60 points.

On remarque par conséquent que l’étendue présente les inconvénients


de dépendre excessivement des valeurs extrêmes et qu’elle ne peut être
déterminée de manière précise que pour des séries discrètes.

b) L’écart moyen absolu (emoy )

L’écart moyen absolu est la moyenne arithmétique simple des valeurs


absolues des écarts des modalités par rapport à leur moyenne x .

Selon la nature de la série statistique, il se calcule comme suit :

o série discrète à N observations :

N
1
emoy =
N
∑ x −x
i =1
i

o série continue à K classes de centre ci :

K K
1
emoy =
N
∑ ni ci − x = ∑ fi ci − x
i =1 i =1

c) L’écart médian absolu (emed )

L’écart médian absolu est la moyenne arithmétique simple des valeurs


absolues des écarts des observations xi par rapport à M e .

Selon la nature de la série statistique, il se calcule comme suit :

o série discrète à N observations :

N
1
emed =
N
∑ x − Me
i =1
i

o série continue à K classes de centre ci :

K K
1
emed =
N
∑ ni ci − Me = ∑ fi ci − Me
i =1 i =1

169
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4.3. Les mesures de concentration

Les notions de dispersion et de concentration sont très proches comme


elles concernent toutes les deux la répartition des données. Les mesures de
concentration sont souvent utilisées en sciences économiques ou sociales
afin de rendre compte des inégalités dans la distribution des revenus, des
salaires, de la fortune, de la surface agricole détenue ou exploitée, etc.

Prenons donc un exemple simplifié issu d’un de ces domaines afin


d’illustrer la détermination et l’interprétation de certaines mesures de
concentration.

4.3.1 La courbe de concentration (ou bien : courbe de Lorenz)

Considérons la série de données suivante, concernant la distribution des


salaires (en €) xi parmi les 500 salariés d’une certaine entreprise :

cumf i mi cumfmi
fmi =
xi ni ci fi i
mi = ni ci 6 i
=∑ fj ∑m i = ∑ fm j
j =1 i =1 j =1

[2 500 ; 3 500[ 12 3 000 0,024 0,024 36000 0,0123 0,0123

[3 500 ; 4 500[ 31 4 000 0,062 0,086 124000 0,0424 0,0547

[4 500 ; 5 500[ 123 5 000 0,246 0,332 615000 0,2104 0,2651

[5 500 ; 6 500[ 216 6 000 0,432 0,764 1296000 0,4434 0,7085

[6 500 ; 7 500[ 92 7 000 0,184 0,948 644000 0,2203 0,9288

[7 500 ; 8 500[ 26 8 000 0,052 1 208000 0,0712 1


6 6 6 6

Total : ∑ ni =
i =1

i =1
fi = ∑ mi =
i =1
∑ fm
i =1
i =
500 1 2 923 000 1

Pour construire la courbe de concentration, nous devons d’abord établir


des séries additionnelles de données :

o la série mi = ni ci qui représente dans ce cas précis la masse salariale


relative à chacune des différentes classes de salaires ;

170
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

mi
o la série fmi = 6
qui représente alors les masses salariales relatives,
∑m
i =1
i

c’est-à-dire la part (le pourcentage) que la masse salariale d’une


certaine classe de salariés occupe dans la masse salariale totale ;
i
o la série cumfmi = ∑ fm j qui représente le cumul des masses salariales
j =1

relatives.

La courbe de concentration se construit en reportant en abscisse les


fréquences cumulées cumf i et en ordonnée les cumuls des masses salariales

relatives cumfmi qui y correspondent, tout en partant du point de coordonnées

(0 ; 0). Le graphique, qui s’inscrit par conséquent dans une sorte de carré,
aura l’allure suivante :

Courbe de Lorenz

1
0,9
0,8
0,7
0,6
cumfmi

0,5
0,4
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
cumfi

Ce graphique comporte, en plus de la courbe de Lorenz, un segment de


droite liant les points de coordonnées (0 ; 0) et (1 ; 1) ; il s’agit donc d’un
segment de droite appartenant à la première bissectrice. Ce segment sert à
nous faciliter l’interprétation du graphique :

171
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o une courbe de concentration proche de la première bissectrice indique


une faible concentration des salaires ; l’évolution du cumul des masses
salariales relatives est proche de celle du cumul des fréquences
relatives ;

o une courbe de concentration éloignée de la première bissectrice (proche


des côtés du carré) indique une forte concentration des salaires ; le
cumul des fréquences relatives augmente de manière sensiblement plus
rapide que le cumul de la masse salariale, ce qui veut dire qu’une
grande partie de la masse salariale est détenue par une partie réduite de
l’effectif total ; les salaires sont donc répartis de manière inégale.

Nous pouvons donc en conclure que la concentration des salaires dans


notre exemple est assez faible. Ainsi, on peut par exemple voir à partir des
données du tableau qu’environ 92,88 % de la masse salariale (ce qui
correspond aux salaires inférieurs à 7 500 €) sont payés à 94,8 % des
salariés. Ceci implique en même temps que seulement quelque 5,2 % des
salariés reçoivent un salaire supérieur à 7 500 €, ce qui correspond à environ
7,1 % de la masse salariale de l’entreprise.

Changeons ensuite un peu la distribution des salaires et le niveau des


salaires des mieux payés, pour obtenir la distribution des salaires suivante :

cumf i mi cumfmi
fmi =
xi ni ci fi i
mi = ni ci 6 i
=∑ fj ∑ mi = ∑ fm j
j =1 i =1 j =1

[2 500 ; 3 500[ 33 3000 0,066 0,066 99000 0,0275 0,0275

[3 500 ; 4 500[ 21 4000 0,042 0,108 84000 0,0233 0,0507

[4 500 ; 5 500[ 51 5000 0,102 0,21 255000 0,0707 0,1215

[5 500 ; 6 500[ 133 6000 0,266 0,476 798000 0,2213 0,3428

[6 500 ; 7 500[ 195 7000 0,39 0,866 1365000 0,3785 0,7213

[7 500 ; 22 500[ 67 15000 0,134 1 1005000 0,2787 1


6 6 6 6

Total : ∑ ni =
i =1
∑i =1
fi = ∑ mi =
i =1
∑ fm
i =1
i =
500 1 3 606 000 1

172
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La courbe de Lorenz associée à cette deuxième série de valeurs se


présentera comme suit :

Courbe de Lorenz

1
0,9
0,8
0,7
0,6
cumfmi

0,5
0,4
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
cumfi

On remarque que la courbe de Lorenz est plus éloignée de la première


bissectrice, ce qui nous mène à la conclusion que cette distribution des
salaires est plus concentrée que la première. De plus, en nous basant sur les
données du tableau, nous remarquons cette fois-ci qu’environ 72,13 % de la
masse salariale (ce qui correspond aux salaires inférieurs à 7 500 €) sont
payés à 86,6 % des salariés. Ceci implique en même temps que 13,4 % des
salariés reçoivent un salaire supérieur à 7 500 €, ce qui correspond dans ce
cas à environ 27,87 % de la masse salariale de l’entreprise. On peut donc en
conclure que les salaires sont distribués de manière plus inégale.

4.3.2 L’indice de Gini ( I G , ou bien : coefficient de Gini)

L’indice de Gini correspond au rapport de la surface comprise entre la


première bissectrice et la courbe de Lorenz et la surface comprise entre la
première bissectrice et l’axe des abscisses (donc la surface du triangle dont
les coordonnées des sommets sont (0 ; 0), (1 ; 0) et (1 ; 1)).

173
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

En présence d’une faible concentration, la surface comprise entre la


première bissectrice et la courbe de Lorenz est assez réduite, comme la
courbe de Lorenz est proche de la bissectrice. La valeur de I G est donc faible.

Lorsque la concentration est plus forte, la courbe de Lorenz est plus


proche des côtés du carré (et donc du triangle), ce qui fait que la valeur de I G

est plus élevée.

1
Nous savons que l’aire de ce triangle vaut , étant donné que tout le
2
graphique est inscrit dans un carré dont la longueur des côtés vaut 1.

Sur le graphique ci-dessous, on voit que l’aire de la surface entre la


première bissectrice et la courbe de Lorenz peut varier entre 0 (confusion de
1
la courbe de Lorenz avec la bissectrice, pas de concentration) et
2
(confusion de la courbe de Lorenz avec les côtés du triangle, concentration
absolue). On peut en conclure que 0 ≤ I G ≤ 1 .

Pour déterminer la surface comprise entre la première bissectrice et la


courbe de Lorenz, la méthode la plus facile est de déterminer d’abord l’aire
comprise entre la courbe de Lorenz et l’axe des abscisses. Cette dernière
peut être déterminée en additionnant les aires Si des différents trapèzes

représentés dans le graphique ci-dessous :

174
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Courbe de Lorenz

1
0,9
0,8
0,7
0,6
cumfmi

0,5
0,4 S6
0,3 S5
0,2
0,1 S4
S3
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
cumfi

Pour chacun des trapèzes Si , nous savons que la longueur de la base


i i −1
est de ∑ f -∑ f
j =1
j
j =1
j = fi .

En outre, pour chacun des trapèzes Si , le côté le plus long correspond à

cumfmi et le côté le plus court correspond à cumfmi −1 .

La hauteur moyenne de chaque trapèze correspond donc à


(cumfmi + cumfmi −1 )
.
2

Ainsi, la surface de chaque trapèze Si correspond à

(cumfmi + cumfmi −1 )
fi .
2
K K
(cumfmi + cumfmi −1 )
La surface totale des trapèzes vaut donc ∑ S =∑ f
i =1
i
i =1
i
2
.

L’aire comprise entre la première bissectrice et la courbe de Lorenz vaut


1 K (cumfmi + cumfmi −1 ) 1  K 
par conséquent − ∑ fi = 1 − ∑ f i (cumfmi + cumfmi −1 ) .
2 i =1 2 2 i =1 

175
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Finalement, le coefficient de Gini est calculé d’après la formule suivante :

1 K

1 − ∑ f i (cumfmi + cumfmi −1 ) K
IG =   = 1−
2 i =1
∑ f i (cumfmi + cumfmi −1 )
1 i =1
2

Calculons le coefficient de Gini pour les deux séries précédentes :

xi fi cumfmi cumfmi + cumfmi −1 f i (cumfmi + cumfmi −1 )

[2 500 ; 3 500[ 0,024 0,0123 0,0123 0,0003

[3 500 ; 4 500[ 0,062 0,0547 0,0671 0,0042

[4 500 ; 5 500[ 0,246 0,2651 0,3199 0,0787

[5 500 ; 6 500[ 0,432 0,7085 0,9737 0,4206

[6 500 ; 7 500[ 0,184 0,9288 1,6374 0,3013

[7 500 ; 8 500[ 0,052 1 1,9288 0,1003


K

Total : 1 ∑ f (cumfm
i =1
i i + cumfmi −1 ) =
0,9053

Pour la série initiale de données, I G = 1 – 0,9053 = 0,0947.

xi fi cumfmi cumfmi + cumfmi −1 f i (cumfmi + cumfmi −1 )

[2 500 ; 3 500[ 0,066 0,0275 0,0275 0,0018

[3 500 ; 4 500[ 0,042 0,0507 0,0782 0,0033

[4 500 ; 5 500[ 0,102 0,1215 0,1722 0,0176

[5 500 ; 6 500[ 0,266 0,3428 0,4642 0,1235

[6 500 ; 7 500[ 0,39 0,7213 1,0641 0,4150

[7 500 ; 22 500[ 0,134 1 1,7213 0,2307


K

1 ∑ f (cumfm
i =1
i i + cumfmi −1 ) =
0,7918

Pour la deuxième série de données, I G = 1 – 0,7918 = 0,2082.

176
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La comparaison des valeurs de l’indice de Gini nous mène à la même


conclusion que celle tirée de l’analyse des graphiques : la série initiale de
données est moins concentrée que la série modifiée ; la distribution des
salaires est donc plus inégale pour la deuxième série.

5. Exercices

Exercice 1
n n n
a. Montrez que ∑ (ax + by ) = a∑ x + b∑ y
i =1
i i
i =1
i
i =1
i (avec a et b constantes).

b. Vérifiez les différentes propriétés des opérateurs Σ et Π à l’aide des


séries de valeurs ci-dessous et en posant a = 3 et b = -1 :
xi 2 4 6
yi 1 3 5

Exercice 2

Voici les notes trimestrielles d’un élève de 2D :

note
Branche Coeff. 1 trimestre 2 trimestre 3 trimestre
annuelle

ECOAI 4 34 27 38

ALLEM 3 29 30 29

ANGLA 3 33 36 30

ECOPO 3 45 43 38

FRANC 3 35 37 38

MATHE 3 30 27 38

BRACO 3

HISTO 2/3 32 21 27

INCIV 1/3 37 25 38

GEOGR 2 26 37 29

PHILO 2 35 43 37

COPOR 2 49 42 44

EDPHY 1 41 52 47

177
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Calculez :
a. les moyennes trimestrielles de la branche combinée (BRACO) histoire –
instruction civique ;
b. les notes annuelles des différentes branches ;
c. la moyenne générale annuelle.

Exercice 3

Le taux de croissance99 du PIB du Luxembourg était de 6,5 % en 2007,


de 0 % en 2008 et de -4,1 % en 2009. Calculez le taux de croissance moyen
du PIB luxembourgeois de 2007 à 2009.

Exercice 4

Le service de photocopies « COPYTOUT » possède deux machines


différentes de machines à copier. La première machine a reproduit 2 000
documents à la vitesse de 1 600 documents à l’heure. La seconde machine a
reproduit 3 000 documents à la vitesse de 1 050 documents à l’heure. Quelle
est la vitesse moyenne pour photocopier des documents du service
« COPYTOUT » ?

Exercice 5

Au début de l’année, une personne a acheté des dollars pour 0,758 € à


l’occasion d’un voyage. Quelques mois plus tard, elle revend les dollars
restants au cours de 0,725 €. Déterminez le cours de change moyen.

Exercice 6
1 1
r r

1 K
  K
r
Soit la formule suivante : M r = 
N
∑n x
i =1
r
i i  (ou bien : M r = ∑ f i xi  )
  i =1 
Déterminez la valeur de r telle que :
a. M r = x

b. M r = Q 2
c. M r = H

99
STATEC, Le Luxembourg en chiffres 2010

178
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Exercice 7

Le tableau suivant informe sur la répartition des exploitations agricoles


du Luxembourg selon leur taille100 :

Surface en ha Nombre d’exploitations

xi ni

[0 ; 5[ 395

[5 ; 10[ 217

[10 ; 20[ 186

[20 ; 30[ 116

[30 ; 50[ 246

[50 ; 70[ 263

[70 ; 100[ 398


101
[100 ; 200[ 421

Travail à faire :

a. Établissez l’histogramme des effectifs.


b. Calculez la taille moyenne d’une exploitation luxembourgeoise par
changement d’origine et d’échelle.
c. Déterminez la taille médiane arithmétiquement et graphiquement et
donnez une interprétation de la valeur trouvée.
d. Calculez l’écart type par changement d’origine et d’échelle.
e. Que dire de la symétrie de la distribution des exploitations ?
f. Les terres sont-elles réparties de manière égalitaire ? Répondez en
interprétant le rapport interquintile, la courbe de Lorenz ainsi que le
coefficient de Gini.

100
www.ser.public.lu ; recensement agricole du 15 mai 2009
101
Les données ont été ajustées afin de faciliter les calculs. Comme la surface agricole utile
(SAU) totale exploitée par les 421 fermes les plus grandes est de 63661 ha, la taille moyenne
d’une exploitation appartenant à la dernière classe est d’environ 150 ha, ce qui permet de
fixer la borne supérieure de cette classe à 200 ha. En réalité, la taille de certaines
exploitations isolées dépasse bien les 200 ha.

179
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Exercice 8102

Une entreprise analyse la répartition de ses salariés suivant la distance


entre leur domicile et le lieu de travail.

Distance [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[ [20 ; 25[ [25 ; 30 [30 ; 35[ [35 ; 40[

Salariés 20 38 62 68 47 35 25 25

Travail à faire :

a. Établissez le polygone des effectifs cumulés croissants et décroissants.


b. Calculez la moyenne et l’écart type par changement d’origine et
d’échelle.
c. Calculez la médiane et représentez-la graphiquement. Interprétez la
valeur trouvée.
d. Calculez le coefficient de variation et interprétez-le.
e. La série statistique, est-elle distribuée sous la forme d’une « cloche
gaussienne » ? Basez votre réponse sur l’étude de la symétrie de la
série ainsi que sur la distribution des effectifs dans les intervalles
[x − σ x ; x + σ x ] , [x − 2σ x ; x + 2σ x ] et [x − 3σ x ; x + 3σ x ] .
Exercice 9103

Le tableau ci-dessous indique la répartition des membres d’une


association sportive en fonction de leur âge.

Âge Effectif Âge Effectif

xi ni xi ni

[0 ; 10[ 24 [40 ; 50[ 74

[10 ; 20[ 92 [50 ; 60[ 44

[20 ; 30[ 124 [60 ; 70[ 40

[30 ; 40[ 142

102
Selon le questionnaire d’examen de fin d’études secondaires, septembre 2006
103
Selon le questionnaire d’examen de fin d’études secondaires, juin 2010

180
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Travail à faire :

a. Établissez l’histogramme des effectifs.


b. Calculez la moyenne arithmétique par changement d’origine et d’échelle.
c. Calculez la médiane et interprétez-la.
d. Calculez l’intervalle interquartile et interprétez le résultat obtenu.
e. Calculez l’écart type par changement d’origine et d’échelle.
f. Calculez le pourcentage de l’effectif compris dans l’intervalle [32 ; 52].

181
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 2 : La régression linéaire

1. Introduction

En sciences économiques et sociales, tout comme dans bon nombre


d’autres domaines, on s’intéresse non seulement à une variable isolée
caractérisant les individus d’une population ou d’un échantillon. Concernant
une population d’élèves, on peut par exemple s’intéresser aux notes obtenues
en économie politique, mais aussi en mathématiques, en langues, … Quant
aux salariés d’une entreprise, les variables étudiées peuvent être les salaires
qu’ils obtiennent, le nombre d’heures prestées, l’ancienneté, le niveau du
diplôme, …

Très souvent, les différentes variables sont « liées » d’une certaine


manière. Ainsi, il est probable qu’un élève qui est fort en mathématiques,
obtient aussi de bonnes notes en statistique. De même, il existe une relation
positive évidente entre le salaire et le nombre d’heures de travail prestées,
l’ancienneté et la qualification. Pour les entreprises, on peut supposer
l’existence d’une relation positive entre le chiffre d’affaires et le niveau des
dépenses publicitaires, …

Afin de déterminer s’il existe une certaine relation linéaire entre deux
variables 104 x et y , on a recours à des instruments de mesure comme la
covariance ou le coefficient de corrélation linéaire. Ces deux instruments
permettent de déterminer si les modalités ( xi ) d’une certaine variable varient

dans le même sens (ou bien, dans le sens contraire) que les modalités ( yi )

d’une autre variable. Il faut cependant préciser que ces instruments servent
uniquement à décrire la relation entre variables que l’on peut supposer être
liées d’une certaine manière, compte tenu de leurs variations conjointes, et
non de démontrer l’existence d’une relation de cause à effets. Deux variables
peuvent bien (par hasard) varier dans le même sens (ou dans le sens

104
Dans le cadre de ce cours, on se limitera à l’étude de relations entre deux variables.

183
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

contraire), sans qu’il n’existe une relation entre elles qui puisse paraître
raisonnable.

Dans ce qui suit, nous allons nous baser sur un exemple issu du cours
de macroéconomie. En fait, d’après le modèle macroéconomique keynésien
exposé dans ce cours, il existe une relation positive entre les dépenses de
consommation des ménages C et le revenu national net Y , avec C = f (Y ) .
Néanmoins, dans ce chapitre ci, les dépenses de consommation de chaque
année seront représentées par la variable y et le revenu national net par la
variable x . Considérons le tableau suivant, représentant les séries de
données (temporelles105), décrivant le cas du Grand-duché de Luxembourg :

RNN Dépense de consommation


Année
(xi ) finale des ménages ( yi )
1995 11,95 7,19
1996 12,55 7,5
1997 13,56 8,02
1998 13,63 8,58
1999 15,29 9,33
2000 16,27 10,25
2001 16,98 10,53
2002 16,99 11,36
2003 17,11 11,46
2004 20,77 12,17
2005 22,64 12,58
2006 22,09 12,96
2007 26,16 13,58
2008 25,25 14,35
2009 22,09 14,18
données en milliards d’euros et à prix courants
Source: STATEC

105
Pour les séries temporelles, l’effectif total N correspond au nombre d’années ; ici, N
vaut donc 15.

184
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2. La covariance

La covariance mesure la variation conjointe des modalités de deux


variables. Ainsi, tout comme la variance décrit la variabilité des modalités
d’une seule variable autour de la moyenne, la covariance permet de décrire la
« variation commune » des modalités de deux variables autour de leurs
moyennes respectives. De ce fait, il y a une forte ressemblance entre la
formule de la variance106 et celle de la covariance107 :

1 N
1 N

σ xy =
N
∑ (xi − x )( yi − y )
i =1
=
N
∑ x y  − x y
i =1
i i

Une covariance positive indique ainsi que la variation des modalités des
deux variables se fait dans le même sens. Dans ce cas, on parle d’une
dépendance linéaire positive. Lorsque les modalités des deux variables
évoluent de manière opposée, la covariance est négative et on parle d’une
dépendance linéaire négative.

Déterminons la covariance entre le RNN luxembourgeois et les


dépenses de consommation finale. Ce calcul se fait en trois étapes. D’abord,
il faut calculer la moyenne arithmétique simple des deux variables. Ensuite,
on établit la série auxiliaire de données xi yi , nécessaire au calcul de la

covariance. Finalement, on remplace les valeurs calculées dans la formule de


la covariance.

106
Rappelons rapidement la formule de la variance d’une série de N observations :
1 N
1 N
 2
σ x2 = ∑ (xi − x ) ∑x
2
= 2
i  − x . La procédure menant à l’expression simplifiée de
N i =1 N i =1 
la formule de la covariance est analogue à celle présentée pour la variance, en bas de page à
la section 4.2.4. du chapitre 1.
107
La covariance est encore souvent notée cov( x; y ) .

185
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

RNN Dépense de consommation


Année
(xi ) finale des ménages ( yi ) xi yi

1995 11,95 7,19 85,9205


1996 12,55 7,5 94,125
1997 13,56 8,02 108,7512
1998 13,63 8,58 116,9454
1999 15,29 9,33 142,6557
2000 16,27 10,25 166,7675
2001 16,98 10,53 178,7994
2002 16,99 11,36 193,0064
2003 17,11 11,46 196,0806
2004 20,77 12,17 252,7709
2005 22,64 12,58 284,8112
2006 22,09 12,96 286,2864
2007 26,16 13,58 355,2528
2008 25,25 14,35 362,3375
2009 22,09 14,18 313,2362
Total: 273,33 164,04 3137,747

données en milliards d’euros et à prix courants


Source: STATEC

2009
1 273,33
x=
N
∑x =
i =1995
i
15
= 18,222

2009
1 164,04
y=
N
∑y =
i =1995
i
15
= 10,936

1  2009  3137,747
σ xy =  ∑ xi y i  − x y = − 18,222 ⋅ 10,936 = 9,907341
N  i =1995  15

Suite au résultat trouvé, on peut croire en l’existence d’une relation


positive entre la consommation des ménages et le RNN.

Comme l’ordre de grandeur de la valeur de la covariance dépend de


l’ordre de grandeur des données 108 , et comme la covariance souffre des
mêmes désavantages que la variance (forte dépendance des valeurs

108
On dit alors que la covariance n’est pas normée.

186
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

aberrantes), la covariance permet de fournir des renseignements fiables


principalement sur le sens de la dépendance linéaire entre les modalités de
deux variables. Seulement une covariance proche de 0 permet de conclure à
l’inexistence d’une dépendance linéaire 109 entre les modalités de deux
variables.

3. Le coefficient de corrélation linéaire

Le coefficient de corrélation permet de tirer les mêmes conclusions


quant à la dépendance linéaire des modalités de deux variables que la
covariance. Il présente cependant l’avantage d’être normé et de ne prendre
que des valeurs situées entre -1 et 1. En fait, on obtient le coefficient de
corrélation110 ρ xy à partir de la covariance, en divisant cette dernière par le

produit des écarts types de x et de y :

σ xy
ρ xy =
σ xσ y

On remarque que le coefficient de corrélation est du même signe que la


covariance, étant donné que les écarts types sont toujours positifs. Les
remarques relatives au signe de la covariance faites au point précédant
restent donc valables.

Cependant, contrairement à la covariance, l’ordre de grandeur de ρ xy

permet de donner des indications sur l’intensité de la dépendance linéaire111


entre les modalités des deux variables. En pratique, on peut retenir les
critères suivants concernant cette intensité :

109
Néanmoins, il se peut qu’il existe une relation de dépendance non linéaire entre les
modalités des deux variables, ce que la covariance ne permet pas d’indiquer.
110
ρ : lettre grecque « rhô » minuscule
111
Une valeur très faible du coefficient de corrélation linéaire permet cependant seulement de
conclure à l’inexistence d’une dépendance linéaire entre les modalités des deux variables ;
on ne peut rien dire sur l’existence d’une relation non linéaire.

187
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Coefficient de corrélation linéaire Intensité de la corrélation linéaire

ρ xy ≤ 0,2 corrélation très faible (voire inexistante)

0,2 < ρ xy ≤ 0,5 corrélation faible

0,5 < ρ xy ≤ 0,7 corrélation moyenne

0,7 < ρ xy ≤ 0,9 corrélation élevée

0,9 < ρ xy ≤ 1 corrélation très élevée

Remarquons encore que le coefficient de corrélation est invariant aux


changements d’origine et d’échelle appliqués aux variables.

Afin de déterminer le coefficient de corrélation entre le RNN et les


dépenses de consommation finale des ménages luxembourgeois, il faut
encore déterminer les écarts types des deux séries. De nouveau, il faut
compléter le tableau des données et établir des séries auxiliaires :

RNN Dépense de consommation

Année (xi ) finale des ménages ( yi ) xi2 yi2

1995 11,95 7,19 142,8025 51,6961


1996 12,55 7,5 157,5025 56,25
1997 13,56 8,02 183,8736 64,3204
1998 13,63 8,58 185,7769 73,6164
1999 15,29 9,33 233,7841 87,0489
2000 16,27 10,25 264,7129 105,0625
2001 16,98 10,53 288,3204 110,8809
2002 16,99 11,36 288,6601 129,0496
2003 17,11 11,46 292,7521 131,3316
2004 20,77 12,17 431,3929 148,1089
2005 22,64 12,58 512,5696 158,2564
2006 22,09 12,96 487,9681 167,9616
2007 26,16 13,58 684,3456 184,4164
2008 25,25 14,35 637,5625 205,9225
2009 22,09 14,18 487,9681 201,0724
Total: 273,33 164,04 5279,992 1874,995

données en milliards d’euros et à prix courants


Source: STATEC

188
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1 2009
 5279,992
σ x2 = 
N
∑x
i =1995
2
i − x2=
 15
− 18,222 2 = 19,958183  σ x = 4,467458

1 2009
 1874,995
σ y2 = 
N
∑y
i =1995
2
i  − y2=
 15
− 10,936 2 = 5,403571  σ y = 2,324558

σ xy 9,907341
ρ xy = = = 0,954
σ xσ y 4,467 ⋅ 2,325

On peut donc conclure qu’il existe une corrélation linéaire positive très
élevée entre le RNN et la consommation des ménages luxembourgeois.

4. La régression linéaire : méthode des moindres carrés


ordinaires

Afin de pouvoir déterminer de manière plus précise le type de relation


existant entre variables, il peut être utile de représenter graphiquement les
différents couples ( xi ; yi ) . Pour le RNN et la consommation, ceci mène au

graphique suivant :

Nuage des points

16

14

12

10

C (= yi) 8

0
0 5 10 15 20 25 30
Y (= xi)

189
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Ce « nuage des points » permet d’admettre l’existence d’une relation


linéaire (affine) positive entre la consommation (C ) des ménages et le RNN
(Y ) .
D’après le modèle keynésien présenté dans le cours de macroéconomie,
la fonction de consommation des ménages (C ) comprend une partie

autonome (Co ) et une partie variable (cY ) . Cette relation peut être écrite sous

forme d’équation de droite :

C = cY + Co

De manière générale, l’équation décrivant une relation affine entre deux


variables s’écrit de la forme y = α x + β .

Ajoutons une droite susceptible de représenter la relation entre C et Y


au nuage des points :

Nuage des points

18

16

14

12

10
C (=yi)
8

0
0 5 10 15 20 25 30
Y (=xi)

On remarque que les couples ( xi ; yi ) ne se situent pas exactement sur la

droite, mais se trouvent soit au dessus, soit en dessous de cette dernière.


Ainsi, en remplaçant les différents xi dans l’équation y = α x + β 112
, nous

112
α : lettre grecque « alpha » minuscule ; β : lettre grecque « beta » minuscule

190
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

n’allons pas retrouver les yi correspondants (comme ils ne se trouvent pas

sur la droite), mais seulement des estimations de ces valeurs que nous allons
noter ŷi (qui se trouvent sur la droite). Pour chaque valeur estimée ŷi

(= α xi + β ) et pour chaque valeur observée yi , il existe donc un écart113 ei tel

que ei = yi − yˆ i .

yi
ei y =α x+ β
ŷi

0 xi x

Chaque observation yi correspond donc à l’expression suivante :

yi = yˆ i + ei . Afin que les valeurs estimées yˆ i (= α xi + β ) soient le plus proche

possible des valeurs réellement observées yi , les paramètres α et β doivent

être déterminés de manière à ce que la somme des carrés des écarts


N
S = ∑ ei2 soit minimale114.
i =1

113
Les écarts ei peuvent être positifs (si yi est situé au dessus de la droite) ou négatifs (si
yi se trouve en dessous de la droite) ; de plus, on suppose que leur moyenne vaut 0, ou
bien, de manière équivalente, leur somme vaut 0.
114
Comme on suppose que la somme des écarts vaut 0, il faut se baser sur les carrés des
écarts, afin que les écarts positifs et négatifs ne s’annulent pas mutuellement. Cette méthode
de déterminer les paramètres de l’équation régression est appelée méthode des « moindres
carrés ordinaires ».

191
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Réécrivons S sous une autre forme :


N N N
S = ∑ ei2 = ∑ ( yi − yˆ i ) = ∑ ( yi − α xi − β )
2 2

i =1 i =1 i =1

Pour déterminer les valeurs de α et de β qui minimisent l’expression S ,


il faut annuler les dérivées115 premières partielles de S par rapport à α et à
β . Il faut donc trouver α et β tels que

 '
( )
N

S α = 0
' 

S α = − 2 ∑
i =1
xi y i − α xi2 − β xi = 0
 ' ⇔
S β = 0 N
S ' = −2 ( y − α x − β ) = 0
 β ∑
i =1
i i

Ceci nous mène au système d’équations suivant :

N N
( )
N N

∑ xi yi − α xi − β xi = 0 ∑ xi y i − α ∑ xi − β ∑ xi = 0 (1)
2 2

 i =1  i =1 i =1 i =1
N ⇔N N
 (y −α x − β ) = 0  y − α x − Nβ = 0 (2)
∑
i =1
i i
∑
i =1
i ∑
i =1
i

Transformons d’abord l’équation (2) afin d’exprimer le paramètre β en


fonction de α :
N N

∑ yi − α ∑ xi
β= i =1 i =1
= y −α x
N

On remarque donc que la droite de régression passe par le point de


coordonnées ( x; y ) .

Remplaçons ensuite β dans l’équation (1) :

N N N

∑ xi yi − α ∑ xi2 − ( y − α x )∑ xi = 0
i =1 i =1 i =1

En isolant α , on obtient l’expression suivante :

115
Pour la dérivation d’une somme, voir point c de la section 4.1.3. du chapitre 1. Attention :
la dérivation se fait ici par rapport à α et à β !

192
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N N

∑ xi yi − y ∑ xi
α= i =1
N
i =1
N

∑x
i =1
2
i − x ∑ xi
i =1

Afin de simplifier cette expression, multiplions le numérateur et le


1
dénominateur par pour trouver l’expression suivante :
N

1 N N

1 N 1 N
 ∑ xi y i − y ∑ xi  ∑ xi y i − y ∑ xi
N  i =1 i =1 
N i =1 N i =1
α= =
1 N N
 1 N
1 N
 ∑ xi2 − x ∑ xi 
N  i =1
∑ i N∑
N i =1
x 2
− x xi
i =1  i =1

L’expression finale du paramètre α s’écrit donc de la manière suivante :

1 N 
 ∑ xi yi  − x y
α =  i =N1 
N
1 
 ∑ xi2  − x 2
 N i =1 

Après avoir calculé la valeur de α , la valeur du paramètre β s’obtient


ensuite facilement, en remplaçant la valeur trouvée pour α dans l’équation

β = y −α x

Afin de calculer les paramètres α et β de notre exemple de départ,


nous avons donc besoin des données suivantes :

193
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

RNN Dépense de consommation

Année (xi ) finale des ménages ( yi ) xi2 xi yi

1995 11,95 7,19 142,8025 85,9205


1996 12,55 7,5 157,5025 94,125
1997 13,56 8,02 183,8736 108,7512
1998 13,63 8,58 185,7769 116,9454
1999 15,29 9,33 233,7841 142,6557
2000 16,27 10,25 264,7129 166,7675
2001 16,98 10,53 288,3204 178,7994
2002 16,99 11,36 288,6601 193,0064
2003 17,11 11,46 292,7521 196,0806
2004 20,77 12,17 431,3929 252,7709
2005 22,64 12,58 512,5696 284,8112
2006 22,09 12,96 487,9681 286,2864
2007 26,16 13,58 684,3456 355,2528
2008 25,25 14,35 637,5625 362,3375
2009 22,09 14,18 487,9681 313,2362
Total: 273,33 164,04 5279,992 3137,747

données en milliards d’euros et à prix courants


Source: STATEC

2009
1 273,33
x=
N
∑x =
i =1995
i
15
= 18,222

2009
1 164,04
y=
N
∑y =
i =1995
i
15
= 10,936

1  2009  3137,747
 ∑ xi y i  − x y = − 18,222 ⋅ 10,936 = 9,907341
N  i =1995  15

1 2009
 5279,992

N
∑x
i =1995
2
i  − x2=
 15
− 18,222 2 = 19,958183

9,907341
α= = 0,496404
19,958183

β = 10,936 − 0,496404 ⋅ 18,222 = 1,890526

194
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La relation entre la consommation des ménages luxembourgeois et le


revenu national net est donc la suivante : C = 0,4964 Y + 1,8905

Nuage des points et droite de régression

18

16 y = 0,4964x + 1,8905

14

12

10
C (=yi)
8

0
0 5 10 15 20 25 30
Y (=xi)

D’après la relation trouvée, la propension marginale à consommer (c )


des ménages luxembourgeois est de 0,4964. Ainsi, de chaque euro de
revenu supplémentaire, 0,4964 cents sont affectés aux dépenses de
consommation. En outre, la consommation autonome (Co ) des ménages

luxembourgeois s’élève à 1,8905 milliards d’euros. Ainsi, si le revenu national


était 0, les ménages luxembourgeois devraient consommer des biens d’une
valeur de 1,8905 milliards d’euros pour pouvoir survivre, ce qui correspond à
3 765,19 € par habitant116 par an. Chaque habitant devrait donc être capable
de survivre en dépensant environ 314 € par mois.

Remarques :

Comme le numérateur et le dénominateur de l’expression trouvée pour


α correspondent respectivement à σ xy et à σ x2 , le paramètre α peut donc
encore être exprimé de la manière suivante :

116
avec une population estimée de 502 100 habitants au 01.01.2010 (STATEC, le
Luxembourg en chiffres 2010)

195
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

σ xy
α=
σ x2

Ainsi, β peut encore être déterminé à travers l’expression suivante :

σ xy
β = y− x
σ x2

Comme il existe un écart ei entre chaque valeur observée yi et la valeur

estimée ŷi , il faut admettre que la relation décrite par l’équation de la droite

de régression n’est pas exacte, mais seulement approximative. De ce fait, on


ne peut pas simplement transformer l’équation y = α x + β (régression de y
en fonction de x ) afin de déterminer les paramètres permettant d’exprimer la
variable x en fonction de y . Il faut donc calculer les paramètres α ' et β ' tels
que x = α ' y + β ' (régression de x en fonction de y ). En suivant une
procédure analogue à celle décrite ci-dessus, on trouvera que

1 N 
 ∑ xi y i  − x y
σ xy
α ' =  i =N1 
N
= 2
1  σy
 ∑ y i2  − y 2
 N i =1 

et que

σ xy
β'= x −α' y = x − y
σ y2

Finalement, reconsidérons la formule du coefficient de corrélation


σ xy
linéaire ρ xy = et comparons ce dernier au produit des paramètres α et
σ xσ y

α' :

σ xy ⋅ σ xy σ xy2
α ⋅ α ' = 2 2 = 2 2 = ρ xy2
σ x ⋅σ y σ x ⋅σ y

196
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

On peut donc conclure que si les paramètres α et α ' sont inverses l’un
( )
de l’autre, la corrélation entre les variables x et y est parfaite ρ xy = 1 et les

deux droites de régression sont confondues.

Nous venons de voir que la relation décrite par l’équation de la droite de


régression n’est pas exacte, mais seulement approximative. On peut donc se
poser la question de savoir si l’équation estimée est adéquate. Afin de
mesurer l’adéquation de l’équation estimée, on a recours au coefficient de
détermination, noté R2. Il est calculé en élevant au carré le coefficient de
corrélation linéaire : R2 = ρ xy2 . Comme -1 < ρ xy < 1, on peut en conclure que

0 < R2 < 1. Une faible valeur de R2 suggère que la relation estimée ne s’ajuste
pas bien aux données observées tandis qu’une valeur élevée de R2 indique
que la relation estimée est adéquate. De manière plus précise, le coefficient
de détermination exprime en pourcentage, la part de la variation de y
expliquée par la relation entre les variables x et y . Dans l’exemple précédent,
R2 = 0,91, ce qui veut dire que 91 % de la variation des dépenses de
consommation s’expliquent par le RNN. 9 % des variations des dépenses de
consommation s’expliquent donc par des variables autres que le RNN,
variables dont le modèle estimé ne tient pas compte.

On peut donc encore noter qu’en réalité, les phénomènes dépendent


souvent de plusieurs variables. On peut donner l’exemple d’une fonction de
production qui dépend de plusieurs facteurs de production (travail, capital,
nature), d’une fonction de coût d’une entreprise qui dépend de plusieurs
éléments (nombre de machines, de travailleurs, volume de la production) qui
peuvent être eux-mêmes interdépendants, du poids des adolescents qui
dépend de leur âge, de leur taille, de facteurs socio-économiques, … A titre
d’exemple, une relation linéaire du type y = α1 x1 + ... + αk xk + β entre une

variable dépendante y et k variables indépendantes peut aussi être estimée


en appliquant la méthode des moindres carrés ordinaires, tout en ayant
recours au calcul matriciel.

197
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5. La régression non linéaire : méthode des moindres carrés


ordinaires

La régression linéaire telle que décrite dans la partie précédente ne fait


de sens que pour des données pour lesquelles on peut présupposer
l’existence d’une relation linéaire. De plus, nous avons déjà vu plus haut
qu’une très faible valeur du coefficient de corrélation linéaire ne permet pas
de conclure à l’inexistence d’une relation non linéaire entre les variables x et
y . Ainsi, afin de déterminer le type de relation qui existe entre deux séries de
données, il est souvent utile d’analyser tout d’abord la forme du nuage de
points.

Souvent, la relation entre les variables x et y est du type y = βx α .


Différents cas peuvent alors se présenter selon la valeur du paramètre α :

1,2
α< 0
1

0,8

yi 0,6

0,4

0,2

0
0 5 10 15 20 25 30
xi

198
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

12
0< α <1
10

yi 6

0
0 5 10 15 20 25 30
xi

1800
α >1
1600
1400
1200
1000
yi
800
600
400
200
0
0 5 10 15 20 25 30
xi

La méthode d’estimation des paramètres α et β des relations


précédentes n’est pas beaucoup plus difficile que celle vue pour la relation
linéaire. La relation y = βx α peut être linéarisée en prenant le logarithme117
des deux côtés. La relation transformée se présente alors comme suit :
ln y = α ln x + ln β . Ainsi, pour estimer les paramètres α et β , il suffit de
transformer les séries statistiques x et y en prenant leur logarithme et

117
Ceci n’est donc possible que lorsque les valeurs des variables x et y sont > 0. Dans le
cas contraire, d’autres méthodes doivent être appliquées afin d’estimer les paramètres α et
β.

199
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

d’appliquer ensuite la méthode des moindres carrés ordinaires aux séries


transformées118. Dans ce type de modèle, l’interprétation du paramètre α est
particulièrement intéressante du point de vue économique, étant donné qu’il
représente l’élasticité119 de la variable x par rapport à la variable y .

Remarques :

D’autres types de relations sont cependant encore possibles. Ainsi, au


lieu d’effectuer une transformation logarithmique sur les valeurs des deux
séries statistiques x et y , il suffit souvent de transformer uniquement la série
y et d’estimer alors la relation ln y = αx + β . Si le nuage de points laisse
présupposer une relation parabolique entre x et y , alors on peut aussi

estimer une relation du type y = α1 x + α2 x 2 + β .

Notons encore que des transformations similaires sont possibles pour


des relations à plus que deux variables.

6. Application résolue120

Un commerçant compare sur 8 ans son chiffre d’affaires par rapport à


son coût d’achat des marchandises vendues (données en milliers d’euros).

CAMV Chida
Année xi yi xi2 yi2
xi yi
1995 224 610 136640 50176 372100
1996 236 650 153400 55696 422500
1997 255 720 183600 65025 518400
1998 250 650 162500 62500 422500
1999 255 680 173400 65025 462400
2000 280 725 203000 78400 525625
2001 289 755 218195 83521 570025
2002 295 800 236000 87025 640000
Total : 2084 5590 1466735 547368 3933550

118
Attention, la valeur trouvée par la méthode des moindres carrés ordinaires pour ln β doit
être retransformée moyennant la fonction exponentielle pour trouver la valeur de β .
119
voir cours d’Economie politique 1D, partie Microéconomie
120
Examen de fin d’études secondaires, septembre 2004 (questions c et d)

200
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Travail à faire :
a. Calculez la covariance et interprétez le résultat.

2084
x= = 260,5
8

5590
y= = 698,75
8

1 2002
 1466735
σ xy = 
N
∑ x y  − x y =
i =1995
i i
8
− 260,5 ⋅ 698,75 = 1317,5

Une covariance positive indique que le CAMV et le CHIDA évoluent


dans le même sens. On peut donc supposer l’existence d’une dépendance
linéaire positive entre les deux variables.

b. Déterminez le coefficient de corrélation linéaire et interprétez le résultat.

1 2002
 547368
σ x2 = 
N
∑x
i =1995
2
i − x2=
 8
− 260,5 2 = 560,75  σ x = 23,6802

1 2002
 3933550
σ y2 = 
N
∑y
i =1995
2
i  − y2=
 8
− 698,75 2 = 3442,1875  σ y = 58,6702

σ xy 1317,5
ρ xy = = = 0,9483
σ xσ y 23,6802 ⋅ 58,6702

Une valeur du coefficient de corrélation linéaire de 0,9483 suggère une


corrélation positive très élevée entre le CAMV et le CHIDA.

c. Représentez graphiquement le nuage des points correspondant aux


données ci-dessus !

201
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Nuage des points

900

800

700

600
CHIDA iy

500

400

300

200

100

0
0 50 100 150 200 250 300 350
CAMV xi

d. Déterminez, par la méthode des moindres carrés ordinaires, l’équation


de la droite de régression de y en x et tracez cette droite dans le
graphique du nuage des points !

σ xy 1317,5
α= = = 2,349532
σ x2 560,75

β = y − α x = 698,75 − 2,349532 ⋅ 260,5 = 86,697

La relation estimée entre le chiffre d’affaires ( y ) et le coût d’achat des


marchandises vendues ( x ) peut donc être décrite comme suit :

y = 2,349532 x + 86,697

202
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Droite de régression

900

800 y = 2,3495x + 86,697


700

600
CHIDA iy

500

400

300

200

100

0
0 50 100 150 200 250 300 350
CAMV xi

e. Pour l’année 2003, le coût d’achat des marchandises vendues est


estimé à environ 300 000 € ! A quel CHIDA l’entreprise peut-elle
s’attendre pour cette même année ?

Si on suppose que x vaut 300, alors y sera égal à 791,5566. Ainsi, si le


coût d’achat des marchandises vendues s’élève à environ 300 000 €, alors on
peut s’attendre à un chiffre d’affaires d’environ 791 556,6 €.

f. Si l’entreprise veut atteindre un chiffre d’affaires d’environ 800 000 € en


2004, quelle est la valeur (au coût d’achat) de marchandises qu’elle doit
vendre ?

Comme la relation estimée entre le CHIDA et le CAMV n’est pas une


relation exacte, on ne peut pas inverser l’équation trouvée précédemment.
Afin d’exprimer le CAMV en fonction du CHIDA, nous devons donc estimer
les paramètres α ' et β ' pour caractériser la relation x = α ' y + β ' .

σ xy 1317,5
α'= = = 0,382751
σ y 3442,1875
2

β ' = x − α ' y = 260,5 − 0,382751 ⋅ 698,75 = −6,9473

203
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La relation estimée entre le CAMV ( x ) et le CHIDA ( y ) peut donc être


décrite comme suit :

x = 0,382751 y – 6,9473

Si on suppose que y vaut 800, alors x sera égal à 299,2535. Ainsi, si


l’entreprise veut atteindre un chiffre d’affaires d’environ 800 000 €, alors elle
doit vendre des marchandises dont la valeur d’achat s’élève à environ
299 253,5 €.

7. Exercices

Exercice 1

Le tableau suivant reprend les valeurs de l’indice des prix à la production


des produits industriels (xi ) et les valeurs de l’indice des prix à la

consommation national ( yi ) du Luxembourg121.

Années IPPI xi IPCN yi


2005 100 100
2006 107,73 102,666
2007 113,41 105,041
2008 122,26 108,613
2009 112,92 109,014
2010 116,29 111,493

Travail à faire :
a. Calculez la covariance et interprétez le résultat.
b. Déterminez le coefficient de corrélation linéaire et interprétez le résultat.
c. Représentez graphiquement le nuage des points correspondant aux
données ci-dessus !
d. Déterminez, par la méthode des moindres carrés ordinaires, l’équation
de la droite de régression de y en x et tracez cette droite dans le
graphique du nuage des points !
e. L’équation estimée, est-elle adéquate ?

121
Source : www.statistiques.public.lu

204
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

f. Si on suppose que les prix à la production ont augmenté de 20 % de


2005 à 2011, quel sera l’impact sur les prix à la consommation ?

Exercice 2122

Le tableau ci-dessous reprend les notes de 8 élèves, choisis au hasard,


en « Sociétés commerciales » et en « Statistiques et probabilités ».

Élève SOCOM xi STAT yi


1 51 42
2 37 34
3 34 28
4 42 43
5 31 30
6 25 22
7 36 32
8 48 41

Travail à faire :
a. Calculez la covariance et interprétez le résultat.
b. Déterminez le coefficient de corrélation linéaire et interprétez le résultat.
c. Représentez graphiquement le nuage des points correspondant aux
données ci-dessus !
d. Déterminez, par la méthode des moindres carrés ordinaires, l’équation
de la droite de régression de y en x et tracez cette droite dans le
graphique du nuage des points !
e. L’équation estimée, est-elle adéquate ?
f. Si on suppose qu’un certain élève a obtenu une note de 46 en SOCOM,
à quelle note peut-on s’attendre en STAT ?
g. Si on suppose qu’un certain élève a obtenu une note de 37 en STAT, à
quelle note peut-on s’attendre en SOCOM ?

Exercice 3123

De 2004 à 2010, une entreprise a augmenté annuellement ses


dépenses de publicité de 10000 €. Elle veut comparer son chiffre d’affaires y

122
Examen de fin d’études secondaires, septembre 2010 (questions 3 et 4)
123
Adaptation du questionnaire de l’examen de fin d’études secondaires, 1996

205
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

aux dépenses de publicité x . La collecte de données est résumée dans le


tableau suivant :

Année Dépenses de publicité CHIDA

xi yi

2004 150 450

2005 160 480

2006 170 480

2007 180 490

2008 190 520

2009 200 550

2010 210 530

Travail à faire :
a. Calculez la covariance et interprétez le résultat.
b. Déterminez le coefficient de corrélation linéaire et interprétez le résultat.
c. Représentez graphiquement le nuage des points correspondant aux
données ci-dessus.
d. Déterminez, par la méthode des moindres carrés ordinaires, l’équation
de la droite de régression de y en x et tracez cette droite dans le
graphique du nuage des points.
e. L’équation estimée, est elle adéquate ?
f. Faites une estimation du CHIDA pour 2011.
g. Quel devrait être le niveau des dépenses de publicité si l’entreprise vise
un CHIDA de 560 000 € en 2012 ?

206
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 3 : Les nombres indices

1. Introduction

De manière générale, un indice sert à décrire l’évolution (en %) de la


valeur d’une certaine grandeur, économique ou autre, par rapport à la valeur
de la grandeur lors d’une période de référence (ou bien : période de base).
Les indices permettent ainsi de faciliter la comparaison de l’évolution de
grandeurs dans l’espace et dans le temps.

Les grandeurs (ou bien : variables) concernées par les indices sont
souvent de nature économique. Ainsi, on décrit souvent l’évolution des prix à
la consommation, de valeurs boursières, d’agrégats macroéconomiques
comme le PIB, … à l’aide d’indices. Les indices servent aussi souvent à
rendre compte de l’évolution de variables de nature démographique ou
sociale, comme la population, l’éducation, le niveau de développement, …

Lorsqu’un indice ne décrit que l’évolution d’une seule variable, on parle


d’un « indice simple ». Au cas où l’indice décrit l’évolution conjointe de
plusieurs variables, on parle d’un « indice synthétique » (ou bien : indice
composé).

2. Les indices simples

2.1. Définition

L’indice simple X t / 0 d’une variable X se calcule en divisant la valeur X t

que cette variable prend à une époque t par la valeur X 0 de la variable à

l’époque de base 0. On obtient alors la formule suivante :

Xt
Xt/0 =
X0

Afin d’exprimer l’indice directement en %, on multiplie le résultat


précédent par 100 :

207
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Xt
X t/0 = ⋅100
X0

Illustrons le calcul d’une série d’indices simples d’une variable à l’aide


d’un exemple concret, concernant le Grand-Duché de Luxembourg :

PIB du Grand-Duché de Luxembourg (en milliards d’€)

Année 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

PIB 22 22,57 23,99 25,83 27,46 30,28 33,92 37,49 39,64 38,04

Indice
base 1 1,026 1,09 1,174 1,248 1,376 1,542 1,704 1,802 1,729
(2000)

Indice
en %
100 102,6 109 117,4 124,8 137,6 154,2 170,4 180,2 172,9
base
(2000)
Source : www.statec.public.lu

Ainsi, la valeur de l’indice à l’époque de base s’obtient comme suit :

X 2000 22
X 2000 / 2000 = = = 1 , ce qui équivaut à 100 %.
X 2000 22

A titre d’exemple, la valeur de l’indice en 2003 en % se calcule d’après


la formule suivante :

X 2003 25,83
X 2003 / 2000 = ⋅100 = ⋅100 = 117,4
X 2000 22

Ces valeurs permettent de conclure que de 2000 à 2003, le PIB du


Luxembourg a augmenté de 17,4 %. La série d’indices permet donc de
déterminer pour chaque année la variation en % du PIB par rapport à
l’année de base (2000). Cependant, on ne peut pas déterminer de la même
manière les taux de croissance entre deux années quelconques124.

124
Pour réaliser ceci, il faut soit calculer le taux de croissance des indices d’une variable
entre deux époques, soit calculer le taux de croissance de la variable elle-même entre deux
époques.

208
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.2. Propriétés des indices simples

2.2.1 L’identité

Si l’époque considérée t et l’époque de base coïncident ( t = 0), on a

Xt X
Xt/0 = = 0 =1
X0 X0

Ou bien, en % :

Xt X
X t/0 = ⋅100 = 0 ⋅100 = 100
X0 X0

L’indice calculé pour la période de base prend donc toujours la valeur 1,


ou bien 100 s’il est exprimé en %.

2.2.2 La réversibilité

Soient deux périodes t et θ 125


. L’indice simple X t / θ d’une certaine

variable, obtenu en divisant la valeur X t que cette variable prend à l’époque t

par la valeur X θ de la variable à l’époque θ , est égal à l’inverse de l’indice

simple X θ / t , obtenu en divisant la valeur X θ de la variable à l’époque θ par

la valeur X t que cette variable prend à l’époque t .

Xt 1 1
X t /θ = = =
Xθ Xθ Xθ /t
Xt

Ou bien, si l’indice est exprimé en % :

Xt 1 1 1
X t /θ = ⋅ 100 = ⋅ 100 = ⋅ 100 = ⋅ 100 2
Xθ X θ X θ /t Xθ /t
Xt 100

Illustrons cette propriété à travers un exemple concret ( t = 2003 et θ =


2000) :

125
θ : lettre grecque « thêta » minuscule

209
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

X 2003 25,83
X 2003 / 2000 = ⋅100 = ⋅100 = 117,4
X 2000 22

X 2000 22
X 2000 / 2003 = ⋅100 = ⋅100 = 85,17
X 2003 25,83

1 1
X 2003 / 2000 = ⋅100 2 = ⋅100 2 = 117,4
X 2000 / 2003 85,17

A titre d’exemple, la propriété de réversibilité permet de conclure que si


un indice indique que les prix ont triplé de l’année θ jusqu’en t , alors ce
même indice permet de conclure que les prix en θ étaient le tiers de ceux en
t.

2.2.3 La transférabilité

Soient les périodes θ , τ 126


et t . On dit qu’un indice est transférable
lorsqu’il vérifie la condition suivante :

X t /θ = X t /τ ⋅ X τ /θ

↓ ↓ ↓ temps
Xθ Xτ Xt
X τ /θ X t /τ

X t /θ
Vérifions que l’indice simple remplit bien cette condition :

X t Xτ X
X t /τ ⋅ X τ /θ = ⋅ = t = X t /θ
Xτ Xθ Xθ

Notons que si l’indice est exprimé en %, la condition de transférabilité


s’écrit comme suit :

X t /τ ⋅ X τ /θ
X t /θ =
100

La propriété de transférabilité permet de conclure par exemple que si un


indice indique que les prix ont doublé de l’année θ jusqu’en τ et qu’ils ont

126
τ : lettre grecque « tau » minuscule

210
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

triplé de τ jusqu’en t , alors les prix ont été multipliés par six de l’année θ
jusqu’en t .

La propriété de transférabilité permet de définir des indices chaînes.


Ceci est nécessaire afin de « raccorder » des séries d’indices concernant la
même grandeur, mais basées sur des périodes différentes, ce qui peut
devenir nécessaire en cas de changement de législation. Pour le Luxembourg
par exemple, le calcul de l’indice des prix à la consommation a fait l’objet de
plusieurs réformes au cours du temps 127 . Les périodes de base des
différentes séries d’indices étaient respectivement 1948, 1965, 1984, 1990,
1996 et 2005. A titre d’exemple, le raccordement de ces différentes séries
d’indices, c’est-à-dire, la détermination de l’indice des prix Pt / 48 , se fait à

travers l’indice chaîne suivant : Pt / 48 = Pt / 05 ⋅ P05 / 96 ⋅ P96 / 90 ⋅ P90 / 84 ⋅ P84 / 65 ⋅ P65 / 48

La propriété de transférabilité peut aussi être utile dans la comparaison


de séries d’indices dans l’espace et dans le temps, car elle permet, combinée
à la propriété de réversibilité, de réaliser des changements de l’année de
base. En effet, très souvent, des séries d’indices à comparer sont construites
à partir d’années de base différentes, ce qui rend les comparaisons difficiles.

PIB de l’Allemagne (en milliards d’€)

Année 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

PIB 2 062,8 2 116,2 2 146,6 2 166,8 2 203,7 2 238,5 2 327,1 2 435,9 2 477,8 2 395

Indice
base 0,952 0,977 0,991 1 1,017 1,033 1,074 1,124 1,144 1,105
(2003)

Indice
en %
95,2 97,7 99,1 100 101,7 103,3 107,4 112,4 114,4 110,5
base
(2003)
Source : www.destatis.de

On remarque que l’année de base choisie pour l’Allemagne (2003) ne


coïncide pas avec celle choisie pour le Luxembourg (2000), ce qui rend

127
www.statistiques.public.lu : Schéma des pondérations de l’indice des prix à la
consommation

211
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

difficile la comparaison de l’évolution du PIB des deux pays. Il faut donc


procéder à un changement de l’année de base afin de transformer la série
d’indices X t / 2003 en la série X t / 2000 .

En appliquant la propriété de transférabilité, nous obtenons :


X t / 2000 = X t / 2003 ⋅ X 2003 / 2000

Ensuite, en développant cette formule davantage, nous obtenons :


X 2003
X t / 2000 = X t / 2003 ⋅
X 2000

X 2003
Comme nous ne connaissons pas la valeur de , appliquons la
X 2000
propriété de réversibilité :

1
X t / 2000 = X t / 2003 ⋅
X 2000
X 2003

Ainsi, la nouvelle série d’indices X t / 2000 peut être construite sur base des

valeurs des indices de la série initiale.

A titre d’exemple, appliquons cette formule à l’année t = 2000 :

1 1
X 2000 / 2000 = X 2000 / 2003 ⋅ = 0,952 ⋅ =1
X 2000 0,952
X 2003

Pour l’époque t = 2003, nous trouvons :

1 1
X 2003 / 2000 = X 2003 / 2003 ⋅ = 1⋅ = 1,05
X 2000 0,952
X 2003

En appliquant la formule trouvée aux différentes époques t , c’est-à-dire,


en multipliant chaque valeur de l’ancienne série d’indices X t / 2003 par

1 1 1
= (respectivement par ⋅ 100 ), nous trouvons la série d’indices
X 2000 95,2 95,2
X 2003
suivante :

212
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

PIB de l’Allemagne (en milliards d’€)

Année 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

PIB 2 062,8 2 116,2 2 146,6 2 166,8 2 203,7 2 238,5 2 327,1 2 435,9 2 477,8 2 395

Indice
base 1 1,026 1,041 1,050 1,068 1,085 1,128 1,181 1,201 1,161
(2000)

Indice
en %
100 102,6 104,1 105 106,8 108,5 112,8 118,1 120,1 116,1
base
(2000)
Source : www.destatis.de

Cette nouvelle série d’indices permet donc de comparer directement


l’évolution du PIB des deux pays en se basant sur l’année 2000. Remarquons
encore que si l’indice est exprimé en %, il faut multiplier par 100 le résultat
trouvé par la formule indiquée ci-dessus.

3. Les indices synthétiques128

Comme déjà mentionné plus haut, les indices synthétiques concernent


plusieurs grandeurs, observées en principe à la même époque. Ces
grandeurs peuvent par exemple être les prix Pi ;t de N biens129 observés à la

période t , les quantités Qi ;t achetées ou produites de N biens à l’époque t ,

ou toute autre grandeur dont les N modalités X i;t ont été observées à une

certaine époque t .

3.1. Les indices synthétiques avec pondération

Les indices synthétiques avec pondération sont des moyennes


pondérées d’indices simples.

On distingue deux grandes catégories d’indices synthétiques pondérés,


à savoir les indices de Laspeyres et les indices de Paasche. Ils servent de

128
Dans ce qui suit, nous allons négliger le fait qu’il faut multiplier les indices par 100 afin de
les exprimer en %.
129
i = 1, 2, …, N

213
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

base de calcul d’autres indices synthétiques plus complexes, comme l’indice


des valeurs globales ou les indices de Fisher.

Les caractéristiques essentielles des indices de Laspeyres et de


Paasche sont résumées dans le tableau suivant :

Laspeyres Paasche

moyenne arithmétique pondérée harmonique pondérée

pondération par rapport à l’époque de base l’époque courante

Dans le cas d’indices pondérés, l’importance relative des modalités des


différentes grandeurs observées est prise en compte à travers des
N
coefficients de pondération wi , avec ∑w
i =1
i =W .

Dans ce qui suit, nous allons nous concentrer sur les indices de prix et
les indices de quantités.

3.1.1 Les indices de prix

Les indices de prix sont utilisés pour mesurer l’inflation. Ils servent aussi
à transformer des séries de valeurs nominales (à prix courants) en séries de
valeurs réelles (à prix constants), en éliminant l’effet de l’inflation130.

a) L’indice de prix de Laspeyres

L’indice de prix de Laspeyres est la moyenne arithmétique pondérée des


Pi ;t
indices de prix simples Pi ;t / 0 = , calculés pour chacun des N biens
Pi;0

observés.

L’indice de prix de Laspeyres se calcule donc d’après la formule


suivante :

130
Afin de réaliser cette transformation, il faut diviser la série nominale par l’indice de prix
approprié. Dans ce cas, l’indice de prix est encore appelé « déflateur ».

214
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N N

∑ wi ⋅ Pi;t / 0 ∑w ⋅P i i ;t / 0 N
wi
LP
t/0 = i =1
N
= i =1
=∑ ⋅Pi ;t / 0
W i =1 W
∑w
i =1
i

Comme il s’agit de calculer un indice de prix, destiné à mesurer


l’évolution du niveau des prix que doit payer un certain agent économique, il
s’avère logique que les pondérations wi représentent l’importance (le poids)

que les différents biens occupent dans les budgets des agents économiques
en question. Une idée serait d’attribuer à chaque indice Pi ;t / 0 un poids wi

correspondant au montant total dépensé pour ce bien à l’époque de base131,


de manière à ce que wi = (Qi ;0 ⋅ Pi ;0 ) . Remplaçons wi par sa nouvelle valeur

dans la formule de l’indice de prix de Laspeyres :


N

∑ (Q
i =1
i ;0 ⋅ Pi ;0 ) ⋅ Pi ;t / 0
LP
t/0 = N

∑ (Q
i =1
i ;0 ⋅ Pi ;0 )

En transformant davantage la formule, nous obtenons :


N Pi ;t
∑ (Q
i =1
i ;0 ⋅ Pi;0 ) ⋅
Pi;0
LPt/ 0 = N

∑ (Q
i =1
i ;0 ⋅ Pi ;0 )

ce qui donne après simplification la formule allégée suivante :


N

∑Q i =1
i ;0 ⋅ Pi ;t
L P
t/0 = N

∑Q i =1
i;0 ⋅ Pi;0

131
Remarquons que siwi = (Qi ;0 ⋅ Pi ;0 ) représente le montant total dépensé par un agent
économique pour un certain bien à l’époque de base, alors W représente le montant total
N
w
des dépenses d’un agent économique à l’époque t. Ainsi, dans la formule Lt / 0 = ∑ i ⋅Pi ;t / 0 ,
P

i =1 W
wi
le coefficient représente le pourcentage des dépenses qu’un agent économique a
W
effectuées pour un certain bien dans le montant des dépenses totales.

215
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Remarquons encore que le STATEC132 utilise cet indice pour calculer


les indices des prix à la consommation national (IPCN) et harmonisé (IPCH)
133
, destinés à mesurer l’inflation au Luxembourg.

b) L’indice de prix de Paasche

L’indice de prix de Paasche est la moyenne harmonique pondérée 134


Pi ;t
des indices de prix simples Pi ;t / 0 = , calculés pour chacun des N biens
Pi;0

observés.

L’indice de prix de Paasche se calcule donc d’après la formule suivante :


N

∑w
i =1
i
P P
t/0 = N
1
∑w
i =1
i ⋅
Pi;t / 0

En appliquant la propriété de réversibilité des indices simples, nous


obtenons :
N

∑w
i =1
i
P P
t/0 = N

∑w ⋅P
i =1
i i ;0 / t

Pour les indices de Paasche, le poids wi attribué à chaque indice simple

correspond au montant total dépensé pour ce bien à l’époque courante, de


manière à ce que wi = (Qi ;t ⋅ Pi;t ) . Remplaçons wi par cette expression dans la

formule de l’indice de prix de Paasche :

132

www.statistiques.public.lu/stat/ReportFolders/ReportFolder.aspx?IF_Language=fra&MainThe
me=5&FldrName=5
133
IPCN : basé sur les dépenses des résidents ; IPCH : basé sur les dépenses totales sur le
territoire
134
La moyenne harmonique pondérée de N termes xi est égale à l’inverse de la moyenne
1 1
pondérée des termes : H =W ⋅ N
xi 1
∑w
i =1
i
xi

216
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

∑ (Q
i =1
i ;t ⋅ Pi;t )
P P
t/0 = N

∑ (Q
i =1
i ;t ⋅ Pi;t ) ⋅ Pi;0 / t

En transformant la formule, nous obtenons :


N

∑ (Q
i =1
i ;t ⋅ Pi;t )
P P
t/0 = N Pi ;0
∑ (Q
i =1
i ;t ⋅ Pi ;t ) ⋅
Pi ;t

Ce qui devient après simplification :


N

∑Q
i =1
i ;t ⋅ Pi ;t
P P
t/0 = N

∑Q
i =1
i ;t ⋅ Pi;0

Remarquons que tant pour l’indice de prix de Laspeyres que pour


l’indice de prix de Paasche, on ne regarde que l’évolution des prix, les
quantités sont supposées constantes.

3.1.2 Les indices de quantités

Dans le calcul des indices de quantité de Laspeyres et de Paasche, les


poids wi attribués aux différents indices simples des quantités des différents

biens Qi;t / 0 restent les mêmes que pour les indices de prix respectifs.

a) L’indice de quantités de Laspeyres

L’indice de quantités de Laspeyres est la moyenne arithmétique


Qi ;t
pondérée des indices de quantités simples Qi;t / 0 = , calculés pour chacun
Qi;0

des N biens observés.

L’indice de quantités de Laspeyres se calcule donc d’après la formule


suivante :

217
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

∑w ⋅Q
i =1
i i ;t / 0
LQ
t/0 = N

∑w
i =1
i

En transformant la formule, et en remplaçant wi par (Qi ;0 ⋅ Pi ;0 ) nous

obtenons :

N Qi ;t
∑ (Q
i =1
i ;0 ⋅ Pi;0 ) ⋅
Qi ;0
LQt/ 0 = N

∑ (Q
i =1
i;0 ⋅ Pi ;0 )

ce qui mène, après simplification, à la formule allégée suivante :


N

∑Q
i =1
i ;t ⋅ Pi ;0
L Q
t/0 = N

∑Q
i =1
i ;0 ⋅ Pi ;0

b) L’indice de quantités de Paasche

L’indice de quantités de Paasche est la moyenne harmonique pondérée


Qi ;t
des indices de quantités simples Qi;t / 0 = , calculés pour chacun des N
Qi;0

biens observés.

L’indice de quantités de Paasche se calcule donc d’après la formule


suivante :
N

∑w
i =1
i
P Q
t/0 = N
1
∑w
i =1
i ⋅
Qi ;t / 0

En appliquant la propriété de réversibilité des indices simples, nous


obtenons :
N

∑w
i =1
i
P Q
t/0 = N

∑w
i =1
i ⋅ Qi;t / 0

218
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

En transformant la formule, et en remplaçant wi par (Qi ;t ⋅ Pi ;t ) nous

obtenons :
N

∑ (Q
i =1
i ;t ⋅ Pi;t )
P Q
t/0 = N Qi;0
∑ (Q
i =1
i ;t ⋅ Pi;t ) ⋅
Qi;t

Ce qui devient après simplification :


N

∑Q
i =1
i ;t ⋅ Pi ;t
P Q
t/0 = N

∑Q
i =1
i ;0 ⋅ Pi ;t

Remarquons que tant pour l’indice de quantités de Laspeyres que pour


l’indice de quantités de Paasche, on ne regarde que l’évolution des quantités,
les prix sont supposés constants.

Remarque :

Les indices de Laspeyres et de Paasche ne sont ni réversibles 135, ni


transférables136.

3.2. Les indices synthétiques avec pondération : l’indice des


valeurs globales et les indices de Fisher

Ces deux types d’indices sont construits sur base des indices de
Laspeyres et de Paasche.

3.2.1 L’indice des valeurs globales

L’indice des valeurs globales mesure l’évolution conjointe des prix et des
quantités. Il évalue donc en quelque sorte l’évolution des dépenses totales
effectuées par les agents économiques.

135
Exemple : si un de ces indices mène à la conclusion que les prix ont triplé de l’année 0
jusqu’en t , alors ce même indice ne permet pas de conclure que les prix en 0 étaient le tiers
de ceux en t .
136
Exemple : si un de ces indices mène à la conclusion que les prix ont doublé de l’année 0
jusqu’en θ et qu’ils ont triplé de θ jusqu’en t , on ne peut pas conclure que les prix ont été
multipliés par six de l’année 0 jusqu’en t .

219
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

∑Q
i =1
i ;t ⋅ Pi;t
I vg
t/0 = N

∑Q
i =1
i;0 ⋅ Pi;0

En outre, l’indice des valeurs globales a les propriétés suivantes :

o I tvg/ 0 = LPt/ 0 ⋅ Pt Q/ 0

o I tvg/ 0 = LQt/ 0 ⋅ Pt P/ 0

Ces propriétés de l’indice des valeurs globales permettent de


décomposer l’évolution nominale137 de grandeurs économiques (comme les
dépenses totales, le stock de capital, les importations ou exportations de
marchandises, …) en une composante réelle138 (évolution des quantités) et
une composante rendant compte de l’évolution des prix, permettant ainsi de
« séparer » l’évolution des quantités de l’inflation139.

3.2.2 Les indices de Fisher

Les indices de prix et de quantités de Fisher sont les moyennes


géométriques simples140 des indices de Laspeyres et de Paasche respectifs.

a) L’indice de prix de Fisher

Ft P/ 0 = LPt/ 0 ⋅ Pt P/ 0

b) L’indice de quantités de Fisher

Ft Q/ 0 = LQt/ 0 ⋅ Pt Q/ 0

Remarquons que les indices de Fisher sont réversibles, mais non


transférables. De plus, les indices de Fisher peuvent être utilisés afin de

137
à prix courants (prix de l’époque t )
138
à prix constants (prix de l’époque de base 0)
139
Ceci est important dans la mesure où, par exemple, une augmentation de la valeur d’une
grandeur économique peut bien se réaliser par une augmentation des prix accompagnée
d’une diminution des quantités.
140
La moyenne géométrique de N termes est égale à la racine N ème du produit de ces N
N
termes : G = N x1 ⋅ x2 ⋅ ... ⋅ x N = N ∏ xi
i =1

220
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

décomposer l’évolution de grandeurs économiques en évolutions nominale


(en valeur) et réelle (en volume) :

Ft vg/ 0 = Ft P/ 0 ⋅ Ft Q/ 0

4. Application résolue

Supposons que les quantités de biens (1 kg de pain de ménage non


coupé, 1 l de lait frais, 1 douzaine d’oeufs) consommés par un ménage de
taille moyenne et les prix141 respectifs ont évolué comme suit :

2005 2007 2009

Unités Prix en € Unités Prix en € Unités Prix en €

pain 100 2,3 104 2,5 108 2,7

lait 150 0,9 160 1 162 1,2

œufs 26 2,9 24 3,1 27 3,6

En prenant l’année 2005 comme année de base, calculez (en %) :

a. les indices de Laspeyres et de Paasche relatifs aux prix


100 ⋅ 2,5 + 150 ⋅ 1 + 26 ⋅ 3,1
LP07 / 05 = ⋅ 100 = 109,128
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9
104 ⋅ 2,5 + 160 ⋅ 1 + 24 ⋅ 3,1
P07P / 05 = ⋅ 100 = 109,187
104 ⋅ 2,3 + 160 ⋅ 0,9 + 24 ⋅ 2,9

100 ⋅ 2,7 + 150 ⋅ 1,2 + 26 ⋅ 3,6


LP09 / 05 = ⋅ 100 = 123,433
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9
108 ⋅ 2,7 + 162 ⋅ 1,2 + 27 ⋅ 3,6
P09P / 05 = ⋅ 100 = 123,429
108 ⋅ 2,3 + 162 ⋅ 0,9 + 27 ⋅ 2,9

En supposant que les gens consomment les mêmes quantités des


différents biens en 2007 et 2009 qu’en 2005, d’après les indices de prix de
Laspeyres, les prix ont augmenté de 9,128 % entre 2005 et 2007 et de
23,433 % entre 2005 et 2009.

141
Prix d’après STATEC, Le Luxembourg en chiffres, 2005, 2007, 2009

221
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

En supposant que les gens ont consommé les mêmes quantités en 2005
qu’en 2007, d’après l’indice de prix de Paasche, les prix ont augmenté de
9,187 % de 2005 à 2007. En supposant que les gens ont consommé les
mêmes quantités en 2005 qu’en 2009, les prix ont augmenté de 23,429 % sur
cette même période, d’après l’indice de prix de Paasche.

b. les indices de Laspeyres et de Paasche relatifs aux quantités :


104 ⋅ 2,3 + 160 ⋅ 0,9 + 24 ⋅ 2,9
LQ07 / 05 = ⋅ 100 = 102,816
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9
104 ⋅ 2,5 + 160 ⋅ 1 + 24 ⋅ 3,1
P07Q / 05 = ⋅ 100 = 102,871
100 ⋅ 2,5 + 150 ⋅ 1 + 26 ⋅ 3,1

108 ⋅ 2,3 + 162 ⋅ 0,9 + 27 ⋅ 2,9


LQ09 / 05 = ⋅ 100 = 107,289
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9
108 ⋅ 2,7 + 162 ⋅ 1,2 + 27 ⋅ 3,6
P09Q / 05 = ⋅ 100 = 107,285
100 ⋅ 2,7 + 150 ⋅ 1,2 + 26 ⋅ 3,6

En supposant que les prix n’ont pas changé en 2007 et en 2009 par
rapport à l’année 2005, d’après l’indice de quantités de Laspeyres, les
quantités consommées ont augmenté de 2,816 % de 2005 à 2007 et de
7,289 % de 2005 jusqu’en 2009.

En supposant que les prix ont été les mêmes en 2005 qu’en 2007,
d’après l’indice de quantités de Paasche, la consommation de biens a
augmenté de 2,871 % de 2005 à 2007. En supposant que les prix ont été les
mêmes en 2005 qu’en 2009, la consommation des différents biens a
augmenté de 7,285 % de 2005 à 2009.

c. l’indice des valeurs globales selon trois manières différentes


LP07 / 05 ⋅ P07Q / 05 109,128 ⋅ 102,871
I 07vg / 05 = = = 112,262
100 100
LQ07 / 05 ⋅ P07P / 05 102,816 ⋅ 109,187
I 07vg / 05 = = = 112,262
100 100
104 ⋅ 2,5 + 160 ⋅ 1 + 24 ⋅ 3,1
I 07vg / 05 = ⋅ 100 = 112,262
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9

222
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

LP09 / 05 ⋅ P09Q / 05 123,433 ⋅ 107,285


I vg
09 / 05 = = = 132,425
100 100
LQ09 / 05 ⋅ P09P / 05 107,289 ⋅ 123,429
I vg
09 / 05 = = = 132,425
100 100
108 ⋅ 2,7 + 162 ⋅ 1,2 + 27 ⋅ 3,6
I 09vg / 05 = ⋅ 100 = 132,425
100 ⋅ 2,3 + 150 ⋅ 0,9 + 26 ⋅ 2,9

D’après l’indice des valeurs globales, la valeur des paniers consommés


(ou bien : le montant dépensé par les ménages afin d’acheter ces différents
biens) a augmenté de 12,262 % de 2005 à 2007 et de 32,425 % de 2005 à
2009.

d. les indices de Fisher

F07P / 05 = LP07 / 05 ⋅ P07P / 05 = 109,128 ⋅ 109,187 = 109,158

F07Q / 05 = LQ07 / 05 ⋅ P07Q / 05 = 102,816 ⋅ 102,871 = 102,844

F07P / 05 ⋅ F07Q / 05 109,158 ⋅ 102,844


F07vg/ 05 = = = 112,262
100 100

F09P / 05 = LP09 / 05 ⋅ P09P / 05 = 123,433 ⋅ 123,429 = 123,431

F09Q / 05 = LQ09 / 05 ⋅ P09Q / 05 = 107,289 ⋅ 107,285 = 107,287

F09P / 05 ⋅ F09Q / 05 123,431 ⋅ 107,287


F09vg/ 05 = = = 132,425
100 100

L’augmentation de 12,262 % de la valeur des paniers consommés entre


2005 et 2007 est due à une augmentation des prix de 9,158 % et une
augmentation des quantités consommées de 2,844 %. De même,
l’augmentation de la valeur des paniers consommés de 32,425 % entre 2005
et 2009 est due à une augmentation des prix de 23,431 % et une
augmentation des quantités consommées de 7,287 % sur cette même
période.

223
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5. Exercices

Exercice 1

Montrez que les indices de Laspeyres et de Paasche ne sont ni


réversibles, ni transférables.

Exercice 2

Montrez que :

a. I tvg/ 0 = LPt/ 0 ⋅ Pt Q/ 0 ;

b. I tvg/ 0 = LQt/ 0 ⋅ Pt P/ 0 .

Exercice 3

Montrez que I tvg/ 0 = Ft vg/ 0 .

Exercice 4

142
Début année Diesel Super 95 octane Super 98 octane

2001 0,629 0,766 0,808


2002 0,620 0,707 0,767
2003 0,652 0,788 0,831

2004 0,622 0,826 0,854


2005 0,724 0,877 0,902
2006 0,849 1,036 1,060
2007 0,876 1,030 1,045
2008 1,029 1,169 1,193
2009 0,909 0,861 0,877
2010 0,896 1,084 1,107
2011 1,089 1,236 1,263
Source : www.statistiques.public.lu

a. Calculez les séries d’indices de prix simples des différents types de


carburants en prenant l’année 2001 comme année de base.

142
Il s’agit à chaque fois des prix (en €) en vigueur au début de l’année en question.

224
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b. Comparez l’évolution des prix des différents types de carburant à l’aide


des séries d’indices de prix simples calculées précédemment. Que
constatez-vous ?

Exercice 5143

Pain Confiture Café


Année
P Q P Q P Q

N 2 4 2 3 3 5

N+1 3 4 3 3 3 6

Calculez les indices suivants :

a. LPN +1 / N

b. I Nvg+1 / N

Exercice 6144

On a relevé les prix de trois articles pour les années 2000 et 2006

Article 1 Article 2 Article 3


Année
Prix en € Quantités Prix en € Quantités Prix en € Quantités

2000 12 80 12 40 16 20

2006 14 100 13 40 16 40

a. Calculez :
i l’indice Laspeyres prix : LP2006 / 2000
Q
ii l’indice Paasche quantités : P2006 / 2000

vg
iii l’indice des valeurs globales : I 2006 / 2000

/ 2000 = L2006 / 2000 ⋅ P2006 / 2000


vg P Q
b. Montrez que I 2006

143
Examen de fin d’études secondaires, septembre 2009
144
Examen de fin d’études secondaires, juin 2006

225
Partie II

Éléments du calcul des probabilités

227
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 4 : Calcul des probabilités

1. Introduction

Illustrons pour commencer la relation entre la statistique descriptive et le


calcul des probabilités. Supposons que nous lançons 120 fois un dé non pipé
à six faces. Nous savons que les résultats possibles sont 1, 2, 3, 4, 5 ou 6145.
Suite aux 120 lancers, les résultats obtenus sont présentés dans un tableau :

Nombre de
Points obtenus Fréquences
réalisations
xi fi
ni

1 26 0,21 6

2 14 0,11 6
3 21 0,175

4 22 0,18 3

5 20 0,1 6

6 17 0,141 6

Total : 120 1

En répétant la même expérience 1 200 fois, les résultats obtenus sont


les suivants146 :

Nombre de
Points obtenus Fréquences
réalisations
xi fi
ni
1 198 0,165

2 202 0,168 3

3 194 0,161 6

4 196 0,16 3

5 206 0,171 6
6 204 0,170
Total : 1 200 1

145
Il s’agit donc d’une variable quantitative discrète.
146
Notons que si on répète la même expérience encore une fois, les fréquences observées
ne seront en général plus les mêmes.

229
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Cependant, en lançant un dé une fois, on sait intuitivement que la


1
chance d’obtenir un des six chiffres est de = 0,1 6 . On remarque donc, qu’en
6
augmentant le nombre de répétitions de l’expérience, la fréquence observée
pour chacun des six résultats se rapproche davantage de la fréquence
théorique à laquelle on peut s’attendre147. Ainsi, en répétant l’expérience un
nombre infini de fois, la fréquence observée tend vers la fréquence théorique,
que l’on appelle encore « probabilité ». De manière analogue, en constituant
un échantillon représentatif comprenant un nombre suffisamment élevé
d’observations, on peut tirer des conclusions sur la population entière à partir
des fréquences établies sur base de l’échantillon.

2. Événements et opérations sur les événements

2.1. Événements

Reprenons l’exemple précédent du dé à six faces. Dans ce contexte, le


fait de lancer un dé une fois peut être appelé « expérience aléatoire », étant
donné que cette expérience est soumise au hasard. De manière générale, il
s’agit donc d’une expérience dont on connaît tous les résultats possibles,
mais dont on ne sait pas lequel des résultats sera réalisé (on ne connaît donc
pas le résultat certain) avant d’avoir fait l’expérience.

En lançant le dé une fois, le résultat obtenu fait partie de l’ensemble de


tous les résultats possibles, noté Ω . Dans notre exemple, Ω = {1, 2, 3, 4, 5, 6}.

Supposons ensuite que nous voulons obtenir un nombre impair en


lançant le dé une seule fois. Dans ce cas précis, l’ensemble des résultats
désirables peut être résumé comme suit : I = {1, 3, 5}. Si, en lançant le dé une
seule fois, nous obtenons le 1, le 3 ou le 5, on dit encore que l’événement
« obtenir un nombre impair » est réalisé. Ainsi, l’ensemble148 I = {1, 3, 5} peut
encore être considéré comme l’événement « obtenir un nombre impair ».

147
« Loi des grands nombres ».
148
Remarquons encore que I est un sous-ensemble de Ω.

230
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Notions :

o Ω : événement « certain » : ensemble de tous les résultats


possibles ;

o ∅ : événement « impossible » : ensemble de tous les résultats


imaginables qui ne peuvent pas être des résultats de l’expérience
aléatoire ; pour l’expérience du jet du dé, un exemple d’événement
impossible est l’événement {obtenir un nombre < 1} .

De manière générale, on appelle événement tout sous-ensemble de Ω


tel qu’à l’issue de l’expérience aléatoire, il est possible de déterminer si
l’événement s’est produit ou non149.

Si Ω contient n éléments alors les singletons e1 , e2 , … , en sont

appelés événements élémentaires. En reprenant l’exemple de


Ω = {1, 2, 3, 4, 5, 6} , les événements élémentaires sont e1 = {1} , e2 = {2} , e3 =

{3}, e4 = {4}, e5 = {5} et e6 = {6} .

2.2. Opérations sur les événements

2.2.1 Implication

Considérons les événements I = {obtenir un nombre impair} = {1, 3, 5} et J =

{obtenir le 5} = {5}. On remarque que si J est réalisé, I est réalisé en même


temps. On dit que la réalisation de J implique la réalisation de I et on note
J⊂I.

I 3
5

1 J 6
4

149
D’après BOGAERT, P., Probabilités pour scientifiques et ingénieurs, De Boeck, Bruxelles,
2007

231
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.2.2 Incompatibilité

Considérons l’événement I = {obtenir un nombre impair} et l’événement K


= {2, 4} . On remarque que les événements I et K ne peuvent pas être
réalisés en même temps : I ∩ K = ∅ . Dans ce cas, on dit que ces
événements sont incompatibles.

K 2 6
4

I 1
3 5


2.2.3 Événements complémentaires (contraires)

Considérons les événements I = {obtenir un nombre impair} et


L = {obtenir un nombre pair} . On remarque que si I est réalisé, L ne peut pas
être réalisé et vice versa. Cependant, contrairement au paragraphe précédent,
la non réalisation de I entraîne la réalisation de L et vice versa. Les
événements I et L sont donc complémentaires si I ∩ L = ∅ et I ∪ L = Ω .
L’événement contraire à l’événement I est encore noté I .

I L= I
1
2
4
3
6
5

Remarques :

Ω et ∅ sont aussi des événements complémentaires, car Ω ∩ ∅ = ∅


et Ω ∪ ∅ = Ω .

De manière générale, comme l’intersection d’événements


complémentaires est vide (∅ ) , les événements complémentaires sont

232
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

incompatibles. Ainsi, par exemple, les événements I et L sont incompatibles


car I ∩ L = ∅ .

Attention : deux événements incompatibles ne sont pas nécessairement


complémentaires, étant donné que leur réunion ne correspond pas
nécessairement à Ω (voir événements I et K ci-dessus).

2.2.4 Intersection

Considérons les événements I = {1, 3, 5} , M = {3, 5, 6} et N = {3, 5} . On


remarque que N est réalisé si I et M sont réalisés en même temps. Ainsi,
N peut se réécrire sous forme d’intersection des événements I et M : N =
I∩M.

I N M
1 3
5 6

2 Ω
2.2.5 Réunion d’événements élémentaires

L’événement I = {obtenir un nombre impair} = {1, 3, 5} se compose des


événements élémentaires e1 = {1} , e3 = {3} et e5 = {5}. I est réalisé si e1 ou

e3 ou e5 sont réalisés, c’est à dire si au moins un des trois événements

élémentaires est réalisé. L’événement I = {1, 3, 5} peut donc encore être noté
sous forme d’union des événements élémentaires 150 e1 , e3 et e5 : I =

e1 ∪ e2 ∪ e3 .

150
Remarquons que les événements élémentaires sont deux à deux incompatibles.

233
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

e1 e5 5
1 I
3
e3
4 6

3. Mesure de la probabilité

On vient de voir dans l’introduction que lorsque l’on lance un dé une fois,
1
la probabilité d’obtenir un résultat précis est de . Ainsi, par exemple,
6
1
l’événement 151 e1 se réalise avec une probabilité de . On remarque qu’il
6
s’agit du rapport entre le nombre d’éléments de l’événement élémentaire e1 =
{1} et le nombre d’éléments de Ω = {1, 2, 3, 4, 5, 6}. Pour l’événement I = {1, 3, 5},
dont on sait qu’il est réalisé si e1 ou e3 ou e5 est réalisé, on peut en déduire

3
que la probabilité d’obtenir un nombre impair est de . De nouveau, on
6
remarque qu’il s’agit du rapport entre le nombre d’éléments de l’événement à
réaliser, c'est-à-dire du nombre de cas favorables à la réalisation de
l’événement I et le nombre d’éléments de l’événement Ω qui comprend tous
les cas possibles.

De manière générale, la probabilité P(A ) qu’un événement quelconque


A se réalise, est donc déterminée par la formule suivante152 :

nombre de cas favorables card(A )


P(A) = = .
nombre de cas possibles card (Ω)

Comme 0 ≤ card(A ) ≤ card(Ω ) 153, on sait que 0 ≤ P(A ) ≤ 1 .

151
De même que pour les autres événements élémentaires.
Le cardinal (card ) d’un ensemble est le nombre d’éléments de cet ensemble.
152

153
card(∅ ) = 0

234
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

4. Dénombrements

Les cardinaux des événements ne sont pas toujours si facile à


déterminer que pour le jet du dé. Pour déterminer le nombre d’éléments des
différents ensembles, donc le nombre de cas favorables et possibles, nous
devons d’abord nous doter de certains outils nous aidant à dénombrer les
résultats d’expériences aléatoires.

4.1. Les permutations

L’utilisation des permutations se fait dans bon nombre de situations de la


vie quotidienne. Un exemple en est la détermination du nombre total de
classements finals possibles lors d’une course. Illustrons le calcul des
permutations à l’aide d’un exemple simplifié mais concret.

Lors du championnat national d’athlétisme, 5 coureurs participent à la


finale du sprint de 100 m. Quel est le nombre total de classements finals
possibles ?

Attribuons des dossards numérotés de S1 à S5 aux différents sprinteurs.

Supposons que le coureur portant le dossard S1 gagne la course. Les


différentes occupations possibles des places 2 à 5 sont alors résumées dans
le schéma ci-dessous :

235
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Comme chacun des 5 coureurs peut gagner la course, on pourrait donc tracer
en tout 5 de ces arbres. Pour chacun des 5 gagnants possibles, il y a donc à
chaque fois 4 coureurs qui peuvent occuper la 2ème place. Les deux
premières places étant alors déterminées, il reste à chaque fois 3 coureurs
pouvant devenir 3ème. Les trois premières places étant déterminées, il reste à
chaque fois 2 coureurs qui peuvent se placer en 4ème position. Les quatre
premières places étant déterminées, il reste à chaque fois 1 coureur qui
occupe la 5ème place.

236
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Le tableau ci-dessous résume le raisonnement précédent :

ère
1 place 5 possibilités
ème
2 place 4 possibilités
ème
3 place 3 possibilités
ème
4 place 2 possibilités
ème
5 place 1 possibilité

Le nombre total de classements finals possibles lors d’une course de 5


coureurs est donc de 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅ 1 = 120 .

De manière générale, le nombre de permutations Pn indique le nombre

de manières différentes possibles de ranger les n éléments d’un certain


ensemble dans un certain ordre. Il s’agit donc du nombre de listes ordonnées
que l’on peut créer à partir de tous les éléments d’un certain ensemble.

Pn = n ⋅ (n − 1) ⋅ (n − 2 ) ⋅ ... ⋅ 3 ⋅ 2 ⋅1 = n!

En revenant à notre exemple, le nombre total de classements finals


possibles lors d’une course de 5 coureurs est de P5 = 5!= 120 .

Remarques :

o n! se lit « factoriel n »

o Par convention : 0!= 1!

o Ceci implique que P0 = 1

o Dans une permutation, l’ordre joue un rôle.

o Chaque élément n’est utilisé qu’une seule fois.

4.2. Les arrangements sans répétitions

Comme pour les permutations, les arrangements sont utiles dans bon
nombre de situations de la vie quotidienne. Des exemples en sont la
détermination du nombre total de compositions des hautes charges d’un
comité154 ou du nombre total d’occupations possibles du podium lors d’une

154
président, vice-président(s), secrétaire, trésorier

237
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

course. Reprenons donc l’exemple simplifié précédent afin d’illustrer le calcul


des arrangements.

Lors du championnat national d’athlétisme, 5 coureurs participent à la


finale du sprint de 100 m. Quel est le nombre total d’occupations possibles du
podium ?

Appliquons le même raisonnement que celui vu ci-dessus. Pour chacun


des 5 gagnants possibles, il y a à chaque fois 4 coureurs qui peuvent
occuper la 2ème place. Pour chacun des 4 coureurs occupant la 2ème place, il y
a à chaque fois 3 coureurs qui peuvent se placer en 3ème position.

Le tableau ci-dessous résume le raisonnement précédent :

ère
1 place 5 possibilités
ème
2 place 4 possibilités
ème
3 place 3 possibilités

Le nombre total d’occupations possibles du podium lors d’une course de


5 coureurs est donc de 5 ⋅ 4 ⋅ 3 = 60 .

De manière générale, le nombre d’arrangements sans répétitions Ank de

k éléments d’un ensemble comprenant en total n éléments (k ≤ n ) indique le


nombre de manières différentes possibles de ranger k éléments d’un certain
ensemble dans un certain ordre. Il s’agit donc du nombre de listes ordonnées
que l’on peut former à partir d’un nombre restreint d’éléments issus d’un
certain ensemble.

Ank = n ⋅ (n − 1) ⋅ (n − 2 ) ⋅ ... ⋅ (n − k + 1)

En multipliant et en divisant l’expression précédente par (n − k ) ! , la


formule peut encore se présenter de manière différente :

n ⋅ (n − 1) ⋅ ... ⋅ (n − k + 1) ⋅ (n − k )!
Ank =
(n − k )!
n ⋅ (n − 1) ⋅ ... ⋅ (n − k + 1) ⋅ [(n − k ) ⋅ (n − k − 1) ⋅ ... ⋅ 3 ⋅ 2 ⋅ 1] n!
= =
(n − k )! (n − k )!

238
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

n!
Ank =
(n − k )!
En revenant à notre exemple, le nombre total d’occupations possibles du
podium lors d’une course de 5 coureurs est donc de
5! 5!
A53 = = = 5 ⋅ 4 ⋅ 3 = 60 .
(5 − 3)! 2!
Remarques :

n! n!
o si k = 0 : An0 = = =1
(n − 0)! n!
n!
o si k = 1 : An1 = = n
(n − 1)!
n!
o si k = n : Ann = = n ! = Pn
(n − n )!
o Dans un arrangement sans répétitions, l’ordre joue un rôle.

o Chaque élément n’est utilisé qu’une seule fois (pas de répétition).

4.3. Les combinaisons

Contrairement aux arrangements, l’ordre ne joue pas de rôle pour les


combinaisons. Reprenons l’exemple simplifié précédent afin d’illustrer le
calcul des combinaisons.

Lors du championnat national d’athlétisme, 5 coureurs participent à la


finale du sprint de 100 m. Supposons que les trois premiers de cette course
se qualifieront pour la participation au championnat d’Europe. Quel est le
nombre de délégations possibles pouvant être envoyées au championnat
d’Europe ?

Nous savons du paragraphe précédent, que le nombre total


d’occupations possibles du podium est de A53 = 5 ⋅ 4 ⋅ 3 = 60 .

Cependant, dans ce cas ci, on ne s’intéresse qu’au nombre de groupes


de 3 personnes que l’on peut former à partir de 5 coureurs. L’ordre à
l’intérieur des groupes ne joue pas de rôle ! A titre d’exemple, les six résultats

239
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

suivants sont équivalents et permettent de former le même groupe de


délégués :

1 2 3 1 2 3 1 2 3

S1 S2 S3 S2 S1 S3 S3 S1 S2

S1 S3 S2 S2 S3 S1 S3 S2 S1

Comme l’ordre ne joue pas de rôle dans le calcul du nombre de


combinaisons, on divise le nombre total de listes ordonnées de 3 personnes
pouvant être formées sur base d’un groupe de 5 personnes ( A53 = 60 ) par le

nombre total de possibilités de former des listes ordonnées de 3 personnes


sur base d’un groupe de 3 personnes ( A33 = P3 = 6 ). Le nombre total de

délégations possibles pouvant être envoyées au championnat d’Europe est


60
donc de = 10 .
6

De manière générale, le nombre de combinaisons Cnk indique le nombre

de listes (groupes) non ordonnées de k éléments pouvant être formées sur


base d’un ensemble comprenant n éléments (k ≤ n ) .

n!

C nk =
A k
n
=
(n − k )! = n!
Pk k! (n − k )!k!
n!
C nk =
(n − k )!k!
En revenant à notre exemple, le nombre total de délégations de 3
personnes pouvant être formées sur base d’un groupe de 5 personnes est
5! 5⋅4
donc de C 53 = = = 10 .
(5 − 3)! 3! 2!
Remarques :

n! n!
o si k = 0 : C n0 = = =1
(n − 0)! ⋅ 0! n!

240
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

n!
o si k = 1 : C n1 = = n = An1
(n − 1)!⋅ 1!
n! n!
o si k = n : C nn = = =1
(n − n )! ⋅ n! 0!⋅n!
n! n!
o Cnk = Cnn − k , car C nk = = = C n−k
(n − k )!⋅ k! k!⋅(n − k )! n
o Chaque élément n’est utilisé qu’une seule fois (pas de répétition).

4.4. Les arrangements avec répétitions

On rencontre les arrangements avec répétitions souvent dans la vie


quotidienne, lorsqu’il s’agit par exemple de déterminer le nombre de mots
pouvant être formés avec un certain ensemble de lettres, les différents codes
secrets pouvant être formés par un certain ensemble de chiffres, le nombre
de plaques d’immatriculation pouvant être formées selon un certain système
(exemple : XY 1224), … Dans ce type d’arrangements, le même élément peut
être utilisé plusieurs fois.

Illustrons les différents cas possibles d’arrangements avec répétition à


l’aide d’exemples concrets.

Supposons tout d’abord que l’on doit former un code secret à 2 éléments
sur base d’un ensemble de 3 éléments, chaque élément pouvant être utilisé
plusieurs fois.

Pour le premier élément du code nous disposons de 3 possibilités. Pour


chacune de ces 3 possibilités, il y a de nouveau 3 choix possibles pour le 2ème
élément du code. Illustrons ce raisonnement à l’aide d’un schéma, où a , b et
c représentent les 3 éléments pouvant servir de base à la formation du code.

1 2 1 2 1 2

a a b a c a

a b b b c b

a c b c c c

241
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Le nombre total de codes possibles est donc de 9 = 32.

Supposons ensuite que l’on doit former un code secret à 3 éléments sur
base d’un ensemble de 3 éléments, chaque élément pouvant être utilisé
plusieurs fois.

Pour le premier élément du code nous disposons de 3 possibilités. Pour


chacune de ces 3 possibilités, il y a de nouveau 3 choix possibles pour le 2ème
élément du code. Pour chacune de ces 3 possibilités, il y a de nouveau 3
choix possibles pour le 3ème élément du code.

Illustrons ce raisonnement à l’aide d’un schéma, où a , b et c


représentent les 3 éléments pouvant servir de base à la formation du code.

1 2 3 1 2 3 1 2 3

a a a b a a c a a

a a b b a b c a b

a a c b a c c a c

a b a b b a c b a

a b b b b b c b b

a b c b b c c b c

a c a b c a c c a

a c b b c b c c b

a c c b c c c c c

Le nombre total de codes possibles est donc de 27 = 33.

Comme dans le cas d’arrangements avec répétitions chaque élément


peut être utilisé plusieurs fois, le nombre d’éléments (la taille) des
arrangements peut dépasser le nombre d’éléments de l’ensemble d’éléments
« à disposition ». Ainsi, à titre d’exemple, il est parfaitement possible de
former des codes secrets à 4 éléments sur base des 3 éléments a , b et c .
Le nombre total de codes possibles serait alors de 34 = 81.

De manière générale, le nombre d’arrangements avec répétitions Rnk de

k éléments d’un ensemble comprenant en total n éléments indique le

242
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

nombre de manières différentes possibles de ranger k éléments pouvant être


utilisés à plusieurs reprises dans un certain ordre.

Rnk = n k

Ainsi, par exemple, le nombre de codes à 3 chiffres que l’on peut former
avec les 10 chiffres de 0 à 9 est de R103 = 10 3 = 1000 .

Remarques :

o Comme chaque élément peut être utilisé plusieurs fois, k peut être
supérieur à n .

o Dans un arrangement avec répétitions, l’ordre joue un rôle.

4.5. Tableau récapitulatif

Le tableau suivant permet de saisir rapidement la formule adaptée aux


problèmes posés dans les exercices et ce sur base des critères de l’ordre et
de la répétition des différents éléments disponibles.

Ordre Répétition Choix

oui oui  successif avec remise Rnk

oui non  successif sans remise Ank

non non  simultané C nk

5. Théorie des probabilités

Le calcul des probabilités est basé sur deux grands axiomes, à partir
desquels on peut déduire un certain nombre de règles.

5.1. Axiomes de la théorie des probabilités

Axiome 1

card(Ω )
P(Ω ) = =1
card(Ω )

243
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La probabilité que l’événement certain se réalise vaut 1. En effet, en


effectuant une expérience aléatoire quelconque, on est sûr de tomber sur un
résultat faisant partie de l’ensemble de tous les résultats.

Axiome 2

Soient les événements A et B tels que A ∩ B = ∅ ( A et B sont


incompatibles155) :

P(A ∪ B) = P(A ) + P(B)


P(A ∪ B) = P(A est réalisé ou B est réalisé)

5.2. Conséquences des axiomes de la théorie des probabilités

Conséquence 1 :

Si A est l’événement complémentaire de A , alors

P(A ) = 1 − P(A )

A
A


Démonstration :

On sait que A ∪ A = Ω et que A ∩ A = ∅ .

155
Rappelons que deux événements sont incompatibles s’ils ne peuvent pas être réalisés en
même temps.

244
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

D’après le 1er axiome, P(A ∪ A ) = P(Ω ) = 1 .

D’après le 2ème axiome, P(A ∪ A ) = P(A ) + P(A ) , car A ∩ A = ∅ .

Ainsi, P(A ) + P(A ) = 1  P(A ) = 1 − P(A ) .

Conséquence 2 :

La probabilité que l’événement impossible ∅ se réalise vaut 0 :

P(∅ ) = 0

Démonstration :

On sait que Ω ∪ ∅ = Ω et que Ω ∩ ∅ = ∅ .

D’après le 1er axiome, P(Ω ∪ ∅ ) = P(Ω ) = 1 .

D’après le 2ème axiome, P(Ω ∪ ∅ ) = P(Ω ) + P(∅ ) , car Ω ∩ ∅ = ∅ .

Ainsi, P(Ω ) + P(∅ ) = 1  1 + P(∅ ) = 1  P(∅ ) = 0 .

Conséquence 3 :

Tout événement A peut être écrit comme la réunion d’un nombre


déterminé d’événements élémentaires ei deux à deux incompatibles :

ei ∩ e j = ∅ , ∀ i ≠ j .

Ainsi, si A = e1 ∪ e2 ∪ e3 et e1 ∩ e2 = ∅ , e1 ∩ e3 = ∅ et e2 ∩ e3 = ∅ ,

alors P(A ) = P(e1 ) + P(e2 ) + P(e3 ) .

Conséquence 4 :

Si A et B sont des événements quelconques, alors

P(A ∪ B) = P(A ) + P(B) − P(A ∩ B)

245
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

A B
e1 e2 e3


Démonstration :

Soient les événements élémentaires e1 , e2 et e3 deux à deux

incompatibles ainsi que les événements A = e1 ∪ e2 et B = e2 ∪ e3 .

On peut en tirer A ∪ B = e1 ∪ e2 ∪ e3 et que A ∩ B = e2 . A et B ne sont

donc pas incompatibles, étant donné que A ∩ B ≠ ∅ .

Nous savons donc que P(A ∩ B) = P(e2 )

De plus, d’après le 2ème axiome :

P(A ) = P(e1 ) + P(e2 )

P(B) = P(e2 ) + P(e3 )

P(A ∪ B) = P(e1 ) + P(e2 ) + P(e3 )

Transformons ensuite l’expression trouvée pour P(A ∪ B) :

P(A ∪ B) = P(e1 ) + P(e2 ) + P(e2 ) − P(e2 ) + P(e3 )

En réaménageant cette expression, nous trouvons :

P(A ∪ B) = P(e1 ) + P(e2 ) + P(e2 ) + P(e3 ) − P(e2 )


1424 43 4 142 4 43 4 1 23
P (A ) P (B ) P (A ∩B )

Comme les éléments de A ∩ B sont comptés tant parmi les éléments de


A que parmi les éléments de B , pour déterminer P(A ∪ B) , il faut soustraire
P(A ∩ B) afin d’éviter que cette probabilité soit comptée deux fois.

Illustrons cette formule importante à l’aide d’un exemple concret :

Lançons un dé à six faces. Soient les événements


A = {obtenir un nombre ≤ 3} = {1, 2, 3} et B = {obtenir un nombre ≥ 3} = {3, 4, 5, 6}.

246
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

On remarque que A ∪ B = {1, 2, 3, 4, 5, 6} = Ω et que les événements A


et B ne sont pas incompatibles : A ∩ B = {3} = e3 ≠ ∅ .

D’après le 2ème axiome, nous savons que :

3
P(A ) = P(e1 ) + P(e2 ) + P(e3 ) =
6

4
P(B) = P(e3 ) + P(e4 ) + P(e5 ) + P(e6 ) =
6

La simple addition de P(A ) et de P(B) donnerait par conséquent une


probabilité supérieure à 1 pour la réalisation de A ∪ B = Ω , ce qui serait
contradictoire à l’axiome 1. Comme A et B ne sont pas incompatibles (ils
peuvent être réalisés en même temps), nous devons soustraire P(A ∩ B) =
1
P(e3 ) = de [P(A ) + P(B)] , étant donné que P(e3 ) serait pris en compte deux
6
fois, une fois dans le calcul de P(A ) et une fois dans le calcul de P(B) .

3 4 1
Ainsi, P(A ∪ B) = P(A ) + P(B) − P(A ∩ B) = + – = 1.
6 6 6

Les mêmes opérations pourraient être effectuées sur base de n’importe


quelle combinaison de deux éléments choisis parmi les événements A , B ou
de leurs événements complémentaires respectifs. Le tableau suivant résume
toutes les possibilités de combinaison de ces différents événements :

événements : A A totaux des lignes :

B P(A ∩ B) P(A ∩ B) P(B)

B P(A ∩ B ) P(A ∩ B ) P(B )

P(A )
totaux des
P(A ) 1
colonnes :

La section suivante traitera de manière plus détaillée le calcul des


probabilités d’intersections d’événements, en distinguant entre événements
dépendants et indépendants.

247
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5.3. Evénements dépendants et indépendants

5.3.1 Evénements dépendants I : probabilité conditionnelle

Bien souvent en réalité, la réalisation d’un certain événement est


soumise à des contraintes ou est conditionnée par certains facteurs, comme
par exemple la réalisation préalable d’un autre événement. Ainsi, dans bon
nombre de cas, des événements qui se suivent influencent l’un l’autre, ils ne
sont donc pas indépendants. La probabilité qu’un certain événement se
réalise est donc influencée, conditionnée par la réalisation précédente d’un
autre événement. Dans ce cas, on parle de probabilité conditionnelle.
L’exemple suivant aidera à illustrer ce concept.

Supposons que nous disposons de deux dés, un blanc et un noir. Soit


l’événement E = {somme des points obtenus en lançant les dés une fois = 4} . Le
tableau suivant illustre tous les résultats possibles que l’on peut obtenir en
lançant deux dés :

noir
1 2 3 4 5 6
blanc

1 (1 ;1) (1 ;2) (1 ;3) (1 ;4) (1 ;5) (1 ;6)

2 (2 ;1) (2 ;2) (2 ;3) (2 ;4) (2 ;5) (2 ;6)

3 (3 ;1) (3 ;2) (3 ;3) (3 ;4) (3 ;5) (3 ;6)

4 (4 ;1) (4 ;2) (4 ;3) (4 ;4) (4 ;5) (4 ;6)

5 (5 ;1) (5 ;2) (5 ;3) (5 ;4) (5 ;5) (5 ;6)

6 (6 ;1) (6 ;2) (6 ;3) (6 ;4) (6 ;5) (6 ;6)

Avant de lancer les dés, nous savons donc que le nombre de résultats
possibles avec deux dés est de 36 et que le nombre de résultats favorables à
3 1
la réalisation de E est de 3 : E = {(1; 3); (3; 1); (2; 2)} . Ainsi, P(E ) = = .
36 12

Changeons maintenant un peu le déroulement de notre expérience et


lançons tout d’abord uniquement le dé blanc sur lequel nous obtenons le 1.

248
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Sachant que l’événement F = {obtenir le 1 sur le dé blanc} a déjà été réalisé,


quelle est maintenant la probabilité que E soit réalisé ?

Cette probabilité est appelée « probabilité conditionnelle » et s’écrit


P(E F) . Elle indique la probabilité que E se réalise, sachant que F a déjà été

réalisé. Dans notre exemple, il s’agit de la probabilité d’obtenir une somme


des points égale à 4, sachant que nous avons déjà obtenu le 1 sur le dé blanc.

Déterminons maintenant P(E F) . Avant de lancer le dé blanc, nous

savons que le nombre de résultats possibles est de 36.

En lançant le dé blanc et en obtenant le 1, le nombre de résultats


possibles est réduit à 6, étant donné qu’après avoir obtenu le 1 sur le dé
blanc, il ne reste plus que 6 possibilités pour le dé noir. Le tableau des
résultats possibles se présentera alors comme suit :

noir
1 2 3 4 5 6
blanc

1 (1 ;1) (1 ;2) (1 ;3) (1 ;4) (1 ;5) (1 ;6)

2 (2 ;1) (2 ;2) (2 ;3) (2 ;4) (2 ;5) (2 ;6)

3 (3 ;1) (3 ;2) (3 ;3) (3 ;4) (3 ;5) (3 ;6)

4 (4 ;1) (4 ;2) (4 ;3) (4 ;4) (4 ;5) (4 ;6)

5 (5 ;1) (5 ;2) (5 ;3) (5 ;4) (5 ;5) (5 ;6)

6 (6 ;1) (6 ;2) (6 ;3) (6 ;4) (6 ;5) (6 ;6)

Le nombre de cas favorables est donc réduit à 1, étant donné qu’avec 1


comme résultat sur le dé blanc, la seule possibilité d’obtenir une somme des
points égale à 4 est d’avoir le 3 sur le dé noir. On peut donc en déduire que

P(E F) =
1
, c’est-à-dire que la probabilité d’obtenir une somme de points
6
1
égale à 4, sachant que le dé blanc indique le résultat 1, est de .
6

Essayons maintenant de déterminer une formule plus générale pour le


calcul des probabilités conditionnelles. Nous savons que, en obtenant le 1 sur

249
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

le dé blanc et en obtenant le 3 sur le dé noir, l’événement E ∩ F = {(1; 3)} est


réalisé aussi. Représentons schématiquement les événements suivants :

o E = {somme des points obtenus en lançant les dés une fois = 4} ;

o F = {obtenir le 1 sur le dé blanc} ;

o E ∩ F = {(1; 3)}.

(2 ;5) (3 ;4) (6 ;4)

(…) (1 ;1) (4 ;3)


E (1 ;3) (1 ;2)
(3 ;1)
(1 ;4) F
E∩F (1 ;5) (…)
(2 ;2)
(…) (1 ;6)
(4 ;5) Ω
card(E ∩ F)
On remarque donc que P(E F) =
1
= .
6 card(F)

1
card(Ω )
Multiplions cette expression par pour obtenir l’expression
1
card(Ω )
suivante :

card(E ∩ F)
card(Ω ) P(E ∩ F)
P(E F) = =
card(F) P(F)
card(Ω )

Appliquons cette formule à notre exemple156 :

card(E ∩ F) 1
P(E ∩ F) card(Ω )
P(E F) =
1
= = 36 =
P(F) card(F) 6 6
card(Ω ) 36

P(E ∩ F)
De la formule P(E F) = , on peut déduire P(E ∩ F) :
P(F)

156
Dans notre exemple, card(Ω ) = 36 .

250
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

P(E ∩ F) = P(E F)⋅ P(F)

De ce qui précède, on déduit que les événements E et F ne sont pas


indépendants. La réalisation de F influence (limite) les possibilités de
réalisation de E . Ainsi, lors du calcul de probabilités du type P(E ∩ F) , il faut
bien contrôler si les événements sont indépendants ou non. Le diagramme en
arbre suivant permet de visualiser le calcul des différentes probabilités des
intersections des événements dépendants E et F et de leurs événements
complémentaires :

P(E F) =
1 1 6 1
E  P(E ∩ F) = ⋅ =
6 6 36 36

6
P(F) = F
36

P(E F) = P(E ∩ F) =
5 5 6 5
E  ⋅ =
6 6 36 36

( )
P EF =
2
30
E  P(E ∩ F ) =
2 30

30 36
=
2
36

P(F ) =
30
F
36

( )
PEF =
28
30
E  P(E ∩ F ) =
28 30

30 36
=
28
36
A titre d’exemple, P(E ∩ F ) représente la probabilité de ne pas avoir
obtenu le un sur le dé blanc (ce qui exclut 6 des 36 possibilités initiales) et de
ne pas avoir obtenu une somme de 4 sur les deux dés (ce qui exclut 2 des 30
possibilités restantes). Au total, on exclut donc 8 possibilités de 36, ce qui
veut dire qu’il nous reste 28 possibilités de ne pas avoir le 1 sur le dé blanc et
de ne pas avoir une somme de 4 sur les deux dés.

251
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Dans le cas d’événements dépendants, il se peut aussi que l’ordre dans


lequel les événements se réalisent puisse être inversé. En reprenant
l’exemple précédent, on pourrait par exemple calculer P(F E ) , ce qui

correspond à la probabilité d’avoir le 1 sur le dé blanc, sachant que la somme


des points obtenus est de 4. Cependant, le fait d’inverser l’ordre dans lequel
ont lieu les événements ne change rien à la valeur des différentes probabilités
des intersections. Le diagramme en arbre ci-dessous permet de visualiser ce
fait :

P(F E ) =
1 1 3 1
F  P(E ∩ F) = ⋅ =
3 3 36 36

3
P(E ) = E
36

P(F E ) = P(E ∩ F ) =
2 2 3 2
F  ⋅ =
3 3 36 36

( )
P FE =
5
33
F  P(E ∩ F) =
5 33

33 36
=
5
36

P(E ) =
33
E
36

( )
P FE =
28
33
F  P(E ∩ F ) =
28 33

33 36
=
28
36
A l’aide des deux diagrammes en arbre précédents, on peut dégager
une propriété utile pour la résolution de certains problèmes. D’après le
premier diagramme, nous savons que P(E ∩ F) = P(E F)⋅ P(F) . A partir du

deuxième diagramme, on peut dégager que P(E ∩ F) = P(F E ) ⋅ P(E ) . On peut

donc en conclure que P(E F)⋅ P(F) = P(F E ) ⋅ P(E ) .

252
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5.3.2 Evénements indépendants

Considérons maintenant les événements F = {obtenir le 1 sur le dé blanc} et


G = {obtenir le 1 sur le dé noir}. De plus, nous savons que l’événement F ∩ G =
1 1 1
{(1; 1)}. Nous savons que P(F) = , P(G ) = et que P(F ∩ G ) = .
6 6 36

Essayons maintenant de déterminer P(F G ) :

1
P(F ∩ G ) 36 1
P(F G ) = = = = P(F)
P(G ) 1 6
6

Ainsi, si deux événements F et G sont indépendants,

P(F ∩ G ) = P(F) ⋅ P(G )

La réalisation de F n’a pas d’influence sur la réalisation de G et vice


versa.

Montrons que cette formule n’est pas vérifiée pour des événements qui
ne sont pas indépendants. Reconsidérons donc les événements
E = {somme des points obtenus en lançant les dés une fois = 4} et F = {obtenir le 1 sur
le dé blanc} :

1
P(E ∩ F)
P(E F) =
1 3 1
= 36 = ≠ P(E ) = =
P(F) 1 6 36 12
6

Le diagramme en arbre suivant permet de visualiser le calcul des


différentes probabilités des intersections des événements indépendants G et
F et de leurs événements complémentaires :

253
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

6 6 6 1
P(G ) = G  P(G ∩ F) = ⋅ =
36 36 36 36

6
P(F) = F
36

P(G ) = P(G ∩ F) =
30 30 6 5
G  ⋅ =
36 36 36 36

P(G ∩ F ) =
6 6 30 5
P(G ) = G  ⋅ =
36 36 36 36

P(F ) =
30
F
36

P(G ) = P(G ∩ F ) =
30 30 30 25
G  ⋅ =
36 36 36 36

Remarques :

Il ne faut pas confondre les notions d’indépendance et d’incompatibilité.


Si deux événements A et B sont incompatibles, nous savons que A ∩ B = ∅ .
Ainsi, P(A B) = 0 , étant donné que P(A ∩ B) = 0 . De même, P(B A ) = 0 .

Considérons par exemple les événements A = {somme des points


obtenus ≤ 5} et B = {obtenir le 6 sur le dé blanc}. On remarque que A ∩ B = ∅ ,
ce qui implique que P(A ∩ B) = 0 et donc aussi P(A B) = 0 . Ceci est logique

étant donné qu’il est impossible d’obtenir une somme des points ≤ 5 lorsqu’on
sait que l’on a obtenu le 6 sur un des dés.

De même, P(B A ) = 0 , ce qui signifie qu’il est impossible d’avoir obtenu

le 6 sur le dé blanc lorsqu’on sait que la somme des points obtenus sur les
deux dés est ≤ 5.

254
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

noir
1 2 3 4 5 6
blanc

1 (1 ;1) (1 ;2) (1 ;3) (1 ;4) (1 ;5) (1 ;6)

2 (2 ;1) (2 ;2) (2 ;3) (2 ;4) (2 ;5) (2 ;6)

3 (3 ;1) (3 ;2) (3 ;3) (3 ;4) (3 ;5) (3 ;6)

4 (4 ;1) (4 ;2) (4 ;3) (4 ;4) (4 ;5) (4 ;6)

5 (5 ;1) (5 ;2) (5 ;3) (5 ;4) (5 ;5) (5 ;6)

6 (6 ;1) (6 ;2) (6 ;3) (6 ;4) (6 ;5) (6 ;6)

Les probabilités conditionnelles trouvent souvent des applications en


réalité. Ainsi par exemple, les tables de mortalité utilisées par les compagnies
d’assurances y sont basées. Ces tables indiquent l’espérance de vie à un an
selon le sexe. Ainsi, la probabilité de vieillir d’un an de plus est conditionnée
par le fait d’être un homme ou une femme, mais aussi par l’âge qu’on a déjà
atteint. Ainsi, il est plus probable de passer de 20 à 21 ans, que de passer de
80 à 81 ans. Cependant, une personne de 20 ans a une probabilité beaucoup
moins élevée d’atteindre l’âge de 81 ans qu’une personne de 80 ans.

5.3.3 Dépendance et indépendance : tableau récapitulatif

Résumons dans le tableau suivant les différents cas de figure possibles


pour le calcul des probabilités de la réalisation conjointe des événements A
et B :

événements A et B … P(A ∩ B)

… incompatibles =0

… indépendants = P(A ) ⋅ P(B)

… dépendants = P(A B) ⋅ P(B)

= P(B A ) ⋅ P(A )

255
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5.3.4 Evénements dépendants II : théorème de Bayes

Considérons de nouveau les événements


E = {somme des points obtenus en lançant les dés une fois = 4} et F = {obtenir le 1 sur
le dé blanc}. Le tableau suivant résume tous les résultats possibles que l’on
peut obtenir avec 2 dés :

noir
1 2 3 4 5 6
blanc

1 (1 ;1) (1 ;2) (1 ;3) (1 ;4) (1 ;5) (1 ;6)

2 (2 ;1) (2 ;2) (2 ;3) (2 ;4) (2 ;5) (2 ;6)

3 (3 ;1) (3 ;2) (3 ;3) (3 ;4) (3 ;5) (3 ;6)

4 (4 ;1) (4 ;2) (4 ;3) (4 ;4) (4 ;5) (4 ;6)

5 (5 ;1) (5 ;2) (5 ;3) (5 ;4) (5 ;5) (5 ;6)

6 (6 ;1) (6 ;2) (6 ;3) (6 ;4) (6 ;5) (6 ;6)

L’événement E est réalisé pour les couples marqués d’un arrière-fond


3
gris. Nous pouvons donc vérifier que P(E ) = .
36

L’événement F est réalisé pour les couples encadrés. Nous pouvons


6
donc aussi vérifier que P(F) = .
36

De ces deux probabilités, nous pouvons déduire les probabilités des


événements complémentaires respectifs :

P(E ) = 1 − P(E ) = 1 –
3 33
=
36 36

P(F ) = 1 − P(F) = 1 –
6 30
=
36 36

De plus, du tableau précédent, on peut déduire les probabilités


suivantes :

P(E ∩ F ) = P(E ∩ F) = P(E ∩ F ) =


1 2 5 28
P(E ∩ F) =
36 36 36 36

256
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Reportons ces probabilités dans le tableau suivant :

E E Somme

P(E ∩ F) =
1 5 6
F P(E ∩ F) =
36 36 36

P(E ∩ F ) = P(E ∩ F ) =
2 28 30
F
36 36 36
3 33
Somme 1
36 36

De ce tableau, nous pouvons déduire que

P(E ∩ F) + P(E ∩ F ) =
1 2 3
+ = = P(E )
36 36 36

et que

P(E ∩ F) + P(E ∩ F) =
5 28 33
+ = = P(F) .
36 36 36

Remplaçons P(F) par P(E ∩ F) + P(E ∩ F) afin de transformer la formule


de calcul des probabilités conditionnelles :

P(E ∩ F) P(E ∩ F)
P(E F) = =
P(F) P(E ∩ F) + P(E ∩ F)

De plus, d’après la formule des probabilités conditionnelles, nous savons


P(E ∩ F) P (E ∩ F)
que P(F E ) =
P(E )
et que P F E = ( )
P(E )
. De ceci découle que

( )
P(E ∩ F) = P(E ) ⋅ P(F E ) et que P(E ∩ F) = P(E )⋅ P F E .

Remplaçons ensuite P(E ∩ F) et P(E ∩ F) par leurs nouvelles valeurs


dans la formule transformée des probabilités conditionnelles :

P(E ∩ F) P(E ) ⋅ P(F E )


P(E F) = =
P(E ∩ F) + P(E ∩ F) P(E ) ⋅ P(F E ) + P(E )⋅ P(F E )

Cette formule est encore connue sous le nom de « théorème de Bayes ».


Elle peut par exemple être utilisée pour évaluer l’efficience de tests de
détection médicaux, de détecteurs de mensonges, de systèmes d’alerte ou de

257
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

sécurité. De même, elle peut être utilisée dans le domaine de l’informatique,


par exemple pour détecter et éliminer les spams dans les messages
électroniques.

6. Applications résolues

6.1. Tirages successifs sans remise

Soit un jeu de 32 cartes. On tire successivement 3 cartes, à chaque fois


sans remettre la carte tirée lors du tirage précédant.

a. Quelle est la probabilité de tirer deux cartes de cœur et une carte noire,
l’ordre ne jouant pas de rôle ?

C82 C16
1
P(a ) = 3
= 0,090322
C 32

b. Quelle est la probabilité de tirer dans l’ordre, une carte de cœur, une
carte noire et une carte de cœur ?

A82 A16
1
P(b ) = = 0,030107
A323

ou bien :

C81 C161 C 71
P(b ) = 1
⋅ 1 ⋅ 1 = 0,030107
C 32 C 31 C 30

6.2. Tirages successifs avec remise

Soit un jeu de 32 cartes. On tire successivement 3 cartes, en remettant


à chaque fois la carte tirée lors du tirage précédant.

a. Quelle est la probabilité de tirer deux cartes de cœur et une carte noire,
l’ordre ne jouant pas de rôle ?

8 ⋅ 8 ⋅ 16 8 ⋅ 16 ⋅ 8 16 ⋅ 8 ⋅ 8 8 216
P(a ) = + + = 3 ⋅ = 0,09375
32 3 32 3 32 3 32 3

ou bien :

258
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

C81C81C16
1
C81C16
1
C81 1
C16 C81C81 8 216
P(a ) = 1 1 1 + 1 1 1 + 1 1 1 = 3 ⋅ 3 = 0,09375
C32C32C32 C32C32C32 C32C32C32 32

b. Quelle est la probabilité de tirer dans l’ordre, une carte de cœur, une
carte noire et une carte de cœur ?

8 ⋅ 16 ⋅ 8 8 216
P(b ) = = = 0,03125
32 3 32 3

ou bien :

C81C161 C81 8216


P(a ) = 1 1 1
= = 0,03125
C32 C32 C32 323

6.3. Tirages simultanés

Soit un jeu de 32 cartes. On tire simultanément157 3 cartes.

Quelle est la probabilité de tirer deux cartes de cœur et une carte noire ?

C82 C16
1
P(E ) = 3
= 0,090322
C 32

6.4. Événements complémentaires, incompatibles et non


incompatibles

Soit un jeu de 32 cartes.

a. On tire simultanément 3 cartes. Quelle est la probabilité d’avoir au moins


un cœur ? (événements complémentaires)

P(a ) = P(1 coeur et 2 autres) + P(2 coeurs et 1 autre) + P(3 coeurs)

= 1 − P(aucun coeur )

3
C24
= 1− = 0,408064
C323

157
Lors d’un tirage simultané, la remise n’est par définition pas possible. De plus, comme les
éléments sont tirés de manière simultanée, il est impossible de définir l’ordre dans lequel ils
ont été tirés. Ainsi, les tirages simultanés sont équivalents aux tirages successifs sans remise
et sans ordre.

259
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b. On tire une carte. Quelle est la probabilité de tirer une carte de cœur ou
une carte noire ? (événements incompatibles)

C81 C161
8 16
P(b ) = P(1 coeur ) + P(1 carte noire ) = 1
+ 1
= + = 0,75
C 32 C 32 32 32

c. On tire une carte. Quelle est la probabilité de tirer une carte de cœur ou
un roi ? (événements non incompatibles)

C81 C41 C11


P(c ) = P(1 coeur ) + P(1 roi ) − P(roi de coeur ) = 1 + 1 − 1 = 0,34375
C32 C32 C32

6.5. Événements dépendants et indépendants

Soit un jeu de 32 cartes.

a. On tire successivement deux cartes avec remise de la première carte


après le premier tirage. Quelle est la probabilité d’avoir une carte de
cœur et puis une carte noire ? (événements indépendants)

C81 C161
P(a ) = P(1 coeur ) ⋅ P(1 carte noire ) = 1 ⋅ 1 = 0,125
C 32 C 32

b. On tire successivement deux cartes sans remettre la première carte


après le premier tirage. Quelle est la probabilité d’avoir d’abord une
carte de cœur et puis une carte noire ? (événements dépendants)

C81 C161
P(b ) = P(1 coeur ) ⋅ P(1 carte noire 1 coeur ) = 1 ⋅ 1 =
8 16
⋅ = 0,129032
C32 C31 32 31

Remarque :

Il faut donc bien distinguer entre

o tirages successifs sans remise  événements dépendants ;

o tirages successifs avec remise  événements indépendants ;

o tirages simultanés.

260
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

6.6. Théorème de Bayes

Une maladie contagieuse atteint une personne parmi 1000. Sur 100
personnes malades, un test permet d’indiquer dans 99 % des cas, qu’une
personne est effectivement malade. Cependant, pour les personnes non
atteintes de la maladie, le test est positif dans 2 % des cas.

Quelle est la probabilité d’être atteint de la maladie, sachant que le test a


été positif ?

Soient les événements A = {être malade} et B = {test positif }.

P(A ) = 0,001

P(B A ) = P(test positif, sachant qu' on est malade) = 0,99

P(B A ) = P(test positif, sachant qu' on n' est pas malade) = 0,02

P(A B) = P(être malade, sachant que le test a été positif ) = ?

P(A ) ⋅ P(B A )
P(A B) =
P(A ) ⋅ P(B A ) + P(A ) ⋅ P(B A )

0,001 ⋅ 0,99
= = 0,0472103
0,001 ⋅ 0,99 + 0,999 ⋅ 0,02

7. Exercices

7.1. Dénombrements

Exercice 1.1

Combien y a-t-il

a. de nombres à deux chiffres différents et distincts de 0 ?


b. de nombres à deux chiffres différents ?
c. de nombres à trois chiffres différents ?

Exercice 1.2

Combien de comités distincts

261
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

a. avec un président, un secrétaire et un trésorier peut-on former à partir


d’une classe de 25 élèves ?
b. avec un président, un secrétaire, un trésorier et trois membres actifs
peut-on former à partir d’une classe de 25 élèves ?

Exercice 1.3

a. De combien de manières différentes peut-on sortir 5 cartes d’un jeu de


32 cartes de sorte que ce groupe contienne 3 rois seulement ?
b. Quatre pièces de monnaie distinctes sont lancées ensemble. De
combien de façons peuvent-elles retomber ?
c. Combien de nombres peut-on former avec 5 chiffres distincts,
commençant par le chiffre 2 et se terminant par le chiffre 8 ?

Exercice 1.4

De combien de façons peut-on ranger 5 livres d’économie, 4 livres de


comptabilité et 2 livres de statistique sur une étagère

a. dans n’importe quel ordre ?


b. si les livres de statistique doivent être situés à l’extrémité de l’étagère ?
c. si les livres doivent rester groupés par sujet ?

Exercice 1.5

Une entreprise compte 20 salariés, dont 11 hommes et 9 femmes. Étant


en difficultés financières, elle décide de licencier 4 salariés au hasard. Quelles
sont les possibilités que parmi les personnes licenciées

a. il n’y ait aucune femme ?


b. il y ait autant d’hommes que de femmes ?
c. il y ait au moins un homme ?

7.2. Calcul des probabilités

Exercice 2.1

Une urne contient dix boules identiques au toucher, numérotées de 1 à


10. On extrait simultanément trois boules de cette urne.

262
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Quelle est la probabilité que

a. la somme des numéros tirés soit égale à 20 ?


b. la somme des numéros tirés soit supérieure à 25 ?

Exercice 2.2

Une urne contient 9 boules identiques au toucher, numérotées de 1 à 9.


On extrait successivement trois boules et on les range dans l’ordre dans
lequel elles ont été tirées.

Quelle est la probabilité que

a. les numéros des trois boules forment le nombre 123 ?


b. les numéros forment un nombre divisible par 125 ?
c. le nombre formé soit constitué de trois chiffres consécutifs rangés en
ordre croissant ?

Exercice 2.3158

On tire simultanément cinq cartes d’un jeu de 32 cartes.

Quelle est la probabilité d’avoir

a. 5 trèfles ?
b. 2 trèfles et 3 piques ?
c. au moins un trèfle ?
d. l’as de trèfle ?
e. aucun pique ?
f. exactement deux rois ?
g. exactement deux cartes rouges ?
h. au moins une carte rouge ?

Exercice 2.4159

Le nom CAROLINE est composé de huit lettres différentes. On prépare


huit morceaux de papier portant chacun une de ces lettres. On tire
simultanément 5 morceaux de papier.

158
D’après MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001
159
D’après MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001

263
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Quelle est la probabilité d’avoir

a. la lettre A ?
b. exactement deux voyelles ?
c. au moins une voyelle ?

Exercice 2.5160

On tire successivement trois cartes d’un jeu de 32 cartes.

Quelle est la probabilité d’avoir

a. d’abord un pique, puis le roi de carreau, puis une carte rouge, sans
remise ?
b. d’abord un pique, puis le roi de carreau, puis une carte rouge, avec
remise ?

Exercice 2.6161

Deux personnes A et B tirent simultanément sur une cible. La probabilité


pour A d’atteindre la cible est estimée à 0,8, celle de B est estimée à 0,75.

Quelle est la probabilité que

a. les deux tireurs touchent tous les deux la cible ?


b. tous les deux manquent la cible ?
c. la cible soit atteinte uniquement par A ?
d. la cible soit atteinte uniquement par B ?
e. la cible soit touchée par une des personnes seulement ?
f. la cible soit atteinte ?
g. la cible soit touchée par un tireur au moins ?

Exercice 2.7162

On lance une pièce de monnaie deux fois de suite.

Quelle est la probabilité d’obtenir

a. deux fois pile ?

160
D’après MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001
161
D’après MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001
162
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

264
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b. au moins une fois pile ?


c. pas de pile ?
d. d’abord pile, puis face ?

Exercice 2.8163

L’examen du cours de probabilités consiste en 10 questions « vrai ou


faux ».

a. Combien de combinaisons différentes de réponses possibles existe-t-il,


en supposant que l’étudiant(e) réponde à toutes les questions ?
b. Combien de combinaisons différentes de réponses possibles existe-t-il,
en supposant que l’étudiant(e) réponde à toutes les questions et que les
réponses à la moitié des questions soient correctes, l’autre moitié des
réponses étant fausses ?
c. Complètement désespéré(e), l’étudiant(e) procède comme suit : il(elle)
lance une pièce de monnaie ; en cas de pile, la réponse à la question
sera « oui », en cas de face, la réponse à la question sera « non ».
Quelle est la probabilité que

i toutes les réponses soient correctes ?

ii la moitié des réponses soient correctes ?

iii exactement la moitié des réponses soient correctes ?

iv aucune des réponses ne soit correcte ?

Exercice 2.9164

Vous jouez au « Lotto » allemand (« 6 aus 49 »).

Quelle est la probabilité d’avoir exactement (« ohne Zusatzzahl »)

a. trois bons numéros ?


b. quatre bons numéros ?
c. cinq bons numéros ?
d. six bons numéros ?

163
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006
164
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

265
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Exercice 2.10165

Un sac contient une boule rouge, 4 boules vertes et 15 boules blanches


identiques au toucher. La boule rouge permet de gagner 100 €, chaque boule
verte permet de gagner 50 € et les boules blanches ne rapportent rien. Un
joueur tire simultanément 5 boules. Quelle est la probabilité pour ce joueur de
gagner exactement 150 € ?

Exercice 2.11166

Vous vous trouvez à la caisse d’un supermarché et vous voulez payer


vos achats par carte de débit. Malheureusement, vous avec oublié votre code
secret.

Quelle est la probabilité que vous réussissiez à entrer le bon code en

a. ne vous souvenant d’aucun des chiffres composant le code ?


b. vous souvenant que le 7 se trouve à la première place du code, et
uniquement à cette place ?
c. vous souvenant que le 7 se trouve à la première place du code ?
d. vous souvenant que le 7 intervient une seule fois dans le code ?

Exercice 2.12167

Une expérience aléatoire consiste à jeter simultanément 2 dés cubiques


parfaits. On considère l’événement A = {somme des points obtenus ≥ 9}. Calculer
P(A ) .

Exercice 2.13168

L’expérience montre que les étudiants en sciences de gestion échouent


dans 15 % des cas à l’examen de statistique et dans 12 % des cas à
l’examen de mathématiques financières. De plus, 8 % des étudiants échouent
à la fois à l’examen de statistique et à l’examen de mathématiques financières.

165
D’après PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,
Saint-Paul, Luxembourg, 1987
166
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006
167
D’après PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,
Saint-Paul, Luxembourg, 1987
168
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

266
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Les événements « échouer en statistique » et « échouer en


mathématiques financières », sont-ils indépendants ?

Quelle est la probabilité qu’un/e étudiant/e choisi/e au hasard

a. n’échoue à aucun examen ?


b. réussisse à au moins un examen ?
c. réussisse en statistiques mais échoue en mathématiques financières ?

Exercice 2.14169

Parmi les 170 employés d’une société, 120 parlent anglais, 105
espagnol et 70 les deux langues. Quelle est la probabilité qu’un employé
choisi au hasard

a. parle espagnol, mais pas anglais ?


b. parle seulement une des deux langues ?
c. ne parle aucune des deux langues ?

Exercice 2.15170

Pendant une heure de travail, la probabilité que la machine A tombe en


panne est de 0,26, la probabilité que la machine B tombe en panne est de
0,37. Quelle est la probabilité que les deux machines tombent en panne
pendant la même heure ?

Exercice 2.16171

80 % des clients d’une certaine banque ont un compte courant tandis


que 50 % des clients disposent d’un compte d’épargne. Chaque client
dispose d’au moins un de ces deux types de comptes.

Quelle est la probabilité qu’un client choisi au hasard

a. dispose d’un compte courant et d’un compte d’épargne ?


b. dispose d’un compte d’épargne, sachant qu’il dispose d’un compte
courant ?

169
D’après LINDENBERG, Andreas, WAGNER, Irmgard, Statistiques – Terminales, Licence
re
1 année, Pearson Education France, Paris, 2007
170
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006
171
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

267
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

c. dispose d’un compte courant, sachant qu’il dispose d’un compte


d’épargne ?

Exercice 2.17

Une entreprise a inséré deux annonces de publicité dans les magazines


spécialisés X et Y. En effectuant un sondage auprès des visiteurs du magasin,
l’entreprise découvre que 14,5 % des visiteurs sont venus grâce à l’annonce
publiée dans le magazine X et que 32,1 % des visiteurs ont été attirés par la
publicité insérée dans le magazine Y. En outre, à travers ce même sondage,
l’entreprise sait que 4 % des visiteurs attirés à travers l’annonce dans le
magazine X et que 1,5 % des visiteurs qui sont venus grâce à la publicité
dans le magazine Y ont effectivement acheté un produit de l’entreprise.
L’entreprise voudrait savoir, quelle publicité a été la plus performante.

Exercice 2.18172

Un sondage parmi les étudiants d’une certaine université a permis de


conclure que 70 % des étudiants mangent régulièrement au restaurant
universitaire et que 40 % des étudiants aimeraient que le restaurant
universitaire soit ouvert plus longtemps. 20 % des étudiants vont
régulièrement au restaurant universitaire et exigent des heures d’ouvertures
plus prolongées.

Quelle est la probabilité qu’un étudiant

a. qui exige des heures d’ouverture plus prolongées, mange régulièrement


au restaurant universitaire ?
b. qui ne mange pas régulièrement au restaurant universitaire, exige des
heures d’ouverture plus prolongées ?

Exercice 2.19173

Une agence bancaire est équipée d’un dispositif d’alarme. La probabilité


qu’il y ait une attaque de banque sur cette filiale est de 0,1. La probabilité
qu’une alarme soit déclenchée en cas d’une attaque est de 0,95. La

172
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006
173
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

268
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

probabilité qu’une alarme soit déclenchée en absence d’une attaque est de


0,03.

a. Calculez la probabilité qu’il n’y ait pas d’attaque, bien qu’une alarme ait
été déclenchée !
b. Calculez la probabilité qu’il y ait une attaque, bien que l’alarme n’ait pas
été déclenchée !

Exercice 2.20

Un détecteur de mensonges permet de détecter le coupable avec une


fiabilité174 de 92 % et détecte un innocent avec une fiabilité de 98 %. Est-il
conseillé d’avoir recours à cette machine dans la résolution de crimes ? En
d’autres mots, quelle est la probabilité que la personne déclarée coupable par
la machine le soit effectivement ? Répondez en supposant qu’il y ait N
suspects, dont exactement une personne qui a toute seule commis le crime !

174
sur 100 personnes coupables, la machine en détecte donc 92

269
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 5 : Les variables aléatoires discrètes

1. Introduction

Souvent, on associe des valeurs numériques (exemples : gains en €,


points obtenus, …) aux résultats d’une expérience aléatoire (exemples :
loteries, jet de dés, placements incertains, …). Le but en est alors de
déterminer la probabilité d’atteindre un certain gain (ou un certain score), de
déterminer le gain moyen ou bien d’analyser la répartition des différents gains
autour du gain moyen, ce qui peut fournir des informations concernant le
risque lié à l’expérience aléatoire en question. Dans ce cas, on s’intéresse
donc davantage aux valeurs numériques associées aux résultats de
l’expérience aléatoire qu’aux résultats eux-mêmes. Comme il s’agit d’une
expérience aléatoire, expérience dont l’issue est soumise au hasard, les
valeurs numériques associées aux résultats de cette expérience sont
considérées comme des réalisations d’une « variable aléatoire ». Une
variable aléatoire est donc une « description numérique du résultat d’une
expérience »175 aléatoire.

2. Caractéristiques d’une variable aléatoire discrète

Afin d’illustrer le traitement, les représentations et les calculs associés


aux variables aléatoires, basons-nous sur l’exemple d’une expérience
aléatoire facile à comprendre, notamment le jet de deux dés à six faces. La
valeur numérique qui nous intéresse, c’est-à-dire la variable aléatoire
associée au jet des deux dés, sera la somme des points obtenus.

Appelons donc X « la somme des points obtenus lors du jet de deux


dés ». La variable aléatoire X peut alors revêtir les valeurs suivantes :

175
ANDERSON, David R., SWEENEY, Dennis J., WILLIAMS, Thomas A., Statistiques pour
l’économie et la gestion, De Boeck, Bruxelles, 2007

271
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

dé 1
1 2 3 4 5 6
dé 2

1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9

4 5 6 7 8 9 10
5 6 7 8 9 10 11

6 7 8 9 10 11 12

2.1. Loi de probabilité

Une variable aléatoire suit une certaine « loi de probabilité » que l’on
peut établir sur base des probabilités de réalisation des différentes valeurs de
la variable.

Cette « loi de probabilité » peut être notée comme suit :

p i = P( X = x i )

où i = 1, 2, ..., N

La probabilité pi représente donc la probabilité que la variable aléatoire

X prenne la valeur xi . Comme les différentes valeurs xi de la variable

aléatoire regroupent toutes les N valeurs possibles que peut prendre X , on


N N
peut en déduire que ∑ P( X = x ) = ∑ p
i =1
i
i =1
i = 1.

La loi de probabilité associée à notre exemple se présente donc comme


suit :

x1 = x2 = x3 = x4 = x5 = x6 = x7 = x8 = x9 = x10 = x11 =
X
2 3 4 5 6 7 8 9 10 11 12

pi = 1 2 3 4 5 6 5 4 3 2 1
P( X = xi ) 36 36 36 36 36 36 36 36 36 36 36

A partir de cet exemple, on peut aussi vérifier facilement que


11
1 2 3 4 5 6 36
∑ P( X = x ) = 2 36 + 2 36 + 2 36 + 2 36 + 2 36 + 36 = 36 = 1 .
i =1
i

272
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

La représentation graphique de la loi de probabilité se fait sous forme de


graphique en bâtons qui montre la distribution des différentes probabilités. Le
graphique indique la probabilité pi associée à chaque valeur xi que peut

prendre X .

Loi de probabilité

7/36

6/36

5/36

4/36
pi
3/36

2/36

1/36

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
xi

2.2. Fonction de répartition

La fonction de répartition F (a ) indique la probabilité que la variable


aléatoire X soit inférieure ou égale à une certaine valeur 176 a . Ainsi, la
fonction de répartition peut être définie comme suit : F (a ) = P( X ≤ a ) .

Afin de déterminer la valeur de F (a ) , il faut additionner les probabilités

pi = P( X = xi ) pour autant que xi soit inférieur ou égal à a .

Ainsi,

j
F (a ) = ∑ pi , ∀ j tel que x j ≤ a
i =1

176
Attention : ne confondez pasxi , qui est une des valeurs que peut prendre la variable
aléatoire X , avec la valeur quelconque a !

273
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

N
En outre, on peut conclure que 0 ≤ F (a ) ≤ 1 , car ∑p i =1.
i =1

Déterminons les valeurs de la fonction de répartition correspondant à la


loi de probabilité de la variable aléatoire X = « somme des points obtenus
lors du jet de deux dés » :

a F (a )

a <2 P( X < 2) = 0

1
2≤ a <3 P( X < 3) = P( X ≤ 2) = P( X = 2) =
36
1 2 3
3≤ a <4 P( X < 4 ) = P( X ≤ 3) = P( X ≤ 2) + P( X = 3) = + =
36 36 36
3 3 6
4≤ a <5 P ( X < 5) = P( X ≤ 4) = P( X ≤ 3) + P( X = 4 ) = + =
36 36 36
6 4 10
5≤ a <6 P( X < 6 ) = P( X ≤ 5) = P ( X ≤ 4 ) + P ( X = 5) = + =
36 36 36
10 5 15
6≤ a <7 P( X < 7 ) = P( X ≤ 6) = P( X ≤ 5) + P( X = 6 ) = + =
36 36 36
15 6 21
7≤ a <8 P( X < 8 ) = P( X ≤ 7 ) = P( X ≤ 6) + P( X = 7 ) = + =
36 36 36
21 5 26
8≤ a <9 P( X < 9 ) = P ( X ≤ 8) = P ( X ≤ 7 ) + P ( X = 8) = + =
36 36 36
26 4 30
9≤ a < 10 P( X < 10) = P( X ≤ 9) = P ( X ≤ 8) + P ( X = 9 ) = + =
36 36 36
30 3 33
10 ≤ a < 11 P( X < 11) = P( X ≤ 10) = P( X ≤ 9) + P( X = 10) = + =
36 36 36
33 2 35
11 ≤ a < 12 P( X < 12) = P( X ≤ 11) = P( X ≤ 10) + P( X = 11) = + =
36 36 36
35 1
12 ≤ a P( X ≤ 12) = P( X ≤ 11) + P( X = 12) = + =1
36 36

274
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Remarque :

A partir de ce tableau, on peut reconstituer les différentes probabilités


pi = P( X = xi ) . Ainsi, on peut par exemple déterminer P( X = 4 ) à partir de

P( X ≤ 4) et P( X ≤ 3) :

P( X ≤ 4) – P( X ≤ 3)

= P( X ≤ 3) + P( X = 4 ) – [ P( X ≤ 2) + P( X = 3) ]

= [ P( X ≤ 2) + P( X = 3) ] + P( X = 4 ) – [ P( X ≤ 2) + P( X = 3) ]

= P( X = 4 )

Vérifions cette propriété à l’aide de notre exemple :

3
On sait que P( X = 4 ) = .
36

6 3 3
P( X ≤ 4) – P( X ≤ 3) = – = = P( X = 4 )
36 36 36

Représentée graphiquement, la fonction de répartition aura l’allure


suivante :

Fonction de répartition

30/36

24/36

F(a) 18/36

12/36

6/36

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
a

275
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2.3. Valeurs centrales et valeurs de dispersion d’une variable


aléatoire discrète

2.3.1 Espérance mathématique d’une variable aléatoire (ou bien :


valeur moyenne)

L’espérance mathématique 177


E ( X ) d’une variable aléatoire X
représente la moyenne des valeurs xi que peut revêtir la variable aléatoire X .

L’espérance mathématique est définie comme suit178 :


N
E ( X ) = ∑ pi xi
i =1

Appliquons cette formule aux données de notre exemple afin de


déterminer l’espérance de la variable aléatoire X = « somme des points
obtenus lors du jet de deux dés » :

1 2 3 4 5 6 5 4 3 2 1
E(X ) = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12
36 36 36 36 36 36 36 36 36 36 36
=7

Ainsi, en lançant deux dés, le score moyen auquel on peut s’attendre est
de 7. Ou bien, exprimé de manière différente : en lançant deux dés un
nombre très élevé (voire infini) de fois, la moyenne des scores obtenus sera
de 7.

2.3.2 Variance et écart type d’une variable aléatoire

La variance σ 2 ( X ) d’une variable aléatoire X correspond à l’espérance

mathématique de la variable179 [ X − E ( X )] . Elle mesure donc la moyenne des


2

177
Au cas où la variable aléatoire X est exprimée en unités monétaires, on parle encore de
« gain espéré » ou d’ « espérance de gain ».
Remarquons que l’espérance mathématique E ( X ) d’une variable aléatoire discrète X
178

est le pendant de la moyenne arithmétique x d’une variable (observée) discrète.


Dans cette expression, X est une variable aléatoire, mais E ( X ) est une constante.
179

276
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

carrés des écarts des valeurs xi de la variable aléatoire X par rapport à leur

valeur moyenne E ( X ) 180.

Ainsi,
N
σ 2 ( X ) = E [X − E ( X )]2 = ∑ pi [xi − E ( X )]2
i =1

Appliquons de nouveau cette formule aux données de notre exemple.


Construisons à cet effet tout d’abord la série de valeurs [xi − E ( X )] = [xi − 7] :
2 2

x1 = x2 = x3 = x4 = x5 = x6 = x7 = x8 = x9 = x10 = x11 =
X
2 3 4 5 6 7 8 9 10 11 12

X −7 -5 -4 -3 -2 -1 0 1 2 3 4 5

[X − 7]2 25 16 9 4 1 0 1 4 9 16 25

1 2 3 4 5 6 5 4 3 2 1
pi
36 36 36 36 36 36 36 36 36 36 36

1 2 3 4 5 6 5 4 3 2 1
σ 2 (X ) = 25 + 16 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 16 + 25
36 36 36 36 36 36 36 36 36 36 36
210
= = 5,8 3
36

L’écart type σ ( X ) de la variable aléatoire correspond à la racine carrée

de sa variance σ 2 ( X ) .

210
σ (X ) = ≈ 2,4152
36

Ces deux valeurs représentent des mesures de dispersion des valeurs


xi de la variable aléatoire X autour de sa moyenne E ( X ) . L’interprétation se

fait de manière analogue à celle présentée au chapitre 1, concernant les

180
De nouveau, on remarque la ressemblance entre la variance σ 2 (X ) d’une variable
aléatoire X et la variance σ des variables (observées) discrètes, présentées au premier
2
x
chapitre.

277
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

181
séries statistiques de variables observées . Ainsi, l’intervalle
 210 210 
[E ( X ) − σ ; E ( X ) + σ ] ≈ 7 − ;7 +  ⊃ [ x4 = 5 ; x8 = 9] regroupe les
 36 36 

 4 5 6 5 4 24 
valeurs xi de variable X que l’on obtient dans  + + + + = =
 36 36 36 36 36 36 
2
= 66, 6 % des cas. Autrement dit, en lançant les dés une fois, on a 66, 6 %
3
de chances d’obtenir une somme des points comprise entre 5 et 9.

Remarque :

Le calcul de la variance peut, selon les données, être plus facile à


réaliser en utilisant la formule simplifiée182 suivante : σ 2 ( X ) = E X 2 − [E ( X )] . ( ) 2

Cette formule peut être déduite comme suit :

(
σ 2 ( X ) = E [ X − E ( X )]2 = E X 2 − 2 X E ( X ) + [E ( X )]2 )
( ) ( )
= E X 2 − E (2 X E ( X )) + E [E ( X )] = E X 2 − 2 E ( X )E ( X ) + [E ( X )]
2 2

( )
= E X 2 − [E ( X )]
2

Cette expression peut encore s’écrire de la manière suivante :

N
σ 2 ( X ) = ∑ pi xi2 − [E ( X )]
2

i =1

Recalculons la variance en appliquant la formule simplifiée.


Construisons à cet effet tout d’abord la série de valeurs xi2 :

181
voir Chapitre 1, point 4.2.4
E (E ( X )) = E ( X ) et que E [E ( X )] = [E ( X )] , étant donné que
182 2 2
Remarquons que
E ( X ) et [E ( X )] ne sont pas des variables, mais des valeurs numériques précises et
2

constantes.

278
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

x1 = x2 = x3 = x4 = x5 = x6 = x7 = x8 = x9 = x10 = x11 =
X
2 3 4 5 6 7 8 9 10 11 12

X2 4 9 16 25 36 49 64 81 100 121 144

1 2 3 4 5 6 5 4 3 2 1
pi
36 36 36 36 36 36 36 36 36 36 36

1 2 3 4 5 6 5 4 3 2 1
σ 2 (X ) = 4 + 9 + 16 + 25 + 36 + 49 + 64 + 81 + 100 + 121 + 144 − 7 2
36 36 36 36 36 36 36 36 36 36 36
= 54,8 3 – 49 = 5,8 3

279
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

3. Application résolue

Dans une urne, il y a 10 boules blanches, 6 boules rouges et 4 boules


noires. Une boule blanche fait gagner 10 €, une boule rouge fait gagner 5 € et
une boule noire fait perdre 20 €.

On tire simultanément deux boules. En définissant la variable aléatoire


X comme « le gain obtenu »,

a. Établissez la loi de probabilité de X et représentez-la graphiquement.

Déterminons les différents gains xi possibles ainsi que les probabilités y

associées (la loi de probabilité), en fonction des différents tirages possibles :

blanche rouge noire gain xi p i = P( X = x i )

C42C160 6
X X -40 € P( X = −40) = =
C202 190

C61C41C100 24
X X -15 € P( X = −15) = =
C202 190
1
C10 C41C60 40
X X -10 € P( X = −10) = =
C202 190

C62C140 15
X X 10 € P( X = 10) = =
C202 190
1
C10 C61C40 60
X X 15 € P( X = 15) = 2 =
C20 190

C102 C100 45
X X 20 € P( X = 20) = =
C202 190

280
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Loi de probabilité

65/190
60/190
55/190
50/190
45/190
40/190
35/190
pi
30/190
25/190
20/190
15/190
10/190
5/190
0
-45 -40 -35 -30 -25 -20 -15 -10 -5 0 5 10 15 20 25
xi

b. Calculez l’espérance et l’écart type de X .

Etablissons, à l’aide d’un tableau, les séries de valeurs utiles au calcul


de la moyenne et de la variance :

pi xi pi xi xi2 pi xi2
6 24 960
-40 € − 1 600
190 19 19
24 36 540
-15 € − 225
190 19 19
40 40 400
-10 € − 100
190 19 19
15 15 150
10 € 100
190 19 19
60 90 1350
15 € 225
190 19 19
45 90 1800
20 € 400
190 19 19
190 95 5200
=1 =5
190 19 19
( )
6 6 6
= ∑ pi
i =1
= ∑ pi xi = E ( X )
i =1
= ∑px
i =1
2
i i = E X2

281
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

5200 2 5200 − 475 248,68


σ 2 ( X ) = E (X 2 ) − [E ( X )]2 = −5 = =
19 19

σ ( X ) = 248,68 = 15,77

c. Déterminez les valeurs de la fonction de répartition et représentez-la


graphiquement.

pi =
xi a F (a )
P( X = xi )

a < -40 P( X < −40 ) = 0

6 6
-40 € -40 ≤ a < -15 P( X < −15) = P( X ≤ −40) =
190 190
24 6 24 30
-15 € -15 ≤ a < -10 P( X < −10 ) = P( X ≤ −15) = + =
190 190 190 190
40 30 40 70
-10 € -10 ≤ a < 10 P( X < 10) = P( X ≤ −10) = + =
190 190 190 190
15 70 15 85
10 € 10 ≤ a < 15 P( X < 15) = P( X ≤ 10) = + =
190 190 190 190
60 85 60 145
15 € 15 ≤ a < 20 P( X < 20) = P( X ≤ 15) = + =
190 190 190 190
45 145 45
20 € 20 ≤ a P( X ≤ 20) = + =1
190 190 190

282
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Fonction de répartition

180/190

160/190

140/190

120/190

100/190
F(a)
80/190

60/190

40/190

20/190

0
-45 -40 -35 -30 -25 -20 -15 -10 -5 0 5 10 15 20 25
a

4. Exercices

Exercice 1183

Une boite contient 10 billets dont un porte le numéro 0, deux le numéro


1, trois le numéro 2 et quatre le numéro 3. On tire au hasard deux billets
simultanément. Soit S la somme des numéros tirés.

a. Représentez graphiquement la loi de probabilité et la fonction de


répartition.
b. Déterminez E (S ) et σ 2 (S ) .

Exercice 2184

Un tenancier présente le jeu suivant :

Tout joueur effectue une mise égale à 34 €.

Il tire ensuite un jeton parmi 17 jetons numérotés de 1 à 17.

o Si le numéro du jeton tiré est un multiple de 3, le joueur reçoit 20 €.

183
D’après PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,
Saint-Paul, Luxembourg, 1987
184
D’après MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001

283
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

o Si le numéro tiré est un multiple de 5, 15 excepté, le joueur reçoit 50 €.

o Si le numéro tiré est un multiple de 7, le joueur reçoit 88 €.

o Si le numéro tiré est le 8, le joueur reçoit 134 €.

o Pour tous les autres numéros tirés, le joueur ne reçoit rien.

a. Énoncez la loi de probabilité de la variable aléatoire X = « somme


reçue par le joueur » et représentez-la graphiquement.
b. Calculez l’espérance et l’écart type de X .
c. Déterminez les valeurs de la fonction de répartition de X et
représentez-la graphiquement.
d. Calculez le bénéfice moyen réalisé par l’organisateur du jeu après que
100 joueurs ont chacun joué une partie.

Exercice 3185

Le tenancier d’une maison de jeu présente le jeu suivant :

Chaque joueur a devant lui un jeu de 32 cartes. Il verse au tenancier,


pour pouvoir jouer, une somme, la mise, égale à 50 €.

Le joueur tire une carte dans le jeu.

o Si cette carte est l’as de carreau, le tenancier verse au joueur 440 €.

o Si la carte est un roi autre que le roi de cœur, le joueur reçoit 80 €.

o Si la carte est un cœur, le joueur reçoit 40 €.

o Si la carte est noire, à l’exception des rois de pique et de trèfle, le joueur


reçoit 20 €.

o Pour toutes les autres cartes tirées, le joueur ne reçoit rien.

a. Énoncez la loi de probabilité de la variable aléatoire X = « somme


reçue par le joueur » et représentez-la graphiquement.
b. Calculez l’espérance et l’écart type de X .
c. Déterminez les valeurs de la fonction de répartition de X et
représentez-la graphiquement.

185
MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001

284
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

d. Calculez le bénéfice moyen réalisé par l’organisateur du jeu après que


100 joueurs ont chacun joué une partir.

Exercice 4186

Une urne contient 2 boules rouges, 5 boules blanches et 3 boules vertes.


Une boule rouge fait gagner 90 €, une boule blanche fait gagner 40 € et une
boule verte fait gagner 100 €. On tire deux boules avec remise. Soit X la
variable aléatoire représentant le gain obtenu.

a. Établissez la loi de probabilité de X et représentez-la graphiquement.


b. Établissez la fonction de répartition et représentez-la graphiquement.
c. Calculez l’espérance mathématique du gain.
d. Calculez l’écart type du gain.

Exercice 5

Refaites l’exercice 4 en supposant que le tirage est effectué sans


remise !

Exercice 6187

Une entreprise industrielle commande chaque mois 15 pièces de


rechange pour assurer le fonctionnement continu de ses machines. Le
nombre de pièces de rechange effectivement utilisées chaque mois est
représenté par la variable aléatoire X , dont la fonction de probabilité est
définie comme suit :

x1 = x2 = x3 = x4 = x5 = x6 =
X
12 13 14 15 16 17

pi 0,1 0,2 0,3 0,2 0,1 0,1

Cependant, pour chaque pièce de rechange non utilisée, l’entreprise doit


subir des coûts de magasinage de 20 € par pièce. De plus, si au cours d’un
certain mois l’entreprise a besoin de plus de 15 pièces de rechange, elle subit
des coûts estimés à 50 € par pièce manquante.

186
Examen de fin d’études secondaires, juin 2009
187
D’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

285
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

a. Établissez la loi de probabilité de la variable aléatoire C représentant les


coûts occasionnés par le fait que le nombre de pièces de rechange
disponibles ne correspond pas au nombre de pièces de rechange
nécessaires pendant un certain mois (en négligeant le fait que les pièces
non utilisées le mois précédant pourraient être utilisées en cas de besoin
au mois suivant).
b. Calculez l’espérance et l’écart type de C .
c. Un analyste externe recommande à l’entreprise de ne commander plus
que 14 pièces de rechange par mois. Est-ce un bon conseil ?

286
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Chapitre 6 : Loi binomiale

1. Les expériences aléatoires de Bernoulli

Une expérience aléatoire est une expérience de Bernoulli si elle remplit


les trois conditions suivantes :

o les seuls résultats possibles de l’expérience sont le « succès » et


l’« échec » ;

o la probabilité p d’un « succès » est la même lors de chaque répétition


de l’expérience ; la probabilité de l’« échec » vaut par conséquent
q = (1 − p ) ;

o le résultat d’une expérience n’a pas d’influence sur le résultat


d’expériences futures ; les expériences sont donc indépendantes.

Donnons un exemple simple d’une expérience aléatoire de Bernoulli.


Lançons un dé à 6 faces une fois et considérons l’événement E = {obtenir le 6}
comme étant le « succès ». Alors tout autre résultat que le 6 est considéré
comme un « échec » (événement E ). De plus, comme nous savons que la
1 1
probabilité d’obtenir le 6 est de , nous pouvons en conclure que P(E ) = =
6 6

p et que P(E ) = 1 - P(E ) =


5
= q . Finalement, nous savons que le fait de
6
lancer le dé une fois n’aura pas d’influence sur les résultats de futurs jets du
dé. Ainsi, comme les trois critères cités ci-dessus sont remplis, l’expérience
aléatoire de lancer un dé en définissant l’évènement « obtenir le 6 » comme
« succès » peut bien être considérée comme une expérience de Bernoulli.

2. Répétition d’une expérience de Bernoulli et loi binomiale

Répétons l’expérience décrite ci-dessus trois fois de suite et définissons


la variable aléatoire X comme le « nombre de succès », ce qui correspond
donc ici au nombre de fois que l’évènement E = {obtenir le 6} a été réalisé. La
loi de probabilité de X peut alors être notée comme suit :

287
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

X x1 = 0 x2 = 1 x3 = 2 x4 = 3

pi = 125 75 15 1
P( X = xi ) 216 216 216 216

Les différentes probabilités pi s’obtiennent comme suit :

p1 = P(E et E et E ) =
5 5 5 125
⋅ ⋅ =
6 6 6 216

1 5 5
p 2 = P(E et E et E ) + P(E et E et E ) + P(E et E et E ) = 3  ⋅ ⋅  =
75
 6 6 6  216

 1 1 5  15
p3 = P(E et E et E ) + P(E et E et E ) + P(E et E et E ) = 3  ⋅ ⋅  =
 6 6 6  216

1 1 1 1
p 4 = P(E et E et E ) = ⋅ ⋅ =
6 6 6 216

On remarque que la valeur x 2 = 1 peut être obtenue selon trois manières


différentes qui correspondent ici au nombre de possibilités que l’on a pour
obtenir exactement un succès et deux échecs sur trois jets188 : C31 = 3 .

De même, la valeur x3 = 2 peut être obtenue selon trois manières qui

correspondent au nombre de possibilités que l’on a pour obtenir exactement


deux succès et un échec sur trois jets189 : C32 = 3 .

Recalculons alors les différents pi en modifiant la forme des calculs :

0 3
5 5 5 5 5 5 1 5 125
p1 = ⋅ ⋅ = 1  ⋅ ⋅  = C30     =
6 6 6 6 6 6 6 6 216

1 2
1 5 5 1 5 75
p 2 = 3  ⋅ ⋅  = C31     =
6 6 6 6 6 216

188
Alternativement, on peut imaginer un groupe de trois personnes, où chaque personne
lance une fois un dé à six faces. C31 = 3 indique alors le nombre de possibilités de répartir
exactement 1 succès sur 3 personnes.
189
De même, C32 = 3 indique le nombre de possibilités de répartir exactement 2 succès sur
3 personnes.

288
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

2 1
1 1 5 1 5 15
p3 = 3  ⋅ ⋅  = C32     =
6 6 6 6 6 216

3 0
1 1 1 1 1 1 1 5 1
p 4 = ⋅ ⋅ = 1  ⋅ ⋅  = C33     =
6 6 6 6 6 6 6 6 216

En considérant la formule usuelle des combinaisons Cnk , on remarque

que n = 3, ce qui correspond au nombre total d’essais et que k = xi , ce qui

correspond à chaque fois au nombre de succès. De plus on remarque que


l’exposant de la probabilité p du succès est égal au nombre de succès k et
que l’exposant de la probabilité q = (1 − p ) de l’échec est égal au nombre
d’échecs n − k .

A partir de cet exemple, nous pouvons déduire la formule générale de la


loi binomiale :

B(k / n, p ) = Cnk p k q n − k
Cette formule permet de fournir la probabilité d’obtenir k succès lors de
n répétitions d’une même expérience aléatoire de Bernoulli, pour laquelle la
probabilité d’un « succès » vaut p .

3. Espérance mathématique de la loi binomiale

Déterminons l’espérance mathématique de la variable aléatoire X de


l’exemple précédent :
4
125 75 15 1 108
E ( X ) = ∑ pi xi = 0+ 1+ 2+ 3=
i =1 216 216 216 216 216

Ce résultat peut se réécrire, après simplification, selon la manière


suivante :

108 3 1
= = 3⋅
216 6 6

289
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

1
Comme nous savons que n = 3 et que p = , nous pouvons en déduire
6
la formule générale de l’espérance mathématique de la loi binomiale190 :

E ( X ) = np

Remarque :

L’espérance mathématique de la loi binomiale indique seulement le


nombre moyen de « succès » obtenus en répétant une expérience aléatoire
n fois. On voit bien que la formule E ( X ) = np est indépendante des valeurs xi

de la variable aléatoire X . Ainsi, si par exemple les valeurs xi représentent

des sommes d’argent ou des points gagnés (perdus), cette formule ne permet
pas de déterminer directement le gain (la perte) monétaire réalisé(e) en
moyenne ou le nombre moyen de points obtenus. Afin d’illustrer ceci,
supposons que l’on reçoit 30 € pour chaque 6 obtenu en lançant un dé, et que
l’on perd à chaque fois 5 € lorsqu’on n’obtient pas de 6. Les valeurs de la
variable aléatoire X , qui devient alors le « gain obtenu », changent alors
comme suit :

X x1 = -15 x 2 = 20 x3 = 55 x 4 = 90

125 75 15 1
pi
216 216 216 216

D’après le paragraphe précédent, nous savons que


1
E ( X ) = np = 3 ⋅ = 0,5 . Néanmoins, en appliquant la formule de base de
6
l’espérance mathématique d’une variable aléatoire, nous trouvons que
4
125 75 15 1
E ( X ) = ∑ pi x i = -15 € + 20 € + 55 € + 90 € = 2,5 €.
i =1 216 216 216 216

Afin de déterminer le gain moyen à partir de la formule de l’espérance


mathématique de la loi binomiale, nous devons appliquer le raisonnement
suivant. Nous savons que np = 0,5, ce qui signifie que sur 3 essais, nous

( )
N n
190
On peut montrer que E ( X ) = ∑ pi xi = ∑ Cnk p k q n− k ⋅ k = np .
i =1 k =0

290
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

gagnons en moyenne 0,5 fois. Par conséquent, nous pouvons dire aussi que
sur 3 essais, nous perdons en moyenne 2,5 fois. Comme nous recevons 30 €
pour chaque gain et comme nous devons payer 5 € à chaque fois que nous
perdons, le gain moyen peut être déterminé comme suit :
0,5 ⋅ 30 € + 2,5 ⋅ (− 5 € ) = 15 € − 12,5 € = 2,5 € .

De manière générale, lorsque les valeurs xi d’une variable aléatoire

représentent d’autres valeurs que le nombre de « succès » obtenus, nous


pouvons dire que le gain moyen (ou bien : l’espérance de gain) se calcule
comme suit :

E ( X ) = np(gain ) + (n − np )(perte) = np(gain ) + nq(perte) = n[ p(gain ) + q(perte)]

4. Variance et écart type de la loi binomiale

Calculons la variance de la variable aléatoire X de notre exemple de


base :

 N

σ 2 ( X ) =  ∑ pi xi2  − (E ( X ))2
 i =1 

2
125 75 15 1  3
= 0+ 1+ 4+ 9–  
216 216 216 216 6

144 9 24 9 15
= − = − =
216 36 36 36 36

Décomposons ce résultat afin d’obtenir l’expression suivante :

15 1 5
= 3⋅ ⋅
36 6 6

1 5
Comme nous savons que n = 3, p = et q = , nous pouvons en
6 6
déduire la formule générale de la variance de la loi binomiale191 :

191
On peut montrer que
   
σ 2 ( X ) =  ∑ pi xi2  − (E ( X ))2 =  ∑ (Cnk p k q n− k )⋅ k 2  − (np )2 = npq .
N n

 i =1   k =0 

291
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

σ 2 ( X ) = npq

Il s’ensuit que l’écart type se calcule de la manière suivante :

σ ( X ) = npq

Remarque :

D’après les formules standard de la variance et de l’écart type de la loi


15
binomiale, on trouve donc que σ 2 ( X ) = = 0,41 6 et que σ ( X ) = 0,64549.
36

Cependant, tout comme pour l’espérance mathématique, on constate de


nouveau que les formules de la variance et de l’écart type ne sont pas
fonction des valeurs xi de la variable aléatoire X . Elles ne permettent donc

pas de calculer la variance et l’écart type dans le cas où les valeurs xi

représentent autre chose que le nombre de « succès », comme par exemple


des points ou des sommes d’argent. Reprenons donc l’exemple transformé
du paragraphe précédent, où l’on obtient 30 € pour chaque 6 et où on doit
payer 5 € à chaque fois que l’on n’obtient pas de 6.

Calculons la variance du gain en utilisant la formule usuelle pour une


variable aléatoire quelconque :

 N

σ 2 ( X ) =  ∑ pi xi2  − (E ( X ))2
 i =1 

125 75 15 1
= (-15)2 + 202 + 552 + 902 – 2,52 = 510,41 6
216 216 216 216

L’écart type vaut alors 22,59 €.

Afin de déterminer la variance et l’écart type du gain à partir des


formules spécifiques de la loi binomiale, nous devons appliquer le
raisonnement suivant. Nous savons que, pour l’exemple de base où les
valeurs xi comptent le nombre de « succès » obtenus sur n essais, les

écarts entre les valeurs xi et xi +1 de la variable aléatoire sont de 1. Pour la

série transformée, on remarque que les écarts entre les valeurs xi et xi +1

valent 35, ce qui équivaut à la longueur de l’intervalle [-5 ; 30]. En multipliant

292
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

l’écart type trouvé à l’aide des formules de base de la loi binomiale par la
longueur de cet intervalle, nous trouvons la valeur de l’écart type de la série
transformée (l’écart type du gain) : σ ( X ) = 0,64549 ⋅ 35 = 22,59 €.

Comme l’écart type correspond à la racine carrée de la variance, la


variance du gain peut être trouvée comme suit :

σ 2 ( X ) = 0,41 6 ⋅ 352 = 510,41 6

De manière générale, lorsque les valeurs xi d’une variable aléatoire

représentent d’autres valeurs que le nombre de « succès » obtenus, nous


pouvons dire que la variance et l’écart type du gain se calculent comme suit :

σ 2 ( X ) = npq ⋅ L2

σ ( X ) = npq ⋅ L

où L représente la longueur de l’intervalle [perte ; gain].

5. Application résolue192

Une compagnie d’assurances conclut au cours d’une certaine semaine


des contrats d’assurance vie avec 5 hommes ayant chacun 50 ans. Selon les
tableaux statistiques à disposition de la compagnie d’assurances, la
probabilité qu’un homme ayant 50 ans soit mort après 25 ans est estimée à
48,1%.

a. Etablissez la loi de probabilité de la variable aléatoire X = « nombre


d’hommes (parmi les 5 contractants) encore en vie après 25 ans ».

La variable aléatoire X suit une loi binomiale de paramètres n = 5 et


p = 0,519. La loi de probabilité s’énonce alors comme suit :

192
Adaptation d’après ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden,
2006

293
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

X pi = P( X = xi ) pi xi
x1 = 0 C50 ⋅ 0,519 0 ⋅ 0,4815 = 0,02575 0
x2 = 1 C51 ⋅ 0,5191 ⋅ 0,4814 = 0,13891 0,13891
x3 = 2 C52 ⋅ 0,519 2 ⋅ 0,4813 = 0,29976 0,59952
x4 = 3 C53 ⋅ 0,519 3 ⋅ 0,4812 = 0.32344 0,97032
x5 = 4 C54 ⋅ 0,519 4 ⋅ 0,4811 = 0,17449 0,69796
x6 = 5 C ⋅ 0,519 ⋅ 0,481 = 0,03765
5
5
5 0
0,18825
N N
Total : ∑ pi = 1
i =1
∑px
i =1
i i = 2,59496

b. Déterminez la probabilité que :

i au plus un des cinq clients soit encore vivant après 25 ans ;

P( X ≤ 1) = P( X = 0) + P( X = 1) = 0,02575 + 0,13891 = 0,16466

ii au moins quatre contractants soient encore en vie après 25 ans ;

P( X = 4) + P( X = 5) = 0,17449 + 0,03765 = 0,21214

iii au moins deux et au plus 3 des clients ne soient pas déjà morts
après 25 ans.

P( X = 2 ) + P( X = 3) = 0,29976 + 0.32344 = 0,6232


c. Sur 5 hommes de 50 ans, combien y en a-t-il en moyenne qui atteignent
l’âge de 75 ans ?

E ( X ) = np = 5 ⋅ 0,519 = 2,595

6. Exercices

Exercice 1193

Un atelier comprend 6 machines qui fonctionnent indépendamment l’une


de l’autre. La probabilité qu’une machine tombe en panne est de 5% (donnée
fournie par le constructeur).

193
D’après PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,
Saint-Paul, Luxembourg, 1987

294
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

Quelle est la probabilité pour que dans l’atelier en question exactement


la moitié des machines tombent simultanément en panne ?

Exercice 2194
a. On joue avec un dé non pipé à six faces. Quelle est la probabilité
d’obtenir au moins une fois le 6 en 4 coups ?
b. On joue avec deux dés non pipés à six faces. Quelle est la probabilité
d’obtenir au moins une fois deux 6 en 24 coups ?
Exercice 3

Un examen en probabilités est composé de 10 questions à choix


multiples indépendantes. Pour chacune des 10 questions l’étudiant a le choix
entre 2 résultats parmi lesquels exactement un est correct.

a. En supposant qu’un certain étudiant répond à l’aveugle aux différentes


questions, déterminez la probabilité qu’il

i n’ait aucune réponse correcte ;

ii réponde de manière correcte à exactement la moitié des


questions ;

iii obtienne le maximum des points.

b. Supposez que l’étudiant doit répondre de manière correcte à 6 questions


pour réussir un examen, quelle est la probabilité qu’il réussisse 5
examens s’il doit en passer 8 en tout ?
c. Répétez l’exercice précédant (points a et b) en supposant que pour
chaque question l’étudiant a le choix entre 4 résultats possibles, dont
exactement une réponse correcte !
Exercice 4

On tire successivement 3 cartes d’un jeu de 32 cartes, en remettant la


carte tirée après chaque tirage.

Quelle est la probabilité d’avoir

a. un cœur au moins ?

194
D’après PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,
Saint-Paul, Luxembourg, 1987

295
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

b. exactement 2 rois ?
c. aucune carte noire ?
Exercice 5195

Une compagnie aérienne a constaté que sur certains vols


essentiellement utilisés par des hommes d’affaires, seulement 88 % des
passagers ayant réservé se présentent effectivement à l’embarquement.
Étant donné que la compagnie aérienne perd de l’argent sur chaque siège
vide, elle réfléchit à vendre plus de billets que le nombre de sièges disponible.
Cependant, dans le cas d’une surréservation, la compagnie risque de devoir
payer des frais (transports, hôtels, …) si trop de personnes se présentent à
l’embarquement.

La compagnie voudrait bien savoir, pour un avion de 200 places, quelle


est la probabilité que les réservations ne peuvent pas toutes être satisfaites,
si la compagnie décide d’une surréservation de 2 %.

Exercice 6196

Combien de fois doit-on lancer un dé pour que la probabilité de sortir un


six exactement une fois soit maximale.

195 re
LINDENBERG, Andreas, WAGNER, Irmgard, Statistiques – Terminales, Licence 1 année,
Pearson Education France, Paris, 2007
196 re
LINDENBERG, Andreas, WAGNER, Irmgard, Statistiques – Terminales, Licence 1 année,
Pearson Education France, Paris, 2007

296
Bibliographie

297
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

ADAM, Arthur, LOUSBERG, Francis, Espace Math 66, De Boeck, Bruxelles,


2000

ANDERSON, David R., SWEENEY, Dennis J., WILLIAMS, Thomas A.,


Statistiques pour l’économie et la gestion, De Boeck, Bruxelles, 2007

BOGAERT, Patrick, Probabilités pour scientifiques et ingénieurs, De Boeck,


Bruxelles, 2007

BOSCH, Karl, Statistik für Nichtstatistiker, Zufall und Wahrscheinlichkeit,


Oldenbourg, München, 2007

DEPRINS, Dominique, Statistique – ESPO 2102, Diffusion universitaire


CIACO, Louvain-la-Neuve, 2008

ECKSTEIN, Peter P., Klausurtraining Statistik, Gabler, Wiesbaden, 2006

GONICK, Larry, WOOLLCOTT, Smith, Statistik in Cartoons, Vahlen, München,


2009

GRABMEIER, Johannes, HAGL, Stefan, Statistik – Grundwissen und Formeln,


Haufe, Freiburg, 2010

HAGL, Stefan, Schnelleinstieg Statistik, Haufe, München, 2008

LINDENBERG, Andreas, WAGNER, Irmgard, Statistiques – Terminales,


Licence 1re année, Pearson Education France, Paris, 2007

MASIÉRI, Walder, Statistique et calcul des probabilités, Dalloz, Paris, 2001

PARIS, José, Probabilité – SESP 1217, Diffusion universitaire CIACO,


Louvain-la-Neuve, 1999

PARIS, José, Probabilités, Exercices – SESP 1217, Diffusion universitaire


CIACO, Louvain-la-Neuve, 2001

PIERETTI, Patrice, WEILAND, Jean, Statistique et Probabilités en Économie,


Saint-Paul, Luxembourg, 1987

SIMARD, Christiane, Notions de Statistique, Modulo, Québec, 2010

THOMAS, R.L., Modern Econometrics, an introduction, Pearson Education


Limited, Harlow, 1997

http://www.ser.public.lu/

http://www.statistiques.public.lu/fr/acteurs/statec/index.html

299
III. Proposition de mise en page

301
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

303
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

304
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

305
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

306
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

307
Élaboration d’un cours de « Statistique et Probabilités »
pour la classe de 1D

308