Elements de Statistiques Pour Les Non in

Joé Clauvis DIFFO
ÉLÉMENTS DE
STATISTIQUES
POUR LES NON-INITIÉS
La statistique n’est pas une accumulation de chiffres. C’est un mode de pensée.
D. SCHWARTZ
JOÉ CLAUVIS DIFFO
ÉLÉMENTS DE STATISTIQUES
POUR LES NON-INITIÉS
Sommaire
SOMMAIRE
AVANT-PROPOS ................................................................................................................................. iii
CHAPITRE I : INTRODUCTION A LA STATISTIQUE ................................................................. 1

1.1 Objet de la statistique .................................................................................................. 2
1.2 Les applications de la statistique dans le domaine sportif .................................... 3
1.3 La collecte de l’information........................................................................................ 4
CHAPITRE II : CONCEPTS DE BASE DE LA STATISTIQUE....................................................... 6

2.1 Population .................................................................................................................... 7
2.2 Caractères ..................................................................................................................... 7
2.3 Modalités ...................................................................................................................... 8
2.4 Tableaux statistiques ................................................................................................... 9
2.5 Les différents types de caractères et de variables statistiques ............................ 12
CHAPITRE III : LES DISTRIBUTIONS STATISTIQUES A UNE DIMENSION ........................ 17

3.1 Présentation générale des tableaux statistiques .................................................... 18
3.2 Les distributions à caractère qualitatif ................................................................... 20
3.4 Conseils généraux la représentation graphique des distributions statistiques 34
CHAPITRE IV : LES DISTRIBUTIONS STATISTIQUES A DEUX DIMENSIONS ................... 35

4.1 Présentation générale ................................................................................................ 36
4.2 Représentation graphique ........................................................................................ 41
CHAPITRE V : DESCRIPTION NUMERIQUE D’UNE VARIABLE STATISTIQUE ................ 46

5.1 Caractéristiques de tendance centrale .................................................................... 47
5.2 Caractéristiques de dispersion ................................................................................ 60
5.3 Caractéristiques de position..................................................................................... 65
5.4 Autres caractéristiques de dispersion : étendue, écarts interdéciles et
interquartiles .............................................................................................................. 66
5.5 Quelques conseils pour l’étude de séries statistiques simples ........................... 68
CHAPITRE VI : DESCRIPTION NUMERIQUE DES SERIES STATISTIQUES DOUBLES :

REGRESSION ET CORRELATION ................................................................................................. 70
6.1 Les caractéristiques marginales et conditionnelles d’une séries statistique
double.......................................................................................................................... 71
6.2 Ajustement linéaire ................................................................................................... 81
6.3 Application de la méthode des moindres carrés à des données individuelles 85
6.4 Application de la méthode des moindres carrés à des données groupées ....... 87
6.5 Ajustements non linéaires ........................................................................................ 91
6.6 Quelques conseils pour l’ajustement linéaire ........................................................ 92
CHAPITRE VII : LES TESTS PARAMETRIQUES.......................................................................... 94

7.1 Définition et loi de probabilité de la distance entre une distribution observée et
une distribution théorique ....................................................................................... 95
i
Sommaire
7.2 Le test du khi-deux.................................................................................................... 97

7.3 Le test de Kolmogorov – Smirov ........................................................................... 103
7.4 Le test u de Mann-Whitney.................................................................................... 104
7.5 Corrélation des rangs .............................................................................................. 106
CHAPITRE VIII : ANALYSE DE LA VARIANCE....................................................................... 109

8.1 Tests simultanés ....................................................................................................... 110
8.2 Procédure de l’analyse de la variance .................................................................. 112
8.3 Conditions de validité............................................................................................. 114
8.4 Analyse de la variance par les rangs .................................................................... 115
CHAPITRE IX : QUELQUES INDICATEURS STATISTIQUES ................................................. 117

9.1 Indices ....................................................................................................................... 118
9.2 Taux de croissance................................................................................................... 118
9.3 Points et pourcentages ............................................................................................ 119
REPERES BIBLIOGRAPHIQUES ................................................................................................... 120
ANNEXES.......................................................................................................................................... 121
ii
Avant-propos
AVANT-PROPOS
La prise en compte de l’importance de la statistique dans le développement

économique et social du Cameroun peut être comparée à l’évolution de la notion de
nombre, dans l’esprit humain ; c’est-à-dire d’une façon extrêmement lente.
L’on ne dressera pas ici l’histoire de la statistique, mais il peut être tout de même
signaler que longtemps réservée aux initiés, la statistique s’ouvre davantage aux
personnes n’ayant aucune base scientifique particulière dans cette discipline.
Cette démocratisation amorcée de la statistique ne voudrait pas signifier que

n’importe qui peut s’aventurer dans le domaine et s’ériger, après quelques
applications pratiques, en « expert ». En effet, s’émancipant du calcul des probabilités
où elle puise l’essentiel de ses fondements scientifiques(1), la statistique appartient
aujourd’hui au club des sciences. Son apprentissage au Cameroun exige une rigueur
que l’on ne retrouve qu’au sein d’une école de formation telle que l’Institut Sous-
régional de Statistique et d’Economie appliquée (ISSEA).
Au demeurant beaucoup de professionnels non spécialistes de la statistique
manipulent au quotidien de masses importantes de chiffres. Ces statistiques sont
généralement exploitées de manière très succincte, toute chose qui prive
l’information statistique d’émerger : la méthode scientifique n’étant pas déployée
dans cette activité. Le constat est le même chez les étudiants de bon nombre d’écoles
supérieures professionnelles qui pour les besoins de rédaction de leurs travaux
d’exposés, de rapports de stage, de monographies ou de mémoires doivent recourir à
la manipulation des statistiques.
Le présent support veut palier à cette « brièveté » de l’analyse de l’information

statistique. Bien que des prérequis mathématiques (et plus particulièrement dans le
calcul des probabilités) soient indispensables pour sa bonne assimilation, il apporte
au futur praticien de la statistique des concepts indispensables pour le « décryptage »
ou la description d’une série de chiffres. C’est ainsi que les cinq premiers chapitres
abordés se rangent dans le bloc de la statistique descriptive. Selon les statisticiens, le
chapitre 6 traitant des régression et corrélation s’intègre aussi bien dans un cours de
statistique descriptive (au sens strict) que dans un cours de statistique plus élaboré.
Ceci n’est plus vrai lorsqu’on aborde les chapitres suivants (7 et 8) que l’on pourra
bien concéder au critique ne faisant pas partie de la statistique descriptive. Toutefois,
leurs lectures sont ici recommandées pour les curieux qui désirent approfondir les
connaissances acquises aux chapitres précédents.
Cela dit, présenté en neuf chapitres, ce document de cours se veut, un guide pour
les futurs amateurs de la science statistique, et un repère pour usagers (non
statisticiens) désirant améliorer des connaissances statistiques parfois
« tronquées »(2). Certaines illustrations mentionnées dans ce support s’inspirent du
(1) On peut noter les noms des pionniers tels que Blaise Pascal, Jacques Bernoulli, Laplace, Gauss, Pearson,
etc.
(2) L’on pourrait illustrer ce propos par la confusion, très répandue entre histogramme et diagramme en
tuyaux d’orgues.
iii
Avant-propos
domaine sportif, car l'idée de rédiger ce manuel a été suscitée par des étudiants de
l’Institut National de la Jeunesse et des Sports (INJS) d’une part, et des enseignants
de cette institution d’autre part.
Ce support s’adresse à ceux qui, pour leurs recherches, leurs études, leurs
enseignements, leurs travaux, doivent procéder à des traitements de données
statistiques dans les domaines socio-économiques, démographiques, sportifs,
médicales… Aussi le texte présent a donc un objectif limité mais à mon avis
essentiel ; il s’agit de présenter des techniques d’analyse descriptive que je dis
« éléments » parce qu’elles sont sous-jacentes aux procédures plus complexes ou plus
raffinées (telles que l’analyse de la variance, l’analyse factorielle, etc.) auxquelles font
généralement allusion les statisticiens lorsqu’ils parlent d’ « analyse statistique ». J’ai
voulu rappeler ici cette vérité, un peu délaissée semble-t-il, que l’analyse statistique
commence avec les procédures de dénombrement et de calculs de moyennes et autres
caractéristiques de distributions, auxquelles se livrent en tout état de cause les
usagers lors de l’inspection « à vue » de leurs données ; et que ces procédures non
seulement sont aussi légitimes que les procédures « raffinées » (notamment
inférentielles) mais que, utilisées avec lucidité, elles peuvent ouvrir la voie à un
emploi plus judicieux de ces dernières.
Rédiger ce support a été un travail extraordinairement enrichissant et sans
l’expertise des groupes et de conseils, celui-ci n’aurait pas été possible.
Voilà pourquoi je veux remercier mes professeurs de l’ISSEA pour la qualité des
enseignements dispensés durant ma formation, et particulièrement à Michel Noé
Gui-Diby, Jeannot Mbangza et Djimrabaye Mandebaye qui m’ont encadré
respectivement dans le cadre des Cours de statistique descriptive (pour le premier) et
de statistiques mathématiques ; lesquels m’ont largement inspirés.
Je suis très reconnaissant à l’endroit de Victor Saïdou, Conférencier de la
Fédération Internationale des Associations d’Athlétisme (FIAA) et enseignant
permanent à l’Institut National de la Jeunesse et des Sports pour les commentaires
sur le manuscrit et l’apport des illustrations pratiques. Merci à Désiré Tioua pour sa
participation aux travaux de relecture.
Pour terminer, il faut souhaiter, à ce manuel, le large succès qu’il mérite pour
qu’il puisse connaître des éditions ultérieures, à chaque fois mises à jour, complétées,
et améliorées. Dans cette perspective, je serais très heureux de recueillir toutes les
critiques et suggestions que les lecteurs voudront bien me faire.
Joé Clauvis DIFFO
Statisticien Principal
E-mail : diffoclauvis@gmail.com
iv
Chapitre I : Introduction à la
Statistique
Sommaire
1.1 Objet de la statistique .................................................................................................. 2
1.2 Les applications de la statistique dans le domaine sportif .................................... 3
1.3 La collecte de l’information........................................................................................ 4
1.3.1 Objectif de l’information ...................................................................................... 4
1.3.2 Quantité des données ........................................................................................... 4
1.3.3 Collecte des données ............................................................................................. 4
1.3.4 Différents mode de collecte de l’information .................................................... 5

Chap. 1. Introduction à la statistique
Introduction
Très tôt les hommes d’Etat ont ressenti la nécessité de connaître les
caractéristiques des pays qu’ils gouvernaient : nombre d’habitants, richesse, etc. Ce
besoin a donné naissance à une arithmétique d’Etat qui a pris le nom de statistique. Le
champ d’application de la statistique a maintenant largement dépassé ce stade, mais
son objet est resté fondamentalement le même : décrire par rapport à une feuille de
critères pertinents, un ensemble d’objets parfaitement déterminé. La méthode
consiste à construire des groupes d’objets ou d’individus homogènes vis-à-vis de
valeurs observées, des critères, puis à dénombrer chacun de ces groupes. L’art de la
statistique réside dans la présentation de l’information ainsi rassemblée.
1.1 Objet de la statistique

La statistique est une méthode scientifique qui consiste à réunir des données
chiffrées sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces
données.
Pour tirer des informations chiffrées utilisables du rassemblement d’observations

nombreuses, il est nécessaire de procéder à un certain nombre d’opérations logiques
qui caractérisent la méthode statistique. Les éléments soumis à l’analyse doivent
appartenir à un ensemble homogène délimité avec précision. Les règles de définition
du champ couvert par l’étude doivent permettre de déterminer sans hésitation, si un
élément observé fait ou non partie de celui-ci. Ainsi, par exemple, pour rendre
compte de la production de véhicules automobiles d’un constructeur, il faudra
préciser s’il s’agit du nombre de voitures sorties de la chaîne, entrées au parc, sorties
du parc, livrées ou facturées. Ces différentes définitions ne sont pas en effet,
équivalentes et des comparaisons dans le temps et dans l’espace effectuées sans
précaution sur des chiffres se rapportant tantôt à l’une, tantôt à l’autre, n’auraient
que peu de signification. Seule la précision de la définition de la population observée
donne une valeur à la mesure quantitative de celle-ci.
Les éléments appartenant à cet ensemble homogène sont ensuite ordonnés et

classés. Pour être efficace, la statistique doit être simplifiée et abstraite : tous les
éléments classés dans un même sous-ensemble, par exemple ; tous les individus
d’une population qui présentent la même modalité du caractère étudié, sont
considérés comme équivalents. On ne retient que leur nombre.
La statistique ne s’intéresse qu’aux ensembles nombreux. La statistique a acquis

peu à peu une place importante parmi les méthodes de sciences fondamentales :
physique, chimie, biologie, génétique, astronomie. Elle s’applique aujourd’hui à tous
les domaines d’investigation ou de recherche quantitative : études économiques,
sociologiques, démographique, psychologiques, sportives, agronomiques,
industrielles, etc. et tend à envahir le domaine des affaires et notre vie de tous les
jours. En effet, elle est, par excellence, l’instrument de connaissance des phénomènes
Eléments de statistiques pour les « non-initiés » 2

de masses dont le développement est une caractéristique essentielle de l’évolution

économique et technique de notre société.
Enfin, cette science n’a pas pour objet la connaissance des éléments des
ensembles dans ce qui fait leur individualité, mais au contraire dans ce qu’ils ont en
commun : il s’agit d’obtenir des résultats globaux.
Remarque : Il ne faut pas confondre la statistique qui est la science qui vient
d’être définie et une statistique qui est un ensemble de données chiffrées sur un sujet
précis.
1.2 Les applications de la statistique dans le domaine sportif

La méthode statistique réunit aujourd’hui un ensemble impressionnant de
techniques au service du monde sportif.
La statistique se propose de classer les données, de les organiser et de les

présenter de façon claire. Ses méthodes font généralement appel au simple bon sens :
elles permettent très souvent de tirer des enseignements précieux sur les
informations existantes, sans qu’il soit utile de mettre en œuvre des techniques plus
élaborées. Elle est essentielle à la conduite du sport tant par la représentation qu’elle
permet des activités de celle-ci que par la connaissance qu’elle donne de son
environnement.
La statistique est à la base du système d’information des organisations sportives :

statistique des athlètes (âge, sexe), statistiques des encadreurs (expérience,
qualifications, grade), statistiques financières, etc. Elle aboutit à la construction d’un
tableau de bord et est indispensable à l’établissement du contrôle des carrières des
sportifs et du suivi de leurs performances.
Le système d’information statistique externe, organisé sur une base nationale et

internationale repose sur des principes analogues. Il fait appel à l’ensemble des
organisations sportives et consacre une large place aux techniques de comparaison
(moyennes des salaires, âge maximum, étendue des salaires ou des revenus,
espérance de vie de l’athlète, nombre de participants selon la compétition). il fournit
les éléments nécessaires à la comparaison à moyen et long terme de l’organisation
sportive.
L’analyse statistique permet aussi de mettre en lumière les liaisons qui existent
entre divers phénomènes : c’est l’objet des études de corrélation. Ces techniques
permettent de mesurer, par exemple, le degré de liaison observé entre l’évolution du
poids des athlètes et un régime alimentaire donné. Si l’on possède des indications sur
l’évolution future du poids d’un athlète dans une discipline sportive donnée – par
exemple, dans le cadre d’un plan ou programme de développement dudit sport – on
pourra en déduire une extrapolation raisonnée des performances.

1.3 La collecte de l’information

Le premier objet de la méthode statistique est de réunir les informations avant de
les traiter. Dans ce document, il ne peut pas être question d’indiquer toutes les
méthodes employées pour réunir les statistiques : en effet, elles sont aussi
nombreuses que les statistiques elles-mêmes. L’on se bornera à quelques généralités.
1.3.1 Objectif de l’information
Il importe, dès le départ, de bien définire l’objectif ou les objectifs de l’étude,

avant de réaliser l’enquête (au sens large, la collecte des statistiques). Si un élément
est oublié dans les premières recherches, il risque d’être long et coûteux de le
rechercher ensuite.
Exemple 1 : Si l’on réalise une enquête sur les paramètres anthropométriques

d’un groupe de sujet déterminé, il ne faut oublier aucune des variables ; on peut
prendre des mesures de la taille debout, du poids, des périmètres brachial et crânien,
des différents plis cutanées, capillaires, sus capillaires… Si ensuite l’on s’aperçoit que
la taille assise est un caractère important, mais que l’on n’a pas recueilli à ce sujet,
l’enquête est pratiquement à refaire.
1.3.2 Quantité des données
Cependant, il ne faut pas être trop ambitieux. Il ne doit pas y avoir de lacune
dans l’information, mais il ne doit pas non plus y avoir trop d’information. L’on est
souvent submergé par des kilogrammes de tableaux sortis d’un ordinateur,
intéressants en principe, mais trop abondants pour qu’il soit question d’en tirer une
synthèse ou même de les lire.
1.3.3 Collecte des données
Les données sont recueillies soit par observation directe, soit indirectement.
 S’il s’agit d’observation directe, l’enquête est menée par les statisticiens, à des fins
uniquement statistiques. D’une manière ou d’une autre, cette enquête aboutit à des
questionnaires que le statisticien est ensuite emmené à dépouiller. Ces questionnaires
portent soit sur chaque unité statistique, soit déjà sur un groupe d’unités statistiques :
dans ce dernier cas, les résultats sont déjà sous forme de tableau.
La réalisation des questionnaires est délicate. Autant que possible, ils ne doivent
pas être trop longs, pour avoir plus de chances d’être remplis correctement ;
cependant ils doivent contenir toute l’information désirée. Par ailleurs, ils ne doivent
présenter aucune ambiguïté (aucune question qui pourrait être mal comprise). Il est

souvent question de tester un questionnaire sur quelques personnes avant de le

lancer. Cette activité est appelée pré-test (ou pré-enquête).
Il est souhaitable que l’enquête puisse atteindre toutes les unités statistiques et
par conséquent qu’il n’y ait pas de « non réponse ». Pour cela, les statisticiens
recourent à tous les moyens d’incitation en leur pouvoir : cependant, ce point reste
difficile.
 Les statistiques recueillies par observation indirecte sont des sous produits
d’autres travaux : statistiques d’une entreprise tirée de sa comptabilité, statistiques
des naissances et décès tirées de l’état civil, statistiques médicales tirées de l’étude
des dossiers des malades, statistiques des réussites tirées des livrets de notes des
élèves… Ce moyen est beaucoup plus économique que le précédent, et a souvent
l’avantage de recouvrir avec certitude toute la population à étudier. Cependant,
dans bien des organisations (entreprises, organismes publics ou non,
établissements...), il est nécessaire de faire prendre conscience à tous de l’utilité des
statistiques, de façon à ce qu’il n’y ait aucune réticence pour la transmission des
informations.
1.3.4 Différents mode de collecte de l’information
 Les résultats statistiques peuvent être obtenus à partir d’une enquête

exhaustive instantanée (dénombrement instantané ou recensement) ou d’un relevé
continu. C’est ainsi que les statistiques démographiques viennent de deux sources : les
recensements de la population, à date fixe, et les statistiques du « mouvement » de la
population dressées à partir de l’état civil.
 De même, l’enquête peut être exhaustive ou partielle. L’enquête exhaustive

porte sur toutes les unités de la population ; elle est utile, mais souvent coûteuse. C’est
pourquoi l’on a souvent recours à des enquêtes partielles faites sur un échantillon de la
population : il s’agit alors de sondage. La méthode des sondages consiste à déterminer
un échantillon représentatif, de manière que les résultats statistiques trouvés sur cet
échantillon soient voisins de ceux que l’on aurait obtenus s’il l’on avait étudié la
population entière. Dans certains cas, une monographie (étude détaillée, ne portant que
sur quelques unités choisies) peut être instructive.
Références
BURTSCHY B., DUSSAIX A.-M., GRELET Y., GROSBRAS J.-M., LLIAKOPOULOS

A., LEJEUNE M., MORINEAU A., PAGÈS J.-P., ROUX M., SAPORTA
G. : Traitement statistique des enquêtes, Éditions Dunod, 1993.
FOURASTIÉ J., SAHLER B.: Probabilités et statistique, Éditions Dunod, 1981.
GUI-DIBY M.-N., Cours de statistique descriptive, polycopié, Institut Sous-régional de

Statistique et d’Économie Appliquée, 2001.

Chapitre II : Concepts de base de
la Statistique
Sommaire
2.1 Population .................................................................................................................... 7
2.2 Caractères ..................................................................................................................... 7
2.3 Modalités ...................................................................................................................... 8
2.4 Tableaux statistiques ................................................................................................... 9
2.5 Les différents types de caractères et de variables statistiques ............................ 12
2.5.1 Les caractères qualitatifs, les codes et les nomenclatures.............................. 12
2.5.2 Les caractères quantitatifs .................................................................................. 14
2.5.2.1 Les variables statistiques discrètes ............................................................. 14
2.5.2.2 Les variables statistiques continues ............................................................ 15

Chap. 2. Concepts de base de la statistique
Introduction
Les observations recueillies sur les indications et suivant les directives du
statisticien, constituent la source des informations statistiques. Pour être claires, ces
instructions doivent définir avec précision l’ensemble étudié et les critères qui en
permettent la description chiffrée par le classement de ses éléments en un certain
nombre de sous-ensembles.
Comme toute science, la statistique fait appel à un vocabulaire spécialisé. Les

premières statistiques correctement élaborées ont été celles des recensements
démographiques ; ce fait a laissé des traces. De ses origines historiques, la statistique
a gardé en partie la terminologie de la démographie. On y parle de population pour
désigner un ensemble, d’individus pour nommer les éléments de cet ensemble, etc.
2.1 Population
Une population est l’ensemble des unités statistiques ou individus étudiés par le
praticien de la statistique. Chaque observation faite par celui-ci porte sur une unité
statistique.
On emploiera les termes de population et d’individus aussi bien lorsqu’il s’agit

d’êtres humains : population camerounaise à la date du recensement de 2005, effectif
des athlètes d’une association sportive (Fédération camerounaise d’athlétisme,
Fédération camerounaise de football, Fédération camerounaise de judo, Fédération
camerounaise de volley-ball, etc.) au 31 décembre 2007…, que d’un ensemble d’objets
inanimés : production de maillots de football pendant l’année 2006, stock des disques
de la Fédération camerounaise d’athlétisme, Fédération gabonaise d’athlétisme,
Fédération ivoirienne d’athlétisme en fin d’année…, ou même d’un nombre plus ou
moins abstrait : ensemble des plaintes des athlètes à la Fédération camerounaise
d’athlétisme au cours de l’année 2007, ensemble des athlètes de la Fédération
camerounaise d’athlétisme contrôlés positifs à l’érythropoïétine en abrégé EPO
(dopage sanguin) au cours de l’année 2005. Les individus de la population peuvent
donc être selon le cas des êtres humains, des objets, des entités (organisations
sportives), des évènements (jeux olympiques d’Athènes de 2004).
La population étudiée doit être définie avec précision de façon à ce que les
enquêteurs ou les différents intermédiaires qui concourent à l’observation des faits,
interprètent les instructions de la même façon.
2.2 Caractères
Pour décrire quantitativement une population, on s’efforce de classer les
individus qui la composent en un certain nombre de sous-ensembles. Cette opération
Eléments de statistiques à l’usage des étudiants des écoles professionnelles 7

de classification aboutit à la confection de tableaux statistiques. Le classement peut se

faire relativement à un ou plusieurs caractères.
Par exemple, pour décrire la population camerounaise, on pourra retenir les

caractères : sexe, âge, état matrimonial, lieu de résidence, catégorie
socioprofessionnelle, niveau d’instruction, etc. S’il s’agit du personnel d’une
organisation sportive, le sexe et l’âge restent des caractères intéressants, mais il
conviendra d’y ajouter la profession, la qualification, le grade dans la discipline
sportive, l’ancienneté dans l’organisation, etc.
Une production industrielle résultant d’un processus de fabrication en série, par

exemple une production de sacs en matière plastique destinés à l’emballage pourra
être classée suivant les caractéristiques techniques des unités produites : dimensions,
épaisseur du film ou des fibres, résistance à l’étirement, résistance à l’abrasion, fait de
satisfaire ou non aux normes de fabrication. L’ensemble des facteurs d’un
établissement se rapportant à une certaine période (le mois), pourra être étudié
suivant l’objet de la commande, la qualité du client (ou du fournisseur), le montant
de la facture, le mode de règlement, l’origine géographique du client (ou du
fournisseur), etc.
L’ensemble abstraite des années 1980 à 1990 pourra être caractérisé, du point de
vue d’une étude sportive générale, par les principaux flux et agrégats du milieu
sportif : nombre de compétition, nombre de participants, montant global du
sponsoring, chiffre d’affaires réalisé, etc. Du point de vue d’une organisation sportive
telle que le Comité National Olympique et Sportif Camerounais, le caractères retenus
pourraient être : le type d’organisation sportives nationale affilié, le nombre
d’athlètes licenciés par les différentes fédérations sportives nationales, le montant des
primes aux athlètes, etc.
2.3 Modalités
Le choix d’un caractère détermine le critère qui servira à classer les individus de
la population étudiée en deux ou plusieurs sous-ensembles. Le nombre de sous-
ensemble correspond aux différentes situations possibles ou modalités de ce
caractère.
Afin que le classement d’une unité statistique soit toujours possible sans
ambiguïté, les différentes modalités d’un caractère doivent être à la fois
incompatibles et exhaustives : un individu appartient à un, et un seulement, des
sous-ensembles définis par ces modalités. L’incompatibilité signifie qu’un individu
ne peut pas appartenir à la fois à deux ou plusieurs modalités, l’exhaustivité
implique que tous les cas ont été prévus.
Ainsi le caractère sexe a deux modalités qui déterminent dans une population le
sous-ensemble des individus masculin et le sous-ensemble des individus féminin.

Le nombre de modalités selon lequel on considère un caractère, peut être fixé plus
ou moins conventionnellement suivant la matière de l’information dont on dispose
ou l’objet de l’étude que l’on effectue. Ainsi, l’état matrimonial comporte
naturellement quatre modalités : célibataire – marié – veuf – divorcé. De nos jours, l’on
tend à y ajouter une cinquième modalité : union libre.
Mais, pour telle étude, on pourra se contenter de classer la population suivant les
deux modalités : marié – non marié. L’âge, par exemple, pourra être enregistré
suivant des modalités correspondant à des classes d’âge annuelles, quinquennales ou
décennales, selon la finesse de l’analyse désirée.
L’exigence d’exhaustivité des modalités se rapportant à un même caractère

pourra, au contraire, conduire assez souvent à introduire une modalité
supplémentaire, résiduelle : non déclaré ailleurs (N.D.A), permettant de classer les
individus dont on ignore la situation vis-à-vis du caractère étudié.
2.4 Tableaux statistiques

L’examen d’une population selon un seul caractère conduit à un tableau
statistique à une seule dimension dont chaque case correspond à l’une des modalités
du caractère. Dans chacune de ces cases est inscrit le nombre d’individus présentant
cette modalité. Mais une même population peut être étudiée simultanément suivant
plusieurs caractères. Le nombre de sous-ensembles incompatibles et exhaustifs ainsi
définis est alors égal au produit du nombre de modalités de chaque caractère.
Le premier résultat d’un dépouillement de données est normalement un tableau

de nombres. Ces tableaux pourront être de simples résultats du dépouillement par
classe (voir tableau 1 et 2), ou faire intervenir à la fois deux caractères (voir tableau
3) ; lorsque les données sont à deux caractères, le tableau est un tableau à double
entrée : la somme des totaux en lignes doit être égale à la somme de totaux en
colonnes.
Il est courant qu’un tableau sortant d’un ordinateur ait des dizaines ou des
centaines de lignes et de colonnes, représentant un nombre imposant de feuillets. Ces
tableaux sont utiles pour l’analyse statistique détaillée, cependant il convient de
veiller à ne publier que des tableaux faciles à lire : leur clarté est en général plus
grande si les résultats sont suffisamment groupés ; une dizaine de lignes et de
colonnes constituent alors un nombre à ne pas dépasser, autant que possible : des
tableaux à 5 ou 6 lignes et 2 ou 3 colonnes sont d’ailleurs souvent plus parlants.
Exemple 1 : Lors d’une étude sur la résistance physique des athlètes de 17 à 20 ans
entraînés, on a mesuré la distance maximale parcourue par chaque athlète sélectionné en 15
minutes, et l’on a noté les distances limites dans chaque cas.

Tableau 1. Distance maximale parcourue par les athlètes en mètres
2711 2862 2851 2912 2922 2791 2825 2935 2895 2758
2915 2873 2926 2664 2800 2931 2722 2774 2903 2952
2853 2700 2885 2857 2844 2907 2917 2786 2820 2930
2789 2790 2753 2910 2847 2684 2936 2706 2758 2887
2941 2906 2784 2882 2859 2903 2925 2704 2092 2888
3090 3125 3268 3169 3169 3492 3206 3312 3382 3182
3263 3105 3259 3166 3116 3254 3308 3242 3287 3286
3192 3193 3260 3188 3188 3262 3508 3231 3190 3152
3214 3194 3201 3172 3172 3225 3389 3189 6298 3325
3289 3191 3213 3124 3124 3021 3290 3297 3086 3387
Il est possible d’établir à partir des données brutes du tableau 1, difficiles à

analyser telles quelles, un tableau résumé plus clair.
Pour noter le dépouillement manuellement, on évite les bâtons successifs presque

impossibles à compter : on dessine souvent un carré, côté après côté ; la 5e
observation est signifiée par une diagonale qui barre le carré. Ce tableau est élaboré
en lisant les observations dans l’ordre où elles viennent : on évite ainsi les oublis ou
les doubles comptes.
On choisit les classes, pas trop nombreuses pour que le tableau soit clair, mais
suffisamment pour qu’il n’y ait pas de perte d’information. Il importe que les classes
recouvrent tous les résultats et aient une intersection vide, d’où les formulations du
type « De… à moins de… » ; la différence entre les deux extrémités est appelée
amplitude de la classe.
Définition des classes
Les classes de valeurs possibles qui constituent les modalités du caractère

quantitatif étudié, peuvent avoir une amplitude constante ou variable.
Exemple 2 :
 La variable âge est très souvent découpée en classes quinquennales : 0 à

moins de 5 ans ; 5 à moins de 10 ans ; … 65 à moins de 70 ans ; 70 ans et
plus.

Les amplitudes de toutes les classes d’âge sont égales à 5 ans, sauf celles de
la dernière classe qui est indéterminée. 0, 5, 10, 15 ans, etc. sont les
extrémités ou bornes de classe.
 La variable durée du chômage pourra donner lieu aux classes suivantes :

moins de 1 mois ; 1 mois à moins de 3 mois ; 3 mois à moins de 6 mois ;
mois à moins de 1 an ; 1 an à moins de 2 ans ; 2 ans et plus.
Les amplitudes sont de 1 mois pour la première classe, 2 mois, 3 mois, 6

mois, 1 an pour les suivantes. Celle de la dernière classe est indéterminée.
Le choix du nombre de classes et de leur amplitude se fait en fonction de l’effectif

de la population (la taille), de façon à ce que le nombre d’unités statistiques dans
chaque classe soit suffisant pour éliminer les variations accidentelles qui se
produisent lorsqu’on considère de trop faibles effectifs.
En règle générale, on évitera de constituer plus de 10 à 15 classes. Dans la mesure

du possible on retiendra des valeurs simples, des nombres ronds pour les extrémités
de classe. On indiquera avec précision les limites de classe afin d’éviter toute erreur
de classement.
Exemple 3 : Le libellé : 0 à 5 salariés ; 5 à 10 salariés ; 10 à 20 salariés…est

incorrect : on ne sait si on doit classer une entreprise ayant exactement 5 salariés dans
la première classe ou la deuxième classe. On convient souvent d’inclure la limite
inférieure et d’en exclure la limite supérieure. Il faut préciser :
0 à moins de 5 salariés ;
5 à moins de 10 salariés ;
10 à moins de 20 salariés ; etc.
Le croisement de deux caractères donne naissance à un tableau statistique à deux

dimensions. Ainsi, le croisement du caractère sexe avec le caractère état matrimonial en
deux postes donne naissance à un tableau statistique à deux dimensions comportant
quatre cases correspondant aux sous-ensembles :
Tableau 2. Répartition de l’effectif des stagiaires selon leur sexe et l’état matrimonial
Sexe
Hommes Femmes
Etat matrimonial
Mariés Hommes mariés Femmes mariés
Non mariés Hommes non

Femmes non mariés
mariés
Il est possible de croiser trois caractères, quatre caractères, cinq caractères… on

obtient des tableaux à trois dimensions, quatre dimensions, cinq dimensions…

Exemple 4 : Le croisement du sexe, de l’état matrimonial et du lieu de résidence

en 60 départements administratifs donnerait lieu à un tableau composé de 60 feuillets
portant chacun le tableau relatif à un département (plus le tableau relatif à l’ensemble
des départements du pays (Cameroun). C’est un tableau à trois dimensions.
Remarque : Il faut cependant toujours avoir à l’esprit que tous les individus
appartenant à un même sous-ensemble sont équivalents ou semblables du point de
vue du phénomène étudié. C’est à cette réalité qu’est liée l’efficacité de la méthode
statistique.
2.5 Les différents types de caractères et de variables statistiques

Un caractère peut être soit qualitatif, soit quantitatif. Dans ce dernier cas, on lui
associe une variable statistique.
Cette distinction est importante car les méthodes d’analyse d’une population
statistique diffèrent suivant la nature du caractère étudié : les modes de classement,
de représentation graphique ne sont pas les mêmes, seuls les caractères quantitatifs
se prêtent au calcul des caractéristiques de tendance centrale ou de dispersion, etc.
2.5.1 Les caractères qualitatifs, les codes et les nomenclatures
Un caractère qualitatif est un caractère dont les modalités échappent à la mesure

(caractère non mesurable). Elles peuvent être seulement constatées : le sexe, la
nationalité, la couleur de la peau, la profession sont des caractères qualitatifs. On ne
peut pas se livrer à une mesure du caractère qualitatif comme ce serait le cas de la
mesure du poids, d’une longueur ou d’un volume.
Quant aux modalités du caractère, elles pourront être très peu nombreuses :
 2 pour le sexe : homme – femme ;

 5 pour l’état matrimonial : célibataire – marié – veuf – divorcé – union libre ;
 ou au contraire si nombreuses que leur simple énumération devient difficile et
que l’on est contraint d’opérer des regroupements (cas des professions par
exemple).
L’énumération des diverses modalités d’un caractère qualitatif constitue ce que

l’on appelle une nomenclature ou une classification. Ces modalités ou rubriques
doivent être exhaustives et mutuellement incompatibles de telle sorte qu’un individu
puisse être classé dans une, et dans une seulement, de celles-ci.
Certaines nomenclatures sont évidentes - c’est le cas de la répartition de la

population suivant le sexe, suivant l’état matrimonial, c’est le cas apparemment pour
la répartition de la population en 2 grandes catégories : les actifs et les inactifs, pour
la répartition des activités en 3 grands secteurs : primaire, secondaire et tertiaire), par

contre dans un grand nombre de cas, ces nomenclatures n’auront rien d’obligatoire,
elles pourront varier d’un pays à l’autre, d’une enquête statistique à l’autre, elles
devront varier suivant les conditions socioéconomiques.
Exemple 5 : Pour l’état matrimonial, il faudra prévoir pour certaines sociétés, la

polygamie et la polyandrie…
Pour les nomenclatures des professions, elles devront varier suivant le niveau de
développement du pays intéressé et le degré de complexité de la société. Il est
souvent pratique, surtout lorsque l’on recourt aux moyens modernes de traitement
automatique de l’information,, d’attribuer un nombre, le numéro de code, à chaque
rubrique.
Exemple 6 : Tentative de nomenclature des disciplines sportives
13 Athlétisme
137 Lancé
1371 Lancé de poids
1372 Lancé de javelot
1373 Lancé de disque
1374 Lancé de marteau
La répartition géographique d’une population est un cas particulier de

classement d’un caractère qualitatif. Etablir une nomenclature revient à procéder à
un découpage territorial. En général, on se contente d’utiliser les circonscriptions
administratives existantes : provinces, préfectures, départements, communes,
districts, cantons, etc. Mais pour certaines études par exemple, des étude de
développement urbain ou d’aménagement du territoire, ces divisions peuvent se
révéler inadéquates.
Du fait des difficultés d’établissement d’une nomenclature pour peu que le

caractère étudié soit complexe, on a souvent avantage à adopter une nomenclature
existante. D’une façon générale, il y a grand intérêt à normaliser l’établissement des
statistiques afin de permettre des comparaisons ultérieures à celles-ci.
Exemple 7 : Codes et nomenclatures
Etat matrimonial Statut dans l’activité

0 Célibataire 0 Sans objet
1 Marié(e) 1 Indépendants sans salariés
2 Veuf(ve) 2 Employeurs
3 Divorcé(e) 3 Aides – familiaux
4 Union libre 4 Apprentis sous contrat
5 Non déclaré (N.D) 5 Salariés d’établissements privés

6 Travailleurs à domicile
7 Salariés des services publics
8 Salariés de l’Etat et des collectivités locales
9 Chômeurs
2.5.2 Les caractères quantitatifs
On dit qu’un caractère est quantitatif lorsqu’il est mesurable (ou repérable).
Exemple 8 : La taille d’un individu (homme ou femme) exprimée en centimètres,

son poids exprimé en kilogramme, son âge en années (ou éventuellement en mois et
jours), la superficie d’un champ exprimée en ares ou hectares, la distance parcourue
exprimée en mètres ou en kilomètres, etc.
A chaque unité statistique correspond alors un nombre qui est la mesure (la
valeur) du caractère (voir tableau 1). A ce nombre, on donne le nom de variable
statistique. Les modalités du caractère sont les valeurs possibles de la variable
statistique ou des regroupements de ces valeurs.
Une variable statistique peut être discrète ou continue : les modes de

représentation graphique de la population seront différents suivant que l’on se
trouve dans l’un ou l’autre cas.
2.5.2.1 Les variables statistiques discrètes
Une variable statistique est discrète lorsqu’elle ne peut prendre que certaines
valeurs isolées dans son intervalle de variation. Il s’agit, en général, de nombres
entiers.
Exemple 9 :
 Nombre de participants à une compétition

 Nombre d’athlètes mariés
 Nombres d’enfants à charge d’une famille
 Nombre de courses gagnées
 Nombre de participants au séminaire
 Nombre de sanctions enregistrées pour comportement antisportif par la
Fédération camerounaise d’athlétisme
 Nombre de radiation au cours de la saison sportive
 Nombre d’athlètes suspendus
 Nombre de cas de fraudes
Les modalités du caractère étudié seront :
 Soit les valeurs possibles de la variable statistique lorsque celle-ci sont peu
nombreuses, en regroupant éventuellement les valeurs peu fréquentes.
Pour le cas des enfants à charge d’une famille, les modalités retenues

pourront être : 0 enfant, 1 enfant, 2 enfants, 3 enfants, 4 enfants, 5 enfants,

6 enfants et plus.
 Soit des regroupements, des classes, de valeurs possibles lorsque celles-ci

sont très nombreuses.
Exemple 1 : (suite) Les classes qui constituent les modalités de caractères,

pourront être : moins de 2700 m, 2700 à moins de 2800 m, 2800 à moins de 2900 m,
3000 à moins de 3100 m, 3100 à moins de 3200 m, 3200 à moins de 3300 m et 3400 m
et plus.
Tableau 3. Répartition des distances maximales parcourue par les athlètes
Distances en mètres
Dépouillement Effectif
Moins de 2700. . . . . . .
2700 à moins de 2800. . . .
2800 à moins de 2900. . . .
2900 à moins de 3100. . . .
3100 à moins de 3200. . . .
3200 à moins de 3300. . . .
3400 et plus. . . . . . . . .
Total . . . . . . . . . 100
Le tableau statistique 2, résultat du dépouillement du tableau 1, ne comporte

normalement que la première et la 3e ou la 4e colonne. Il permet, beaucoup mieux
que le tableau 1, de se rendre compte des résultats. En particulier, l’existence d’un
« creux » à moins de 2700 m était difficile à déceler sur les données brutes.
L’effectif d’une classe statistique est le nombre d’éléments de la population

observés dans cette classe.
2.5.2.2 Les variables statistiques continues
Une variable statistique est continue lorsqu’elle peut prendre toutes les valeurs à
l’intérieur de son intervalle de variation. Ce nombre de valeurs possible est toujours
infini. Il est donc nécessaire, avant de classer les observations, de définir les
modalités du caractère en regroupant en classes les valeurs possibles de la variable
statistique.

Exemple 10 :
 La taille, le poids, l’âge d’un individu

 La teneur en nickel, en chrome ou en manganèse d’un alliage
 La durée du chômage d’une personne
 La distance séparant deux points
 La durée d’une course
 Le débit d’une canalisation
 La surface d’une exploitation agricole
Dans la pratique, la distinction entre variables discrètes et continues est assez

artificielle. La précision d’une mesure est toujours limitée et les résultats de celles-ci
seront donc données sous forme discrète.
Inversement, lorsqu’une variable discrète est susceptible de prendre un grand

nombre de valeurs possibles, deux valeurs voisines apparaissent, relativement
comme très proches l’une de l’autre et la variable sera, par extension, considérée et
traitée comme une variable continue.
Exemple 10 : (suite)
 La hauteur d’un saut à la perche

 La distance d’un lancé du poids, du disque, du javelot, du marteau
 La hauteur d’un saut
 La longueur d’un triple saut
 La distance d’un saut en longueur
Références
BURTSCHY B., DUSSAIX A.-M., GRELET Y., GROSBRAS J.-M., LLIAKOPOULOS

A., LEJEUNE M., MORINEAU A., PAGÈS J.-P., ROUX M., SAPORTA
G. : Traitement statistique des enquêtes, Éditions Dunod, 1993.
GUI-DIBY M.-N. : Cours de statistique descriptive, polycopié, Institut Sous-régional de

Statistique et d’Économie Appliquée.

Les distributions
Chapitre III :
statistiques à une dimension
Sommaire
3.1 Présentation générale des tableaux statistiques .................................................... 18

3.2.1 Tableau statistique .............................................................................................. 20
3.2.2 Représentation graphique .................................................................................. 20
3.2.2.1 Représentation par tuyaux d’orgue ou par secteurs ................................ 20

3.2.2.2 Les diagrammes figuratifs et les cartogrammes ....................................... 22
3.3.1 Variables discrètes ............................................................................................... 24
3.3.1.1 Tableaux statistiques ..................................................................................... 24

3.3.1.2 Représentation graphique ............................................................................ 26
3.3.2 Variables continues ............................................................................................. 28
3.3.2.1 Tableaux statistiques ..................................................................................... 28

3.3.2.2 Représentation graphique ............................................................................ 29
3.4 Conseils généraux la représentation graphique des distributions statistiques 34
Chap. 3. Les distributions statistiques à une dimension
Introduction
Après classement suivant le (ou les) caractère(s) retenu(s), les observations
forment une distribution ou série statistique. Le terme de série est assez souvent
réservé aux distributions des observations dans le temps : il est alors synonyme de
série chronologique, série temporelle ou chronique.
Les distributions statistiques les plus simples sont naturellement les séries à un
seul caractère : elles sont présentées sous forme de tableaux statistiques à une
dimension (ou à simple entrée). Néanmoins, la lecture de ces tableaux, la synthèse
des informations qu’ils contiennent, est parfois assez difficile. Une distribution
statistique peut souvent être exprimée de façon beaucoup plus claire sous forme de
diagramme pour en réaliser une synthèse visuelle.
Suivant la nature qualitative ou quantitative, discrète ou continue du caractère

étudié, on utilise différents types de représentations graphiques. En général, les
représentations assurent la proportionnalité entre les effectifs et des aires (ou ce qui
est équivalent, entre des fréquences et des aires).
3.1 Présentation générale des tableaux statistiques

Soit une population ou un univers statistique P comprenant n individus pour
chacun desquels on a fait une observation concernant le caractère K. Celui-ci
comporte les modalités M1, M2, …, Mi,…, Mk. L’opération préliminaire de mise en
ordre des observations va consister à classer chacun des n individus dans les k sous-
ensembles définis par les diverses modalités du caractère k. Pour chaque modalité
Mi, on inscrira dans le tableau statistique le nombre d’éléments (le cardinal) du sous-
ensemble correspondant. Ce nombre est l’effectif ni. Du point de vue du caractère K,
tous les individus présentant la modalité Mi sont considérés comme équivalents : on
ne retient que leur nombre.
Fréquence
ni
La fréquence de la modalité Mi est définie par le rapport : fi 
n
C’est la proportion des individus de la population présentant la modalité Mi.

Celle-ci est souvent exprimée en pourcentage (%). Les fréquences permettent de
comparer les structures, selon le caractère étudié, la population d’effectifs différents.
Par définition, les modalités étant à la fois incompatibles et exhaustives, chaque

observation figure dans une et une seule d’entre elles. Par suite, la somme des
effectifs ni est égale à l’effectif total n de la population : n1  n2  ...  ni  ...  nk .
k
Ou symboliquement : n
i 1
i n

k
L’expression symbolique n
i 1
i s’énonce : « Somme, de i égale 1 à k, de ni ».
 est la lettre grecque majuscule « sigma » qui symbolise le mot « somme ». Il

en résulte que la somme des fréquence est égale à l’unité :
n1 n2 n n  n  ...  nk
f1  f 2  ...  f k    ...  k  1 2
n n n n
k
Symboliquement : f
i 1
i 1
Un tableau statistique décrivant une population P suivant un caractère K se

présente sous la forme générale suivante :
Tableau 1. Distribution de la population P suivant le caractère K
Caractère étudié Effectif de chaque modalité

(K)
M1 n1
M2 n2
.. ..
. .
Mi ni
.. ..
. .
Mk nk
Total n
On prendra toujours soin de préciser dans la présentation du tableau :
 La population étudiée et l’unité statistique employée :
Exemple 1 : Distribution des arbitres de basket-ball selon le nombre

d’année d’ancienneté dans la pratique de l’arbitrage.
 L’origine du renseignement :
Exemple 2 : Source : Fédération camerounaise de basket-ball.

3.2 Les distributions à caractère qualitatif

3.2.1 Tableau statistique
La présentation d’un tableau statistique concernant un caractère qualitatif suit

très exactement les règles générales exposées ci-dessus.
Exemple 3:
Tableau 2. Répartition des arbitres et commissaires sportifs du championnat MTN élite

One suivant la catégorie socioprofessionnelle
2006-2007 2007-2008
Catégories socioprofessionnelle Fréquence Fréquence
Effectif Effectif
(%) (%)
Agriculteurs exploitants 3 2,6 6 5,9

Salariés agricoles 5 4,3 4 3,9
Patrons de l’industrie et du commerce 6 5,2 7 6,9
Professions libérales et cadres supérieurs 18 15,7 17 16,7
Cadres moyens 23 20,0 28 27,5
Employés 30 26,1 27 26,5
Ouvriers 9 7,8 2 2,0
Personnel de service 11 9,6 3 2,9
Autre catégories 10 8,7 8 7,8
Total 115 100,0 102 100,0
Source : Fédération camerounaise de football
3.2.2 Représentation graphique
Une première synthèse de l’information contenue dans un tableau statistique est

fournie par sa traduction sous forme de graphique. Le principe de la représentation
graphique des caractères qualitatifs est la proportionnalité des surfaces
représentatives aux effectifs représentés.
3.2.2.1 Représentation par tuyaux d’orgue ou par secteurs
On représente habituellement les distributions selon un caractère qualitatif au

moyen de tuyaux ou de secteurs circulaires. De cette manière, les effectifs (ou
fréquences) sont proportionnels aux aires.

Dans la représentation par tuyaux d’orgue, les différentes modalités de caractère

sont figurées par des rectangles dont la base est constante et dont la hauteur, et l’aire
par conséquent, est proportionnelle aux effectifs.
Très souvent les différentes modalités sont ordonnées sur un graphique dans le
sens des effectifs croissants ou décroissants.
Dans la représentation par secteurs (diagramme sectoriel), ces dernières ont une
aire, et par conséquent un angle au centre proportionnel aux effectifs des modalités
correspondants. Ce système de figuration permet de rendre sensible à la fois les
différences en valeur absolue et en valeur relative. L’angle au centre  i de chaque
ni
modalité est égal au produit de la fréquence f i par 360° : i  360
n
Exemple 4 : Comparaison des effectifs des arbitres et commissaires sportifs du

championnat MTN élite One des saisons sportives 2006-2007 et 2007-2008 par
catégorie socioprofessionnelle.
Tableau 3. Répartition des arbitres et commissaires sportifs du championnat MTN élite

One suivant la catégorie socioprofessionnelle
2006-2007 2007-2008
Catégories socioprofessionnelle Fréquence Fréquence
Effectif Effectif
(%) (%)
Salariés agricoles 5 4,3 4 3,9

Patrons 9 7,8 13 12,7
Professions libérales et cadres 41 35,7 35 34,3
Employés 50 43,5 42 41,2
Autre catégories 10 8,7 8 7,8
Total 115 100,0 102 100,0
Figure 1. Représentation par tuyaux d’orgue.
Répartition de la population des arbitres et commissaires sportifs du championnat MTN élite
One des saisons sportives 2006-2007 et 2007-2008.
50
45
40
35
30
25
20
15
10
5
0
Salariés Patrons Professions Employés Autre catégories
agricoles libérales et
cadres
2006-2007 2007-2008

Le total des effectifs des arbitres et commissaires sportifs de chaque saison

sportive peut également être représenté par un cercle dont l’aire lui est
proportionnelle. Les rayons ( r1 pour la saison 2006-2007 et r2 pour la saison 2007-
2008) des deux cercles seront donc dans le rapport :
 r12 115 r
  1,13  1  1, 06
 r2 102
2
r2
Figure 2. Représentations par secteurs.

Répartition de la population des arbitres et commissaires sportifs du championnat MTN
élite One des saisons sportives 2006-2007 et 2007-2008.
Salariés Autre Salariés

Autre
2006 - 2007
agricoles catégorie 2007 - 2008
catégories 4,3% agricoles
s 3,9%
8,7%
7,8%
Patrons
7,8%
Patrons
12,7%
Professions Employés Professio

libérales et 41,2% ns
Employés
cadres
43,5%
35,7%
libérales
et cadres
34,3%
Le rapprochement des aires des différents secteurs permet les comparaisons des
effectifs en valeur absolue : ainsi, il apparaît que les populations des arbitres et
commissaires sportifs ayant exercé pour le compte du championnat MTN élite One à
la Fédération camerounaise de football sont du même ordre de grandeur, la
considération des angles au centre des secteurs rend possible, au contraire, les
comparaisons en valeur relative : la part des patrons est beaucoup plus élevée au
cours de la saison sportive 2007-2008 qu’au cours de la saison 2006-2007, celle des
salariés agricoles étant quasiment identique.
3.2.2.2 Les diagrammes figuratifs et les cartogrammes
a) Diagrammes figuratifs
On utilise souvent des illustrations pour figurer la distribution de caractères

qualitatifs. L’inexactitude de telles représentations est inévitable : outre l’imprécision
des illustrations, le lecteur ne sait s’il doit prendre en considération les longueurs, les
surfaces ou les volumes du diagramme figuratif.

D’une façon générale, si l’on désire rendre moins austère la représentation d’un
caractère qualitatif, il est préférable d’utiliser des diagrammes en tuyaux d’orgue ou
en secteurs et d’illustrer ceux-ci par des silhouettes suggestives.
b) Cartogrammes
La répartition géographique d’une population est un cas particulier des

distributions statistiques à un caractère qualitatif.
Il existe deux grandes catégories de cartogrammes : dans le premier type, les

phénomènes sont représentés par un système conventionnel de hachures ou de
couleurs s’appliquant à toute la surface de chaque unité géographique, dans le
second type, ils le sont par des surfaces centrées sur les unités géographiques et
proportionnelles aux effectifs à représenter.
i) Représentation par gamme conventionnelle de hachures ou de couleurs
Dans ce système, une intensité de hachures ou de couleur correspond à chaque

classe de valeurs du phénomène. L’impression retirée par le lecteur dépend à la fois
de l’intensité des hachures ou de la couleur, et de la surface à laquelle elles sont
appliquées. Ce procédé convient assez mal à la représentation des effectifs ou des
quantités exprimées en valeur absolue.
En revanche, ce procédé convient parfaitement à la représentation des densités

par unité de surface : nombre moyen d’habitants au km2, taux de (re)boisement, taux
de mortalité, etc.
ii) Représentation par surface
Pour représenter des effectifs ou des quantités, il semble donc, en règle générale,
préférable de recourir à des surfaces représentatives, par exemple des cercles,
centrées sur l’unité géographique correspondante et proportionnelle aux effectifs.
3.3 Les distributions à caractère quantitatif

Le mode de représentation des tableaux et de représentation graphique dépendra
de la nature discrète ou continue de la variable statistique (voir chapitre II). Les
variables discrètes regroupées par classe en raison du grand nombre de valeurs
qu’elles peuvent prendre (poids, taille, variables continues).

3.3.1 Variables discrètes
3.3.1.1 Tableaux statistiques
Les différentes modalités sont constituées par les valeurs possibles de la variable
discrète. En face de chacune de ces valeurs, on fait figurer l’effectif correspondant.
C’est le cas, par exemple, de la distribution des ménages selon le nombre d’enfants.
Exemple 5 : Au cours d’une étude sur les revenus des ménages camerounais, on a
relevé, dans l’optique d’évaluer la taille du ménage, le nombre d’enfants à charge. La
population étudiée est l’ensemble des ménages visités. La variable statistique est le
nombre d’enfants par ménage.
Tableau 4. Distribution des ménages camerounais selon le nombre d’enfants
Nombre Effectifs des Fréquences Effectifs

Fréquence (%)
d’enfants ménages cumulées cumulés
( xi ) ( ni ) ( fi ) ( Fi ) ( Ni  n  Fi )
0 240 7,9 7,9 240

1 570 18,8 26,6 810
2 410 13,5 40,1 1 220
3 730 24,0 64,1 1 950
4 480 15,8 79,9 2 430
5 et plus 610 20,1 100,0 3 040
Total 3 040 100,0
Source : Ministère de l’Economie
a) Fréquence
Le tableau est souvent complété, pour permettre les comparaisons entre les
populations d’effectifs différents - par exemple, avec une étude qui aurait inclus 5
081 ménages, pour l’indication de la fréquence f i correspondant à chaque valeur xi
de la variable discrète :
ni
fi  (100)
n
b) Fréquence cumulée. Effectif cumulé
La fréquence cumulée Fi est la somme des fréquences correspondant aux valeurs

de la variable statistique discrète inférieures ou égales à xi :

F1  f1
F2  f1  f 2
…
k
Fk  f1  f 2  ...  f h  ...  f k ou symboliquement : Fi   fi
i 1
Les valeurs de Fi sont, par conséquent, obtenues dans le tableau statistique par
additions successives des fréquences f i .
Signification de la fréquence cumulée
La fréquence cumulée Fi indique la proportion des individus pour lesquels la

variable statistique est inférieure à xi 1 . Ainsi, dans l’exemple 5, il y a 7,9% des
ménages où il n’y a aucun enfant, 40,1% pour lesquels il y a moins de 3 enfants, etc.
On définirait de façon analogue les effectifs cumulés :

i i i
nh
Ni   nf h   n   nh
h 1 h 1 n h 1
La forme générale d’un tableau statistique relatif à une variable discrète,

complétée par l’indication des fréquences simples (ou fréquences relatives) et des
fréquences cumulées, est donc celle du tableau suivant :
Tableau 5. Distribution statistique discrète
Caractère Effectif Fréquence Fréquences

étudié ( ni ) ni cumulées
( Fi  )
( xi ) n i
( Fi   f h )
h 1
x1 n1 f1 F1  f1
x2 n2 f2 F1  f1  f 2
. . . .
. . . .
. . . .
i
xi ni fi
Fi   f h
h 1
. . . .
. . . .
. . . .
k
xk nk fk
Fk   f h
h 1
k k
Total n
h 1
h n f
h 1
h 1 /

k
Par définition, la somme des fréquences est égale à l’unité : f
h 1
h  1 ; et la
fréquence cumulée est nulle pour les valeurs de xi inférieures à la plus petite valeur
observée, et égale à 1 pour celles supérieures ou égales à la plus grande valeur
observée.
On est conduit souvent à regrouper les valeurs extrêmes de la variable statistique

de façon à ne former qu’une seule classe (voir Exemple 5, tableau 4).
3.3.1.2 Représentation graphique
Pour les séries statistiques discrètes, il existe deux types de représentation

graphique :
 Le diagramme différentiel (diagramme en bâtons), correspond à la

représentation des fréquences ou des effectifs ;
 Le diagramme intégral (courbe cumulative) à celle des fréquences (ou

des effectifs) cumulées.
a) Diagramme en bâtons
Le diagramme en bâtons est la représentation graphique de la distribution des

effectifs ou des fréquences d’une variable statistique discrète. A chaque valeur xi de
cette variable portée en abscisse, on fait correspondre un segment vertical de
longueur proportionnelle à l’effectif ni ou à la fréquence f i de cette valeur.
Exemple 5 : (suite)
Figure 3. Diagramme en bâtons

Distribution de ménages camerounais selon le nombre d’enfants
800
700
Effectifs
600
500
400
300
200
100
0
0 1 2 3 4 5 et plus
Nombre d'enfants
le nombre d’enfants (variable observée) est toujours indiqué en abscisse. La

longueur des segments de droite représente l’effectif.

b) Courbe cumulative
La courbe cumulative est la représentation graphique des effectifs ou des

fréquences cumulées. C’est un graphique en escalier dont les paliers horizontaux ont
pour ordonnées :
i
Fi  fi  f 2  ...  f h  ....  fi 1  fi   f h
h 1
Les marches de l’escalier correspondent aux valeurs possibles de xi et ont des

hauteurs proportionnelles aux fréquences f i .
Plus exactement, la courbe est la représentation graphique de la proportion f ( x)

des individus de la population pour lesquels la valeur de la variable observée est
inférieure à x . Cette fonction définie pour toute valeur de x , est appelée fonction
cumulative ou fonction de répartition. Elle est constante dans chaque intervalle
séparant deux valeurs possibles consécutives : F ( x)  Fi pour xi  x xi 1 .
Exemple 5 : (suite)
Figure 4. Courbe cumulative de la répartition des ménages

100 F(x) camerounais selon le nombre d’enfants.
90
75
60
45
30
15
0 xi
0 1 2 3 4 5
Par suite, F ( x) est nulle pour les valeurs de x inférieures à la plus petite valeur et
égale à 1 pour les valeurs de x supérieures à la plus grande valeur observée. Ces
propriétés que l’on remarque graphiquement, s’expriment conventionnellement de la
façon suivante :
F ()  0 et F ()  1
Remarque : La représentation graphique des effectifs est identique à celle des

fréquences. On passe de l’une à l’autre par un simple changement d’échelle sur l’axe
des ordonnées : ainsi, dans l’exemple 5, il suffit d’utiliser une unité de mesure 3 040
fois plus petite pour obtenir le diagramme en bâtons des effectifs à partir de celui des
fréquences. Il en serait de même pour la courbe cumulative.

3.3.2 Variables continues
3.3.2.1 Tableaux statistiques
Dans le cas d’une variable statistique x continue, les observations sont

nécessairement regroupées par classe. Les modalités du caractère sont constituées
par les différentes classes. Si l’on désigne respectivement par ei 1 et ei les extrémités
inférieures et supérieures de la classe i , celle-ci est généralement définie par :
ei 1  x  ei .
Exemple 6 : Tableau 6. Répartition des ouvriers du complexe sportif et culturel

d’Awinng selon leur salaire mensuel
Fréquences
Classe de salaire Effectifs Fréquence f i
cumulées
(en 103 F CFA) ( ni ) (en %) ( Fi )
15 à moins de 35 26 18,6 18,6

35 à moins de 45 33 23,6 42,1
45 à moins de 55 64 45,7 87,9
55 à moins de 65 7 5,0 92,9
65 à moins de 85 10 7,1 100,0
Total 140 100,0 /
Source : G & V Consulting Enterprise
Remarque : Les classes extrêmes sont souvent ouvertes : « moins de 15 000 F

CFA », « 95 000 F CFA et plus ». Cette imprécision n’est pas gênante dans la mesure
où les fréquences concernées sont très faibles.
a) Fréquence
Pour permettre les comparaisons entre populations d’effectifs différents - par

exemple, avec un chantier similaire dont le nombre des ouvriers serait de 85 – le
tableau comporte souvent l’indication de la fréquence f i de chaque classe :
ni
fi  (100) En outre, en vue notamment de préparer la représentation de la courbe
n
cumulative, on calcule parfois la fréquence cumulée.
b) Fréquence cumulée. Effectif cumulé
La fréquence cumulée Fi est la somme des fréquences de chaque classe

correspondant aux valeurs de la variable statistique continue x inférieures à
l’extrémité supérieure ei de la classe i .

k
Fk  f1  f 2  ...  f h  ...  f k ou symboliquement : Fi   fi
i 1
Les valeurs de Fi obtenues par addition successives des fréquences f i figurant

dans le tableau statistique, sont écrites de préférence entre les lignes correspondant
aux classes, pour bien marquer qu’elles se rapportent, non pas aux classes, mais à
leurs extrémités supérieures. Ainsi, dans l’exemple 6, il y a 42,1% des ouvriers qui
touchent un salaire inférieur à 45 000 FCFA par mois. On définirait de manière
analogue les effectifs cumulés :
i
Ni   nh  ni
h 1
Dès lors, la forme générale d’un tableau statistique relatif à une variable continue,
complète par l’indication des fréquences (relatives) et des fréquences cumulées, est
celle du tableau statistique reproduit ci-après.
3.3.2.2 Représentation graphique
Comme pour les variables discrètes, deux types de représentation graphique sont
possibles pour les séries statistiques continues :
 La série des fréquences ou des effectifs : diagramme différentiel, nommé

histogramme.
 La série des fréquences ou des effectifs cumulés : diagramme intégral,
appelé courbe cumulative.
Tableau 7. Distribution statistique continue
N° de classe Définition des classe Effectif Fréquence Fréquences cumulées

i
( Fi   f h )
ni
(i) ( ei 1  x  ei ) ( ni ) ( Fi  )
n h 1
1 e0  x  e1 n1 f1 F1  f1
2 e1  x  e2 n2 f2 F1  f1  f 2
. . . . .
. . . . .
. . . . .
i
i ei 1  x  ei ni fi Fi   f h
h 1
. . . . .
. . . . .
. . . . .
k
k ek 1  x  ek nk fk Fk   f h  1
h 1
k k
Total / n
h 1
h n f
h 1
h 1 /

a) Histogramme
L’histogramme est la représentation graphique de la distribution des effectifs ou

des fréquences d’une variable statistique continue. A chaque classe de valeurs de la
variable, portée en abscisse, on fait correspondre un rectangle basé sur cette classe.
La représentation est donc effectuée comme si la distribution était uniforme à

l’intérieur d’une classe. La surface limitée par l’histogramme doit être
proportionnelle à l’effectif (ou à la fréquence). Il convient de prendre garde à
l’amplitude des classes : on se ramène à la plus petite amplitude élémentaire ou unité
d’amplitude de la classe par rapport à cette amplitude élémentaire.
Exemple 6 : (suite) Reprenons l’exemple du tableau 6. Choisissons 10 comme

amplitude élémentaire et représentons l’histogramme des effectifs. Les hauteurs des
rectangles sont indiquées dans le tableau 8.
Tableau 8. Répartition des ouvriers du complexe sportif et culturel d’Awinng

selon leur salaire mensuel net
Classe de salaire Hauteur du

Amplitude Effectif
(en 103 F CFA) rectangle
26 10
15 à moins de 35 20 26  13
20
33 10
35 à moins de 45 10 33  33
10
64 10
45 à moins de 55 10 64  64
10
7 10
55 à moins de 65 10 7 7
10
10 10
65 à moins de 85 20 10 5
20
Total / 140 /
Remarque : Pour la dernière classe, on aurait pu avoir « 65 000 F et plus » au lieu

de « 65 000 à moins de 85 000 F ». Dans ce cas, si l’on ne dispose pas de données
brutes, les extrémités des classes sont laissées à l’interprétation du praticien de la
statistique qui doit veiller à les choisir de façon vraisemblable. On obtient
l’histogramme de la figure 5 suivante :

Figure 5. Histogramme de la distribution des salaires des ouvriers selon le salaire mensuel
ni
60 ai
50
20
40
Polygone des
fréquences
30
20
20
10
x
0 15 35 45 55 65 85
Plus encore que le tableau de répartition, l’histogramme obtenu peut faire penser
que les résultats données ne sont pas homogènes : il est probable en effet qu’il existe
deux groupes d’ouvriers différents, ou que certains ouvriers ont été choisis selon des
critères différents des autres : la répartition des salaires fait apparaître une première
population d’ouvriers dont les salaires vont de 15 000 à 55 000 F et une autre, mieux
payée, mais moins nombreuse dont les salaires varient entre 55 000 à 85 000 F.
En pratique, on procédera comme suit dans le cas d’une série dont les amplitudes
sont inégales :
 Choix d’une unité d’amplitude de classe  : pour simplifier les calculs, on

retiendra le plus grand commun diviseur (PGCD) des amplitudes de
classe, 10000 dans l’exemple précédent.
ei  ei 1
 Expression des amplitudes dans cette nouvelle unité : ai 

fi
 La hauteur hi des rectangles représentatifs de chaque classe est égale à :
ai
de sorte que la surface des rectangles représentatifs Si est égale à la
fi
fréquence de la classe correspondante f i ; on a : Si  ai  hi  ai   fi
ai
Polygone des fréquences. Courbe de fréquence
Le polygone des fréquences s’obtient en joignant les milieux des sommets de

chaque rectangle par des segments de droite. La limite, au sens mathématique, du
polygone des fréquences, lorsque les intervalles de classe deviennent de plus en plus
petites, est une courbe continue dite courbe de fréquence.

En effet, la courbe de fréquence provient de l’idée suivant : si la population

étudiée est très nombreuse, l’histogramme ne donne qu’une représentation
imparfaite de celle-ci du fait du groupement des observations en un relativement
petit nombre de classes. Si l’on divisait une première fois, l’amplitude de chaque
classe par 2, on obtiendrait une représentation plus satisfaisante de la distribution.
On peut recommencer l’opération une deuxième fois, une troisième fois, …, une
nième fois, etc. A la limite, l’amplitude de classe tend vers 0 et l’histogramme tend
vers une courbe continue appelée courbe de fréquence.
La courbe de fréquence est donc tracée directement à partir de l’histogramme

primitif. Naturellement, l’aire délimitée par la courbe est, comme celle de
l’histogramme, égale à l’unité. L’aire délimitée par la courbe doit également être, aux
irrégularités accidentelles près, resté la même. On est donc guidé dans le tracé de la
courbe par cette règle de compensation des aires.
Pour le tracé du polygone des fréquences, il est d’usage d’ajouter de part et

d’autre de l’histogramme une classe dont la fréquence absolue est nulle. De cette
façon, l’aire délimitée par le polygone des fréquences est égale à la surface de
l’histogramme des fréquences (ou des effectifs).
Exemple 6 : (suite) Tracer le polygone des fréquences (voir Figure 4).
b) Courbe cumulative
Comme pour les variables discrètes, la courbe cumulative est la représentation

graphique de la fonction cumulative (ou fonction de répartition) F ( x) . Celle-ci est
égale à la proportion des observations pour lesquelles la variable statistique est
inférieure à x .
Les observations étant groupées par classe, on ne connaît de cette fonction que les
valeurs qui correspondent aux extrémités supérieures ( ei ) des classes et pour
lesquelles elle est égale à la fréquence cumulée Fi : F (ei )  Fi .
Exemple 6 : (suite) Tracer la courbe cumulative de la répartition des salaires des

ouvriers selon le salaire mensuel net.
C’est une courbe non décroissante. Elle est égale à zéro pour les valeurs de x
inférieures à la plus petite valeur possible et égale à 1 pour les valeurs supérieures à
la plus grande ; ce que l’on note symboliquement par : F ()  0 et F ()  1
On définirait de façon analogue la courbe des effectifs cumulés, qui se déduit de

la précédente par un changement d’unité (ou d’échelle) sur l’axe des ordonnées.

Figure 6. Courbe cumulative de la répartition des salaires des ouvriers selon le salaire
mensuel net
F(x)
100
75
50
25
0
15 35 45 55 65 85 x
Figure 6. Correspondance entre l’histogramme et la courbe cumulative
F(x)
0
x
F(x)
0
x

3.4 Conseils généraux la représentation graphique des

distributions statistiques
Nous n’avons pas épuisé les différents types de représentations graphiques de
distributions statistiques et nous rencontrerons d’autres aux chapitres suivants.
Toutefois, quel que soit le mode de représentation retenu, le graphique doit
s’accompagner des indications suivantes :
 Un titre décrivant sans ambiguïté l’objet du diagramme avec les notes

explicatives nécessaires ;
 Des axes de référence mentionnant la variable que chacun d’eux

représente, les axes étant clairement gradués, les échelles bien apparentes,
la légende n’étant pas omise ;
 Enfin, une indication de la source, qui permet notamment de se reporter

au tableau statistique correspondant pour complément d’information ou
contrôle.
Les échelles, en abscisses et en ordonnées, doivent être convenablement choisies

de façon que les variations apparaissent clairement sans être toutefois exagérées.
Le rapprochement de deux ou plusieurs graphiques permet des comparaisons

rapides entre les évolutions respectives de deux ou plusieurs phénomènes. Ce
rapprochement s’exécute en présentant les dessins côte à côte ou, mieux, en les
superposant : dans ce dernier cas, il est nécessaire d’utiliser un papier calque
transparent. L’examen d’un graphique donne la possibilité de déceler rapidement les
erreurs : une observation anormale s’écarte, en effet, des positions des autres points
et ceci d’autant plus que l’erreur commise est plus grande.
D’une façon générale, il ne faut pas sous-estimer les possibilités de la méthode

graphique. Ces représentations frappent l’œil. Les dents d’une courbe sont perçues
plus aisément que les écarts entre nombre successifs d’un tableau statistique. Pour la
préparation d’un grand nombre de décisions dans l’organisation ou dans
l’entreprise, il suffit d’informations sûres clairement exposées : quelques graphiques
y aideront beaucoup. Le tableau de bord de l’Organisation gagnera à être présenté
sous forme graphique.
Références

GRAIS B. : Cours de statistique descriptive, Éditions Dunod, 1990.

Les distributions
Chapitre IV :
statistiques à deux dimensions
Sommaire
4.1 Présentation générale ................................................................................................ 36
4.1.1 Distribution marginale ....................................................................................... 38
4.1.2 Distribution conditionnelle ................................................................................ 39
4.2 Représentation graphique ........................................................................................ 41
4.2.1 Caractères qualitatifs .......................................................................................... 41
4.2.2 Caractères quantitatifs ........................................................................................ 42

Chap. 4. Les distributions statistiques à deux dimensions
Introduction
Pour l’étude de certains phénomènes complexes, il s’avère insuffisant de prendre
en compte un seul caractère : il en faut considérer simultanément deux ou même
davantage. Naturellement, l’analyse des tableaux statistiques correspondant et leur
représentation graphique deviennent plus difficiles. La représentation graphique
globale d’une distribution à deux caractères quantitatifs n’est strictement possible,
par exemple, que dans l’espace à trois dimensions. On est donc conduit, en
définissant les distributions marginales et conditionnelles, à ramener la
représentation d’une distribution à plusieurs dimensions à celle d’une distribution à
un seul caractère ou à adopter certaines conventions.
On n’étudiera que les séries statistiques à deux caractères. Elles sont présentées
sous forme de tableaux statistiques à deux dimensions (ou à double entrée). On
généraliserait aisément les méthodes indiquées au présent chapitre à la présentation
des séries comportant plus de deux caractères.
4.1 Présentation générale

Soit une population P comprenant n individus pour chacun desquels on a fait
une observation concernant simultanément les caractères X et Y. Le caractère A
comporte K modalités X1 ,..., X i ,..., X k et le caractère Y les modalités Y1 ,..., Yj ,..., Yl .
L’opération préliminaire de mise en ordre des observations va consister à classer
chacun des n individus dans les k  l sous-ensembles définis par le croisement des
caractères X et Y. A chacun des sous-ensembles correspond une case du tableau
statistique à double entrée où figurent en lignes les modalités de X et en colonne les
modalités de Y (tableau de k lignes et de l colonnes). Dans chaque case, on inscrira le
nombre d’éléments (le cardinal) du sous-ensemble correspondant. Ce nombre est
l’effectif nij des individus présentant à la fois la modalité X i et la modalité Y j . Du point
de vue des caractères étudiés, tous les individus présentant simultanément les
modalités X i et Y j sont considérés comme équivalents : on ne retient que leur nombre
(voir tableau 1).
Pour les calculs à effectuer sur un tableau à double entrée, on a, de beaucoup,

intérêt à adopter une écriture symbolique. On indique par un point une totalisation
effective suivant l’indice i ou l’indice j.
ni. est le total des effectifs de la ligne i, la sommation étant effectuée sous l’indice
l
j : ni.  ni1  ni 2  ...  nij  ...  nil   nij
j 1
n. j est le total des effectifs de la colonne j, la sommation étant cette fois effectuée
k
suivant l’indice i : n. j  n1 j  n2 j  ...  nij  ...  nkj   nij
i 1

Tableau 1. Présentation générale d’un tableau à double entrée
Caractère Y
Y1 Y2 … Yj … Yl Totaux
Caractère X
X1 n11 n12 … n1 j … n1l n1.
X2 n21 n22 … n2 j … n2l n2.
Xi ni1 ni 2 nij nil ni.
Xk nk 1 nk 2 … nkj … nkl nk .
Totaux n.1 n.2 … n. j … n.l n..
n.. est le total. On l’obtient en effectuant la sommation, soit ligne par ligne, soit
l k l k
colonne par colonne : n..   nij   n. j   ni.
j 1 i 1 j 1 i 1
Exemple 1.
Tableau 1: Nombre d'ouvriers répartis suivant l'âge et la rémunération mensuelle

(Janvier 2000)
Age (ans)
25 à 30 à 35 à 40 à 45 à 50 à
Moins 55 et
moins moins moins moins moins moins Totaux
Rémunération de 15 plus
de 30 de 35 de 40 de 45 de 50 de 55
(FCFA)
Moins de 80 000 207 121 38 17 10 2 7 3 405
80 000 à moins de 90000 302 481 513 103 86 6 10 2 1503
90 000 à moins de 100 000 18 526 682 567 613 431 105 60 3002
100 000 à moins de 120 000 111 342 298 416 480 226 37 1910
120 000 à moins de 150 000 1 3 182 227 263 98 18 792
150 000 à moins de 200 000 18 22 13 12 5 70
200 000 et plus 1 14 6 7 5 33
Totaux 527 1240 1578 1186 1388 1201 465 130 7715
Source : Société de développement du Littoral Nord

On appelle fréquence de l’événement ( X i , Y j ) la proportion des observations qui

nij
présentent simultanément les modalités X i et Y j : fij  .
n
En adoptant les mêmes conventions d’écriture que pour les effectifs nij , on
indique par un point les totalisations effectuées suivant l’indice i ou l’indice j :
l l nij ni. k k n n
fi.   fij    ; f. j   fij   ij  . j f i. est le total des fréquences de la ligne i, et
j 1 j 1 n n i 1 i 1 n n
f. j est le total des fréquences de la colonne j.
l k l k
Comme pour les distributions à un caractère :  fj 1 i 1
ij   f. j   f i .  1
j 1 i 1
Le tableau est souvent présenté en pourcentage. La somme des fréquences est

alors égale à 100.
Exemple 1: (suite)
Tableau 2. Distribution des fréquences des ouvriers selon l'âge et la rémunération mensuelle
Age (ans)
25 à 30 à 35 à 40 à 45 à 50 à
Moins 55 et
de 30 de 35 de 40 de 45 de 50 de 55
(FCFA)
Moins de 80 000 2,7 1,6 0,5 0,2 0,1 0,0 0,1 0,0 5,2
80 000 à moins de 90000 3,9 6,2 6,6 1,3 1,1 0,1 0,1 0,0 19,5
90 000 à moins de 100 000 0,2 6,8 8,8 7,3 7,9 5,6 1,4 0,8 38,9
100 000 à moins de 120 000 1,4 4,4 3,9 5,4 6,2 2,9 0,5 24,8
120 000 à moins de 150 000 0,0 0,0 2,4 2,9 3,4 1,3 0,2 10,3
150 000 à moins de 200 000 0,2 0,3 0,2 0,2 0,1 0,9
200 000 et plus 0,0 0,2 0,1 0,1 0,1 0,4
Totaux 6,8 16,1 20,5 15,4 18,0 15,6 6,0 1,7 100,0
4.1.1 Distribution marginale
Les sommes des effectifs ou des fréquences en ligne définissent la distribution

marginale des effectifs ou des fréquences suivant le caractère X. C’est une
distribution à une dimension : le caractère n’intervient plus. La fréquence marginale
n i.
de la modalité du X i caractère X est égale à : fi. 
n

Ainsi, dans l’exemple précédent (tableau 2), 5,2% des ouvriers ont une
rémunération mensuelle inférieure à 80 000 F CFA, 19,5% une rémunération
comprise entre 80 000 et 90 000 F CFA, etc. C’est la distribution marginale selon la
rémunération : l’âge n’intervient pas.
La distribution marginale du caractère Y est, quant à elle, définie par les sommes
en colonne. La fréquence marginale de la modalité du Y j caractère Y est égale à :
n.j
f. j  . Dans l’exemple précédent, 6,8% des ouvriers ont moins de 25 ans, 16,1% ont
n
un âge compris entre 25 et 30 ans, etc.
4.1.2 Distribution conditionnelle
Considérons les ni individus remplissant la condition de présenter la modalité X i .

nij
Parmi ceux-ci, il y’en a une proportion qui présente simultanément la modalité Y j .
ni .
On dit que la fréquence conditionnelle de la modalité Y j liée par X i est :
nij
f j / i  f ji  f (Y j X i ) 
ni.
Les différentes fréquences conditionnelles pour une même modalité X i du
caractère X définissent la distribution conditionnelle de B liée par X i . C’est une
distribution à un seul caractère et il y a autant de distributions conditionnelles de Y
qu’il y a de modalité X i de X, c’est-à-dire de lignes du tableau. Chaque distribution
conditionnelle correspond à une série de pourcentage en ligne.
Exemple 1: (suite)
Tableau 3. Distribution conditionnelle de l'âge des ouvriers liée par la rémunération mensuelle
Age (ans)
25 à 30 à 35 à 40 à 45 à 50 à
Moins 55 et
de 30 de 35 de 40 de 45 de 50 de 55
(FCFA)
Moins de 80 000 51,1 29,9 9,4 4,2 2,5 0,5 1,7 0,7 100,0
80 000 à moins de 90000 20,1 32,0 34,1 6,9 5,7 0,4 0,7 0,1 100,0
90 000 à moins de 100 000 0,6 17,5 22,7 18,9 20,4 14,4 3,5 2,0 100,0
100 000 à moins de 120 000 5,8 17,9 15,6 21,8 25,1 11,8 1,9 100,0
120 000 à moins de 150 000 0,1 0,4 23,0 28,7 33,2 12,4 2,3 100,0
150 000 à moins de 200 000 25,7 31,4 18,6 17,1 7,1 100,0
200 000 et plus 3,0 42,4 18,2 21,2 15,2 100,0
Totaux 6,8 16,1 20,5 15,4 18,0 15,6 6,0 1,7 100,0

Il y’a 7 distributions conditionnelles de l’âge liées par la rémunération mensuelle.

La première correspond aux ouvriers ayant une rémunération mensuelle inférieure à
80 000 F : 51,1% ont moins de 25 ans, 29,9% ont entre 25 et 30 ans, 1,7% ont entre 50 et
55 ans.
On définit de façon analogue, la distribution conditionnelle de X liée par Y j . La

fréquence conditionnelle de la modalité X i liée par Y j est :
nij
fi / j  fi j  f ( X i Y j ) 
n. j
Les proportions sont cette fois calculées en colonne et il y a autant de

distributions conditionnelles de X qu’il y a de modalité Y j , c’est-à-dire des colonnes
du tableau.
Exemple 1: (suite)
Tableau 4. Distribution conditionnelle de la rémunération mensuelle des ouvriers liée par l'âge
Age (ans)
25 à 30 à 35 à 40 à 45 à 50 à
Moins 55 et
de 30 de 35 de 40 de 45 de 50 de 55
(FCFA)
Moins de 80 000 39,3 9,8 2,4 1,4 0,7 0,2 1,5 2,3 5,2
80 000 à moins de 90000 57,3 38,8 32,5 8,7 6,2 0,5 2,2 1,5 19,5
90 000 à moins de 100 000 3,4 42,4 43,2 47,8 44,2 35,9 22,6 46,2 38,9
100 000 à moins de 120 000 9,0 21,7 25,1 30,0 40,0 48,6 28,5 24,8
120 000 à moins de 150 000 0,1 0,2 15,3 16,4 21,9 21,1 13,8 10,3
150 000 à moins de 200 000 1,5 1,6 1,1 2,6 3,8 0,9
200 000 et plus 0,1 1,0 0,5 1,5 3,8 0,4
Totaux 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0
Sur le tableau 4, on peut lire les 8 distributions conditionnelles des rémunérations

mensuelles des ouvriers liés par l’âge.
Propriété des fréquences marginales et conditionnelles
Par définition : F ij  f (Yj X i )  fi  f ( X i Yj )  f j  fi.  f ji  f. j  fi j
nij nij ni. nij n. j

En effet :    
n ni. n n. j n
La fréquence de l’observation ( X i , Y j ) est égale à la fréquence conditionnelle de Y j

liée par X i multipliée par la fréquence marginale de X i , ou encore, en échangeant les
rôles de X i et Y j , à la fréquence conditionnelle de X i liée par Y j multipliée par la
fréquence marginale de Y j .

Remarque : Cette relation, connue dans le calcul des probabilités sous le nom de
formule des probabilités composées, jouera un rôle important dans l’étude de la
corrélation entre deux variables.
4.2 Représentation graphique

Le mode de représentation graphique d’une distribution statistique à deux
caractères dépendra de la nature de chacun de ces caractères : qualitatifs, quantitatifs,
discrets ou continus.
La représentation graphique d’une distribution statistique à deux caractères

quantitatifs n’est strictement possible que dans l’espace à trois dimensions : chacun
des caractères est porté selon une dimension et la troisième est affectée aux effectifs
ou fréquences. Mais on peut aussi décrire la population par la représentation
graphique de ses dimensions conditionnelles.
Il existe donc une grande diversité de représentation graphique des distributions

statistiques à deux caractères. Les principes de représentation sont analogues à ceux
utilisées pour les distributions pour les distributions à un caractère. Aussi,
n’étudierons-nous que quelques exemples. La représentation graphique permettra de
se faire une première opinion d’une liaison entre les deux caractères étudiés.
4.2.1 Caractères qualitatifs
Il n’est pas possible, dans ce cas, de représenter les deux caractères de façon
absolument symétrique.
Exemple 2 : La distribution suivante représente la Répartition de la population

active du Cameroun selon certaines catégories socioprofessionnelles et statut en 1989.
Tableau 5. Répartition de la population active du Cameroun selon certaines catégories

socioprofessionnelles et statut en 1989
Statut Travailleurs
Patrons Salariés Ensemble
familiaux
Catégories
Effectif % Effectif % Effectif % Effectif %
socioprofessionnelles
Agriculteurs exploitants 28 583 38,5 - 0,0 35 481 88,7 64 064 31,3
Employés - 0,0 24 860 27,5 - 0,0 24 860 12,2
Personne de service 45 620 61,5 65 481 72,5 4500 11,3 115 601 56,5
Total 74 203 100,0 90 341 100,0 39 981 100,0 204 525 100,0
Source : Direction de la statistique et de la comptabilité nationale

Graphique 1. Distribution de la population active du Cameroun selon certaines catégories

100 000
Effectif 90 000
80 000
70 000
60 000
50 000
40 000
30 000
20 000
10 000
0
Patrons Salariés Travailleurs familiaux
Catégorie professionnelle
Agriculteurs exploitants Employés Personnels de service
Graphique 2. Distribution de la population active du Cameroun selon certaines catégories

Pourcentage
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Patrons Salariés Travailleurs familiaux
Catégorie profesionnelle
Agriculteurs exploitants Employés Personne de service
4.2.2 Caractères quantitatifs
Désignons par X et Y les variables statistiques correspondant aux deux caractères

quantitatifs. On pourra représenter la distribution globale à deux caractères.
Exemple 3 :

Tableau 1. Nombre d'ouvriers répartis suivant l'âge et la rémunération mensuelle
Age
(ans) Moins de 25 [25 ; 35[ [35 ; 50[ 50 et plus Total
Rémunération
(FCFA)
Moins de 80 000 153 121 38 17 329
[80 000 ; 100 000[ 486 481 289 85 1 341
[100 000 ; 150 000[ 201 526 430 254 1 411
150 000 et plus 100 111 342 198 751
Total 940 1 239 1 099 554 3 832
Source : Société de développement du Littoral Nord
Graphique 3. Distribution des ouvriers répartis suivant l'âge et la rémunération mensuelle
600
Effectif
500
400
300
200
100
0
Moins de 25 [25 ; 35[ [35 ; 50[ 50 et plus
Age (ans)
Moins de 80 000 [80 000 ; 100 000[ [100 000 ; 150 000[ 150 000 et plus
Cas d’une population décrite par individus : diagramme de corrélation
Si les deux variables étudiées sont quantitatifs et si la population étudiée est peu
nombreuse, on peut représenter pour chaque individu le couple de valeurs x et y qui
lui est attaché. Dans ce cas, la représentation graphique consiste à porter sur un
diagramme cartésien les points de coordonnées x et y correspondant aux divers
individus.

Exemple 3 : Lors d’une étude sur la résistance physique de 30 enfants âgés entre
10 et 15 ans entraînés, on a mesuré la distance maximale parcourue par chaque
enfant sélectionné en 9 minutes, et l’on a noté les distances limites dans chaque cas.
Tableau 1. Distribution des 30 enfants selon l’âge (x) et

la distance maximale parcourue en mètres (y)
Enfant N° x y Enfant N° x y Enfant N° x y

1 10 550 11 10 431 21 13 605
2 11 650 12 14 684 22 12 543
3 11 452 13 10 460 23 10 310
4 12 468 14 15 750 24 11 450
5 10 456 15 15 840 25 12 457
6 10 401 16 10 530 26 13 643
7 11 390 17 15 760 27 14 740
8 13 650 18 11 359 28 10 310
9 13 548 19 10 408 29 14 499
10 14 450 20 13 595 30 15 700
Figure 4. Diagramme de corrélation. Distribution des 30 enfants selon l’âge (x)

et la distance maximale parcourue en mètres (y)
900
800
Y
700
600
500
400
300
200
100
0
9 10 11 12 13 14 15 16
X
Le dessin prend finalement l’aspect d’un nuage de points. Schématiquement, le

nuage peut revêtir trois aspects :

a) Les points représentatifs sont distribués sur toute la surface du graphique, à

peu près comme s’ils avaient été placés au hasard. C’est le signe qu’il n’y a
aucun lien entre les deux variables X et Y : on dit qu’elles sont indépendantes.
b) Les points représentatifs sont, au contraire, bien nuagés le long d’une courbe
(droite, arc de cercle, arc d’ellipse, morceau d’hyperbole…). Une loi
rigoureuse préside alors aux relations entre les deux variables. Ainsi, dans
certaines limites, la longueur Y d’un ressort est proportionnelle à la force X qui
s’exerce sur lui : la courbe représentative de Y en fonction de X est une droite.
A chaque valeur de x, correspond une valeur de y : on dit qu’il y a liaison
fonctionnelle entre Y et X. Dans l’exemple 3, s’il les distances maximales
parcourues étaient fonction de l’âge de l’enfant, elles se distribueraient
rigoureusement selon la première bissectrice.
c) En réalité, la plupart des phénomènes identifiés à des distributions à deux

variables se trouvent entre ces deux extrêmes. Les points représentatifs se
distribuent dans une région privilégiée du dessin. Moins le nuage de points a
d’épaisseur et plus on se trouve proche de la liaison fonctionnelle : on dit qu’il
y a corrélation entre les deux variables. Inversement, plus le nuage de points
s’étale, moins ses limites sont précises, plus on est proche de l’indépendance :
la corrélation est faible.
Références


Chapitre V : Description numérique
d’une variable statistique
Sommaire
5.1 Caractéristiques de tendance centrale .................................................................... 47

5.1.1 Moyenne ............................................................................................................... 47
5.1.1.1 Moyenne arithmétique ................................................................................. 47
5.1.1.2 Moyenne géométrique .................................................................................. 52
5.1.1.3 Moyenne harmonique................................................................................... 53
5.1.2 Mode...................................................................................................................... 55
5.1.3 Médiane ................................................................................................................ 56
5.1.3.1 Effectifs (ou fréquences) cumulé(e)s ........................................................... 57
5.1.3.2 Variable continue........................................................................................... 57
5.1.3.3 Variable discrète ............................................................................................ 58
5.1.3.4 Calcul de la médiane ..................................................................................... 59
5.2 Caractéristiques de dispersion ................................................................................ 60
5.2.1 Ecart absolu moyen ............................................................................................. 60
5.2.2 Ecart-type.............................................................................................................. 61
5.2.2.1 Définition ........................................................................................................ 61
5.2.2.2 Méthode de calcul ......................................................................................... 62
5.2.2.3 Signification de l’écart-type ......................................................................... 64
5.2.3 Coefficient de variation ...................................................................................... 64
5.3 Caractéristiques de position..................................................................................... 65
5.3.1 Cas d’une variable continue .............................................................................. 65
5.3.2 Cas d’une variable discrète ................................................................................ 66
5.4 Autres caractéristiques de dispersion : étendue, écarts interdéciles et
interquartiles .............................................................................................................. 66
5.5 Quelques conseils pour l’étude de séries statistiques simples ........................... 68
Chap. 5. Description numérique d’une variable statistique
Introduction
Il ne suffit pas d’un grand regard sur le tableau 1 du chapitre 2 ou le tableau 4 du
chapitre 3 ou sur les graphiques 3 et 5 du chapitre 3 pour connaître et analyser la
répartition des distances maximales parcourues par les athlètes âgés de 17 à 20 ans
ou celle des ménages camerounais selon le nombre d’enfants. Un tableau statistique
ou un graphique sont parfois long à consulter, sans permettre d’avoir une idée
suffisamment concise de la distribution statistique observée. On cherche alors à
résumer celle-ci par une caractéristique de tendance centrale, c’est-à-dire par un seul
nombre destiné à caractériser l’ensemble d’une façon objective et impersonnelle.
Le futur praticien doit se familiariser dans le présent chapitre aux notions de

moyenne arithmétique, géométrique et harmonique ; d’autres caractéristiques, médiane
et mode, par exemple, jouent un rôle analogue.
Les calculs indiqués dans ce chapitre devraient être réalisés sur des données
énumérées. L’on reprendra pour illustration certains tableaux figurant aux chapitres
précédents. Lorsqu’il s’agit d’une variable continue dont les réalisations sont
groupées en classes (confère tableau 3 du chap. 2), l’on se ramène au cas discret au
prix d’une approximation.
5.1 Caractéristiques de tendance centrale

5.1.1 Moyenne
5.1.1.1 Moyenne arithmétique
La moyenne arithmétique d’une série de valeurs d’une variable statistique est

égale à la somme de ces valeurs divisée par leur nombre.
Autrement dit, la moyenne arithmétique est la valeur commune qu’auraient les

données si elles étaient toutes égales de façon à ce que leur somme reste la même : les
surplus des nombres les plus élevés seraient répartis entre les nombres les moins
élevés.
a) Cas de données énumérées
Lorsque les données sont présentées comme dans le tableau 1 du chapitre 2, le

calcul de la moyenne ne présente aucune difficulté, surtout si l’on dispose d’une
machine à calculer (certaines machines, dites « statistique » donnent directement la
moyenne sans aucun calcul à l’aide des touches  et x ).
Sur les données du tableau 1 du chapitre 2, l’on effectue la somme des distances :
on divise ensuite cette somme par 100 ; d’où la moyenne : x = 3 058,11 qu’il convient
d’arrondir à 3 058 m.

x1  x2  ...  xn
La formule générale est pour n observations x1 , x2 ,..., xn : x 
n
Le symbole x se lit « x barre » ou « x moyen ». Il est fréquemment utilisé pour

désigner la moyenne.
b) Cas d’une variable discrète
Si la variable est discrète, on emploie la formule de la moyenne pondérée. Pour t

classes d’effectifs ni ou de fréquences f i , la moyenne x s’écrit pour les valeurs
x1 ,..., xi ,..., xt de la variable :
n1 x1  n2 x2  ...  nt xt f x  f x  ...  f t xt
x  1 1 2 2
n1  n2  ...  nt f1  f 2  ...  ft
O a l’habitude de résumer cette écriture en employant le signe  :

t t
n x  f x
i i i i
x i 1
t
 i 1
t
n
i 1
i f
i 1
i
Le symbole  lire « sigma », lettre majuscule grecque, ou « somme ») est utilisé

pour écrire plus rapidement une somme en termes ne différant que par leurs indices :
i t t t

i 1
,  ,  , (et même, s’il n’y a aucune ambiguïté,
i 1 1
 ) sont des manières de plus en
plus abrégées, d’indiquer que l’on effectue une somme de t termes, identiques à
celui qu’introduit le symbole, mais différant par l’indice : i prenant successivement
toutes les valeurs entières de 1 à t .
Pour les données du tableau 4 du chapitre 3, on peut réaliser le tableau de calcul

suivant :
Tableau 1. Calcul du nombre d’enfants moyen par famille
(1) (2) (3) (4)

Nombre d’enfants
Effectifs ni ni xi ni xi2
( xi )
0 240 0 0
1 570 570 570
2 410 820 1 640
3 730 2190 6 570
4 480 1920 7 680
5 et plus 610 3965 25 772,5
Total 3 040 9 465,0 42 232,5

Seuls les colonnes (1) (2) et (3) du tableau sont nécessaires ici. La colonne (4) sera
utilisée plus loin). Pour la classe « 5 et plus », la valeur de la variable choisie a été 6,5.
On a la moyenne :
t
n x i i
9465
x i 1
t
  3,11
3040
n 1
i
Il y a en moyenne 3,11 enfants par famille. Ce nombre n’est pas entier. On le

conserve cependant, car il signifie que 100 familles ont en moyenne 311 enfants.
c) Cas d’une variable continue
Si la variable est continue et si les données sont groupées comme dans le tableau 6
du chapitre 3, on ne peut que rechercher arbitrairement une moyenne à l’intérieur de
chaque classe ; à défaut d’autre renseignement, on choisit le « centre de classe » ( xi
pour la classe i ) qui est la moyenne arithmétique des extrémités de la classe. Le
calcul est effectué comme si tous les individus d’une classe avaient pour le caractère
le centre de classe, avec toute la part d’approximation que cela comporte.
Exemple 1 : Calcul de la moyenne des salaires à partir du tableau 6 du chapitre 3.
Tableau 2. Calcul du salaire moyen des ouvriers
Centre
Classe Effectif Effectif
Effectifs de x  x0
de ni xi nx 2
i i x  i
'
i
'
ni x
i nx '2
i i cumulé cumulé
ni classe a
salaire xi
« moins « plus
en 103 F de » de »
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
15 0 140
26 25 0650 16 250 -3 -78 234
35 026 114
33 40 1 320 52 800 0 0 0
45 059 81
64 50 3 200 160 000 2 128 256
55 123 17
07 60 0420 25 200 4 28 112
65 130 10
10 75 0750 56 250 7 70 490
85 140 0
Total 140 250 6 340 310 500 148 1 092

n x i i
6340
On a alors x  i 1
t
  45, 286 , soit 45 286 F CFA.
140
 ni1
Les colonnes (5), (6), (7), (8), (9) et (10) sont utilisées plus loin.
Signalons ici que quelques fois, le calcul de la moyenne telle que présenté à
l’exemple 1 peut conduire à une perte de précision de la moyenne due au
regroupement des données en classes et au choix du centre de classe comme
moyenne de la classe : comme tous les « résumés » que permet la science statistique,
ce regroupement représente une perte d’information. Cependant, l’esprit humain
n’est pas capable de considérer toutes les données à la fois ; c’est la forme résumée –
moins précise – qui lui est seule accessible.
Le calcul qui vient d’être présenté s’effectue aisément à l’aide d’une machine à
calculer, surtout si celle-ci peut garder en mémoire les sommes de produits.
Certaines, machines programmables fournissent d’ailleurs directement la moyenne et
d’autres caractéristiques, même dans le cas des données groupées. Si l’on ne dispose
pas de machine, on peut simplifier le calcul en faisant un changement de variable ; la
variable auxiliaire :
xi  x0
xi' 
a
x0 et a étant choisis convenablement, allège les calculs. On calcule alors la

moyenne x ' des xi' . La moyenne des xi est alors :
x  ax '  x0
Suite de l’exemple 1 : Calcul à l’aide d’une variable auxiliaire.
Sur le tableau 2, x0 a été choisi à 40 (centre d’une classe situé à peu près au milieu
de la répartition et suffisamment nombreuse) et a égale à 5, (pour que les xi' soient
entiers). Les xi' obtenus (colonnes 6) sont plus simples que les xi .
Remarque : Si les classes avaient été d’amplitudes égales, il aurait été facile
d’avoir une variable auxiliaire plus simple encore. Le fait d’avoir des classes
d’amplitudes inégales constitue un danger pour le calcul, car le contrôle est moins
aisé ; si les classes sont d’amplitudes égales, la variable auxiliaire prend des valeurs
entières successives.
148
x'   1, 06
140
D’où, en revenant à la variable x : x  5  (1,0571)  40  45, 286 soit 45 286 F CFA.

Résultat identique au précédent.

Propriétés algébriques de la moyenne
Propriété 1 : La somme algébrique des écarts des observations à la moyenne est

nulle :  ni ( xi  x )  0
Démonstration :
 n (x
i i  x )   ni xi   ni x
n
  ni ( xi  x )   ni xi   ni x
n
  ni ( xi  x )  nx  nx
  ni ( xi  x )  0
Propriété 2 : La somme des carrés des écarts des observations à la moyenne est
inférieure à la somme des carrés des observations des écarts par rapport à toute autre
valeur.
Démonstration :
La somme des carrés des écarts par rapport à une valeur quelconque X dépend
de la valeur X : c’est le trinôme de second degré en X : S ( X )   ni ( xi  X )2 (1)
Ce trinôme de second degré est minimum lorsque sa dérivée par rapport à X est
nulle c’est-à-dire. S '( X )  2 ni ( xi  X )  0
Condition de 2nd ordre : S ''( X ) 0 c’est-à-dire 2n 0
2 ni ( xi  X )  0
  ni ( xi  X )  0
  ni xi   ni X
 nx  nX
xX
Propriété 3 : La moyenne x d’une population P composée de deux sous-

populations P1 ( x1 ) , P2 ( x2 ) peut être exprimée tout simplement en fonction de x1 et x2 .
Démonstration :
Soit une population P d’effectif n composée de deux sous populations P1

d’effectifs n1 et P2 d’effectifs n2 : n  n1  n2 .
Soient n1i et n2i les nombres d’individus respectifs des sous populations P1 et P2 .
Dans la population P correspondant à xi est ni  n1i  n2i .
Par définition de la moyenne, les moyennes des sous populations ont pour
expression :

1 k 1 k 1 k
x1   n1i xi , x2   n2i xi et la moyenne totale x   ni xi
n1 i 1 n1 i 1 n i 1
k k k
1 1
x
n1  n2
 (n
i 1
1i  n2i ) xi  ( n1i xi   n2i xi )
n1  n2 i 1 i 1
1
x (n1 x1  n2 x2 )
n1  n2
n1 x1  n2 x2 nx nx n n
x  1 1  2 2  1 x1  2 x2
n1  n2 n1  n2 n1  n2 n n
d’où x  f1 x1  f 2 x2 avec f1  f 2  1
Ainsi, la moyenne de la population totale x apparaît comme la moyenne de x1 et

de x2 pondérée par les proportions de P1 et de P2 dans la population totale. CQFD.
La relation (1) s’étend au cas où le nombre de sous population est supérieur à

deux, cas général du mélange de populations.
En désignant par nh l’effectif de la sous population Ph :
1 l
 nh xh   i 1 f h xh avec n   i 1 nh   i 1 h  i 1 f h   1
i l i l i l n i l n
Ph : x 
n i 1 n n
Il existe d’autres types de moyenne que la moyenne arithmétique beaucoup

moins fréquente, leur utilisation est cependant recommandée dans certains cas.
5.1.1.2 Moyenne géométrique
Moyenne géométrique simple
La moyenne géométrique G de la série des valeurs x1 , , xn est définie par la

relation :
n 1
G  n x1 x2 ...xn  ( xi ) n
i 1
ou en prenant le logarithme des deux membres :
1 n
log G   log( xi )
n i 1
Exemple 2 : Soit la suite des 6 nombres 1, 2, 5, 7, 10, 13 ; la moyenne géométrique

G  6 1 2  5  7 10 13  4,57
Exemple 3 : Soit un atelier de 22 ouvriers donc les primes hebdomadaires se

répartissent de la façon suivante :

Tableau 3. Répartition des salaires et calcul du salaire la moyen des ouvriers
Prime hebdomadaire en F Effectifs ni log xi n i log x i
10 000 10 4,00000 40,00000

12 000 5 4,07918 20,39591
12 500 4 4,09691 16,38764
14 000 3 4,14613 12,43838
Total 22 89,22193
1 4 89, 22193
log G   n i log xi  22  4,05554
n 1
D’où G  104,05554  11364 F
C’est une moyenne géométrique pondérée : les coefficients de pondération

représentent le nombre des ouvriers qui se trouvent à chaque niveau de primes. Ici,
l’emploi de la moyenne géométrique ne s’impose pas : elle n’a pas de signification
concrète.
Moyenne géométrique pondérée
Soit une variable statistique pouvant prendre k valeurs x1 ,..., xi ,..., xk auxquelles
correspondent respectivement des effectifs n1 ,..., ni ,..., nk .
La moyenne géométrique a pour expression :

1 k 1
G  n x1n1 x2n2 x3n3 ...xini ...xknk  ( x1n1 x2n2 x3n3 ...xini ...xknk ) n  ( xini ) n
1
En prenant le logarithme des deux nombres, on obtient :

k k k
ni
G   xini
i 1
n
  xifi avec fi 
i 1 n
et f
i 1
i 1
5.1.1.3 Moyenne harmonique
Moyenne harmonique simple
La moyenne harmonique H de la série des valeurs x1 , , xn est définie par la

n n
relation : H 
1 1 1 n
1
  ... 
x1 x2 xn x
i 1 i
Exemple 4 : Un spéculateur a consacré pendant quelques années la même somme

S à l’achat de sacs de cacao aux prix respectifs de 5 400 F le sac, 5 500 F, 5 800 F, et
6 400 F.

La dépense totale effectuée par celui-ci est de : D  4  S .
S
La 1ère année, le spéculateur a acheté q1 
5400
S
La 2ème année, le spéculateur a acheté q2 
5500
S
5800
S
6400
D’où Dm  pm  q
 4S  pm  (q1  q2  q3  q4 )
S S S S
 4S  pm  (    )
5400 5500 5800 6400
1 1 1 1
 4S  pm  S  (    )
5400 5500 5800 6400
4
 pm   5749,876
1 1 1 1
  
5400 5500 5800 6400
C’est-à-dire : pm  5750 F. Dans ce cas, l’emploi de la moyenne harmonique

s’impose.
Exemple 5 : Une entreprise de transport interurbain dispose de 10 bus qui font

des rotations entre Douala et Obala dont on ne connait pas la distance. Au cours de
l’une de celles-ci, le trajet Douala – Obala a été couvert par ces véhicules aux vitesses
moyennes suivantes :
Tableau 4. Répartition des véhicules selon la vitesse moyenne
Vitesse moyenne en km/h Nombre de bus

( xi ) ( ni )
080 3
120 5
140 2
Total 10
Détermination de la vitesse moyenne des dix bus :
D
D  vt  v 
t

3D 5D 2D
or t1  , t2  et t3 
80 120 140
10 D 10
v   107 d’où la vitesse moyenne v est égale à 107
3D 5 D 2 D 3 5 2
   
80 120 140 80 120 140
km/h.
Moyenne harmonique pondérée
Soit une variable statistique pouvant prendre k valeurs x1 ,..., xi ,..., xk auxquelles
correspondent respectivement des effectifs n1 ,..., ni ,..., nk .
La moyenne harmonique a pour expression :
n n 1
H  
n1 n2 n ni fi
 
k k
  ...  k i 1 i 1
x1 x2 xk xi xi
k
ni
Avec fi 
n
et f
i 1
i 1
Remarque : Les moyennes harmonique H , géométrique G et arithmétique X se

répartissent dans l’ordre suivant : H  G  X .
5.1.2 Mode
Le mode ou valeur modale est la valeur que la variable statistique prend le plus
fréquemment.
Dans le cas d’une variable discrète, le mode peut être trouvé immédiatement, au
vu du tableau des fréquences ou des effectifs.
Ainsi, le mode de la distribution des ménages camerounais selon le nombre

d’enfants est 3 enfants (tableau 4 du chapitre 3).
Si la variable est continue, et si les données sont groupées en classes, on parle

plutôt de classe modale : la classe ayant l’effectif le plus élevé (effectif ramené à l’unité
d’amplitude, cf. tableau 8 du chapitre 3).
Il peut arriver que la classe modale ne soit pas celle où l’effectif apparaît, sur le
tableau, le plus élevé. En effet, cette dernière classe peut avoir une amplitude plus
grande qu’une autre dont l’effectif par unité d’amplitude, est plus élevé. Sur l’exemple
du tableau 2, si la classe 45 à moins de 65 figurait, son effectif serait 71, supérieur à
celui retenu pour la classe modale. Mais ramené à l’unité d’amplitude, l’effectif n’est
7110
plus que :  35,5
20

La répartition des ouvriers du complexe sportif et culturel d’Awinng selon le

salaire mensuel (tableaux 6 et 8 du chap. 3 et 2 du chap. 5) a pour classe modale la
classe « 45000 à moins de 55000 F », d’effectif 64 (voir histogramme figure 5 du
chapitre 3 : la classe modale est celle qui est représentée par le rectangle le plus
allongé).
Figure 1 : Détermination du mode : cas d’une variable continue

fi
ai
1
M 0*  ei 1   
1   2
1
2
x Variable
continue
0 1 M 0*
5.1.3 Médiane
La médiane d’une série statistique est une valeur de la variable telle qu’il y ait
autant d’observations ayant une valeur supérieure à la médiane que d’observations
ayant une valeur inférieure à la médiane.
Ainsi, si nous considérons les cinq premières valeurs des distances maximales
parcourues par les athlètes de 17 à 20 ans en 15 minutes (tableau 1 du chapitre 2) :
2711, 2915, 2853, 2789, 2941
Ces valeurs peuvent être rangées selon les grandeurs croissantes :
2711, 2789, 2853, 2915, 2941
La valeur 2853 est telle que deux observations ont une valeur inférieure, et deux
autres une valeur supérieure : c’est la médiane.
Lorsque les observations sont toutes données, il suffit donc de les classer par
ordre de grandeurs croissantes (ou décroissantes), et de prendre celle qui se trouve
au milieu. Si le nombre des observations est pair, la médiane peut être théoriquement
l’une quelconque des valeurs comprise entre les deux valeurs centrales observées ; le
plus souvent, on choisit leur demi-somme.
Si par contre les observations sont groupées en classes, il est nécessaire de recourir
aux effectifs – ou aux fréquences – cumulé(e)s.

5.1.3.1 Effectifs (ou fréquences) cumulé(e)s
Il est souvent intéressant, devant une distribution statistique, de pouvoir dire « il

y a autant d’observations » ou « il y a tel pourcentage d’observations » inférieures à
telle valeur (ou supérieures). C’est à ce genre de préoccupations que répond le calcul
des fréquences ou des effectifs cumulés.
5.1.3.2 Variable continue
Dans le cas d’une variable continue, reprenons l’exemple du tableau 6 du chapitre

3 et cherchons combien d’ouvriers ont perçu un salaire mensuel supérieure à 40 000,
50 000….F, puis combien ont perçu un salaire mensuel inférieur à 30 000, 20 000….F.
Le calcul se fait aisément : on ajoute l’effectif d’une classe à l’effectif cumulé
précédent, en commençant par le haut du tableau pour l’effectif cumulé « moins de »
et par le bas pour l’effectif cumulé « plus de ». La seule difficulté est de bien
commencer ; pour cela, il suffit de se référer à la signification des résultats ; si l’on
cherche combien d’ouvriers ont perçu un salaire mensuel de moins de 15 000 F, le
tableau 6 du chapitre 3 permet de répondre qu’il n’y en a aucun, on écrit donc
l’effectif cumulé 0 en face du salaire 15 000 F. Il est important de souligner que cette
étude se fait sur les extrémités des classes.
Les résultats sont les colonnes 9 et 10 du tableau 2 (chapitre 5). Les effectifs
cumulés doivent être disposés en face des extrémités de classe (et non des centres de
classe). On lit, par exemple, que 81 ouvriers ont un salaire mensuel de plus de 45 000
F. il est possible d’effectuer une représentation graphique des effectifs cumulés. Dans
la pratique, on se contente des effectifs cumulés dans un seul sens.
Figure 1. Détermination du salaire médian

150 Effectifs cumulés
120 « moins de »
« Plus de »
90
70
30
Salaire mensuel (en F)
0
15 30 45 60 75 90
M = 46 718

Cette représentation ne présente aucune difficulté si le tableau des effectifs

cumulés a été correctement réalisé. L’échelle des abscisses doit être exacte ; par
conséquent, les classes d’amplitudes inégales doivent apparaître inégales. Entre deux
points connus, l’on suppose que la variation de l’effectif cumulé est linéaire ; on peut,
par exemple, lire sur la figure 1 que 30 ouvriers ont perçu un salaire mensuel
d’environ 36 000 F.
5.1.3.3 Variable discrète
Suite exemple 5 du chapitre 3 :
Tableau 5. Fréquence cumulée du nombre d’enfants par ménage
Nombre d’enfants Fréquence f i Fréquences cumulées croissantes

( xi ) (%) ( Fi )
7,9
0 7,9
18,8
1 26,6
13,5
2 40,1
24,0
3 64,1
15,8
4 79,9
20,1
7 100,0
Total 100,0
Figure 2. Détermination du nombre d’enfants médian
Fréquence cumulée
« moins de »
100
75
50
25
0
0 1 2 3 4 7 Nombre d’enfants
Médiane par ménage

Remarque : les tableaux et graphiques représentant les effectifs cumulés ou les

fréquences cumulées ont la même signification. On choisit entre effectif ou fréquence
selon les besoins ou la simplicité des calculs.
5.1.3.4 Calcul de la médiane
La médiane est la valeur de la variable qui correspond à la fréquence cumulée

50% , ou à l’effectif n 2 . Ceci permet de la calculer lorsque les données sont groupées.
Cas d’une variable continue
Si la variable statistique est continue, on calcule la valeur de la variable

correspondant à la fréquence cumulée 50%.
Considérons les données du tableau 2 : la médiane M correspond à l’effectif

140 2  70 . On procède à l’interpolation linéaire sur les effectifs cumulés « moins de »
(ou éventuellement « plus de ») :
Figure 3. Calcul de la médiane
123 D
m’
70 C
m
59
A
45 Me 55 x
Avec les notations de la figure 3, Amm ' et ACB sont semblables et :
Am m ' m

AC BC
Les abscisses de la première colonne du tableau suivant correspondent aux

ordonnées de la seconde colonne.
45 59
M 70
55 123
M  45 70  59
D’où : 
55  45 123  59
70  59
Soit : M  45  (55  45)   46, 718
123  59

C’est-à-dire : 46 718 F
Cette valeur peut être lue sur le graphique des effectifs cumulés correspondant à
l’effectif 70 : on lit 46 718 F. Signalons que les courbes cumulées dans les deux sens
ont pour point d’intersection la médiane : celle-ci est en effet telle que 50% de
l’effectif ait une taille inférieure à elle (« moins de ») et 50% ait une taille qui lui soit
supérieure (voir figure 1).
Cas d’une variable discrète
Si la variable est discrète, il suffit de rechercher à quelle valeur correspond la

fréquence cumulée 50% (ou l’effectif cumulé n 2 ). Dans le tableau 5, on voit que 40%
des familles ont moins de 2 enfants et 64% moins de 3 : la médiane est dont 3 enfants
(voir figure 2, la valeur de la variable pour laquelle la fréquence cumulée dépasse
50%).
5.2 Caractéristiques de dispersion

Les deux séries de données suivantes :
95 97 100 103 105
50 75 100 125 150
Ont même moyenne arithmétique et même médiane (100). Cependant elles

diffèrent profondément. Ce qui fait leur différence, c’est ce qu’en statistique on
nomme dispersion ou variation; la deuxième série est beaucoup plus dispersée que la
première.
Il est donc important de résumer une série statistique non seulement par les
caractéristiques de tendance centrale, mais par des caractéristiques de dispersion.
Nous en définirons de deux sortes : celles liées à la moyenne : écart absolu moyen et
écart-type ; celles liées à la médiane : écart interquartile, écart interdécile, etc.
5.2.1 Ecart absolu moyen
L’idée qui est à retenir pour l’élaboration des caractéristiques liées à la moyenne
est celle d’écart à la moyenne. Pour chaque valeur de la variable x , on calcule l’écart
de cette valeur à celle de la moyenne x ; on cherche ensuite à résumer ces écarts en
calculant une moyenne.
Pour les deux séries précédentes, les écarts sont :
-5 -3 0 3 5
-50 -25 0 25 50

Il est impossible de résumer ces écarts par leur moyenne arithmétique, puisque
par définition même de x :
 n ( x  x )   n x   n x  nx  nx  0
i i i i i
Cependant, la simple vue des deux lignes d’écarts calculés plus haut montre que
ceux-ci caractérisent convenablement la dispersion. On a alors recours à la moyenne de
valeurs absolues des écarts, c’est l’écart absolu moyen.
e
 x xi
ou, si les observations sont réparties en classes :
e
ni xi  x
n
16
Pour la première série observée, on a : e1   3, 2 ; et pour la deuxième :
5
150
e2   30
5
Cette caractéristique rend convenablement compte de la différence de dispersion

entre les deux séries. Elle est cependant peu utilisée, car elle est d’un maniement
algébrique difficile ; en outre, la formation des lois statistiques fait appel à d’autres
caractéristiques : l’écart type.
5.2.2 Ecart-type
5.2.2.1 Définition
La caractéristique de dispersion la plus usuelle est en effet l’écart-type. Puisque,

répétons-le, la moyenne arithmétique des écarts à la moyenne est nulle, on a recours
à la moyenne quadratique de ces écarts. On définit :
 La variance d’une série : c’est la moyenne arithmétique des carrés des

écarts à la moyenne :
V
 n (x  x )
i i
2
n i
 L’écart-type d’une série : c’est la moyenne quadratique des écarts à la

moyenne, autrement dit, c’est la racine carrée de la variance :
 V 
 n (x  x )
i i
2
n i

On utilise le symbole  pour le représenter (lettre grecque « sigma » minuscule).
Ainsi, en reprenant les deux séries du § 5.2.1, pour la première série :
25  9  0  9  25
v1   13, 60    3, 69
5
6250
et pour la deuxième : v2   1250    35,36
5
Les rapports entre les écarts-types des deux séries sont voisins des rapports entre les
écarts absolus moyens. Ces deux séries donnent pratiquement les mêmes
informations. Pour les raisons exposés au § 5.2.1, l’on préfère en général l’écart-type.
5.2.2.2 Méthode de calcul
L’on vient de calculer des écarts-types en nous référant à la définition.

Cependant, ce calcul risque de devenir laborieux si la moyenne n’est pas entière : on
a traité des « écarts à la moyenne » non entiers avec d’inévitables arrondis, d’où des
calculs lourds et forcément peu précis. Pour alléger les calculs, on se sert du théorème
de Kœnig que nous démontrons dans un cas particulier, car la démonstration de ce
théorème exige une certaine habitude du maniement du signe  .
Développons :
S   ni ( xi  x )2   ni xi2   2ni xi x   x 2
  ni xi2  2 x  ni xi   x 2
or, n x
i i  nx
1
S   ni xi2  ( ni xi )2
n
On exprime souvent ce théorème à partir de la formule de la variance qui s’en

déduit :
1 1  n x2
V
n 
 ni xi2  n ( ni xi )2   n
i i
 ( x )2
La variance est égale à la moyenne des carrés moins le carré de la moyenne. Ce résultat
simplifie considérablement les calculs nécessaires pour obtenir la variance et l’écart-
type ; c’est sous cette forme que le théorème de Kœnig est utilisé dès qu’on dispose
d’une machine à calculer. Signalons cependant sa forme la plus générale, x0 étant
quelconque :
S   ni ( xi  x0 )2  n( x  x0 )2

d’où : V  
ni ( xi  x0 )2
 ( x  x0 )2
 ni
Cette formule permet d’utiliser une variable auxiliaire (cf. 5.1.1.1.c) de la forme :
xi  x0
xi' 
a
La variance est alors celle de la variable auxiliaire multipliée par le coefficient a 2 :
V ( x)  a 2V ( x ')
Exemples : Calculer variances et écart-types sur les tableaux 1 et 2. Pour le

tableau 2, vérifier les résultats en utilisant la colonne (8) où l’on utilise une variable
auxiliaire.
Propriétés algébriques de la variance
Soit une population P d’effectif n composée de deux sous populations P1

d’effectifs n1 et P2 d’effectifs n2 : n  n1  n2 . Soient n1i et n2i les nombres d’individus
respectifs des sous populations P1 et P2 . Dans la population P correspondant à xi est
ni  n1i  n2i .
Par définition de la moyenne, les moyennes des sous populations ont pour
expression :
1 k 1 k 1 k
x1   n1i xi , x2   n2i xi et la moyenne totale x   ni xi
n1 i 1 n1 i 1 n i 1
Population P1 Population P2 Population P

Moyennes x1 x2 x
Ecarts-type 1 2 
Effectifs n1 n2 n
Pour chaque xi ni  ni  ni 1 2
Par définition, la variance de la sous-population P1 a pour expression :

1 k
 12   ni ( xi  x1 )2
n1 i 1 1
Elle peut s’écrire encore en prenant pour valeur x la moyenne générale de P :
1
 12   ni ( xi  x  x  x1 )2
n1 i 1
1
 12  
n1 i
ni1 ( xi  x ) 2  ( x1  x ) 2 aaaaa(1)
1
De même,  22 
n2
n
i
i2 ( xi  x )2  ( x2  x ) 2 aaaaa(2)

Par ailleurs, la variance de P est :
1
2   ni ( xi  x )2
n i
1
2   (ni1  ni2 )( xi  x )2
n1  n2 i
1 1
2 
n1  n2
n
i
i1 ( xi  x ) 2 
n1  n2
n
i
i2 ( xi  x ) 2
n1 n2
2   12  ( x1  x )2    22  ( x2  x ) 2 
n1  n2 n1  n2 
n1 n2 n1 n2
2   12   22  ( x1  x )2  ( x2  x )2
n1  n2 n1  n2 n1  n2 n1  n2
l
n1 n2
si f1 
n1  n2
, 00000 f 2 
n1  n2
avec f
j 1
j 1
 2   j 1 f j 2j   j 1 f j ( x j  x )2
l l
on a :
Variance totale = Moyenne des variances + Variances des moyennes.
5.2.2.3 Signification de l’écart-type
On se fait une idée simple de la signification de l’écart-type lorsque l’on compare

deux séries de même nature : celle qui a l’écart-type le plus élevé est la plus
dispersée. Cependant, par référence à une loi statistique usuelle, la loi normale, il est
possible de préciser un peu la signification de l’écart-type. Lorsqu’une série
statistique satisfait à la loi normale, 95% des observations sont comprises entre
x  2 et x  2 : plus l’écart-type est élevé, plus les observations sont dispersées. Si la
série statistique étudiée, sans suivre une loi normale, n’est pas trop dissymétrique, la
même propriété est approximativement vraie.
On déduit de la propriété énoncée ci-dessus dans le cas de la loi normale, la règle

de vérification suivante : l’étendue d’une série (différence entre l’observation la plus
élevée et l’observation la plus faible) est du même ordre de grandeur que quatre
écart-types. Par exemple, pour les salaires mensuels des ouvriers (tableau 2),
l’étendue est égale à 85000 15000  70000 F et 4  51700 F : les deux nombres ne sont pas
égaux, mais ils sont du même ordre de grandeur.
5.2.3 Coefficient de variation
On calcule parfois le coefficient de variation  x qui a l’avantage d’être

comparable pour toutes les séries statistiques. Les coefficients de variation des deux
séries étudiées ci-dessus sont :
42232,5 310500
 (3,11) 2  (45, 29) 2
3040 2, 05 140 12,93
  0, 66 (tableau 1)   0, 29 (tableau 2)
3,11 3,11 45, 29 45, 29

la série des salaires apparaît peu dispersée, parce que toutes les observations sont
« relativement » voisines de la moyenne. Par contre, la série du nombre d’enfants par
ménage a un fort coefficient de variation ; cela tient à ce qu’il s’agit d’une série
dissymétrique : beaucoup de ménages ont 0, 1 ou 2 enfants (moins de la moyenne) ;
au-dessus de 3 enfants, il y a en quelque sorte un émiettement des ménages entre
4…6 enfants.
5.3 Caractéristiques de position

Les quartiles, déciles et centiles sont des caractéristiques qui correspondent au
même genre de préoccupation que la médiane. Il s’agit des valeurs de la variable qui
correspondent aux effectifs cumulés :
n , 2n , 3n pour les quartiles ; le 2ème quartile est la médiane,

4 4 4
n
10
, 2n 10 , …, 5n 10 ,…. 9n 10 pour les déciles ; le 5ème décile est la médiane,
n
100
, 2n 100 , …, 50n 100 ,…. 99n 100 pour les centiles ; le 50ème centile est la médiane.
On les appelle caractéristiques de position, puisqu’elles permettent de placer les

valeurs de la variable.
5.3.1 Cas d’une variable continue
Pour une variable statistique continue, les calculs s’effectuent comme ceux
concernant la médiane.
Reprenons les données du tableau 8 du chapitre 3, regroupées en effectifs

cumulés au tableau 2. Les quartiles peuvent être déterminés soit graphiquement, soit
par un calcul d’interpolation linéaire. Le premier quartile Q1 correspond à l’effectif
cumulé 35 (25% de l’effectif total) soit, en reprenant un tableau analogue à celui du §
5.1.3.4.
35 26
Q1 35
45 59
Q1  35 35  26 35  26
D’où :  Ce qui donne : Q1  35  (45  35)   37, 727 Soit 37 727 F.
45  35 59  26 59  26
Q3  45 105  59
De même, on peut trouver pour le 3ème quartile : 
55  45 123  59
105  59
D’où : Q1  45  (55  45)   52,188 Soit 52 188 F.
123  59
On calculerait de la même manière les déciles.

5.3.2 Cas d’une variable discrète
Pour une variable statistique discrète, le principe est le même.
Reprenons l’exemple du nombre d’enfants par ménage, dont les effectifs cumulés
figurent au tableau 5. on lit directement :
D1  D2  0 enfant D3  1 enfant D4  D5  D6  2 enfants D7  3 enfants

D8  D9  4 enfants
pour les populations plus nombreuses, on calculerait de même certains centiles,

particulièrement les centiles extrêmes C1 et C99 .
5.4 Autres caractéristiques de dispersion : étendue, écarts

interdéciles et interquartiles
Les caractéristiques de position définies au § 5.3 suggèrent une manière de
caractériser la dispersion sensiblement différente de celle qui aboutit à l’usage de
l’écart type. En effet, un intervalle dans lequel on trouve toute la population étudiée,
ou un intervalle à l’intérieur duquel se situe 80% de cette population, les 10%
extrêmes (les plus aberrants par rapport à l’ensemble) étant éliminés des deux côtés,
peut donner une idée de la façon donc se répartit une série.
Le premier intervalle ainsi défini est l’étendue, différente entre l’observation la

plus élevée et l’observation la plus faible.
Le second est l’écart interdécile : D9  D1 . On définit de la même manière l’écart

interquartile : Q3  Q1 .
Suite exemple 1 du chapitre 2 : Si l’on se reporte aux données brutes du tableau 1

du chapitre 2). Si l’on ne disposait que du tableau agrégé 2 du chapitre 2 avec les
interprétations « 2600 à 2800 m » pour la première classe, et « 3300 à 3600 m » pour la
dernière classe, Ainsi, pour cette série, l’étendue est : e  3600  2600  1000 m.

Tableau 5. Répartition des distances maximales parcourue par les athlètes
Effectifs Centre de Effectif

Classe de ni xi Effectif cumulé
ni classe xi cumulé
salaire en 103 F « plus de »
« moins de »
(1) (2) (3) (4) (5) (6)
2 600 0 100
17 2 700 45 900
2 800 17 83
33 2 900 95 700
3 000 50 50
23 3 100 71 300
3 200 73 27
018 3 250 58 500
3 300 91 9
9 3 450 31 050
3 600 100 0
Total 100 302 450
D1  2600 10  0 D9  3200 90  73
On a :   D1  2718 m et   D9  3294 m
2800  2600 17  0 3300  3200 91  73
L’écart interdécile est : D9  D1  3294  2718  576 m
En éliminant les 10% les plus longues et les 10% les moins longues, les distances
maximales parcourues par les athlètes sont réparties à l’intérieur d’une « plage » de
576 m. Ainsi, l’intervalle D9  D1 qui contient 80% des observations est parfois
employé au même titre que l’intervalle (ou écart) interquartile comme mesure de la
dispersion.
Q1  2800 25  17 Q3  3200 75  73
Ainisi :   Q1  2848 m et   Q3  3211 m
3000  2800 50  17 3300  3200 91  73
L’écart interquartile est : Q3  Q1  3211  2848  363 m
50% de la population des athlètes a une distance maximale parcourue répartie

sur une plage de 363 m.
On peut faire les mêmes calculs pour une variable discrète. Les résultats sont
sensiblement moins intéressants. En effet, il est fréquent que les quartiles ou les
déciles soient égaux à la médiane.
Note : On emploie parfois d’autres caractéristiques. Par exemple :
Q3  Q1
L’écart « semi-interquartile » :
2

Q3  Q1
L’écart « interquartile relatif » :
M
5.5 Quelques conseils pour l’étude de séries statistiques simples

Ce paragraphe n’ajoute rien de nouveau aux précédents. Mais, en fonction des
difficultés et des erreurs qui gênent souvent les débutants, il vise à leur proposer
quelques idées simples.
1) Il est nécessaire de séparer clairement deux types de calculs :
 moyenne, écart-type…, à réaliser à partir des centres de classes et des

effectifs de classes ;
 médiane, quartiles, intervalles interquartiles…, à réaliser à partir des
extrémités de classes et des effectifs cumulés.
2) Il est important devant chaque résultat, de préciser en quelle unité il est

exprimé et de le confronter aux données. On évitera alors de trouver des
moyennes ou des médianes qui ne sont même pas comprises entre les valeurs
extrêmes, ou qui sont dépourvues de sens. L’écart-type se mesure dans la
même unité que les données ; pour vérifier son ordre de grandeur, on peut
retenir que pour une population assez bien centrée (pas trop différente d’une
population « normale »), 4 est du même ordre de grandeur que l’étendue.
3) Pour éviter les erreurs dans l’élaboration des tableaux d’effectifs cumulés, il
est recommandé de se référer à la signification de ces effectifs.
4) Il est souvent utile de contrôler des calculs algébriques par une méthode
graphique, ou réciproquement (calcul de la médiane et des autres
caractéristiques de position).
5) Pour effectuer des graphiques, il ne faut pas hésiter à passer du temps à

choisir les échelles et à graduer les axes. Ce temps n’est pas « perdu », il
donne au contraire une grande sécurité au tracé qui suit.
6) Un tableau ou un graphique ne doivent jamais être présentés sans titre, ni

sans précisions concernant la population, les unités… La statistique n’est pas
seulement un exercice académique et, dans le travail, un tableau sur feuille
volante sans référence est inutilisable.
7) Les définitions de ce chapitre et du précédent sont destinées à l’étude d’une

série statistique simple ou la comparaison de plusieurs séries simples. Le
choix des caractéristiques à utiliser dépend des séries à étudier.
Références


LABENNE C. : Statistiques descriptives, Les Éditions d’Organisation, 1991.

Description Chapitre VI :
numérique des séries statistiques

doubles : régression et corrélation
Sommaire
6.1 Les caractéristiques marginales et conditionnelles d’une série statistique

double.......................................................................................................................... 71
6.1.1 Caractéristiques marginales ............................................................................... 71
6.1.2 Caractéristiques conditionnelles ....................................................................... 74
6.1.3 Covariance ............................................................................................................ 75
6.1.4 Relations entre caractéristiques marginales et conditionnelles .................... 77
6.2 Ajustement linéaire ................................................................................................... 81
6.2.1 Ajustement graphique ........................................................................................ 81
6.2.2 Autres ajustements .............................................................................................. 81
6.2.3 Méthodes des moindres carrés .......................................................................... 82
6.2.4 Notion de corrélation linéaire............................................................................ 82
6.3 Application de la méthode des moindres carrés à des données individuelles 85
6.3.1 Principe de la méthode ....................................................................................... 85
6.3.2 Application à l’exemple du tableau 6 ............................................................... 85
6.3.3 Droite d’estimation de x en y .......................................................................... 86
6.3.4 Retour sur le coefficient de corrélation linéaire .............................................. 86
6.4 Application de la méthode des moindres carrés à des données groupées ....... 87
6.4.1 Méthode ................................................................................................................ 87
6.4.2 Distributions conditionnelles : courbes de régression ................................... 87
6.4.3 Coefficient de corrélation linéaire ..................................................................... 88
6.4.4 Droites d’estimation par la méthode des moindres carrés............................ 88
6.4.5 Utilisation de la droite d’ajustement pour l’estimation et la prévision ....... 89
6.5 Ajustements non linéaires ........................................................................................ 91
6.6 Quelques conseils pour l’ajustement linéaire ........................................................ 92
Chap. 6. Description numérique des séries statistiques doubles : Régression et corrélation
Introduction
Dans le chapitre précédent, les séries statistiques étudiées étaient des séries
simples ; on étudiait une population selon un seul caractère. Cependant, il est
souvent utile de considérer à la fois plusieurs caractères de la même population : la
taille, l’âge et le poids d’un groupe d’enfants, le salaire et la qualification d’un groupe
de salariés ; le format et le nombre de page de publications ; la température et la
pression d’un milieu à différentes heures…
6.1 Les caractéristiques marginales et conditionnelles d’une série

statistique double
Considérons la distribution, selon les deux variables statistiques X et Y , d’une
population P d’effectif total n (tableau 1). Les distributions marginales et
conditionnelles de X et Y ont été définies dans Les distributions statistiques à deux
dimensions, chapitre IV.
6.1.1 Caractéristiques marginales
La colonne marginale du tableau 1, qui contient les effectifs ni. correspondant à

chaque valeur xi. de la variable X , constitue la distribution marginale de X . Les
caractéristiques marginales de X (moyenne arithmétique et variance) sont :
1 k
x  ni. xi
n.. i 1
1 k
V (X )   ni. ( xi  x )2 .
n.. i 1
D’une façon analogue, la dernière ligne du tableau 1, qui contient les effectifs n. j ,
constitue la distribution marginale de Y . Par conséquent, si X (ou Y ) est une variable
continue, xi (ou y j ) est choisi, par convention, égal au centre de la classe
correspondante, comme pour le calcul de la moyenne et de l’écart-type des séries
statistiques à une seule variable :
1 l
y  n. j y j
n.. j 1
1 l
V (Y )   n. j ( y j  y )2 .
n.. j 1

Tableau 1. Présentation générale d’un tableau à deux variables
Sous  population 
P1 P2 … Pj … Pl

Caractère Y
Y1 Y2 … Yj … Yl Totaux
Caractère X
P1' X1 n11 n12 … n1 j … n1l n1.
P2' X2 n21 n22 … n2 j … n2l n2.

.. .. .. .. .. .. ..
. . . . . . .
Pi ' Xi ni1 ni 2 nij nil ni.
.. .. .. .. .. .. ..
. . . . . . .
Pk' Xk nk 1 nk 2 … nkj … nkl nk .
Totaux n.1 n.2 … n. j … n.l n..
Exemple 1 : Soit la distribution suivante des usines d’un groupe financier selon
l’âge et la rémunération mensuelle (tableau 2).
La distribution marginale des ouvriers selon la rémunération mensuelle R est

fournie par la colonne (1) du tableau 2. le calcul des caractéristiques de cette
distribution conduit aux résultats suivants (1) :
1
 Moyenne marginale de R : r   ni.ri  1008, 6 F.
n i
1
 Variance marginale de R : V ( R)   ni. (ri  r )2  36350 F.
n i
 R  109,7 F
La distribution marginale selon l’âge A de ces mêmes ouvriers est donnée par la
ligne (2) de ce tableau. Les caractéristiques de cette distribution ont pour valeurs :
1
 Moyenne marginale de A : a  n. j a j  37, 4 ans
n j
1
 Variance marginale de A : V ( A)   n. j (a j  a )2  84, 22 F.
n j
 A  9, 2 ans
(1) L’on recommande au futur praticien d’effectuer lui-même ces calculs en remplissant les colonnes et
lignes supplémentaires du tableau 2.

Tableau 2. Nombre d’ouvriers répartis suivant l’âge et la rémunération mensuelle. Janvier 2000.
Moins [25 – [30 – [35 – [40 – [45 – [50 – 55 et

a ni.
n a n a ij j
ri  nij a j
ri ni. ri ni. ri 2 ij j
ai 
j
Age (ans) de 25 30[ 35[ 40[ 45[ 50[ 55[ plus (1) j
ni.
j
R Moins de 800 207 121 38 17 10 2 7 3 405

Rémunération [800 – 900[ 302 461 513 103 86 6 10 2 1 483
mensuelle (F)
[900 – 1000[ 18 526 682 567 613 431 105 60 3 002
[1000 – 1200[ 111 342 298 416 480 226 37 1 910
[1200 – 1500[ 1 3 182 227 263 98 18 792
[1500 – 2000[ 18 22 13 12 5 70
2000 et plus 1 14 6 7 5 33
n. j (2) 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695
aj
n. j a j
n. j a 2j
n r
i
ij i
n r ij i
rj  i
n. j
a j  nij ri
i
(1) Cette colonne indique la distribution marginale des ouvriers suivant la rémunération mensuelle.
(2) Cette ligne indique la distribution marginale des ouvriers suivant l’âge.

6.1.2 Caractéristiques conditionnelles
La colonne j du tableau 1, qui décrit la répartition de la variable X des n. j

individus présentant la valeur y j de la variable Y , constitue la distribution
conditionnelle de X lié par Y  y j . Les caractéristiques (moyenne et variance) de la
variable conditionnelle X y j sont donc :
k k
1 1
xj 
n. j
n x
i 1
ij i et Vj ( X ) 
n. j
 n (x  x ) .
i 1
ij i j
2
D’une façon analogue, la ligne i du tableau 1 décrit la répartition selon la variable

Y des ni. individus présentant la valeur xi de la variable X , et constitue la distribution
conditionnelle de Y lié par X  xi . Les caractéristiques conditionnelles correspondantes
sont donc :
1 l 1 l
yi   nij y j
ni. j 1
et Vi (Y )   nij ( y j  yi )2 .
ni. j 1
Exemple 2 : Les distributions conditionnelles des ouvriers selon la rémunération

mensuelle liée par l’âge sont constituées par les colonnes du tableau 2. Pour chacune
de celles-ci, on peut calculer la moyenne et la variance de la rémunération. Ces
caractéristiques ont les valeurs indiquées dans le tableau 3.
Tableau 3. Caractéristiques conditionnelles de la rémunération en fonction de l’âge
Centre Rémunération mensuelle Variance et écart-type de la

Classe d’âge
de classe moyenne (en F) rémunération mensuelle
aj rj V j ( R)  j ( R)
20,0 794,5 6 100 78,1
25 ans
27,5 901,5 9 825 99,1
30 ans
32,5 944,5 9 875 99,4
35 ans
37,5 1 050,0 33 000 181,7
40 ans
42,5 1 077,5 43 575 208,8
45 ans
47,5 1 111,5 32 825 181,2
50 ans
52,5 1 141,0 49 450 222,4
55 ans
60,0 1 119,5 86 100 293,4
Caractéristiques marginales
r = 1 008,5 V ( R) = 36 347  R = 190,7
(tous âges)

On remarque, par exemple, que les écarts-type sont plus faibles pour les jeunes
ouvriers que pour ceux qui sont plus âgés : la population jeune est, comme il est
naturel, plus homogène du point de vue de la rémunération.
Les distributions conditionnelles des ouvriers selon l’âge lié par la rémunération
sont constituées, au contraire, par les lignes du tableau 2. Les caractéristiques
conditionnelles correspondantes font l’objet du tableau 4.
Tableau 4. Caractéristiques conditionnelles de l’âge en fonction de la rémunération
Classe de rémunération Age

Centre de classe Variance et écart-type de l’âge
mensuelle (en F) moyen
ri ai Vi ( A)  i ( A)
700 25,7 58,23 7,6
800
850 29,6 43,11 6,6
900
950 37,1 62,30 7,9
1 000
1 100 41,8 58,50 7,7
1 200
1 350 44,6 29,68 5,5
1 500
1 750 45,1 43,31 6,6
2 000
2 200 48,0 42,34 6,5
Caractéristiques marginales
a = 37,4 V ( A) = 84,22  A = 9,2
(toutes rémunérations)
6.1.3 Covariance
On définit la covariance de deux variables statistiques X et Y par :
1
cov( X , Y )   nij ( xi  x )( y j  y ).
n i j
On remarquera que cette définition est homogène à celle de la variance : si l’on

fait Y  X , on retrouve la formule de cette dernière.
La covariance est nulle si les deux variables sont indépendantes. Cette grandeur
interviendra dans l’étude de la liaison entre deux variables et, notamment, dans celle
de la corrélation linéaire.
Calcul pratique

Pour simplifier le calcul de la covariance, on utilise des méthodes analogues à

celles employées pour le calcul de la variance : formule développée et changement de
variable (voir Description numérique d’une variable statistique, Chap. V).
Formule développée
Il est possible de développer la formule de définition pour obtenir une expression

mieux adaptée au calcul numérique :
1
cov( X , Y )   nij ( xi  x )( y j  y )
n i j
1 1 1 1
cov( X , Y )  
n i j
nij xi y j  y .  nij xi x . nij y j  xy .  nij
n i j n i j n i j
or par définition :
 n
i j
ij n
 n x   n x
i j
ij i
i
i. i  nx
 n
i j
ij y j   n. j y j  ny
i
d’où
1
cov( X , Y )   nij xi y j  xy
n i j
Changement de variable
Un changement de variable judicieux appliqué à x et y permettra souvent une

simplification supplémentaire des calculs. Choisissons pour x et y de nouvelles
origines x0 et y0 et de nouvelles unités de mesure  et  , de façon à ce que les
valeurs auxiliaires x ' et y ' soient des nombres entiers plus simples que les valeurs
primitives de x et y :
xi  x0 y j  y0
xi'  , et y 'j 
 
soit : xi   xi'  x0  x   x '  xo et y j   y'j  y0  y   y '  yo
D’où, xi  x   ( xi'  x ' ) et y j  y   ( y'j  y ' )
1
cov( X , Y )   nij ( xi  x )( y j  y )
n i j
1
Ainsi : cov( X , Y )    nij ( xi'  x ' )( y 'j  y ' )
n i j
cov( X , Y )   cov( X ' , Y ' )

On trouvera plus loin à propos de l’ajustement linéaire, des exemples de calcul

de la covariance.
6.1.4 Relations entre caractéristiques marginales et conditionnelles
La population P peut être considérée comme composée :
 Soit des l sous-populations P1 , P2 ,..., Pl d’effectifs n.1 , n.2 ,..., n.l , correspondant aux
distributions conditionnelles de X liées par Y ;
 Soit des k sous-populations P1' , P2' ,..., Pk' d’effectifs n1. , n2. ,..., nk . , correspondant
aux distributions conditionnelles de Y liées par X .
On peut, par conséquent, appliquer à la moyenne et la variance marginale de X ,

ou de Y , les résultats, établi dans Description numérique d’une variable statistique,
Chapitre V, concernant l’expression de la moyenne et de la variance d’une
population composée de plusieurs sous-populations.
Expression de la moyenne marginale en fonction des moyennes conditionnelles
La moyenne relative à l’ensemble d’une population est égale à la moyenne

pondérée des moyennes des sous-populations (résultat établi dans Description
numérique d’une variable statistique, Chapitre V). Les coefficients de pondération sont
les proportions des sous-populations dans la population totale.
En considérant la distribution marginale de X comme formée des distribution

conditionnelles de X lié par Y , on obtient l’expression de la moyenne marginale de
X en fonction des moyennes conditionnelles de X lié par Y :
1 l
x  n. j x j
n.. j 1
De même, en considérant la distribution marginale de Y comme formée des

distributions conditionnelles de Y lié par X , on obtient l’expression de la moyenne
marginale de Y en fonction des moyennes conditionnelles de Y lié par X :
1 k
y  ni. yi
n.. i 1
Propriété : la moyenne marginale est égale à la moyenne pondérée des moyennes

conditionnelles.
Expression de la variance en fonction des variances conditionnelles
La variance relative à l’ensemble d’une population est égale à la somme de deux

termes, la moyenne pondérée des variances des sous-populations et la variance pondérée
des moyennes des sous-populations (résultat établit dans Description numérique d’une
variable statistique, Chapitre V, § 5.2.2.2).

Par conséquent, en considérant la distribution marginale de X comme formée

des distribution conditionnelles de X lié par Y , on obtient :
1 l 1 l
V (X )  
n.. j 1
n. jV j ( X )   n. j ( x j  x ) 2 .
n.. j 1
De même, en considérant la distribution marginale de Y comme formée des

distribution conditionnelles de Y lié par X :
1 k 1 k
V (Y )  
n.. i 1
ni.Vi (Y )   ni. ( yi  y ) 2 .
n.. i 1
Propriété : la variance marginale est égale à la somme de la moyenne pondérée des

variances conditionnelles et de la variance pondérée des moyennes conditionnelles.
La dispersion de la distribution marginale résulte donc de deux facteurs :
 La dispersion de chacune des distributions conditionnelles autour de leur

moyenne ;
 La dispersion des moyennes conditionnelles entre elles.
Ainsi une partie de la variance totale de X (ou de Y ) peut-elle être expliquée par
la variance des moyennes conditionnelles (2e facteur). La variance moyenne résultant
des hétérogénéités propres à chacune des distributions conditionnelles (1er facteur)
apparaît alors comme une variance résiduelle.
Exemple 3 : Le tableau 5 présente la répartition des distances parcourues par 200

véhicules après un coup de frein, selon la vitesse du véhicule. Le tableau 5 est
complété par les calculs nécessaires à un ajustement par la méthode des moindres
carrés. Son centre est le tableau carré représentant les distances par 200 véhicules
après un coup de frein(1),selon la vitesse du véhicule. On lit par exemple :
n21  25 : 25 véhicules allant à une vitesse comprise entre 70 et 80 km/h ont

parcouru 30 à 40 m avant de s’arrêter.
n.5  55 : 55 véhicules avaient une vitesse comprise entre 90 et 100 km/h.
Comme l’on vient de voir, ce dernier résultat est l’un des éléments de la
distribution marginale des x j : cette distribution – comme la distribution marginale
des yi - peut être traitée comme une série simple. On définit en particulier la
moyenne y , la variance V ( y) et l’écart-type  y .
De même, l’une quelconque des lignes ou des colonnes du tableau peut être
interprétée comme une distribution conditionnelle.
(1) Coup de frein destiné à arrêter le véhicule.

La 4e colonne du tableau 5 indique la répartition des distances parcourues par les

véhicules dont la vitesse était comprise entre 100 et 110 km/h (distribution de y sous
la condition que x  x4 ).
Il est possible d’étudier les distributions conditionnelles comme des séries

statistiques simples.

Tableau 5. Répartition des distances parcourues par 200 véhicules après un coup de frein, selon la vitesse du véhicule.
x vitesse (km/h) [70 – 80[ [80 – 90[ [90 – 100[ [100 – 110[ [110 – 120[ ni. yi ni. yi ni. yi2 n x
j
ij j xy yi  nij x j
j
y [20 – 30[ 3 3 25 75 1 878 225 75 5 625

distance
[30 – 40[ 25 5 30 35 1 050 36 750 2 300 76,67 80 500
(m)
[40 – 60[ 13 29 24 12 78 50 3 900 195 000 6 980 89,49 349 000
[60 – 80[ 6 12 21 12 5 56 70 3 920 274 400 5 300 94,64 371 000
[80 – 100[ 2 10 16 5 33 90 2 970 267 300 3 375 102,27 303 750
n. j 47 48 55 40 10 200 11 915 775 325 18 180 1 109 875
xj 75 85 95 105 115
n. j x j 3 525 4 080 5 225 4 200 1150 18 180
n. j x 2j 264 375 346 800 496 375 441 000 132 250 1 680 800
n
i
ij yi 2 020 2 645 3 750 2 880 800 11 915
yx 42,98 55,10 64,91 72 80
x j  nij yi 151 500 224 825 339 150 302 400 92 000 1 109 875
i

6.2 Ajustement linéaire
On constate, sur la figure 4 (chapitre IV), que les points représentatifs de la série
des distances ne sont pas rigoureusement alignés, mais qu’ils forment un « nuage de
points » relativement allongé. Il n’est pas alors dépourvu de sens de chercher si l’on
peut déterminer une droite qui résume, approximativement, l’ensemble des points. La
recherche d’une telle droite est un ajustement linéaire.
6.2.1 Ajustement graphique
Théoriquement, diverses sortes d’ajustement linéaires sont possibles. La plus

simple est l’ajustement graphique, réalisé par le dessinateur. L’inconvénient majeur de
l’ajustement graphique est qu’il est subjectif : chaque dessinateur trouve une droite
qui, à son avis, représente au mieux l’ensemble des points… et qui n’est pas celle que
trace un autre dessinateur. Une multitude de droites peut ainsi être trouvée, sans que
l’on dispose de critère objectif pour choisir entre elles.
6.2.2 Autres ajustements
Exemple 4 : le tableau 6 donne la consommation en milliers de calories de douze

familles de condition modeste en moyenne pour un jour. Chaque homme adulte est
compté pour une part d’unité, dépendant de son âge et de son sexe.
Tableau 6. Consommation en milliers de calories par jour de douze familles.
Unités de Calories Unités de Calories

N° de N° de
consommation par jour consommation par jour
famille famille
xi yj xi yj
1 5,3 13,0 7 5,2 10,1

2 7,2 18,0 8 4,5 7,1
3 5,6 9,4 9 4,0 8,9
4 7,1 15,4 10 2,0 4,4
5 5,0 7,8 11 5,7 12,1
6 3,3 9,3 12 4,7 11,5
Les autres ajustements peuvent être réalisés de façon plus objective, par exemple
en utilisant les points extrêmes (dans le cas de l’exemple 4, les points représentant les
familles 10 et 2) ou les moyennes de certains groupes de résultats. Lorsqu’il s’agit de
séries chronologiques (1), il est usuel de réaliser un ajustement linéaire par de telles
méthodes : on détermine la droite passant par les points représentatifs de la première
et de la dernière date, ou par les points dont les coordonnées sont des moyenne (par
exemple annuelles) calculées aux deux extrémités.
(1) Séries doubles dans lesquels le temps (chrono, en grec) est l’une des variables.

6.2.3 Méthodes des moindres carrés
La méthode des moindres carrés présente un caractère plus rigoureux que les
précédentes. Elle consiste à rechercher une droite telle que la somme de ses
« distances » aux différents points représentant les données soit minimale. Le mot
distance est pris au sens large (expression satisfaisant à l’inégalité des distances). La
« distance » choisie est le carré de la différence des ordonnées entre chaque point et le
point de la droite ayant même abscisse (1).
6.2.4 Notion de corrélation linéaire
La méthode des moindres carrés peut être utilisée pour n’importe quelle série
double. Quelle que soit cette série, saufs cas exceptionnels (points représentatifs
disposés en carrés de même centre), il existe une droite d’estimation par la méthode
des moindres carrés. Pour s’assurer d’une façon objective (et non purement visuelle)
que l’ajustement est valide, on calcule le coefficient de corrélation linéaire dont l’usage
cov( x, y )
sera justifié plus loin : r
 x y
Ce coefficient est compris entre 1 et 1 . S’il est voisin en valeur absolue de 1,

l’ajustement est valide (0,70  r  1).
Sur l’exemple 4, calculons le coefficient de corrélation linéaire. Le tableau de

calcul est le suivant :
Tableau 6 bis. Tableau de calcul d’après les données du tableau 6
i xi yj x i2 y i2 xi y j
1 5,3 13,0 28,09 169,00 68,90

2 7,2 18 51,84 324,00 129,60
3 5,6 9,4 31,36 88,36 52,64
4 7,1 15,4 50,41 237,16 109,34
5 5,0 7,8 25,00 60,84 39,00
6 3,3 9,3 10,89 86,49 30,69
7 5,2 10,1 27,04 102,01 52,52
8 4,5 7,1 20,25 50,41 31,95
9 4,0 8,9 16,00 79,21 35,60
10 2,0 4,4 4,00 19,36 8,80
11 5,7 12,1 32,49 146,41 68,97
12 4,7 11,5 22,09 132,25 54,05
Total 59,6 127,0 319,46 1 495,50 682,06
(1) On appelle parfois la droite ainsi obtenue : droite de régression de y en x. Cette dénomination sera évitée
ici, car la courbe de régression est l’ensemble des points qui, pour une abscisse donnée x, ont pour ordonnée la
moyenne conditionnelle y x cf. 6.4.

A l’aide de ce tableau, on peut effectuer les calculs suivants :
59, 60
x  4,97  5 unités de consommation,
12
127
y  10,58  10, 6 103 calories,
12
319, 46
V ( x)   (4,97)2  1,95  x  1,95  1, 40 unités de consommation
12
1495,50
V ( y)   (10,58)2  12,62  y  12,62  3,55 103 calories
12
on calcule de même :
682,06
cov( x, y)   4,97 10,58  4, 26
12
Le coefficient de corrélation est alors :
cov( x, y) 4, 26
r   0,86
 x y 1, 40  3,55
sans indiquer une très bonne précision (il faudrait qu’il soit supérieur à 0,95), ce
coefficient autorise l’ajustement linéaire.
Propriétés
P1. Si les variables x et y sont indépendantes, le coefficient de corrélation

linéaire est égal à 0.
En effet, lorsque les deux variables sont indépendantes :

cov( x, y)  0
D’où :
cov( x, y)
r 0
 x y
Toutefois :
r 0
n’implique pas nécessairement l’indépendance de x et y . Il indique seulement que les
droites d’ajustements sont parallèles aux axes de coordonnées.
En effet, si  x  0 et  y  0 :
a  r y /  x  0 pour r  0
a '  r x /  y  0 pour r  0

Ainsi, sur la figure suivante, il n’y a pas indépendance entre X et Y , mais bien
liaison fonctionnelle. Cependant, les droites d’ajustement sont parallèles aux axes de
coordonnées et r  0 . Cet exemple montre bien que le coefficient de corrélation
linéaire ne doit être utilisé pour caractériser l’intensité de la corrélation que dans le
cas où celle-ci est approximativement linéaire.
Figure 1. Droites d’ajustements : variables indépendantes
Droite d’ajustement
Y de X en Y
Droite d’ajustement de Y en X
X
P2. Le coefficient de corrélation linéaire est compris entre + 1 et – 1.
P3. Si les variables X et Y sont liées par une relation fonctionnelle linéaire, le
coefficient de corrélation est égal à –1 ou + 1.
Soit la relation fonctionnelle
yi  axi  b
On a :
r  1 si a  0 (liaison directe)
r  1 si a  0 (liaison indirecte).
P4. Entre ces deux extrêmes, absence de corrélation et liaison fonctionnelle

linéaire, le coefficient de corrélation constitue une mesure de la plus ou moins grande
dépendance linéaire entre des variables statistiques. Sa valeur absolue est d’autant
plus proche de l’unité que cette dépendance est d’autant plus forte.

6.3 Application de la méthode des moindres carrés à des données

individuelles
6.3.1 Principe de la méthode
La droite définie au § 6.2.3 a pour équation : ŷ  ax  b
(on emploie ŷ qui se lit « y chapeau ou y estimé », par opposition à y qui

représente le « y observé »). On recherche les paramètres a et b . La différence des
ordonnées entre un point ( xi , yi ) et le point de la droite de même abscisse est :
yi  yˆi  yi  axi  b
La somme des carrés de ces différences doit être minimum :

n
S   ( yi  axi  b)2 minimum
i 1
Pour définir les coefficients a et b, on développe S et on le considère

successivement comme un trinôme en b, puis, b étant déterminé, comme un trinôme
en a . On trouve :
b  y  ax
et a
 ( x  x )( y  y )   x y
i i i i  n.x . y
 (x  x )i
2
x 2
i  nx 2
On reconnaît au numérateur la covariance de x et y et au dénominateur la

variance de x, au coefficient n près.
cov( x, y) cov( x, y) y
a  r
V ( x) x 2
x
La forme du coefficient b permet de constater que la droite d’ajustement passe

par le « point moyen » (de coordonnées x et y ). Son équation est :
yˆ  y  a( x  x )
C’est la droite d’ajustement de y en x .
6.3.2 Application à l’exemple du tableau 6
En utilisant les formules indiquées ci-dessus, on trouve :
cov( x, y ) cov( x, y )
a 
V ( x)  x2
4, 26
a  2,18
1,95

d’où l’équation de la droite d’estimation de y en x : yˆ1  10,6  2, 2( x  5)
Le résultat est arrondi, car la précision ici serait illusoire.
Effectuer le tracé de cette droite sur une figure où serait préalablement représenté
le nuage de points.
6.3.3 Droite d’estimation de x en y
Le lecteur aura peut-être remarqué que le calcul précédent fait jouer un rôle
dissymétrique aux variables x et y . Or, rien, au niveau de la statistique, ne permet
de dire si l’une des variables dépend de l’autre (1). Il est alors aussi logique de
recommencer les calculs précédents, mais en inversant les rôles des deux variables.
On définit ainsi une droite d’estimation de x en y d’équation :
xˆ  x  a '( y  y )
cov( x, y) cov( x, y) 
avec a'   r x
V ( y) y 2
y
dans le cas de l’exemple, on trouve :
xˆ  5  0,34( y  10,6)
Cette deuxième droite d’estimation est différente de la précédente, mais on peut

dire si elle représente un meilleur ajustement.
L’équation peut s’écrire sous la forme y  f ( x) :
yˆ 2  10,6  3( x  5)
Elle diffère de la précédente par sa pente.
6.3.4 Retour sur le coefficient de corrélation linéaire
Les deux droites d’estimation trouvées sont différentes. Le carré du coefficient de

corrélation linéaire est précisément égal au produit des pentes.
r2  a  a '
Si les deux droites étaient identiques, r serait en valeur absolue égal à 1. ( a et a '
inverses l’une de l’autre).
 Si les droites sont proches, | r | est voisin de 1, ce qui correspond à un

ajustement valide.
(1) Au niveau d’un raisonnement sur les données, certains estiment peut-être que le nombre de calories
consommées dépend du nombre d’unités de consommation et non le contraire. Mais ceci n’est pas indiqué par
les calculs statistiques.

 Par contre, si | r | n’est pas très différent de zéro, c’est que les deux pentes a et
a ' sont loin d’être inverses l’une de l’autre, et par conséquent que les droites
d’ajustement sont sensiblement différents : les points représentatifs sont loin
d’être réellement alignés.
La corrélation est la relation linéaire – vraie en moyenne et seulement en moyenne –

trouvée grâce à l’ajustement par la méthode des moindres carrés.
6.4 Application de la méthode des moindres carrés à des données

groupées
6.4.1 Méthode
Le principe du calcul est le même, mais la présentation est moins aisée. C’est la
raison pour laquelle il est rare que ce calcul soit programmé sur une calculatrice
électrique de poche.
Pour la répartition des distances parcourues par des véhicules après un coup de
frein selon la vitesse, la présentation des calculs peut être celle du tableau 5. les
colonnes ni. yi , ni. yi2 et les lignes n. j x j et n. j x 2 permettent de calculer les caractéristiques
j
des deux distributions marginales :
18.180 11.915
x  90,90 km/h y  59,58 m
200 200
1.683.800 775 325

V ( x)   (90,9) 2  156,19 V ( y)   (59,58)2  327, 44
200 200
 x  12,5 km/h  y  18,1 m
6.4.2 Distributions conditionnelles : courbes de régression
Sur un tel tableau, il est possible d’analyser les distributions conditionnelles. En

calculant sur une ligne  nij x j , il est possible de calculer x y , c’est-à-dire la moyenne
j
(conditionnelle) de x pour un y donné (plus exactement pour y compris entre les

limites de classes). Ainsi :
Pour y compris entre 30 et 40 m (ligne 2) xy  76,67 km/h
De même, en colonne, on calcule les moyennes conditionnelles de y pour un x

donné :
Pour x compris entre 100 et 110 km/h yx  72 m

Il serait possible, sur le même principe, de calculer les écarts-types des

distributions conditionnelles). L’ensemble des points de coordonnées ( yx , x j ) constitue
la courbe de régression de y en x et l’ensemble des points coordonnées ( xy , yi ) constitue
la courbe de régression de x en y. Ces deux courbes, tracées, représentent valablement
la distribution : si l’on roule à telle vitesse, en moyenne, l’on s’arrête en tant de
mètres ; si l’on a eu besoin de tant de mètres pour s’arrêter, c’est qu’en moyenne on
roulait à telle vitesse… Il n’est guère possible de décrire plus efficacement l’ensemble
des 200 observations.
Application : construire sur le même graphique les courbes de régression de y

en x et de x en y.
6.4.3 Coefficient de corrélation linéaire
On peut constater que les deux courbes de régression sont sensiblement

différentes de droites. Il est possible en effet de vérifier que le coefficient de
corrélation linéaire entre x et y est assez mauvais. Pour la covariance, on calcule :
 y  n x  x  n
i
i
j
ij j
j
j
i
ij yi   nij xi yi
i j
Les deux premières sommes sont effectuées en dernière colonne et en dernière

ligne du tableau 5. Le résultat de la sommation est le même, ce qui peut servir de
vérification. Noter les autres sommes identiques qui peuvent aider à la vérification.
On a alors la covariance :
1.109.875
cov( x, y)   (90,90)  (59,58)  133, 55
200
D’où le coefficient de corrélation linéaire :
133,55
r  0,59
18,112,5
Ce coefficient est inférieur à 0,60. L’ajustement linéaire ne représente pas un bon

« résumé » des observations. Puisqu’il est toujours possible de calculer les droites des
moindres carrés, nous allons vérifier que l’ajustement linéaire est mauvais en
calculant les équations de ces droites.
6.4.4 Droites d’estimation par la méthode des moindres carrés
Pour la droite d’estimation de y en x :
cov( x, y) 133,55
a   0,86
V ( x) 156,19

d’où l’équation :
yˆ1  59,58  0,86( x  90,90)
Pour la droite d’estimation de x en y :
cov( x, y) 133,55
a'    0, 41
V ( y) 327, 44
D’où l’équation : yˆ2  59,58  2, 45( x  90,90)
ces deux droites sont différentes ; par contre, elles ne sont pas très éloignées
chacune de la courbe de régression correspondante. Ce résultat explique – sans
l’excuser – la fréquente confusion entre « courbe de régression » et « droite
d’ajustement par la méthode des moindres carrés ».
Figure 2. Positions respectives des droites des moindres carrés.

y Droite d’ajustement de
y Droite d’ajustement de y Droite d’ajustement de X en Y
Y en X X en Y
y y y
de Y en X
Droite d’ajustement de Y en X
de X en Y
x x
x x x x
r0
r0 r 0
6.4.5 Utilisation de la droite d’ajustement pour l’estimation et la prévision
En l’absence de toute autre information, l’estimation la meilleure que l’on puisse

faire de la valeur inconnue prise par une variable statistique y est sa moyenne y .
Par contre, si y est en corrélation avec une autre variable x, la connaissance de la

valeur de celle-ci permet d’améliorer l’estimation de y . Dans l’hypothèse où cette
liaison est linéaire, l’équation de la droite des moindres carrés est :
y
y y r (x  x )
x
A la valeur de x0 de x correspond pour y l’estimation :
y
y*  y  r ( x0  x )
x

L’information supplémentaire représentée par l’existence de la liaison linéaire et

la connaissance de la valeur de x a permis d’apporter à l’estimation primitive y la
x
correction r ( x0  x ).
y
Dans le premier cas, la mesure de la dispersion des valeurs observées yi autour

de la valeur estimée,
1 l
V ( y)   n. j ( y j  y )2
n j 1
forme un indicateur d’écart entre prévisions et réalisations.
Dans le second cas, cet indicateur est constitué par la moyenne des carrés des
écarts des valeurs observés à la droite d’ajustement :
y
2
1 k l  
VR   nij ( y j  y )  r ( xi  x ) 
n i 1 j 1  x 
Cette quantité est minimum par définition même de la droite des moindres
carrés. Calculons la valeur de ce minimum :
1 k l y 1 k l
2
 1 k l
VR   nij ( y j  y )2  2r  nij ( y j  y )( xi  x )  r 2 2y  nij ( xi  x )2
n i 1 j 1  x n i 1 j 1  x n i 1 j 1
or :
1 k l 1 k

n i 1 j 1
nij ( xi  x ) 2   ni. ( xi  x ) 2   x2
n i 1
1 k l 1 l

n i 1 j 1
nij ( y j  y ) 2   n. j ( y j  y ) 2   y2
n j 1
1 k l
 nij ( y j  y )( xi  x )  cov( x, y)  r x y
n i 1 j 1
d’où :
y 2 2
VR    2r
2
r x y  r 2  x
2 y
x 
y
x
L’écart entre prévisions et réalisations est donc réduit, en moyenne, dans le

rapport :
V ( y)  VR V ( y)  (1  r 2 )V ( y)
  r2
V ( y) V ( y)
par la connaissance de la valeur de x et l’utilisation de la droite d’ajustement.

6.5 Ajustements non linéaires
Il peut arriver que les points représentant une série double ne soient pas alignés,
mais soient voisins d’une courbe connue. On se sert alors en général de la méthode
des moindres carrés, mais en transformant au préalable l’une des variables. Ainsi, un
ajustement linéaire entre y et x n donne un ajustement de la forme y  axn  b ; un
ajustement entre y et log x donne : y  a log x  b ; un ajustement entre log y et x
donne : y  beax ... Certaines machines à calculer ajustent souvent directement, au
moins sur des données individuelles, les relations suivantes :
y  aebx (exponentielle) y  a0  a1 x  a2 x 2
(parabole)
y  ax (puissance)
b
y  cb (géométrique)
x
y  a  b log x (logarithme) y  cabx (Gompertz)

y  abxb 1e ax (Weibull)
b
y  cx a  dxb (exponentielle)
Il est également possible de réaliser des ajustements linéaires ou non, à plusieurs

variables, toujours sur le principe de la méthode des moindres carrés.
Schéma exponentiel
Soit deux grandeurs x et y liées par la relation
y  y0 a x . (1)
Cette relation (fonction exponentielle) représente les phénomènes pour lesquels

le taux de variation de y par rapport à x est constant :
dy
y
 k.
dx
Ce schéma convient très souvent pour décrire l’évolution (croissante ou

décroissante) d’une grandeur en fonction du temps.
Prenons le logarithme des deux nombres de l’expression (1) :
log y  log y0  x log a.
En posant :
Y  log y ,   log a ,   log y0 .
On obtient :
Y x   .

La relation (1) est donc représentée par une droite sur un graphique semi-
logarithmique. Cette droite pourra être ajustée aux points observés ( xi , yi ) par la
méthode des moindres carrés.
6.6 Quelques conseils pour l’ajustement linéaire
1) Faire d’abord une étude graphique, si les données le permettent. On

distinguera ainsi si un ajustement, linéaire ou non, peut se justifier.
2) Se souvenir qu’un coefficient de corrélation est compris entre – 1 et + 1.
3) Le coefficient de corrélation linéaire est positif en cas de liaison directe, négatif
en cas de liaison inverse. Il n’a de sens et ne doit donc être employé, que dans le cas
où la liaison entre les deux variables peut être considérée comme approximativement
linéaire.
4) Le coefficient de corrélation linéaire est invariant par rapport à un changement
d’origine et d’unité : c’est un nombre sans dimension.
5) Calculer le coefficient de corrélation avant d’effectuer l’ajustement. Si le
coefficient est trop faible en valeur absolue, ne pas continuer les calculs (au besoin,
rechercher un ajustement non linéaire).
6) La covariance est du même signe que la pente de la droite ajustée.
Contrairement à la variance, elle n’est donc pas toujours positive, le signe est en
général visible graphiquement, d’après la forme du nuage de points.
7) La statistique descriptive à laquelle nous nous limitons ici, ne peut conclure
quant à une relation causale entre deux ou plusieurs caractères étudiés. Elle décrit
seulement cet ensemble à plusieurs caractères et éventuellement le résume par une
relation, vraie en moyenne, entre les valeurs des variables correspondant aux
caractères (lorsque ceux-ci sont quantitatifs). La relation ainsi trouvée peut être une
aide pour la recherche d’une loi (biologique, physique, chimique, voire économique),
mais ne peut en rien se substituer à la recherche de cette loi à l’aide des causalités
démontrées par un raisonnement scientifique.
Références
LABENNE C. : Statistiques descriptives, Les Éditions d’Organisation, 1991.

Chapitre VII : Les tests paramétriques
ou
Validité de l’ajustement
d’une loi théorique à une
distribution observée (1)
Sommaire
7.1 Définition et loi de probabilité de la distance entre une distribution observée et
une distribution théorique ....................................................................................... 95
7.2 Le test du khi-deux.................................................................................................... 97
7.2.1 Ajustement à une loi donnée ............................................................................. 97
7.2.2 Autre utilisation : test d’indépendance ............................................................ 99
7.3 Le test de Kolmogorov – Smirov ........................................................................... 103
7.4 Le test u de Mann-Whitney.................................................................................... 104
7.5 Corrélation des rangs .............................................................................................. 106
7.5.1 Test de Spearman .............................................................................................. 106
(1) Plus que les précédents, ce chapitre exige des pré-requis dans les domaines mathématiques tels que : le
calcul des probabilités et l’analyse mathématique.
Chap.7 Les tests paramétriques
Introduction
Supposons qu’une variable statistique X suive très exactement une loi de
probabilité P . Si on tire un échantillon dans la population correspondant à cette loi, la
distribution observée s’écartera néanmoins toujours plus ou moins de la distribution
théorique : les observations sont en effet entachées de fluctuations aléatoires.
Généralement, on ne connaît ni la forme de la loi de probabilité suivie par le

phénomène observé, ni la valeur des paramètres de cette loi. C’est une réflexion sur
la nature du phénomène et l’analyse de la distribution observée qui permet de choisir
parmi les lois de probabilité, celle qui paraît susceptible de convenir. On estime
ensuite, à partir de la série empirique, les paramètres de cette loi.
Les écarts entre la loi théorique ainsi déterminée et la distribution observée

peuvent donc être attribués :
 soit aux fluctuations d’échantillonnage,
 soit au fait que le phénomène ne suit pas, en réalité la loi supposée.
Très grossièrement : si les écarts sont très faibles, on admettra qu’ils sont
imputables aux fluctuations aléatoires ; s’ils sont très élevés, on en conclura qu’ils ne
peuvent être expliqués par les seules fluctuations et que, par conséquent, le
phénomène ne suit pas la loi retenue.
Plus précisément, juger de la validité d’un ajustement consiste à tester l’hypothèse

que le phénomène observé suit la loi théorique supposée. Pour ce faire, il faut d’abord
définir une mesure de la distance existant entre la distribution empirique et la loi de
probabilité théorique et ensuite déterminer la loi de probabilité de cette grandeur.
Connaissant cette loi, si on constate que dans l’hypothèse retenue, il y a une forte
probabilité d’obtenir, par le seul fait des fluctuations aléatoires, une distance
supérieure à celle qui a été observée, on acceptera l’hypothèse et l’on admettra que le
phénomène suit bien la loi théorique supposée ; si, au contraire, cette probabilité est
faible (moins de 5%, par exemple). Il y a de grandes chances que les écarts constatés
ne soient pas imputables aux seules fluctuations aléatoires, mais plutôt à
l’inadéquation de la loi théorique retenue pour représenter le phénomène : on
rejettera alors l’hypothèse.
7.1 Définition et loi de probabilité de la distance entre une

distribution observée et une distribution théorique
Soit X une variable aléatoire suivant une loi de probabilité P . Procéder à N
observations de cette variable revient à tirer un échantillon de taille N dans la
population théorique infinie correspondant à la loi de probabilité P . Les observations
sont classées suivant k modalités :

C1 , C2 ,..., Ck
qui représentent soit les différentes valeurs possibles ou groupes de valeurs de la
variable si celle-ci est discrète, soit les classes de valeurs associées à la variable si
celle-ci est continue.
A chacune de ces modalités ou classes correspond une probabilité déterminée par
la loi P : p1 , p2 ,..., pk .
L’effectif susceptible d’être observé sur l’échantillon pour chacune de ces classes :
O1 , O2 ,..., Ok
est une variable aléatoire binomiale.

Ainsi, pour la classe Ci , l’effectif Oi est une variable binomiale de paramètres N ,
effectif de l’échantillon, et pi , probabilité que la variable X appartienne à cette
classe :
Oi  ( N , pi )
Son espérance mathématique

E (Oi )  Npi
représente l’effectif théorique de la classe Ci .

Sa variance est :
V (Oi )  Npi (1  pi )  Npi .
En effet, le choix du nombre de classes et de leurs limites est généralement fait de

façon à ce que la probabilité pi soit relativement petite, donc 1  pi proche de 1.
Dans ces conditions, pourvu que la classe Ci soit suffisamment grande pour avoir un
effectif théorique d’au moins 4 ou 5 individus (sinon les conditions de convergence de la
loi binomiale vers la loi normale ne seraient pas remplies), l’écart Ei entre effectif
empirique et effectif théorique :
Oi  Npi
Ei 
Npi
peut être considérée comme une variable normale centrée réduite.

Les effectifs observés en réalité sur l’échantillon pour chacune des classes sont :
N1 , N2 ,..., Nk
Elevons tous ces écarts au carré et faisons-en la somme pour toutes les classes :
k k
( Ni  Npi )2
d   ei2   .
i 1 i 1 Npi
Cette somme d fournit une mesure de la distance existant entre la distribution

observée et la distribution théoriques.
Or, la variable aléatoire :

k k
(Oi  Npi )2
D   Ei2  
i 1 i 1 Npi
donc d représente la valeur observée sur l’échantillon, est la somme des carrés de k
variables normales centrées réduites liées par la relation linéaire :
O1  O2  ...  Oi  ...  Ok  N .
Cette variable suit donc une loi de  2 à v  k  1 degrés de liberté.

Le symbole  2 se lit « khi-deux ».
Cette propriété est tout à fait remarquable : en effet, la loi de probabilité de la

variable D ne dépend que du nombre de classes, et non de la nature du phénomène
étudié (c’est-à-dire de la loi de probabilité P ).
7.2 Le test du khi-deux

7.2.1 Ajustement à une loi donnée
Généralement, on ne connaît pas à priori la loi de probabilité théorique suivie par

la variable aléatoire X . Suivant la nature du phénomène et après analyse de la
distribution observée, on fait le choix d’un type de loi dont on estime les paramètres
sur la base des observations (1). Cette loi supposée P fait correspondre aux k
modalités ou classes :
C1 , C2 ,..., Ck ,
les probabilités :
p1 , p2 ,..., pk .
et, par suite, les effectifs théoriques :
Np1 , Np2 ,..., Npk .
On est alors à même de calculer la valeur :

k
( Ni  Npi )2 loi
d    2 (k  1)
i 1 Npi
prise par la variable aléatoire D, qui mesure la distance existant entre la distribution
observée et la distribution théorique.
(1) Pour en savoir davantage, faire des recherches sur les différentes lois statistiques suivantes : loi
binomiale, loi de poisson, loi normale, loi du khi-deux.

Cette distance D suit, dans l’hypothèse où la distribution théorique est effectivement la

loi P, une loi de  2 . Le nombre v de degrés de liberté de cette loi dépend du nombre k
de classes et du nombre r de paramètres estimés à partir des observations : v  k  r  1
Le test du  2 , introduit par K. Pearson, repose sur le raisonnement suivant :
On fait l’hypothèse que le phénomène observé suit la loi théorique supposée P ;

dans ces conditions, la distance D est, du fait des fluctuations aléatoires, une variable
 2 à v  k  r  1 degrés de liberté.
S’il y a une forte probabilité (déterminée par consultation de la table de  2 )


que D prenne une valeur supérieure à la valeur d observée, les fluctuations
aléatoires suffisent à exprimer la distance enregistrée : l’hypothèse est jugée acceptable
(1).
 Si, par contre, il n’y a qu’une faible probabilité (par exemple, une probabilité
inférieure à 5% ) d’obtenir une valeur de D supérieure à la valeur d observée, il est
beaucoup plus probable que cette valeur élevée soit due à l’inadéquation de la loi
théorique P : on rejette l’hypothèse que le phénomène observé suit cette loi.
Exemple 1 : On construit un modèle pour étudier le nombre de plaintes reçues

par le Département « Administration et logistique » d’une organisation sportive
(service réclamations) à l’issue de la clôture des activités annuelles. La probabilité,
selon le modèle, d’obtenir n réclamations en une compétition est donné par le
tableau ci-après :
n P
0 0,14
1 0,27
2 0,27
3 0,18
4 0,09
5 0,04
6 et plus 0,01
Un échantillon de 100 compétitions observées a donné les résultats suivants :
Nombre de plaintes par compétition Fréquence

0 15
1 35
2 30
3 15
4 3
5 2
6 et plus 0
(1) Ceci ne signifie pas que l’hypothèse soit nécessairement vraie, mais simplement que les informations
dont on dispose ne permettent pas de la rejeter. On notera que plusieurs lois théoriques différentes peuvent être
jugées acceptables, de ce point de vue, pour représenter un même ensemble d’observations.

Le calcul peut être présenté ainsi :
Nombre de
plaintes par Fréquence ( (Oi  npi ) 2
npi Oi  npi (Oi  npi )2
compétition Oi ) npi
(n)
0 15 14 1 1 0,0714
1 35 27 8 64 2,3704
2 30 27 3 9 0,3333
3 15 18 -3 9 0,5000
4 3 9
5 2 5 4 14 -9 81 5,7857
6 et plus 0 1
Total 9,0608
Le nombre de degrés de liberté est ddl  v  7  2 1  5 1  4
Dans la table correspondante, on lit, par exemple, au seuil 5%
 2  9, 488
La valeur calculée du  2 est inférieure à cette valeur critique : le test ne fournit pas
d’argument contre le modèle adopté : le nombre de plaintes reçus suit la loi de probabilité
adoptée.
Remarque : Le test s’applique parfaitement à une variable ordinaire (l’on a

d’ailleurs ramené une éventuelle variable numérique à ce cas en définissant des
classes), voire nominale (l’ordre des classes n’a pas été utilisé).
7.2.2 Autre utilisation : test d’indépendance
Le test du  2 est employé dans le problème suivant : on s’intéresse à une

population dont les éléments possèdent deux caractères : numériques (quantitatifs)
ou qualitatifs.
Ces caractères peuvent-ils être considérés comme statistiquement indépendants ?

Par exemple, la couleur des yeux et la couleur des cheveux sont-ils des caractères
indépendants ? De même pour le débit moyen d’un fleuve et les chutes de pluie aux
environs de la source.
Y
1 . . . . . . j . . . . l
X
1
. .
. .
. .
. .
. .
i . . . . . . nij
.
.
.
.
k
nij est le nombre d’observations possédant le caractère X avec la modalité i et Y

avec j. Si pij , pi et p j sont respectivement les probabilités d’avoir les modalités i( X )
et j (Y ), i( X ), j (Y ), l’indépendance s’exprime par :
pij  pi  p j
l k
Soient n   nij .n. j   nij .ni.   nij
j 1 i 1 i j
ni nj
On peut estimer pi et p j par pi  et p j  .
n n
Le problème de test est le suivant :
H0 : X et Y sont indépendants
H1 : X et Y ne sont pas indépendants
Sous l’hypothèse (H0) d’indépendance, la quantité :
(nij  npij )2
D  
i j npij
qui mesure l’écart entre le tableau observé et le tableau théorique sous (H0), suit
une loi du  2 (d ) .
2
 ni. .n. j 
n 
l  ij 
  
k n 
On peut encore écrire : D   2 emp 
loi
  2 (d )
i 1 j 1 n .n
i. . j

Calculons le nombre d de degrés de liberté : on est dans un schéma

multinominal à kl catégories. Le nombre de paramètres estimés est (k 1)  (l  1) .
D’où d  kl  (k  1)  (l  1)  1
d  (k  1)(l  1)
Exemple 2 : Un Centre de formation pour « sportif de haut niveau » veut savoir si

les sports de ses athlètes masculin et féminin sont sensiblement différents. Il
interroge 700 athlètes, et le tableau ci-dessous, appelé tableau de contingence, retrace
les résultats :
Sexe
Hommes Femmes Total
Préférences
Athlétisme 120 55 175
Lutte 30 25 55
Football 250 40 290
Volley ball 100 80 180
Total 500 200 700
Les différences sont-elles significatives ?
S’il y avait indépendance entre le sexe et le sport préféré, on aurait attendu, par
exemple :
500 175
pour les hommes préférant l’athlétisme  125
700
200 175
pour les femmes préférant l’athlétisme  50
700
D’une façon générale, en faisant l’hypothèse de l’indépendance (hypothèse

nulle), on n’aurait obtenu (en arrondissant) :
ni. .n. j
Le tableau de calcul des
n
Sexe
Hommes Femmes
Préférences
Athlétisme 125 50
Lutte 39 16
Football 207 83
Volley ball 129 51

2
 ni. .n. j 
n 
l  ij 
  
k n 
Le tableau de calcul du  2 emp
i 1 j 1 ni. .n. j
n
nij 120 55 30 25 250 40 100 80

ni. .n. j
125 50 40 15 207 83 129 51
n
ni. .n. j
nij  -5 5 -10 10 43 -43 -29 29
n
2
 ni. .n. j 
 nij   2 
emp
 n  0,2000 0,5000 2,5000 6,6667 8,9324 22,2771 6,5194 16,4902
ni. .n. j 64,086
n
Les valeurs critiques sont encore déterminées par la table de  2 , le nombre de

degrés de liberté étant ddl  (k  1)(l 1), k et l étant les nombres de lignes et de
colonnes du tableau de contingence.
Ici : ddl  (4 1)(2 1)  3
Au seuil 5%, la lecture du khi deux donne : lu2  7,815
La valeur trouvée étant supérieure à cette valeur critique, l’hypothèse d’indépendance doit
être rejetée : la préférence d’un type de sport dépend du sexe de l’athlète.
Remarque : Ceci peut-être étendu sans difficulté à des tableaux

multidimensionnels.
Conseils pratiques :
1. Pour que la distance D suive une loi de  2 , les conditions de convergence

impliquent que les effectifs théoriques Npi des différentes classes ne soient pas trop
petits : en pratique, on considère qu’ils doivent être au moins égaux à 5.
Par suite, il est parfois nécessaire de regrouper certaines classes, notamment aux
extrémités de la distribution. Naturellement, le nombre de classes k qui doit être pris
en considération dans le calcul du nombre de degrés de liberté est le nombre de
classes après regroupement.
2. Habituellement, les seuils de probabilités à partir desquels on décide de rejeter

l’hypothèse sont de l’ordre de 2 à 5% .

3. En règle générale, la région critique (région de rejet de l’hypothèse nulle

(H0)) d’un test du khi-deux est de la forme :
W  empirique
2
 12 (k  1)(l  1) pour un test d’indépendance
W  empirique
2
 12 (k  r  1) pour un test d’ajustement (ou d’adéquation)
7.3 Le test de Kolmogorov – Smirov

Ce test est un autre moyen de comparer une distribution observée avec une
distribution théorique. Il utilise :
F0 ( x) la fonction de fréquences cumulées théoriques ;
Fn ( x) la fonction de fréquences cumulées observées dans l’échantillon de

taille n (pour tout x, si k est le nombre d’observations xi inférieure ou égales à x, on
k
a Fn ( x)  ).
n
Le test utilise l’écart maximal entre ces deux fonctions. Soit :
Dn  Max F0 ( x)  Fn ( x)
x
Si Dn est inférieure la valeur critique indiquée dans la table, on accepte l’hypothèse

H0 : l’échantillon a été tiré d’une population dont la distribution admet F0 pour fonction des
fréquences cumulées.
La table donne des valeurs critiques pour des échantillons jusqu’à 35. A partir de
a
35, on peut utiliser pour approximation , n désignant la taille de l’échantillon et
n
a étant donné par le tableau suivant :
Seuil 20% 15% 10% 5% 1%
a 1,07 1,14 1,22 1,36 1,63
Sans que la puissance ait pu être effectivement calculée, le test de Kolmogorov –

Smirov est généralement considéré comme plus puissant que le test du  2 , en
particulier pour des variables numériques. On notera qu’il n’inflige pas la perte
d’information provoquée par le regroupement en classe exigé par le test de  2 .
Suite Exemple 1 : Appliquons le test de Kolmogorov – Smirov aux données de

l’exemple précédent :

Nombre de plaintes
Cumul Fréquence Cumul
par compétition Probabilité Ecart
( F0 ( x) ) observée ( Fn ( x) )
(n)
0 0,14 0,14 0,15 0,15 0,01
1 0,27 0,41 0,35 0,50 0,09
2 0,27 0,68 0,30 0,80 0,12
3 0,18 0,86 0,15 0,95 0,09
4 0,09 0,95 0,03 0,98 0,03
5 0,04 0,99 0,02 1 0,01
6 et plus 0,01 1 0,00 1 0,0
L’écart maximal observé est Dn  Max

x
F0 ( x)  Fn ( x)  0,12 .
a 1,36
Pour un échantillon de taille 100, on prend pour valeur critique  , soit
n 100
0,136 au seuil 5% .
La valeur observée 0,12 étant inférieure à la valeur critique, le test de Kolmogorov –
Smirov ne fournit pas d’argument contre le modèle adopté.
7.4 Le test u de Mann-Whitney

Ce test permet de comparer deux populations pour lesquelles on dispose
d’échantillons indépendants, de tailles respectives n1 et n2 . L’hypothèse nulle est :
H0 : Les deux populations sont identiques
Contre l’hypothèse alternative
H1 : Les deux populations sont différentes
Si les deux populations sont identiques, les échantillons doivent « se

ressembler ». Si on range en ordre croissant les membres (ou les unités) des deux
échantillons réunis E1 et E2, chaque élément de E1 et E2, chaque élément de E1 doit
être précédé par un nombre « raisonnable » d’éléments de E2 : s’il y en a « trop », les
éléments de E1 sont plutôt « trop grands » et vice versa.
Exemple 3 : Une société veut tester un nouveau présentoir pour ses produits.
Elle sélectionne 10 magasins, place le nouveau présentoir dans six d’entre eux, et

conserve l’ancien dans quatre (groupe témoin). Les variations des ventes mensuelles
sont les suivantes :
Nouveau
+15 +5 +20 +13 -1 +9
présentoir (en %)
Groupe témoin +10 +2 -2 +12
On classe l’ensemble des observations :
E1 -1 +5 +9 +13 +15 +20
E2 -2 +2 +10 +12
L’observation (-1) de E1 est précédée par 1 observation de E2.
(+5) 2 observations de E2.
(+9) 2
(+13) 4
(+15) 4
(+20) 00004 observations de E2.
L’indicateur choisi vaut donc U = 17
L’observation (-2) de E2 est précédée par 0 observation de E1.

(+2) 1 observation de E2.
(+10) 3
(+12) 3servations de E2.
L’indicateur choisi vaut donc U’= 7
On retient la plus petite valeur, soit ici 7. la consultation d’une table montre que
cette valeur est inférieure à la valeur critique. Le test n’indique aucun argument en
faveur du nouveau présentoir.
Pour des échantillons importants, ce calcul peut être fastidieux. On peut utiliser
une formule abrégée :
n1 (n1  1)
U  n1  n2   R1
2
n (n  1)
U '  n1  n2  2 2  R2
2
où R1 (respectivement R2 ) représente la somme des rangs dans le classement

global des éléments de E1 (respectivement E2). Dans l’exemple 3,
R1  2  4  5  8  9  10  38 R2  1  3  6  7  17
On retrouve le même résultat. L’un des calculs étant fait, on peut éviter le second
en notant que : U  U '  n1.n2

Pour des petits échantillons, U est distribué suivant une loi de Laplace – Gauss de
n1 .n2 n .n (n  n  1)
moyenne   et de variance  2  1 2 1 2 .
2 12
7.5 Corrélation des rangs

Il peut être utile de disposer de tests non paramétriques, notamment si les
données ont des valeurs numériques douteuses ou sans signification, mais un ordre
bien déterminé. Par exemple, si l’on fait classer des desserts instantanés par des
consommateurs, on peut obtenir un ordre de préférence. La traduire par des valeurs
numériques (par exemple des notes sur 20) laisse place à trop d’arbitraire pour qu’on
puisse fonder sur celle-ci une analyse statistique précise.
Les tests les plus connus en ce sens sont les tests de corrélation des rangs.
7.5.1 Test de Spearman
Supposons N produits, rangés selon deux critères distincts ; pour nos desserts
instantanés, ce peut être un ordre préférentiel de goût, et un ordre préférentiel
d’aspect.
Soit X1 , X 2 , X n les rangs des desserts pour le goût et Y1 , Y2 , Yn les rangs pour
l’aspect. Une parfaite corrélation entre ces deux critères se traduirait par une identité
des rangs, soit pour tout i :
X i  Yi ou di  X i  Yi  0
Si nous voulons calculer le coefficient de corrélation des rangs :
 ( x  x )( y
i i  y)
i
n
 ( x  x )( y
i i  y)
rs   i
 (x  x )
i
2
(y i  y )2  (x  x )
i
2
 (y i  y )2
i
 i i i
n n
Nous pouvons simplifier le calcul en remarquant que les nombres X i sont, dans
un certain ordre, les entiers de 1 à N et donc que :
n(n  1) x (n  1)
x  d’où x  
i
i i
i
; et par une formule connue,
2 n 2
n(n  1)(2n  1) n3  n
x i
2
i

2
et  (x  x )   x
i i
2
i
2
i
 nx 
12
Les Yi vérifient les mêmes formules. Par suite :

di  ( X i  x )  (Yi  y )
et d i2  ( X i  x )2  2( X i  x )(Yi  y )  (Yi  y )2
n3  n n3  n n3  n
d’où  d i2 
i 12
 2rs
12

12
et finalement
6 d i2
rs  1  i
n3  n
Naturellement, rs , que nous avons calculé comme un coefficient de corrélation,

est compris entre –1 et +1. On vérifie que rs  1 si et seulement si les deux classements
sont identiques ( X i  Yi pour tout indice i ) et que rs  1 si et seulement si les deux
classements sont inversés ( X i  Yi  n  1 pour tout i ).
Le coefficient de corrélation des rangs se teste comme un coefficient de

corrélation en comparant :
n  2 loi
t  rs  T (n  2) au t de Student.
1  rs2
Le calcul de rs est souvent plus simple que le calcul d’un coefficient linéaire,
lorsque les deux calculs sont possibles. Hotelling a comparé des tests lorsqu’ils sont
concurrents, pour rejeter l’hypothèse nulle H0 (absence de corrélation dans la
population) : il a trouvé un rapport de 91%, ce qui exprime qu’on obtient la même
prévision avec 10 observations en utilisant rs qu’avec 9 observations en utilisant r.
Exemple 4 : Considérons les données relatives à la publicité sur le lieu de vente

(PLV). Nous classons les représentants en ordre décroissant du chiffre d’affaires
réalisé, et nous calculons leurs rangs dans l’ordre des coûts de matériel utilisé.
Rang 2 1 3 5 4 8 6 7 9 10 11 12 13 14 15
X (Coût) 97 124 92 84 90 69 74 70 66 61 58 53 48 42 0
Y (C.A.) 915 884 854 795 756 704 695 672 610 580 510 504 440 394 310
Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Différence
des rangs 1 1 0 1 1 2 1 1 0 0 0 0 0 0 0
(di  X i  Yi )
Alors di
2
i
 12  12  12  12  22  12  12  10 et n3  n  n(n2  1)  n(n  1)(n  1)  15 16 14 et
60
rs  1   0,98
16 15 14

13
On obtient donc : ts  0,98  17, 756
1  (0,98)2
Cette valeur étant largement supérieure à la valeur critique 1,771, on conclut à

une réelle efficacité de la PLV.
Références
DJIMRABAYE M. : Statistiques mathématiques I, Cours magistral, Institut Sous-

régional de Statistique et d’Économie Appliquée, 2002 - 2003.
CARON N., TASSI P. : Méthodes statistiques, Éditions Économica, 1991.
MBANGZA J. : Statistiques mathématiques II, Cours magistral, Institut Sous-régional

de Statistique et d’Économie Appliquée, 2003 - 2004.

Chapitre VIII : Analyse de la variance
Sommaire
8.1 Tests simultanés ....................................................................................................... 110
8.2 Procédure de l’analyse de la variance .................................................................. 112
8.3 Conditions de validité ............................................................................................ 114
8.4 Analyse de la variance par les rangs .................................................................... 115

Chap.8 Analyse de la variance
Introduction
Le langage de cette partie de la statistique comporte plusieurs termes issus du
langage agricole, pour des raisons historiques. Pour nous, un traitement peut être un
nouvel emballage d’un produit, une nouvelle méthode de stimulation de vendeurs,
etc.). On compare alors un groupe « traité » à un groupe témoin.
8.1 Tests simultanés

Lorsque plusieurs traitements doivent être essayés simultanément, cette méthode
est inadaptée. Imaginons qu’un éditeur veuille choisir entre trois couvertures
possibles pour un nouveau livre, soit C1 , C2 et C3 . La comparaison de ces couvertures
deux à deux est inadaptée : notamment, elle multiplie les risques d’erreurs. Avec 10
10  9
couvertures, il faudrait  
 soit 45 comparaisons de paires, et si nous acceptons
 2 
pour chacune un risque d’erreur de première espèce de 5%, il est probable que, sur
45 tests, un ou plusieurs seront ainsi erronés.
Pour tester les trois couvertures, l’on peut prendre un échantillon aléatoire de 15
consommateurs (dans la réalité, on utilise des échantillons plus importants), et
soumettre chaque couverture à 5 d’entre eux pris au hasard. Supposons qu’on leur
demande de noter sur 20 la couverture et qu’on obtienne les résultats suivants :
C1 C2 C3
X 1 = 14 Y1 = 16 Z1 = 14
X2 = 6 Y2 = 14 Z 2 = 16
X 3 = 12 Y3 = 8 Z 3 = 14
X 4 = 10 Y4 = 8 Z 4 = 14
X5 = 8 Y5 = 14 Z 5 = 12
Moyenne x = 10 y = 12 z = 14
Ces différences entre moyennes sont-elles significatives, où peuvent-elles être

imputées aux fluctuations d’échantillonnage ?
L’hypothèse nulle de notre test est donc l’égalité des moyenne x = y = z
Et l’hypothèse alternative est qu’une au moins de ces moyennes est différente.
Si l’hypothèse nulle est vraie, chaque groupe de notes est un échantillon extrait
d’une même population et nous pouvons estimer la variance ( 2 ) de cette population
à l’aide de chacun des trois échantillons. On obtient trois estimations :

 (x i  x )2
1
s 
2 i
soit s12  42  (4)2  22  02  (2)2   10
n1  1
1
4
(y i  y )2
1
s22  i
soit s12  42  22  (4)2  22  (4)2   14
n2  1 4
 (z i  z )2
1
s 
2 i
soit s32  02  22  02  02  (2)2   2
n3  1
3
4
Ce sont les « variances intra-groupes ». On peut même prendre pour estimation la

moyenne pondérée de ces estimations :
(n1  1) s12  (n2  1) s22  (n2  1) s32

Vi 
(n1  1)  (n2  1)  (n3  1)
10  14  2 26
Soit ici, puisque les trois groupes ont même effectif s 2    8, 67
3 3
Mais il existe une autre façon d’estimer la variance ( 2 ) de la population. La

moyenne d’échantillon de taille p (ici p  5 ) a pour variance le quotient par p de la
variance de la population.
Donc les moyennes ( x = 10, y = 12 et z = 14) forment un échantillon de taille 3

dont la moyenne :
10  12  14 36
  12
3 3
est une estimation de la moyenne de la population et par conséquent la variance

(corrigée du biais par le facteur n  3 ) est une estimation de  2 .
D’où l’estimation de  2 par la « variance entre groupes » :
(10  12)2  (12  12)2  (14  12)2 40

Ve  5    20
2 2
Ve 20
Si l’hypothèse nulle est exacte, le rapport F  (ici F   2,31 ) de ces deux
Vi 8, 67
estimations de  2 ne doivent pas être très différent de F (distribution de Fischer –
Snedecor), sous hypothèses que nous expliciterons plus loin. Nous expliciterons
également plus loin la détermination des paramètres (degrés de liberté) de cette
distribution. Pour être complet, indiquons seulement que la valeur critique au seuil
5% est 3,89 : la valeur trouvée étant 2,31 ; le test n’indique aucune différence
significative entre les trois couvertures.

8.2 Procédure de l’analyse de la variance

Résumons la procédure :
soit un nombre connu d’échantillons comparés ;
o p la taille (supposée constante) de ces échantillons ;
o xij la i ième observation du j ième échantillon ;
o x j la moyenne du j ième échantillon ;
o x la moyenne générale ;
o  2 la variance (inconnue) de la population.
On calcule :
 La variance de chaque échantillon :

p
( xij  x j )2
s 2
 i 1
p 1
j
 La variance intra-groupe de ces variances :
1
  ( xij  x j )2
k p
Vi 
k ( p  1) j 1 i 1
1 k
Vi   j 1 s j2
k
1 p
 La variance de l’échantillon des moyennes ( X1 , X 2 ,..., X j ,..., X n )  ( xij  x j )2
k i 1
k
qu’on corrige par le facteur , et qui est un estimateur de  2 , d’où l’estimation
(k  1)
de  2 , variance entre groupes :
1
 ( x j  x )2
k
Ve 
k  1 j 1

k
Ve k ( p  1) ( x j  x )2
 Le quotient F   k
j 1
k 1   ( xij  x j )2
p
Vi
j 1 i 1
 On compare la valeur F trouvée à la valeur pour la distribution de Fischer

– Snedecor avec pour degrés de liberté 1  ddl1  k  1 ;  2  ddl2  k ( p  1) .

Calculs simplifiés
p
o Calculer les sommes T j pour chaque échantillon : T j   xij  x. j
i 1
k k
o Calculer la somme générale : G   T j   x. j
j 1 j 1
k p
o Calculer la somme Q des carrés de tous les nombres : Q   xij2
j 1 i 1
k k
o Calculer la somme des carrés des totaux des colonnes S   T 2   x 2 j .j
j 1 j 1
o Calculer les degrés de liberté ddl1  k  1 ; ddl2  k ( p  1) .
 G2 
S  
ddl2  k 
o Alors, F  .
ddl1  pQ  S 
Reprenons l’exemple précédent :
C1 C2 C3
14 16 14
6 14 16
12 8 14
10 8 14
8 14 12
Tj 50 60 70
G  50  60  70  180
Q  132  62  122  102  82  162  142  82  82  142  142  162  142  142  122  2304
S  502  602  702  11000
k 3 p5 ddl1  k  1  2 ddl2  k ( p  1)  12
1 1802
(11000  )
(3  1) 3 12 200
F    2,31
(5  2304  11000) 2 520
3(5  1)

Tableau usuel de l’Analyse de la variance
(1) (2) (3) (4) (5)
Somme des
Origine de la Nombre de
(A) carrés des Variance F
fluctuation d.d.l.
écarts
Entre colonnes T j2 TG2 c 1 (2) S2

S2 
(B)  n. j  n (3) s2
Intra - colonnes T j2 nc s2 

(2)
(C)  nij2   n. j (3)
(résiduelles)
Totale TG2 n 1
 nij2  n
c : nombre de colonne
n : nombre total d’observations
TG : total général
Tj : total d’une colonne
8.3 Conditions de validité

Quatre hypothèses ont été faites, plus ou moins explicitement, pour conclure le
test d’analyse de la variance :
a) Les populations globales ont des distributions normales.

b) Les échantillons sont aléatoires et de même taille.
c) Les observations sont indépendantes.
d) Les populations ont même variance (homoscédasticité).
La première condition n’est pas très importante si les échantillons sont de tailles
suffisantes. Si ces tailles sont différentes, le principe du test reste le même,
simplement Vi est calculée comme une moyenne pondérée des variances internes à
chaque échantillon.
Les deux autres conditions sont essentielles à la validité de la procédure telle que
nous l’avons présentée.

8.4 Analyse de la variance par les rangs

On peut s’affranchir de la condition de la population parente et de la condition
d’homoscédasticité en utilisant la méthode de Kruskal – Wallis. Cette méthode offre
en outre l’avantage de n’utiliser que les rangs : il n’est donc pas nécessaire que les
variables soient mesurées avec précision, ni même qu’elles soient mesurables : il
suffit qu’elles puissent être ordonnées.
Montrons un exemple de déroulement de ce test. Un hypermarché veut comparer

trois méthodes d’exposition de certains articles en promotion :
Méthode 1 : en extrémités de gondoles

Méthode 2 : en linéaire à hauteur des yeux
Méthode 3 : aux abords des caisses
Un échantillon de 15 produits est constitué et les produits sont affectés au hasard

à l’une des trois méthodes d’exposition. L’efficacité de la méthode est mesurée par
l’accroissement des ventes (en pourcentage par rapport au mois précédent). Les
résultats sont les suivants :
Taux de croissance du C.A en %
Méthode 1 Méthode 2 Méthode 3

+5 -3 +15
+14 0 +13
+12 +8 +9
+10 +4,5 +1
+4 +3
+7
La première étape consiste à remplacer chaque valeur par son rang : +15 est la
plus grande, et reçoit donc le rang n°1, le n°2 est +14. le nouveau tableau est donc :
Méthode 1 Méthode 2 Méthode 3

9 15 1
2 14 3
4 7 6
5 10 13
11 12
8
Sommes des rangs S j 31 46 43

Le test de Kruskal – Wallis permet de juger si les sommes (compte tenu des
effectifs des groupes) sont différentes pour que l’hypothèse que les divers groupes
proviennent d’une même population (c’est-à-dire que les trois modes de
représentation seront sans influence sur les ventes) soit acceptable.
On calcule pour cela la statistique :

2
12 k Sj
H 
n(n  1) j 1 n j
 3(n  1)
où S j est la somme des rangs pour la méthode n° j , n j l’effectif correspondant et

k
n   n j , c’est-à-dire l’effectif total.
j 1
12  312 462 432 

Sur ces échantillons, H prend la valeur      3 16  3, 468
15 16  5 4 6 
Qu’on doit comparer à la valeur d’un  2 à k  1  2 degrés de liberté (d.d.l). Pour 2

d.d.l, la valeur limite du  2 au seuil 5% est 5,991 : le test n’indique aucune raison de
rejeter l’hypothèse d’homogénéité, autrement dit, il n’établit pas la supériorité d’une
quelconque des méthodes d’exposition.
En cas d’ex æquo, on attribue le rang moyen à chacune des mesures classées ex
æquo.
Références
DJIMRABAYE M. : Statistiques mathématiques I, Cours magistral, Institut Sous-

régional de Statistique et d’Économie Appliquée, 2002 - 2003.
CARON N., TASSI P. : Méthodes statistiques, Éditions Economica, 1991.

MBANGZA J. : Statistiques mathématiques II, Cours magistral, Institut Sous-régional

de Statistique et d’Économie Appliquée, 2003 - 2004.
VALLERON A.-J, LAZAR P. : Exercices programmés de statistiques à l’usage des médecins

et biologistes, Éditions Médicales Flammarion, 1966.

Chapitre IX : Quelques indicateurs
statistiques
Ce chapitre est rédigé à la mémoire

de feu Alexis NKOMO YA
Ancien professeur d’économie descriptive à l’ISSEA .
Sommaire
9.1 Indices ....................................................................................................................... 118
9.2 Taux de croissance .................................................................................................. 118
9.3 Points et pourcentages ............................................................................................ 119

Chap. 9 Quelques indicateurs statistiques
Introduction
Pour mesurer l’évolution d’une grandeur entre deux périodes, il est souvent
possible d’utiliser des indices ou des taux de croissance.
9.1 Indices
Un indice mesure l’évolution d’une grandeur par rapport à une valeur prise
comme référence et égale par convention à 100.
Indice en t 0 =100
Valeur en t 1
Indice en t 1 =  100
Valeur en t 0
Attention :
- Bien évidemment, la valeur prise comme référence peut-être la valeur en

t 0 , t1 , ou t 2 ...
- Si deux indices varient dans une même période, pour les comparer, il faut
faire le rapport des deux :
At 0 =100 ; At 1  150
Bt 0 =100 ; Bt 1  120
150
 1, 25
120
C’est-à-dire que A a augmenté de 25% de plus que B.
- Les indices ne se soustraient pas, il faut faire leur rapport.
9.2 Taux de croissance

Un taux de croissance est un rapport exprimé en %.
Le coefficient multiplicateur est le nombre par lequel une grandeur est multipliée
quand elle progresse d’un pourcentage donné :
10% correspond à une multiplication par 1,10.
Calculer un taux de croissance c’est mesurer la variation relative d’une grandeur

entre deux périodes :
Valeur en t 1  Valeur en t 0
 100
Valeur en t 0

Chap. 9 Quelques indicateurs statistiques
Attention :
- Une grandeur ne peut régresser de plus de 100%. Après une baisse de 100% il
ne reste plus rien…
- Quand une grandeur connaît plusieurs variations successives, il faut les

multiplier. Si, par exemple, une valeur A augmente de 10% puis de 15%, elle
devient : A  (1 + 0,1)  (1 + 0,15) ;
- Si elle augmente de 20% puis diminue de 15% : A  (1 + 0,2)  (1 - 0,15).
Une croissance moyenne ne s’obtient pas en divisant la croissance totale par le

nombre d’années : si une grandeur augmente de 20% en 10 ans, cela signifie que
son coefficient multiplicateur est de 1,20. Si on appelle x le coefficient
multiplicateur annuel moyen recherché, on a donc :
 x 10  1, 20
1
soit x  10 1, 20  1, 2 10  1, 0184
9.3 Points et pourcentages

Si le taux d’inflation passe de 5% à 8%, on peut affirmer que l’inflation a
progressé :
- Soit de 8 - 5 = 3 ; ici il s’agit de points (de pourcentages).
8% - 5%
- Soit de  100 = 60% ; il s’agit de pourcentages,
5%
croissance de 60% de la hausse des prix (c’est-à-dire 60% de 5% = 3%).
On peut dire que l’inflation a augmenté de 3 points ou de 60%.
Références
ECHAUDEMAISON C.-D. : Sciences économiques et sociales, TermSE, Éditions Nathan,

1995.
NKOMO YA A. : Economie descriptive, Cours magistral, Institut Sous-régional de


Repères bibliographiques
B. BURTSCHY, A.-M. DUSSAIX, Y. GRELET, J.-M. GROSBRAS, A. LLIAKOPOULOS,

M. LEJEUNE, A. MORINEAU, J.-P. PAGÈS, M. ROUX, G. SAPORTA : Traitement
statistique des enquêtes, Éditions Dunod, 1993.
M. DJIMRABAYE, Statistiques mathématiques I, Cours magistral, cycle des ingénieurs

statisticiens 2e année, Institut Sous-régional de Statistique et d’Économie
Appliquée, 2002 - 2003.
C.-D. ECHAUDEMAISON, Sciences économiques et sociales, TermSE, Éditions Nathan,

1995.
J. FOURASTIÉ, B. SAHLER, Probabilités et statistique, Éditions Dunod, 1981.
B. GRAIS, Méthodes statistiques. Techniques statistiques 2, Éditions Dunod, 1995.
B. GRAIS, Cours de statistique descriptive, Éditions Dunod, 1990.
M.-N. GUI-DIBY, Cours de statistique descriptive, polycopié, cycle des ingénieurs

statisticiens 1ère année, Institut Sous-régional de Statistique et d’Économie
Appliquée, 2001.
C. LABENNE : Statistiques descriptives, Les Éditions d’Organisation, 1991.
J. MBANGZA, Statistiques mathématiques II, Cours magistral, cycle des ingénieurs

statisticiens 3e année, Institut Sous-régional de Statistique et d’Économie
Appliquée, 2003 - 2004.
A. NKOMO YA, Economie descriptive, Cours magistral, cycle des ingénieurs

statisticiens 1ère année, Institut Sous-régional de Statistique et d’Économie
Appliquée, 2001.
Ph. TASSI, N. CARON, Méthodes statistiques, Éditions Economica, 1991.
A.-J VALLERON, P. LAZAR, Exercices programmés de statistiques à l’usage des médecins

et biologistes, Éditions Médicales Flammarion, 1966.

Annexes
Annexes : Les tables statistiques

Elements de Statistiques Pour Les Non in

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Elements de Statistiques Pour Les Non in

Transféré par

Droits d'auteur :

Formats disponibles

Joé Clauvis DIFFO

AVANT-PROPOS ................................................................................................................................. iii

CHAPITRE I : INTRODUCTION A LA STATISTIQUE ................................................................. 1

CHAPITRE II : CONCEPTS DE BASE DE LA STATISTIQUE....................................................... 6

CHAPITRE III : LES DISTRIBUTIONS STATISTIQUES A UNE DIMENSION ........................ 17

CHAPITRE IV : LES DISTRIBUTIONS STATISTIQUES A DEUX DIMENSIONS ................... 35

CHAPITRE V : DESCRIPTION NUMERIQUE D’UNE VARIABLE STATISTIQUE ................ 46

CHAPITRE VI : DESCRIPTION NUMERIQUE DES SERIES STATISTIQUES DOUBLES :

CHAPITRE VII : LES TESTS PARAMETRIQUES.......................................................................... 94

7.2 Le test du khi-deux.................................................................................................... 97

CHAPITRE VIII : ANALYSE DE LA VARIANCE....................................................................... 109

CHAPITRE IX : QUELQUES INDICATEURS STATISTIQUES ................................................. 117

REPERES BIBLIOGRAPHIQUES ................................................................................................... 120

La prise en compte de l’importance de la statistique dans le développement

Cette démocratisation amorcée de la statistique ne voudrait pas signifier que

Le présent support veut palier à cette « brièveté » de l’analyse de l’information

Joé Clauvis DIFFO

1.1 Objet de la statistique .................................................................................................. 2

1.2 Les applications de la statistique dans le domaine sportif .................................... 3

1.3 La collecte de l’information........................................................................................ 4

1.3.1 Objectif de l’information ...................................................................................... 4

1.3.2 Quantité des données ........................................................................................... 4

1.3.3 Collecte des données ............................................................................................. 4

1.3.4 Différents mode de collecte de l’information .................................................... 5

1.1 Objet de la statistique

Pour tirer des informations chiffrées utilisables du rassemblement d’observations

Les éléments appartenant à cet ensemble homogène sont ensuite ordonnés et

La statistique ne s’intéresse qu’aux ensembles nombreux. La statistique a acquis

Eléments de statistiques pour les « non-initiés » 2

de masses dont le développement est une caractéristique essentielle de l’évolution

1.2 Les applications de la statistique dans le domaine sportif

La statistique se propose de classer les données, de les organiser et de les

La statistique est à la base du système d’information des organisations sportives :

Le système d’information statistique externe, organisé sur une base nationale et

Eléments de statistiques pour les « non-initiés » 3

1.3 La collecte de l’information

1.3.1 Objectif de l’information

Il importe, dès le départ, de bien définire l’objectif ou les objectifs de l’étude,

Exemple 1 : Si l’on réalise une enquête sur les paramètres anthropométriques

1.3.2 Quantité des données

1.3.3 Collecte des données

Eléments de statistiques pour les « non-initiés » 4

souvent question de tester un questionnaire sur quelques personnes avant de le

1.3.4 Différents mode de collecte de l’information

 Les résultats statistiques peuvent être obtenus à partir d’une enquête

 De même, l’enquête peut être exhaustive ou partielle. L’enquête exhaustive

BURTSCHY B., DUSSAIX A.-M., GRELET Y., GROSBRAS J.-M., LLIAKOPOULOS

FOURASTIÉ J., SAHLER B.: Probabilités et statistique, Éditions Dunod, 1981.

GUI-DIBY M.-N., Cours de statistique descriptive, polycopié, Institut Sous-régional de

Eléments de statistiques pour les « non-initiés » 5

2.1 Population .................................................................................................................... 7

2.2 Caractères ..................................................................................................................... 7

2.3 Modalités ...................................................................................................................... 8

2.4 Tableaux statistiques ................................................................................................... 9

2.5 Les différents types de caractères et de variables statistiques ............................ 12

2.5.1 Les caractères qualitatifs, les codes et les nomenclatures.............................. 12

2.5.2 Les caractères quantitatifs .................................................................................. 14

2.5.2.1 Les variables statistiques discrètes ............................................................. 14

2.5.2.2 Les variables statistiques continues ............................................................ 15

Comme toute science, la statistique fait appel à un vocabulaire spécialisé. Les

On emploiera les termes de population et d’individus aussi bien lorsqu’il s’agit

Eléments de statistiques à l’usage des étudiants des écoles professionnelles 7

de classification aboutit à la confection de tableaux statistiques. Le classement peut se