Académique Documents
Professionnel Documents
Culture Documents
Notes de cours de
Statistique Descriptive
Avec exercices
Par
PLAN DU COURS
CHAPITRE I: GENERALITES
1. NOTIONS DE VARIABLES
IV.1. NOTIONS
IV.2.1. DEFINITIONS
A. GENERALITES
IV.2.3. LA MEDIANE
A. GENERALITES
4
B. CALCULS DE MEDIANE
IV.2.4. LE MODE
A. GENERALITES
B. CALCULS DU MODE
IV.3.1. NOTIONS
A. ETENDUE DE VARIATION
C. ECART-TYPE ET VARIANCE
B. ECART REDUIT
C. INDICE DE DISPERSION
A. DISTRIBUTION NORMALE
B. DISTRIBUTIONS DISSYMETRIQUES
A. LES PRIX
B. LES QUANTITES
C. LES VALEURS
INTRODUCTION
Le terme statistique tire son origine du mot allemand statistik, utilisé pour décrire les
données numériques (chiffrées) portant notamment sur les caractéristiques
économiques, sociales, politique ou culturelles d’un lieu précis.
On emploi aussi le mot statistique pour résumer une grande quantité de données à
l’aide des mesures récapitulatives appelées statistiques descriptives.
A. Objectif Général:
B. Objetifs specifiques:
L'étudiant qui aura suivi et participé activement aux séances de ces cours de
Statistique descriptive, devrait être en mesure de:
CHAPITRE I : GENERALITES
1. La statistique est une branche des mathématiques. Elle utilise donc des
nombres, les mesures et les graphiques;
2. la statistique concerne l'étude de grands ensembles de faits, d'objets, de
personnes; elle néglige les cas particuliers et les individus pris isolement. Elle
dispose de techniques de collecte, de classification, de présentation et de
traitement de données;
3. La statistique nous permet d'effectuer des mesures. A cette fin, la population
étudiée et les indicateurs employés doivent être définis avec rigueur et sans
ambigüité;
4. La statistique nous permet de généraliser des résultats provenant d'un petit
ensemble (l'échantillon) à un ensemble plus vaste (la population).
C'est fort de tout ceci que certains auteurs (Lind et al., 2007) considèrent la statistique
comme un art et une science ayant pour objet de collecter, d’organiser et d’analyser
des données, de tirer des conclusions pour une population à partir de données
provenant d’un échantillon, de formuler des prévisions et d’analyser des politiques.
- Le terme “Statistique” est utilisé au pluriel (les statistiques) pour désigner des
collections de chiffres sous forme de tableaux, parfois sous forme de graphiques, et
qui regroupent toutes les observations effectuées sur les faits nombreux, relatifs à un
même phénomène. Dans ce cas, il s'agit des valeurs numériques relatives à un
phénomène social, physique, professionnel, économique, éducationnel, etc.
La statistique traite des chiffres, des nombres issus d’une collecte et dépouillement,
de manière à aboutir à des rapports numériques qui ne couvrent pas assez d’
imperfections dues au facteur du hasard ou peu scientifique, et qui confirment le
rapport cause-à-effet des observations régulières. L'Analyse Statistique s'occupe donc
uniquement des chiffres ou valeurs quantitatives, lesquelles sont supposées être
objectivement collectées, et dénuées de tous sentiments.
En tant que science, la Statistique est un ensemble des procédés, des méthodes
scientifiques, des techniques ayant pour but l’étude mathématique à partir de laquelle
on recueille, organise, résume, présente et analyse des données numériques relatives
à un phénomène aléatoire et qui permet d’établir des relations de causalité et de
prendre des décisions judicieuses. Voici donc les opérations principales d'un
processus d’analyse statistique :
Les méthodes de nature qualitative ont pour objet d'expliquer le pourquoi des choses
et les interactions entre les phénomènes, de donner un sens aux liens, aux similarités
ou aux différences qui ont été établies par la quantification.
Cependant, l'utilisation des chiffres n'est pas réservée aux seules sciences
quantitatives ; les sciences qualitatives aussi y font recours, même si dans ce cas, les
chiffres n'ont pas de valeurs quantitatives; ils sont nécessaires pour codifier les faits,
ou autres opérations.
forme de tableau ou sous forme des graphiques ou des diagrammes pour décrire les
structures qui se cachent dans les données.
- La statistique inductive ou inférentielle a pour but de tirer des conclusions sur une
population à partir des faits quantitatifs étudiés d’un échantillon des données.
1. Population
Elle correspond aux 2. Echantillon
différents poids de
sgffr
tous les étudiants de Un échantillon de 200 étudiants est tiré
l’ISC. La moyenne est
inconnue.
Ainsi donc, selon la nature des données et les résultats attendus, on fait appel à des
approches statistiques : la statistique descriptive qui permet de décrire ou d'étudier
un échantillon à partir des données collectées. Cette description se fait à travers la
présentation des données (la plus synthétique possible), leur représentation graphique
et le calcul des résumés numériques. La statistique inductive ou inférentielle qui
utilise les données d'un sous-ensemble pour en induire les caractéristiques de
l'ensemble global (un sondage).
Actuellement la statistique est bien plus qu'une science ou art; elle s’est développée
comme une méthode scientifique d’analyse s’appliquant très largement à l’économie
et à toutes les sciences sociales et de la nature. Concernant les domaines, les
statistiques restent transversales, elles intéressent tous les domaines y compris
ceux qui sont restés méfiants vis-vis d'elles.
11
L'importance accordée de nos jours, à la qualité fait de son contrôle une application
primordiale de la statistique, dans la gestion de la production. De nombreux
graphiques de contrôle de la qualité sont utilisés pour vérifier les caractéristiques du
produit fini dans un processus de production.
En ce qui concerne les finances, presque toutes les opérations financières font recours
aux valeurs quantitatives. Les analystes financiers utilisent des informations
statistiques diverses pour orienter leurs recommandations en matière
d'investissements.
En marketing, des informations fournies par les relevés des caisses ou les marchés
peuvent donner les indications importantes sur les types de produits, les besoins des
consommateurs, les relations entre ventes et promotion. On peut, à partir de ces
informations, établir les futures stratégies commerciales. La notion d'échantillon est
une émanation de la Statistique.
Aussi, les scanners électroniques des caisses enregistreuses dans les commerces
collectent des données utilisées dans de nombreuses applications de recherche en
marketing. Des producteurs dépensent beaucoup d'argent par catégorie de produit
pour obtenir un type quelconque de données scannées. Ils achètent également des
données et des conclusions statistiques relatives aux activités promotionnelles, telles
que les offres spéciales des magasins. Les fabricants des produits peuvent examiner
les conclusions des études statistiques menées à partir des données scannées afin de
mieux comprendre la relation entre vente et promotion. De telles analyses se révèlent
souvent utiles pour établir les futures stratégies commerciales des produits concernés.
13
Dans une étude, la variable est une caractéristique des éléments à laquelle on
s’intéresse. Après avoir identifié avec précision l’objet de son étude et son
échantillon, on peut passer à l’étude des certaines qualités, certains attributions ou
certaines caractéristiques que possèdent les individus observés. C’est ce qu’on
appelle les variables statistiques. Une variable est un facteur susceptible de
fluctuation. En statistique, elle est une modalité à laquelle on peut attribuer plusieurs
valeurs différentes, plusieurs niveaux.
Elles donnent lieu aux chiffres ou valeurs numériques (exemples, l'âge, la taille, les
cotes des étudiants, les salaires, etc)
- les variables qualitatives : sont des données observables, mais non mesurables.
( exemples, le sexe: filles-garçons; couleurs, nationalité, province d'origine, tributs,
etc.). Une variable est dite qualitative si ses différentes formes sont des catégories des
attributs qui ne sont habituellement pas des mesures à l'aide de nombres.
Une variable qualitative est dite ordinale si les différentes formes qu'elle prend
peuvent être ordonnées;
Une variable qualitative est dite nominale, Ce sont des caractères qu’on ne peut
pas quantifier avec exactitude
Cependant, on peut parfois, pour des raisons d'utilisation, attribuer des codes, de
manière arbitraire de nombres aux différentes modalités qu’elle peut prendre pour
les distinguer.
Une variable quantitative continue c'est un caractère qui peut prendre n’importe
quelle valeur numérique, c'est-a-dire qui accepte de prendre des valeurs décimales.
C’est une grandeur variable qui change par graduation ou encore une grandeur qui
accepte des divisions aussi petites que possibles.
Une variable quantitative discontinue ou discrète est une grandeur qui change par
saut ou encore qui n’accepte pas de valeurs décimales, ni le sectionnement.
Exemples : le nombre de travailleurs, ou de véhicules, d'ordinateurs, etc.
Une étude basée sur toute la population mère est appelée “recensement”.
Si les mesures sont calculées a partir de données issues d'une population, on parle de
paramètre de la population. Cela est possible, lorsque cette population est
relativement petite.
Ainsi, une population d’étude n'est pas nécessairement humaine; plutôt, elle peut être
constituée des êtres humains, des objets et autres êtres inanimés. Ce terme désigne
l’ensemble des éléments (hommes, animal, choses, plantes…) qui possèdent les
caractéristiques qu’on veut observer ou étudier. C’est l’univers total des observations.
On appelle «paramètre» une valeur caractéristique de la population.
N.B. Une population doit être bien définie avec précision, des le départ; et elle doit
être homogène au regard des caractères étudiés. Un élément d'une population
d'étude s'appelle “unité statistique” Une population mère d'études doit être
homogène, car elle doit contenir des individus ayant les mêmes caractéristiques de
base.
1. Des ressources limitées : baser son étude sur la population entière, surtout
lorsque cette population mère est vaste, peut s'avérer une tâche couteuse: les
moyens financiers et matériel disponibles et même le temps peuvent paraitre
énormes.
17
2. Rareté : quelques fois, on ne dispose que d’un échantillon très petit suite à
l’indisponibilité de la population.
En fait, extraire un échantillon de mesures, c’est faire en sorte que l’on retrouve dans
l’échantillon les différentes mesures possibles dans des propositions identiques à
celles de l’ensemble de la population. Dans la pratique le point de départ est souvent
un échantillon limité de mesures et on fait l’hypothèse que celui-ci est extrait au
hasard et est représentatif d’un ensemble parent théorique.
Un échantillon est dit probabiliste ou aléatoire lorsque tous les éléments de l’univers
défini ont une chance égale de faire partie de cet échantillon: les individus sont donc
tirés, les uns après les autres, pour faire partie de l'échantillon. Le choix se fait par
tirage exhaustif (sans remise ou remplacement) soit par tirage non exhaustif
(avec remise ou remplacement). Dans le premier cas, chaque individu tiré une fois
ne peut l’être une nouvelle fois. Dans le second cas, après chaque tirage, la
population initiale est reconstituée.
Un échantillon est dit représentatif d’une population pour un caractère, s’il n’y a
aucune raison de penser que la valeur de ce caractère puisse différer dans
l’échantillon et dans la population, plutôt, cet échantillon couvre l'essentiel, si pas
toutes les caractéristiques de base de la population parente.
L'échantillonnage aléatoire simple est l’une des plus courantes techniques utilisées
pour sélectionner un échantillon dans une population. La procédure de sélection varie
selon que la population est finie ou infinie.
Avec une population finie, tous les sujets ont la même probabilité d’être
sélectionnés. Seuls les échantillons avec «remise» sont strictement des échantillons
aléatoires simples.
Une population est considérée comme infinie s’il est impossible de compter les
éléments de sa population. Dans cet échantillon, chaque élément sélectionné doit
provenir de la même population et chaque élément est sélectionné de manière
indépendante. En pratique, on ne peut pas utiliser la même procédure de sélection
parce qu’il est impossible d’énumérer toute la population, a cause du caractère infini
de la population: comment sélectionner des individus qu'on ne connait pas? Dans ce
cas, on recourt à des estimations.
commodité peut fournir de bons résultats aussi bien que de mauvais. Cependant, il est
impossible d’évaluer le degré de représentativité de l’échantillon dans la population.
Par conséquent, aucune procédure statistique bien fondée ne permet de faire une
analyse probabiliste. On peut citer ici:
2. L’échantillon par choix raisonné, lequel est très répandu dans les études du
marché, cet échantillon restreint est basé sur le choix des unités les plus
représentatives de l’ensemble au lieu de se fixer au hasard. On se sert des
techniques de quotas, échantillon de convenance, méthodes des unités-types
(partages de l’ensemble en groupes homogènes et à choisir dans chaque groupe une
unité statistique représentative du groupe).
Les différentes formes que peut revêtir une variable qualitative sont appelées
modalités ; celles d'une variable qualitative doivent être exhaustives et mutuellement
exclusives: toute donnée, toute forme de la variable une unité statistique doit pouvoir
être placée dans une seule exhaustivité ou modalité : on est “garçon” ou “fille”, pas le
deux, a la fois.
Tout individu, objet ou mesure est inclus dans une seule catégorie.
Exemple: le sexe , les numéros des joueurs, les marques de voiture etc.
C’est une manière la plus simple d’assigner les nombres à des objets ou d’utiliser ces
nombres comme substituts de ces objets. Ces données sont soit numériques, soit
alphabétiques, soit alphanumériques: comme nous allons faire subir un traitement
statistique aux variables qualitatives, nous devons associer un nombre à chacune de
leurs modalités. Lorsque les modalités ne présentent pas de hiérarchie, on utilise une
échelle nominale, et on attribue de façon arbitraire un code distinct à chacune des
modalités. Ces codes sont utilisés comme étiquettes distinctives et aucune opération
mathématique n’est possible car elle n’aurait aucune signification.
Dans une échelle nominale, on peut distinguer deux types de variables : des variables
qui possèdent seulement deux modalités naturelles, on les appelle variables
nominales dichotomiques (le sexe a deux modalités : masculin et féminin) et des
variables de plus de deux modalités sont dites multichotomiques. (état civil : marié,
célibataire, veuf, divorcé).
21
2. Echelle ordinale
Exemple : Les rangs obtenus après un classement en classes d’école primaire : 1ère,
2ème, 3ème , etc. - opinion sur le goût d’un produit jugé « excellent », « très bon », «
bon », « assez bon », « mauvais », « médiocre ».
- Seules les valeurs des évaluations sont comparables et nonnpas les différences entre
les valeurs des évaluations
- On ne peut pas effectuer d’opérations arithmétiques sur les donnée mis à part le fait
d’établie des inégalités. La soustraction et l’addition n’ont aucune signification.
1. Echelles d’intervalle
Les formes prises par la variable quantitative (continue ou discontinue) sont de nature
numérique et portent le nom de “valeur”, plutôt que celui de modalité (réservée a la
variable qualitative). Pour mesurer une variable quantitative, nous disposons, en plus
des échelles nominales et ordinales, de deux autres types d'échelles de mesure qu'on
dit quantitatives ou métriques: les échelles d'intervalle et de rapport.
L’échelle d'intervalles permet de quantifier des écarts. Cette échelle est caractérisée
par la présence d'unité de mesure normalisée et d'un point de référence fixe de
22
- les différences équivalentes sur le plan des attributs mesurés sont représentées par
les différences égales dans les nombres attribués aux catégories
- l’addition et la soustraction ont du sens, mais les rapports entre deux valeurs n’en
ont pas.
Celle-ci est la plus puissante échelle ou la plus précise des échelles qui sont utilisées.
Ce type d'échelle se caractérise par la présence d'un zero absolu, c'est-a-dire qui
signifie l'absence du caractère étudié. Ceci permet d'effectuer d'autres opérations
sur les mesures (des multiplications et des divisions). Le zero absolu dénote une
absence totale. L'échelle de rapports autorise des comparaisons du type “ tel individu
est deux fois plus grand...que l'autre”; “telle famille a deux ou trois fois plus d'enfants
que l'autre”.
23
Parfois les données nécessaires à une étude particulière ne sont pas disponibles
auprès des sources existantes. Dans ce cas, les données peuvent être obtenues en
effectuant des études statistiques. Ce sont des données primaires, collectées
directement par le chercheur après enquête. Dans ce cas, on distingue deux types
d’études statistiques : les études expérimentales et les études empiriques
Dans une étude statistique expérimentale, on identifie en premier lieu la variable qui
nous intéresse, c’est la variable dépendante; ensuite, une ou plusieurs variables sont
identifiées et contrôlées de sorte à obtenir des données concernant leur influence sur
la variable considérée. Ce sont des variables indépendantes. La variable
indépendante est celle qui cause les variations de la variable dépendante et qui n’est
pas maîtrisée. C’est donc un ensemble des facteurs exogènes (en opposition aux
facteurs endogènes).
Exemple : En étudiant l’évolution des ventes de la bière dans un bar (variable dépendante),
on constate que elles peuvent être influencées par plusieurs facteurs notamment le prix, la
demande, la qualité, la température etc.(variables indépendantes).
24
Dans une étude statistique non expérimentale ou empirique, on procède soit aux
enquêtes par recensement c'est-à-dire par investigation exhaustive (étude complète
de la population ou des unités statistiques) soit par sondage, investigation partielle,
(étude partielle de la population ou des unités statistiques) en se servant des données
des observations, d’un questionnaire oral ou écrit. C'est toujours sous une forme
éparse et chaotique que les données collectées apparaissent. Il va faudrait donc les
arranger, les ordonner pour une meilleure exploitation.
III.1. 2. LE DEPOUILLEMENT
On distingue :
Exemple :
Ex :
d) Tableau statistique
Lors du dépouillement, la façon la plus simple pour ordonner les données ou chiffres
qui ont été récoltés c’est de les présenter sous forme d’un tableau appelé tableau
statistique ou tableau de distribution de fréquence ou simplement tableau de
fréquence.
Exemple : Voici les données sur l’opinion de quelques Kinois sur la qualité de l’eau
fournie par la REGIDESO:
On attribue les codes suivants : Très satisfait =1 ; peu satisfait =2 ; pas satisfait =3
Total
On distingue trois cas pour ce type de variable : données non groupées, données
groupées non classifiées et données groupées classifiées
Lorsque la masse de données chiffrées n'est pas si énorme, elles peuvent être traitées
sans inquiétude, ni besoin de les grouper. Une série non groupée n'a pas d'effectifs,
car les variables sont reprises individuellement telles qu'elles ont apparu dans
l'observation. Certains travaux à réaliser à partir de cette série peuvent nécessiter
simplement un arrangement, en établissant un ordre (croissant ou décroissant).
Après la collecte des données, le chercheur dispose d'une masse désordonnée des
chiffres; lesquelles données n'ont en général aucune signification. Pour leur attribuer
une certaine signification, le chercheur devrait les organiser en tableaux.
La nécessite de regrouper les données chiffrées dans une série statistique se justifie
lorsqu'il y a des notes qui se répètent en grands nombres. Ces variables qui
reviennent plusieurs fois dans l'observation devraient être groupées. Des lors, la série
est groupée, en vue de pouvoir économiser les places ou les espaces.
il n’est pas nécessaire de regrouper les données en classes. L'on peut donc reprendre
les modalités des variables individuellement, et y adjoindre les effectifs respectifs,
selon leurs apparitions dans l'observation: à chaque Valeur de la variable (X)
correspondrait donc un effectif simple (n ou f). Dans ce cas, on suppose que
l'intervalle (i) est de 1.
27
Exemple : Etablir le tableau de fréquence sur la durée de temps d’attente par les
malades dans un hôpital de la place.
X Dépouillement f
par trait
4
5
6
7
8
9
10
TOTAL
Commentaries:
Exemple : Voici les salaires des travailleurs d’une entreprise exprimés en $US. 149
150 147 152 153 155 156 157 159 160 161 161 162 162 162 163 164 164 165 165
165 166 166 166 166 167 186 167 168 168 168 169 169 170 170 171 171 171 171
173 186 174 174 174 176 177 177 179 182 184 184
Diviseurs 2, 3,4 4, 5,6 6, 7,8 8, 9,10 10, 11,12 12, 13, 14, 13, 14, 15,16
Q = E/D
N.B. Quelle que soit la méthode, on choisira un diviseur qui donne un quotient
impair plus petit arrondi à l’unité. C’est l’intervalle des classes tandis que le
diviseur choisi + 1 donne le nombre des classes.
Dans cet exemple, le quotient impair le plus petit, i = 5
2ère méthode : Dans ce cas, on considère soit la limite inférieure soit supérieure
comme centre de classe et on détermine les limites à partir de la valeur de i
Il est conseillé de garder une valeur impaire de i pour avoir un centre de classe entier.
Dans l’exemple : i= 5 li = 147 On aura : 145 146 147 148 149
La 1ère classe devient : 145 - 149
4. le dépouillement :
41, 102, 83, 66, 98, 74, 77, 80, 67, 96, 73, 78, 93, 70, 65, 71, 72, 60, 77, 90, 64, 73,
74, 61, 75, 71, 55, 89, 67, 43, 68, 66, 76, 75, 61, 88, 85, 58, 78, 80, 69, 72, 82, 73, 78,
88, 71, 84, 50, 77, 70, 73, 57, 53, 47, 64, 86, 72, 79, 59, 67, 62.
30
Il existe des règles pour arrondir des nombres décimaux, en statistique plus que dans
d'autres disciplines du savoir humain. De ce fait, l'opération d'arrondissement des
chiffres doit être basée sur des principes rigides que nous devrions respecter
scrupuleusement:
Ex. 3,17 devient 3, 2; 6,06 devient 6,1 et 5, 75 devient 5,8 alors que 5,85 demeure
5,8, car la priorité est accordée aux chiffres pairs.
Ex. 5, 148 devient 5,15; 6,048 devient 6,05; et 2,1827 devient 2,18, alors que 2,1857
devient 2,19.
C’est la différence entre les limites exactes. Dans notre exemple : 44,5-39,5 = 5.
L’effectif simple (n) ou fréquence absolue (f), sont les nombres de fois
qu'apparaissent les valeurs des variables (X) dans une observation. La connaissance
des effectifs simples nous permet de répondre a la question du genre “combien
sont...” ou “combien ont...”
Les proportions sont trouvées sous la même logique que les fréquences relatives,
en divisant chaque effectif simple par le total et sont comprises entre 0 et 1; leur total
étant égal à 1. p= f/N
Les pourcentages sont trouvés en multipliant les proportions par 100, c'est-a-dire en
avançant la virgule de deux rangs à droite. Exemple, si p= 0,25; % de cette
proportion égale 25%; et si p= 0,456, c.à.d. 45,6%.
f
% = x 100
N
Effectifs marginaux : ce sont des totaux des effectifs en marge de chaque colonne
ou de chaque ligne.
ETUDIANTS L1 L2 Effectifs
marginaux
Filles 232 234 466
Garcons 533 335 868
Effectifs marginaux 765 569 1.334
5 . Effectifs cumulés
Les effectifs cumulés (nc) ou fréquences cumulées (fc) sont des additions
successives des effectifs ou fréquences simples. Leur connaissance nous permet de
répondre au genre des questions telles que combien d'étudiants ont plus de 23 ans?
Combien ont moins de 20 ans?, etc.
32
Chaque dernière case des effectifs cumulés (croissants et décroissants) doit être égale
au total d'effectifs (N).
X f xc fr % fc fc % fc % fc
ou P
Somme
(Σ)
33
Commentaires
Lorsqu'on effectue une enquête, on recueille souvent des informations sur plus d'une
caractéristique des unités statistiques. Il est possible d'observer sur chaque unité ou
modalité de variable, deux possibilités. Ce genre de tableaux permet de comparer ou
établir des liens entre ces deux variables.
L'unité statistique est considérée en fonction de ces deux modalités: une du caractère
X et une autre du caractère Y; il convient de présenter de telles séries dans un tableau
qui a deux entrées.
Exemple: Répartition des étudiants HEC selon leur sexe et leurs sections.
Section Gestion Info.(J/S) Secretariat Ressources Total
Sexe (J/S) Hum.(J/S)
Commentaires :
1920 12000
Commentaires :
2021 13500
2022 15000
2023 15800
34
Comme les tableaux, les graphiques servent à organiser et à traiter des données ainsi
qu'à les présenter sous une forme permettant de saisir au premier coup d'œil les
principales caractéristiques d'un phénomène, telle que l'évolution, les comparaisons,
etc. Il en existe des normes pour bien dresser un graphique.
Les coordonnées sont deux axes qui se rencontrent en formant un angle droit. On appelle l'axe
horizontal, l'axe des abscisses ou l’ axe des x, on appelle l'axe vertical, des ordonnées ou des Y.
Le tracé: illustre des variations de la variable. Le tracé peut selon le cas être composé des
points, des droites, des courbes, etc. Lorsqu'on a ordonné les valeurs d'une variable, il est aussi
On obtient, une représentation très concrète, et compréhensible des données qui, sous d'autres forme
Impénétrables, en particulier lorsque le nombre des données est très élevé. Donc les graphiques
sont des représentations imagées des données inscrites dans des tableaux statistiques. La représentati
graphiquement les données numériques
Dans l'un ou l'autre cas, la présentation s'établit à partir du tableau des fréquences.
le polygone d’effectifs
Ces graphiques sont dressés sur base de Coordonnées abscisses OX et ordonnées OY.
Sur les coordonnées, nous portons en abscisses des points représentants les valeurs ou aspects de
la variable (1, 2, 3, 4, 5....) à partir de chacun de ces points nous élevons parallèlement à l'axe des
No m b r e d ’ e n f a n t s Ef f e c t i f s Ef f e c t i f c u m u l é
1 5 5
2 17 22
3 31 53
4 11 84
5 4 88
6 1 89
N= 8 9
Sur l’axe des abscisses plaçons les points correspondants aux valeurs du caractère
1, 2, 3, 4, 5,6. A chacun de ces points traçons parallèlement à l’axe des ordonnées
un bâton de longueur proportionnelle à l’effectif correspondant.
Nous obtiendrons un diagramme en bâtons.
Au lieu des bâtons, les lignes peuvent être remplacées par les colonnes ou des
rectangles qui ne se touchent pas et qui sont placés l’un à côté de l’autre. On opte
pour ce type de représentation à cause de la facilité de comparaison visuelle.
0 1 2 3 4 5
6 x x X
B) Histogramme (variable statistique continue)
Ou diagramme à rectangle continus. Il est obtenu à partir d’une série groupée
classifiée uniquement, car ce sont des limites de classes qui en constituent les bases des
rectangles. Un histogramme est conçu de la manière suivante :
Il comporte deux axes orthogonaux et l'échelle des classes est portée en ordonnée.
Chaque classe est représentée par un rectangle dont la base est égale à l'intervalle
de classe et la hauteur Proportionnelle de son effectif.
60
45
50
40
36
30
27
20 18
10 9 9
3
0 20 25 30 35 40 45 50 60
55
50
45
40
30
20
10
15 20 25 30 35 40 45 50 55 60 65
0
Sont élaborés à l'aide des figures géométrique : cercle, carré, figures, etc.
a) Graph ique circ ulair e ou à secte urs ( une s eule sé rie d e do nnée s )
TOTAL
des angles de 30 degrés à partir du centre. Ainsi, une année est une rotation complète
de 360 degrés.
Exemple : La production en milliers de tonnes de bière de Primus et de Skol, en 1984
et 1985.
Mois Jan Fév. Mars Avr. Mai Juin Juil. Aout Sept. Oct. Nov. Dé c .
1984 18 23 25 22 25 25 15 15 29 25 25 33
1985 25 26 35 28 30 23 29 29 30 43 34 20
Il existe en outre,
-des graphiques triangulaires (lorsque la variable d’étude est divisée en trois
composantes :
ex. publicité : affiches, cadeaux, annonces ;
Actif : mobiliers, réalisables disponibles ;
Passif : capitaux propres, dette a long terme, dette a court terme)
Somme toute, lorsqu’on voudrait représenter les données statistiques, il est conseillé
d’utiliser à la fois les trois modes de représentation : les tableaux, puis les graphiques
et enfin les textes de commentaires pour interpréter les graphiques et les tableaux. Il
convient de représenter les petits tableaux détaillés, avant d’en prendre un plus
synthétique. En ce qui concerne le dressage des graphiques, il convient d’avoir les
valeurs de i égales dans une même série. Si les valeurs sont inégales, on doit procéder
à la correction des effectifs. Le graphique ne sera dressé qu’a l’aide des effectifs
corrigés. On se réfère à l’effectif qui se répète le plus (priorité nombre impair).
41
1.1. NOTIONS
L a p r é se n t a t i o n d e s s é r i e s s ta t i s t i q ue s p a r d e s t a bl e a u x t ra d u i t de f aç on
i n s u f f i s a n te l e s p h é no m è n e s s t at i s t i q u es , s u r t o u t l o r s q u e l e s v a l e u r s a c c u s é e s
p a r l a v a r i a b l e s o n t n o m b r e u s e s ( o u lorsque les classes sont nombreuses). La
représentation graph ique marque un p rogrès dans cette traduction des
phénomènes statistiques.
Il est cependant certain qu'on a intérêt à essayer de caractériser, de résumer une série
statistique par quelques nombres. Ainsi, cherche-t-on à résumer globalement une série
au moyen de caractéristiques. Une caractéristique doit être un bon résumé de la
s é r i e e t sa d é te r m i na t io n d o i t ê t re c o m mo d e .
On distingue :
- l e s c a r a c t é r i s t i q u e s d e pos iti on ou te nda nc e ce ntr al e qu i résu me un e sé rie
par un seul nombre : moyenne, mode et médiane.
- les caractéris tiq u es de dispersion qui corrigent les caractéristiques de
p o s i t i o n p a r l ' e x a m e n d e « di s p er s i o n » o u « é t a l em e n t » d e l a sé r ie .
1 . L A M O Y E NN E
La moyenne est l'indice global le plus utilisé. Elle est définie comme le
quotient de la somme des données (x) par le nombre de données (N). La
moyenne s'exprime toujours en termes de mesure de la variable.
Ex. 45,67 Francs Congolais ; 67,12 véhicules.
42
A. Sortes et calculs
-
1 . L A M O Y EN N E AR I T H M E T I Q U E ( X ou M o u M a)
N o u s c o n s i d é r o n s 3 c as :
Moyenne Arithmétique Simple
X- = 46+54+42+46+42 = 4 6 $
5
Cette méthode est sans doute très simple mais elle peut devenir fastidieuse si le
nombre de mesure est important et si chaque mesure compte beaucoup de chiffres.
fx
X= ou X = ∑ X fr.
N
X f fx fr Xfr
10 4
15 7
20 10
25 18
30 5
35 6
Σ= Σ=
Moyenne =
43
fxc
X= où
N
X : moyenne
N : nombre total de scores
f : fréquence de chaque classe ou n(effectif)
Xc : points milieux des classes (valeurs centrales)
Exemple :
X f Xf f(xc)
25-29 1
X =
30-34 6
35-39 7
40-44 2
45-49 4
50-54 10
N=30 Σ=
Méthode de codage :
fx ' Xc − X 0
X= X0 + i avec X’ =
N i
- les Xc sont les valeurs centrales des classes
- i est l’intervalle de classe : dans notre exemple i= 10
- Xo est la valeur centrale de la classe centrale (Celle qui divise les observation
en 50%)
X f fc Xc X’ f X’
20-29 3 3 24,5 -3
30-39 6 9 34,5 -2
40-49 13 22 44,5 -1
50-59 21 43 54,5 0
60-69 15 58 64,5 +1
70-79 5 63 74,5 +2
80-89 2 65 84,5 +3
Totaux N= 65 65/2
= 32,5
Une moyenne arithmétique pondérée est nécessaire, lorsqu’on est en face des
données qui ont des pondérations mises entre parenthèses.
# S éri es n on g ro up ée s:
∑p
4+8+2 + 2 + 2 18
# Sér ie s gr ou pé es
La même formule, mais si les notes sont classifiées, on utilise les valeurs centrales
X 1,64 1,68 1,73 1,77 1,83 1,86 1,91 1,97 2,03 2,05 Total
P 10 70 50 8 110 200 140 100 30 10 728
Xp 16,4 117,6 86,5 14,1 210,3 372 267,4 197 60,9 20,5 1355,76
Ma p=
Map=
46
N.B. Le logarithme est l’exposant auquel il faut élever la base pour avoir ce nombre.
Le logarithme d’un produit est égal a la somme des logarithmes.
Exemple :
1) X=8, 5, 3, 2, 7
5 5
Mg=√8x5x3x2x7 = √1680
On peut aussi procéder par la méthode d’estimation, cad sans racine carrée
Exemple : Soit la population d’une zone en 1980 : 40.000 habitants. Si elle augmente
de 5%, dites les populations de cette zone en 1982, 1983 et 1984. Dites aussi ces
populations en 1982, si on sait celles de 1984 et 1980.
Solution :
1981 : 40.000x1.05= 42000 habitants.
1982 : 42.000x 1.05= 441.000 habitants ;
1983 : 441.000x1.05= 46.305 habitants ;
1984 : 46.305x1,05= 48.620,25 habitants ; soit 48.621 habitants.
2
De 1982= √40.000x48.621 = 441.000 habitants.
Dans une série groupée, la moyenne géométrique, c’est la racine de la somme
nième du produit des nombres avec leurs effectifs simples
∑n
Sans log= √n1X1 . n2X2. n3X3….nnXn
∑p
Sans log : Mgp=√X1p1.X2p2.X3p3……..Xnpn
Avec log. Log Mg= ∑(p(logX))/ ∑p
47
Critiques :
La moyenne géométrique présente quelques inconvénients qui sont les
suivants :
- Elle a des calculs difficiles et compliques avec des logarithmes ;
- Elle se fait absorber en cas de note nulle (cad s’il y a un zéro quelque part,
cette moyenne est égale a 0 a cause des multiplications) ;
- Elle a tendance a atténuer le mouvement de la hausse au profit du mouvement
de la baisse. C’est l’inverse de la moyenne arithmétique.
Q= √21915/25 = 29,61
Qp=√∑(pX)/ ∑p
48
4. MO YE N NE S HA R MO NI QU E S ( H o u Mh )
Dans une série non groupée, elle représente l’inverse de la moyenne arithmétique des
inverses des nombres.
Formule : H = N
∑ (1//Xi )
X= 4, 7, 8, 9
Cette logique est fausse ; car il faudrait appliquer la formule de la moyenne harmonique.
Hp = ∑p : p/Xi
X 3 4 5
P 3 2 2
∑p = 3+2+2= 7
2. L A ME DI AN E ( Me o u Md n)
La médiane, c'est un point sur l'échelle des résultats divisant cette échelle en deux
parties égales. C'est un point tel qu'au-dessus et en-dessous duquel se trouve 50%
d'observations des résultats des données. L a m édi an e a in si dé fi nie , p ré su pp os e
que l es d on né es s on t arrangées en ordre de grandeur avant les calculs.
Calcul de la médiane
➢ Avantage de la médiane
- Calcul facile
- Donne une idée satisfaisante de la tendance centrale et n’est pas influençable
par les résultats extrêmes (trop grand ou trop petit) ou par le changement d’un
résultat (moyenne).
➢ Inconvénient
2. Données groupées
Me = l1 i
50
l1 : Limite inférieure exacte de la classe médiane (la classe contenant comme Fc).
N : effectif total des données
F : effectif cumulé de la classe immédiatement inférieure à la classe médiane.
f : fréquence absolue de la classe médiane.
i : intervalle contenant la classe médiane.
Exemple :
Ci-dessous la distribution groupée des poids en Kg de 82 personnes.
X f fc
35-59 2 2
60-64 5 7
64-69 9 16
70-74 18 34
75-79 27 61
80-84 15 76
85-89 4 80
90-94 2 82
82
1. N = 82 e t
2. Classe contenant la médiane
3. L1 =75
4. F =34
5. f=27
6. i=5
Me = 75 + (
1. 3. LE MODE : Mo
L e m o d e e s t l a v a l e u r d u c a r a c t è r e ( d o n n é e s q u a l i t a t i v e s ) q u i c o rr e s p o n d
à la fréquence la plus élevée ou c'est la valeur de la variable (données quantitative)
qui correspond à la fréquence la plus élevée. C'est la valeur dominante. Il s'exprime
dans la même unité que la variable.
Calcul du mode :
Lorsque les données n e sont pas groupées, le mode est la valeur la plus fréquente
d a n s u ne s é ri e d ' ob s e rv a t i o n s.
Exem ple :
1) 5 ; 6 ; 4 ; 8 ; 1 5 Pas de mode
2) 5 ; 6 ; 8 ; 1 0 ; 1 0 ; 1 5 Mo = 10 (distribution uni modale)
3) 5 ; 6 ; 6 ; 8 , 1 0 ; 1 5 ; 1 5 Mo = 6 et 15 (distribution bimodale).
4) 5 ; 6 ; 6 ; 8 ; 1 0 ; 1 5 ; 1 5 ; 5 Mo = 5 ; 6 ; 15 (distribution plurimodale
ou multimodale).
2 . D o n n é e s g r o u pé e s u n i m o d al e
Lorsque les observati o ns sont groupées en classe, le mode est le point milieu ou la
valeur centrale de la classe comportant la plus haute fréquence. Cette classe est
appelée « classe modale ».
E x e m p l e s : d e s d o n n ée s g r o u p é e s u n i m o d a l e
X f xc
Mo = 81 ; Le mode est la valeur centrale de la
89-91 3 classe qui a le plus grand nombre de sujet, la
plus haute fréquence, l’effectif le plus élevé.
86-88 5
83-85 8
80-82 10
77-79 7
74-76 4
52
3 . D o n n é e s g r o u pé e s b i m o d al e :
- Si les deux classes ne sont pas adjacentes, le mode est déterminé par la
formule de Pearson : Mo = 3Mdn – 2M
X f xc
89-91 6 Mo = 84+81 = 82,5
86-88 5 2
83-85 10
80-82 10
77-79 7
74-76 4
74-76 4
X f
25-29 3
30-34 10
35-39 5
40-44 10
45-49 7
50-54 4
53
Avantage du mode
- Sa détermination est immédiate. Il n'est pas influencé p arles valeurs
extrêmes ni par les cas aberrants. La recherche du mode peut mettre en relief
l'hétérogénéité d'un groupe.
Inconvénients
- Il n e t ie nt pa s c omp te de t ou tes le s don né es ;
- Il se déplace de façon notoire par groupement en classe ;
- Il possède de signification réelle que si la fréquence correspondante est
nettement supérieure aux autres fréquences.
On peut aussi trouver les valeurs de ces 3 caractéristiques de position, en utilisant des
règles établies par Karl Pearson.
Me = (2M+Me)/3
M = (3Me-Mo)/2
3)Quelle est la note moyenne d’une série dont le mode est 18 et le médian 20 ?
Solution : Mo =
Note : Il convient d’observer que ces trois valeurs des caractéristiques sont proches
les unes des autres : pas trop d’écarts entre ces valeurs de moyenne, médiane et
mode.
54
= 6,14
= 6,14
Les deux séries ont même médiane et même moyenne cependant elles
sont différentes. Les données ne sont pas groupées de la même manière autour de la
moyenne. Il est évident que les mesures des salaires, dans le second établissement
sont plus étalées, plus dispersées autour des valeurs centrales que dans le premier
établissement.
55
Ainsi les indices de dispersion nous disent comment les données individuelles
sont regroupées autour de la moyenne. Pour rappel les caractéristiques de position
nous indiquent la place, la position qu’un individu occupe dans son groupe
d’appartenance, tandis que les caractéristiques de dispersion indiquent comment les
données individuelles sont étalées, dispersées, regroupées autour de la moyenne.
Nous appelons écart x d’une donnée X dans un groupe la différence entre cette
donnée et la moyenne du groupe d’où x’ = X- la moyenne. La dispersion est grande,
lorsque les valeurs des observations sont très variées. Elle est petite si ces valeurs
sont très rapprochées les unes des autres.
Elle est aussi appelée marge de variation. C’est l’écart entre la donnée
la plus basse et la donnée la plus élevée. Cet indice ne convient pas parce qu’il ne
tient compte que de deux données extrême pendant que d’autres aspects statistiques
peuvent être contenus.
Exemple : Dans une usine A qui fabrique des batteries, la production la plus
importante au cours d’un mois est de 52 batteries et la moins importante est de 48
batteries. Dans l’usine B la production la plus importante au cours d’un mois est de
60 batteries et la moins importante est de 40 batteries.
Solution : la moyenne de production dans les deux usines est de 50 batteries/mois
56
C’est la moyenne arithmétique de tous les écarts à la moyenne sans égard à leurs
signes algébrique, on pourrait trouver cet indice en faisant la somme des écarts de
chaque donnée et en divisant par le nombre de données. C’est la grandeur de
déviation et non leur sens positif ou négatif qui importe dans la notion de la
variabilité, la somme des écarts individuels est égale à zéro. Il s’en suit que pour
obtenir une mesure de l’écart des résultats, on fait abstraction des signes des écarts à
la moyenne.
EA M =
Pour trouver l’écart moyen d’un ensemble de données, on commence par calculer la moyenne de l’échantillon.
Ensuite, on calcule l’écart entre chaque observation et la moyenne. On additionne ces écarts, en ignorant les
signes, et l’on divise le résultat obtenu par le nombre d’observation.
Exemple : les salaires de cinq ministres dans une usine d’extraction pétrolières sont les
suivants : 90.000 $, 84.000 $, 86.000 $, 90.000 $, et 82.000$.
Calculez l’Ecart absolu moyen de cet échantillon.
Calcul de la moyenne Moyenne =
EA M =
Salaire ($) f xc fx c x c- x f x c- x
5-9 6
10 - 14 12
15 - 19 19
20 - 24 7
25 -29 3
Total
III.2.3. Variance σ 2
Elle tient compte des signes algébriques des écarts. Si on élève au carré les écarts à
la moyenne arithmétique, on maintient les propriétés algébriques tout en obtenant le
signe positif. C’est sur les écarts au carré que se fonde la variance. Celle-ci est donc
la moyenne arithmétique des carrés des écarts.
σ2 =
ou σ2 = (Xc – X)². f
N-1
Salaire ($) f xc fx c (x c-x ) ( x c- x ) 2 f (xc-x )2
5-9 6
10 - 14 12
15 - 19 19
20 - 24 7
25 -29 3
Total
M o y en n e =
Le Coefficient de variation
Le coefficient de variation est utilisé pour comparer la dispersion dans deux séries
différentes des données. Il mesure l’écart type relatif à la moyenne dans un
échantillon.
Lorsque les unités sont différentes , on doit convertir chacune de ces mesures en
valeur relative appelée coefficient de variation (CV) élaboré par Karl Pearson.
Exemple : une étude menée sur l’importance des primes payées à des années de
service des employés a permis d’obtenir les statistiques suivantes :
La dispersion par rapport à la moyenne est plus grande dans la distribution des
primes versées que dans la distribution des années de service.
On utilise la même méthode lorsque les données sont exprimées dans les mêmes
unités, mais les moyennes sont très différents.
Mina est enseignante. Elle donne deux cours dans un collège de la place.
Communication et Finances. La moyenne des notes de tous les étudiants dans le
cours de Communication orale est de 70,5 et l’écart type est de 5,6. La moyenne des
notes de tous les étudiants dans le cours de Finance est de 90 et l’écart type est de
6,4. Mina aimerait comparer la dispersion relative des notes de ces deux cours à
l’aide du CV.
Ces sont des paramètres qui divisent la série en un certain nombre des parties égales.
On distingue : les quartiles, les déciles et les centiles.
1. Les quartiles
Divisent la série en quatre parties. Et on note ces valeurs par Q1, Q2 et Q3 et on
les appelle respectivement le premier, le deuxième et le troisième quartile.
- le premier quartile Q1 la valeur de la variable telle que 25 % des valeurs prises
par la variable lui soient inférieures et 75% lui soient supérieures.
- Le deuxième quartile (Q2) étant en fait la médiane (Il divise la série en deux
parties égales).
- Le troisième quartile Q3 la valeur de la variable telle que 75 % des valeurs
prises par la variable lui soient inférieures et25% lui soient supérieures
Ces sont les premiers et les troisièmes quartiles qui sont utilisés en
statistique.
2. Les déciles
On appelle déciles, les valeurs qui divisent la série en dix parties égales et on
les notes D1 et D2…. Et D9
3. Les centiles
Ces paramètres divisent la série en 100 parties. On calcule le 1er et le 99ème
centiles. Le calcul des centiles et déciles s’effectue par une méthode
analogue à celle employée dans le calcul de la médiane.
C5 0 =
C7 0 =
61
PARAMETRES DE FORME
❖ Une distribution est dite symétrique, et donc « normale », quand les effectifs
sont distribues symétriquement par rapport a la moyenne, c’est- a-dire quand
les valeurs sont équidistantes (50%-50%) de la moyenne. Dans ce cas , la
moyenne est égale au mode et à la médiane. Par conséquent la valeur
d’une asymétrie est nulle.
Dans le cas d’une distribution non symétrique, la façon dont elle s’éloigne de la
symétrie est appelée « dissymétrie ou asymétrie». Dans les domaines économiques,
sociaux, etc. , la plupart d’histogrammes et courbes ne sont pas symétriques mais
plutôt dissymétriques. On parle des courbes asymétrie positive (asymétrie à droite)
Et asymétrie négative (asymétrie à gauche).
b) Coefficient d’asymétrie.
On parle aussi des courbes asymétrique par rapport à leur hauteur ou voussure :
une courbe de distribution piquée indique peu de variations dans les valeurs, une
distribution relativement homogène, avec beaucoup de valeurs égales ou
proches de la moyenne.
La courbe aplatie suggère des variations importantes, une distribution
relativement hétérogène, avec beaucoup de valeurs éloignées de la moyenne.
65
On appellera de:
On distingue :
Un indice élémentaire peut s’avérer très utile pour suivre l’évolution d’un prix, d’une
quantité ou d’une valeur mais, bien souvent, cet indice ne donne pas une vision
globale du phénomène économique ou social.
On utilise les indices, aussi bien élémentaires, synthétiques que composites, pour
trois grandes catégories de variables: les prix, les quantités et les valeurs
L'indice simple se calcule, lorsqu'on considère une seule grandeur variable dans le
temps et dans l'espace; dans ce cas, le problème est simple, et l'indice est le rapport
entre les deux situations: celle de base et celle actuelle. En général, l'indice de base(
o) est la plus ancienne alors que celle actuelle (1) est la plus récente. L'indice de prix
est le rapport entre le prix d'un article pendant une certaine période (dite période
actuelle) et son prix pendant la période dite de base(plus ancienne).
Exemple: si les prix d'un carton de savons sont respectivement de 50 USD en 2021 et
80 CDF en 2023; calculer son indice de prix, base 100, en année 2021.
Solution:
Interprétation
67
Puisque la signification de prix des articles est fondée sur le 100%, lorsque la réponse
est supérieure à 100%, il s'agit de l'inflation ou hausse de prix. C'est lorsque la valeur
de l'indice est inferieure à100% que l'on parle de baisse de prix. Dans ce cas, on
interprète l'indice comme étant une augmentation (hausse) de prix de ce carton de
savons 67%, de 2021 à 2023.
Iq1/q0=q1/q0 x100
En pratique, on retiendra pour base, non pas une date ou période élémentaire
(semaine→ hebdomadaire; mois→ mensuel; ou année→ annuel), mais plutôt une
période plus large pour éviter des fluctuations accidentelles et saisonnières qui
pourraient advenir, pour perturber la comparaison des observations. Ainsi, pour faire
face a ces dangers, on préfère retenir une année entière, ou une série d'années, même
si on est appelé a choisir une année quelconque, laquelle est jugée être moins
accidentelle ou ayant peu d'irrégularités d'ordre climatique ou économique majeures.
Un indice composite est cette grandeur statistique du niveau d'un phénomène dont
l'étude directe est difficile ou impossible. Il fait intervenir des unités de nature
différentes.
68
Exemples:- le cout de vie; lequel ne fait pas intervenir un seul élément, plutôt
plusieurs facteurs entrent en jeu: aliments, transport, habillement, impôt, soins de
sante, éducation, etc.
- la valeur monétaire.
Tout calcul d'indices doit débuter par une enquête de la structure de consommation.
En République Démocratique du Congo, l'Institut Supérieur de la Statistique (INS)
avait pris en considération notamment la situation politico-économico-sociale.
• la formule de Laspeyres;
• celle de Paasche;
• celle de Fischer qui combine les deux premières.
Ces méthodes sont conformes tant au calcul des indices des prix qu’ celui des
indices des autres grandeurs des biens. Ce sont des méthodes qui utilisent les indices
élémentaires et ceux synthétiques. Elles peuvent être reparties en deux grandes
variétés suivantes:
- Les méthodes de moyennes des indices; et - Les méthodes des sommes des indices.
Lorsqu'on est en présence de plusieurs indices, on peut faire usage des moyennes
pour en ressortir un seul qui représenterait tous les autres indices. Nous allons utiliser
les moyennes arithmétiques simples ou pondérées.
Cette méthode consiste à diviser la somme des prix à la période n par la somme de
prix à la période de base et à exprimer le tout en pourcentage. Ici, l'indice est trouve a
69
partir de l'année de référence (de base), et cette méthode donne lieu a des indices
globaux. Sommes simples
Igp = 1640/920 x 100 = 180,22%; soit une hausse de prix de 80,22%, de 2020 à 2023.
2 Sommes pondérées
Ici, les pondérations sont des facteurs qui peuvent influer sur la valeur de l'article,
comme le carburant, la distance, etc. Cependant, dans certains cas, la quantité est une
pondération.
Exemple: soit le tableau de denrées qui suit. Calculons l'évolution des prix(en
dollars) de ce panier entre 2020 et 2023.
IL= 7380/5313 x 100 = 138,90%; une inflation de 38,90% de prix de denrées, 2020-
2023.
7000
1880 IP= 7000/8000 x 100 = 372,34%; Soit une inflation de 272,34 %, de 2005 à
2010.
71
Exercices d’Application
Quantitatif
Item Qualitatif Quantitatif Type
Caractères continu
discontinu d’échelle
01 Sexe
02 Etat matrimonial
03 Age
04 Taille
05 Couleur des yeux
06 Poids
07 Tensions artérielles
08 Taux de cholestérol
09 Région Habitée
10 Nationalité
11 Chiffre d'affaires
12 Taille des
13 entreprises
14 Revenu familial
15 Nombre de
16 personne habitant
17 une résidence
18 Nombre de place
19 au cinéma
20 Nombre d'enfants
par ménage
b) Pourquoi
6.Voici le nombre de mètres de tissu tissé, par ouvrier, dans un atelier comptant 50
ouvriers.
24 25 29 23 27 25 28 20 29 22
22 24 26 21 32 30 26 25 34 24
26 31 27 35 21 32 30 26 34 26
28 37 28 28 29 26 19 21 30 30
23 20 25 27 17 22 24 20 25 31
Pour "pointer" le nombre d'observations d'une même valeur, utiliser le procédé du
pâturage. Faire le regroupement en classes et compléter le tableau ci-dessous:
Valeurs de X f fr fc % Fc %
73
X F fc fr
La proportion des travailleurs ayant un
20-24 5
salaire compris entre 30$ et 39$ est de :
25-29 12
30-34 8
a) 74% b) 20% c) 16% d) 24%
35-39 12
e) aucune bonne réponse
40-44 6
45-49 7
8.La fréquence relative d'une classe s'obtient en divisant l'effectif de la classe par:
a) L'effectif total?
b) Le nombre des classes?
c) L'amplitude de la classe?
9. les ouvriers d'une entreprise sont repartis en fonctions de leurs salaires horaire,
dans le tableau suivant:
Valeurs 1 2 3 4 5 Total
10,5% 22,3% 30,4% 23,6% 13,2% 100%
Proportion
fc
Quelle est la fréquence cumulée croissante pour X=3? (choisir la bonne la réponse)
a) 67,2% b) 63,2% c) 32,8% d) 30,4%
16. Mettre une croix dans la case correspondant à la nature de chaque indicateur
numérique suivant:
X f
19. Dans une série statistique, il est possible de déterminer dix déciles
Oui ( ) Non ( )
20. En vous référant aux données de la question N° 7 calculer :
➢ La moyenne:
➢ Le mode:
➢ Médian:
• L'Ecart moyen:
• La variance:
• L'Ecart type:
26. Indiquez vrai, faux ou douteux (Mettez une croix dans la bonne case)
a) La variance d'échantillon est une estimation de la variabilité dans la
population: Vrai ( ), Faux ( ), Douteux ( )
b) Dans certains cas, la variance d'un échantillon est négative:
Vrai ( ), Faux ( ), Douteux ( )
c) La somme des carrés des écarts par rapport à la valeur zéro est égale à la
somme des carrés des données: Vrai ( ), Faux ( ), Douteux ( )
d) La variance et les données sont exprimées par la même unité.
Vrai ( ), Faux ( ), Douteux ( )
e) L'écart type et la variance sont exprimés par la même unité.
Vrai ( ), Faux ( ), Douteux ( )
79
12 16 18 6 10 8 15 17 13 15
- Calculer l'écart type de cette série……………………………………..
Calculer:
Q1 =
Q2 =
Q3 =
EIQ =
c) Asymétrique – …………………………………………………………………...
33. Le tableau ci-dessous indique, pour chaque lieu, les prix et les quantités
commandées de ces trois matériaux au cours d'une même période:
Prix Quantités
Produits
2022 2023 2022 2023
− Calculer :
a) indice de Laspeyres =
b) indice de Paasche =
34.Le personnel d’un cabinet médical a étudié les temps d’attente des patients qui
arrivent au cabinet pour urgence. Les données suivantes ont été colletées au cours
d’un mois (les temps d’attente sont en minutes).
44 12 22 31 26 22 30 26 18 28 12 40 17 13 14 17 25 29 15 30 10 28 16
33 24 20 29 34 23 13
1. Construire la distribution de fréquence
2 .Construire la distribution de fréquence relative
3. Construire la distribution de fréquence croissante et décroissante.
4. Quelle est la proportion et le pourcentage de patients qui viennent en urgence et
qui ont un temps d’attente inférieur ou égal à 9 minutes ?
5. Tracer un histogramme de cette distribution
6. Tracer la médiane par la méthode graphique
81
7. Calculer
Médiane =
le Mode =
Ecart type =
Coefficient de variation=
REFERENCES
Anderson, D., Sweeney, D., & Williams, T. (2005). Statistiques pour l’économie et
la gestion. Paris.
Lind, D. D., Marchal, W. G., Mason, R. D., Gupta, S. D., Kabadi, S., & Singh, J.
(2007). Méthodes statistiques pour les sciences de la gestion (Chenelière).
Quebec (Canada).