Vous êtes sur la page 1sur 48

SOMMAIRE

TERMINOLOGIE DE BASE …………………………………………………………...……………3

REPRESENTATION
GRAPHIQUES……………………………………………………………………………………….24

LES PARAMETRES DE
POSITION…………………………………………………………………………..………………..44

LES PARAMETRES DE
DISPERSION…………………………………………………..…………………………………….60


Ce chapitre introductif est consacré à la définition de la statistique ainsi que des différents termes qui
en constituent le vocabulaire de base.

1- Définition et objet de la statistique

Dans le langage courant le mot « statistiques » désigne un ensemble de données souvent numériques
sur un phénomène.

Exemple : Des statistiques liées à la criminalité, des statistiques de l’accident d la route.


Ainsi, les statistiques constituent un ensemble d’information dont on devra analyser les caractéristiques
principales afin de traduire les réalités qu’elles représentent.

Quant à la « la statistique », elle désigne l’ensemble des méthodes ayant pour but d’analyser les
statistique. La statistique est donc l’étude mathématique des statistiques en vue d’en tirer des décisions.

La statistique descriptive appartient cependant à un ensemble plus vaste, la statistique générale, qui se
divise en deux branches : statistique descriptive, et la statistique mathématique (ou statistique
‘’inférentielle’’). Dont l’objet est de formuler des lois de comportement à partir d’observation souvent
incomplètes. Cette dernière intervient dans les enquêtes et les sondages. Elle s’appuie non seulement
sur la statistique descriptive, mais aussi sur le calcul des probabilités.

D’un point de vue méthodologique, la statistique descriptive précède en général la statistique


inférentielle dans une démarche de traitement des données. Ces deux aspects étant bien entendu
complémentaires. Elle utilise les méthodes mathématiques et l’outil informatique pour sa mise en
œuvre.

Statistique descriptive

Statistique générale
Statistique inférentielle

2- Domaines d’application de la statistique

Il suffit d’allumer son ordinateur ou d’écouter les informations à la radio pour constater que les
statistiques sont partout. Ceci relève que le monde moderne est presque entièrement tourné vers le
quantitatif et le mesurable. D’où l’intérêt de la statistique, discipline relativement récente, mais qui
correspond parfaitement à cette orientation du monde moderne.

La statistique s’applique à la plupart des disciplines : agronomie, biologie , démographie (les données
collectées permettent l’étude des moralités), économie , sociologie, linguistique, psychologie, le
marketing ( la création et la mise sur le marché d’un nouveau produit nécessite l’utilisation de
technique de sondage consistant à interroger un échantillon de la population ), la modélisation
statistique ou économique (elle permet de représenter une réalité par des relations pour par exemple
prévoir la variable futur ou quantifier l’effet d’un choc sur une variable donnée)…

1. Démarche statistique

Une étude statistique comporte divers étapes :


- La conception : elle définit les objectifs généraux et spécifiques à atteindre, la population
statistique, les unités statistiques, les caractères à étudie, la nomenclature retenue. Elle prépare la
phase de la collecte.
- La collecte des données : c’est la phase d’exécution de l’enquête, de chiffrement
- L’apurement : elle comporte la conception des masques de saisies, la saisie elle-même, la phase de
vérification de contrôle, de redressement, de traitements des points particuliers.
- L’analyse des données : représentation sous forme de tableaux, graphiques, calcul des
caractéristiques de tendance centrale et de dispersion, et éventuellement la modélisation.
- Les recommandations : sur la base des résultats obtenus.

2. Observation des faits


2.1. Vocabulaires statistiques
v Population, échantillon, individu

Comme le mathématicien, le statisticien doit d’abord définir avec précision l’ensemble de référence
sur lequel vont porter les observations ; cet ensemble est appelé ensemble statistique ou population
statistique. La population statistique est donc l’ensemble sur lequel porte une étude. C’est l’ensemble
dans lequel le statisticien opère, c'est-à-dire l’ensemble des unités observées.

Chaque élément de la population statistique est un individu ou une unité statistique. Lorsque la
population est trop importante pour être connue entièrement, on prélève un échantillon. Les relations
qui existent qui existent entre la population, les échantillons et les unités statistiques sont résumées
dans le schéma ci-dessous :

v Caractère qualitatif, variable quantitative, modalités, valeur

Dans une population, par exemple celle des étudiants d’une faculté, les unités sont repérées par le nom
et prénom des étudiants (on a donc une liste). Si l’on souhaite étudier cette population, on va retenir
certains critères d’étude comme le sexe, la filière principale à laquelle chaque étudiant se rattache, les
matières optionnelles qu’il a choisies, l’âge, le poids, la taille, etc.

Parmi ces critères, certains sont quantitatifs, comme l’âge, le poids, la taille. On peut en effectuer des
calculs numériques sur ces critères : poids moyen, taille maximale, taille minimale, etc. D’autres
critères ne sont pas quantifiables, car on ne peut pas effectuer de calculs dessus. Ils sont qualitatifs.
C’est le cas du sexe par exemple. On peut connaitre l’effectif masculin et féminin d’une population,
mais la notion de « sexe moyen » n’a pas de sens et ne peut d’ailleurs pas être calculée.

Afin de différencier les deux types de critères, les critères qualitatifs sont appelés des caractères et les
critères quantitatifs et on qualifie de valeurs les différents chiffres d’une variable.


Le caractère (variable) statistique est donc l’aspect particulier de l’individu auquel on s’intéresse.
Quant aux modalités, ce sont les différentes rubriques associées à des caractères. Autrement dit, ce
sont les différentes valeurs possibles du caractère étudié. Ainsi, le caractère « sexe » comporte deux
modalités.

Exemples :

- Si l’on dresse une statistique du personnel d’une entreprise d’après l’ancienneté de ses membres,
l’ensemble du personnel constitue la population, chaque membre de ce personnel est une unité
statistique, et le caractère statistique est l’ancienneté de chacun de ses membres.
- Si l’on dresse une statistique du parc automobile d’un département (ensemble des voitures
immatriculées dans ce département) à une date donnée d’après la marque des voitures, la
population est ce parc automobile, l’unité statistique, chacune des voitures, et le caractère
statistique la marque de chaque voiture.

v Modalités ordinales, modalités nominales

Les modalités d’un caractère qualitatif, si elles ne peuvent pas être mesurées quantitativement, sont
parfois susceptibles d’être classées. Ce sont des modalités ordinales.

Exemple 1 : Un questionnaire de satisfaction demande aux consommateurs d’évaluer une prestation


en cochant l’une des six catégories suivantes :

(a) Nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e) très bonne , (f) excellente

Il s’agit de modalités ordinales puisqu’elles peuvent être hiérarchisées : une prestation excellente est
meilleure qu’une prestation bonne, etc. La différence avec des valeurs quantitatives est qu’on ne peut
dire, par exemple, si une prestation jugée excellente est deux fois ou quatre fois meilleure qu’une
prestation décrite comme moyenne. On ne peut effectuer un classement, non une quantification.

Remarque : certaines modalités ordinales peuvent néanmoins être transformées en valeurs


quantitatives. Ce sont en fait des valeurs quantitatives qui prennent l’apparence de modalités
qualitatives ordinales.

Exemple 2 : Des chemises sont classées par taille : XS, S, M, L, XL, XXL, XXXL. Il s’agit de
modalités faussement ordinales. En réalité il existe un tableau de correspondance qui explicitera à
quelle taille en cm chacune de ces catégories correspond.

Les modalités d’un caractère qualitatif qui ne peuvent pas être classées ou hiérarchisées sont dites
nominales.

Exemple 3 : On demande à un échantillon de personnes ce qu’évoque pour elles un parfum. Plus


précisément, elles doivent cocher une des cases suivantes :

(a) Aventure, (b) sensualité, (c) confort, (d) nostalgie

Il est clair qu’aucune comparaison ni hiérarchisation ne peuvent être établies entre ces modalités. Elles
sont nominales.


Remarque : Certaines modalités purement nominales sont parfois codées avec des chiffres. Par
exemple, le sexe des individus d’une population sera codé par ‘’1’’ pour les hommes et par ‘’2’’ pour
les femmes. Il s’agit bien là d’une tentative de quantification d’une variable purement nominale. On
parle alors de variables pseudo-numériques. On peut en effet de cette façon calculer une moyenne, qui
sera en fait la proportion des hommes dans la population ou dans l’échantillon.

v Valeurs discrètes, valeurs continues

Une variable quantitative peut-être discrète ou continue. Lorsque le nombre de valeurs possibles est
fini (exemple : le nombre d’enfants, le nombre de pièces d’un logement, etc.), la variable est discrète.
Lorsque le nombre de valeurs possibles de la variable est infini (exemple : la taille, le poids ou le
revenu des ménages), la variable est continue.

v Effectifs, fréquences, pourcentage, ratios, taux et indices

Une fois les unités statistiques d’une population répertoriées, celles-ci sont présentées dans des
tableaux, de diverses manières : effectifs ou fréquences absolues, fréquences relatives, pourcentages,
ratios, indices et taux. Il convient de définir ces termes avec précision :

a. Effectifs ou fréquences absolues

Il s’agit de la répartition brute des données. Lorsque les données sont présentées individuellement,
chaque donnée à la même fréquence unitaire d’apparition, leur effectif ou fréquence absolue est égale
à 1. Lorsque les données sont regroupées par valeur ou modalités, les effectifs ou fréquences absolue
correspondent au nombre de données qui ont la valeur ou modalité ou encore qui sont groupées dans
une classe donnée.

Symboliquement, l’effectif total est donc le nombre total d’individus observés.

On a d’une manière générale :

𝑁 = 𝑛$ + 𝑛& + 𝑛' + 𝑛( = 𝑛)

b. Fréquences relatives et Fréquences en pourcentages

La fréquence relative est égale à la fréquence absolue (effectif) divisée par l’effectif total. On a donc :
𝑛)
𝑓) = 𝑒𝑡 𝑓) + 𝑓& + ⋯ + 𝑓) = 1
𝑛
Le pourcentage des données qui correspondent à une modalité, à une valeur ou à une classe s’obtient
en multipliant la fréquence relative correspondante par 100. C’est-a-dire :
01
𝑓) = ×100et 𝑓$ + 𝑓& + ⋯ + 𝑓4 = 𝑓) = 100
0

Exemple : le tableau suivant indique la répartition des ménages en fonction du nombre d’ampoules
utilisées à leur domicile.


Effectifs ou Fréquences Fréquence en
Classes fréquences relatives pourcentages
absolues (𝑓) )
(𝑛) )
2−5 21
5 − 10 63
0 − 15 16
Total 100
Les colonnes 2 (fréquences absolues) et 4 (fréquences en pourcentages) contiennent les mêmes valeurs
car l’effectif total est égal à 100. Si celui-ci était différent de 100, les valeurs contenues dans les deux
colonnes seraient différentes.

c. Classe,centre, amplitude, densité

Par convention, une classe est un intervalle fermé à gauche et ouvert à droite, du type 𝑎; 𝑏 . Elle est
dite « bornée » si a ≠ −∞et 𝑏 ≠ +∞.

L’effectif 𝑛) de la classe numéro i est le nombre d’individu dont le caractère prend une valeur
supérieure ou égale à 𝑎 et strictement inférieur à b.

Le centre d’une classe bornée est égal à la moyenne arithmétique des deux bornes de la classe. On a :
@AB
𝐶) = .
&

L’amplitude d’une classe bornée est égale à la différence entre la borne supérieure et la borne inférieur
de cette classe. On a : 𝑎) = 𝑏 − 𝑎.

La densité d’une classe bornée est égale au quotient de l’effectif de cette classe par son amplitude. On
𝒏
a :𝒅𝒊 = 𝒊 .
𝒂𝒊

NB : on calcule les densités lorsque les classes sont d’amplitudes inégales (mais finies).

d. Effectifs cumulés, Fréquences cumulés

L’effectif cumulé croissant de la valeur de rang k (ou de la classe de rang k) est la somme des effectifs
des modalités ou valeurs depuis la première jusqu’à celle de rang k incluse (on définit de même la
fréquence cumulée décroissante)

L’effectif cumulé décroissant de la valeur de rang k (ou de la classe de rang k)

e. Ratio, taux et indices

Un ratio est une fraction qui divise deux quantités. Les fréquences relatives sont des ratios puisqu’elles
divisent deux quantités. Plus généralement, les ratios sont très utilisés en statistiques.

Exemple 1 : Soit la série de pièces défectueuses produites par 10 machines au cours d’une semaine
donnée.

8,16,9,33,14,5,3,7,10,7


Ces chiffres sont des taux car ils sont exprimés dans l’unité « semaine ». Cette unité est « I ». On dit
par conséquent 8 pièces par semaine, 16 pièces par semaine, etc.

Un indice est le ratio d’une quantité à une autre quantité qui sert de référence, multiplié par 100.

Exemple 3 : Soit la série de pièces défectueuses produites par 10 machines au cours d’une semaine
donnée de l’exemple 1. Divisions chacune des valeurs de la série par la valeur la plus faible et
multiplions ensuite chaque valeur par 100. Le résultat est une série d’indices, la « base 100 » étant la
machine numéro7.

266,7 ; 533,3 ; 300 ; 1100 ; 466,7 ; 166,7 ; 100 ; 233,3 ; 333,3 ; 233,3

3. Méthode d’observation
3.2.1. Dénombrement instantané. Dénombrement continu

Le dénombrement que suppose toute statistique peut être instantané ou au contraire continu. Ainsi la
population d’un pays à une date donnée peut être connue à l’aide d’un recensement effectué à cette
même date (dénombrement instantané) ou à, partir d’un recensement antérieur, par addition ou
soustraction, suivant le cas, des nombres des naissances, des décès, des émigrés, des immigrés
(dénombrement continu).

3.2.2. Recensement et sondages

Etude complète d’une population (enquête exhaustive), son recensement, c'est-à-dire l’examen de
toutes les unités qui la composent, n’est pas toujours possible. Cette étude quand elle est possible peut
demander du temps, et son coût peut être élevé. Il peut aussi arriver que les unités statistiques observées
soient détruites à l’occasion de leur examen. Pour ces diverses raisons on peut être conduit à observer
qu’une partie de la population, c'est-à-dire à procéder à un sondage (enquête partielle). Les unités
étudiées à l’occasion du sondage constituent un échantillon. L’étude de cet échantillon fournira des
informations et conduira à des conclusions qui pourront être étendues avec précaution, à la population
complète (population mère).

4.2.3. Questionnaires

Lorsque les unités statistiques sur lesquelles porte l’observation sont des personnes, elles peuvent être
soumises à un questionnaire. Destiné à fournir des renseignements nombreux et aussi exact que
possible, un questionnaire doit présenter un certain nombre de qualités :

- Il doit être adapté au niveau des personnes consultées ;


- Il doit être complet ;
- Les questions posées doivent être simples, et appeler des réponses précises et courtes, « oui » ou
« non », par exemple ;
- Les questions posées doivent être telles qu’elles permettent au statisticien de contrôler la valeur
des réponses recueillies.

Enfin, dans un questionnaire, on distingue généralement deux types de questions :

- Les questions fermées où le nombre de réponses est limité.


- Les questions ouvertes ou l’on peut librement exposer ses raisons.

4.3. Dépouillement des observations


4.3.1. Dépouillement dans le cas d’un caractère qualificatif

Supposons qu’on ait à dresser une statistique portant sur la situation matrimoniale de vingt
personnes de sexe masculin. On a retenu pour ce caractère, qualificatif les modalités suivantes :
célibataire, marié, veuf, divorcé.
Pour faciliter le dépouillement on a établi le code suivant les différentes situations matrimoniales
possibles se verront affecter des numéros :
Célibataire : 1 marié : 2 veuf : 3 divorcé : 4
Les vingt personnes interrogées ont fourni les réponses suivantes :
2 1 1 4 1 4 3 2 2 2
3 2 1 1 4 2 2 1 2 3

Le dépouillement va consister à compter combien, parmi les vingt unités statistiques observées,
répondent à la modalité codée1, à la modalité codée2, et ainsi de suite. Exécuté de façon manuelle
le dépouillement pourra se présenter de la façon suivante :

Situation matrimoniale Effectifs


1
2
3
4

Si les modalités que peut présenter le caractère qualitatif étudié sont très nombreuses, elles pourront
faire l’objet d’une véritable nomenclature.

4.3.2. Dépouillement dans le cas d’un caractère quantitatif (ou variable statistique)

Exemple1 : supposons que vingt sportifs aient été pesés à l’occasion d’un contrôle médical. Les
résultats sont les suivants, l’unité de poids retenue étant le kilogramme :
77,45 62,2 67,82 71,28 74,37
81,29 78,54 63,22 59,47 61,33
56,41 63,23 63,28 71,66 68,72
54,93 71,44 74,31 77,82 67,41

Il est bien certain que, dans pareil cas, pour pouvoir dresser une statistique, il faudra diviser le
domaine de variation de la variable, ici de 54,93 kg à 81,29kg en intervalles (ou classes), de
préférence amplitude constante.
Par exemple le dépouillement pourra se présenter comme suit :


Classes (d’amplitude 5 kg) Effectifs
De 50 à 55
De 55 à 60
De 60 à 65
De 65 à 70
De 70 à 75
De 75 à 80
Plus de 80
TOTAL

Le choix du nombre de classes, et partant, de l’amplitude des classes, dépend du domaine de


variation de la variable étudiée, et de la statistique à établir. Un nombre trop faible de classes peut
conduire à regrouper dans une même classe des mesures observées de la variable qui présenteraient
entre elles des écarts sensibles, et en conséquence peut nuire à la précision des résultats obtenus.
Trop grand nombre de calculs.
En règle générale, deux principes guident le regroupement des données en classe :
- Le principe de l’exclusivité : aucune observation ne peut être classée dans plus d’une catégorie.
- Le principe de l’inclusivité : chaque observation peut être classée dans une catégorie des classes.

Le nombre minimal de classes est déterminé selon la formule empirique de YULE :


K=2,5(n)1/4 ou selon la règle de STURGE : k= 1+3,3 log (n) ou n est le nombre d’observation de
k le nombre de classes.

Exemple2 : On a questionné 100 ménages sur le nombre d’ampoules électrique utilisées dans leur
domicile. Dans le premier tableau, les données sont regroupées par nombre d’ampoules. Dans le
second tableau, elles sont regroupées par classes.

Tableau1 : Regroupement par nombre d’ampoules


Nombres 2 3 4 5 6 7 8 9 11 12 13 15
d’ampoules
Effectifs 5 8 8 10 18 16 10 9 6 5 3 2

Tableau 2 : Regroupement par classes


Classes Effectifs
2−5
5 − 10
10 − 15

4. Séries statistiques
On appelle série statistique la suite des valeurs prises par une variable x sur les unités
d’observation.
Le nombre d’unités d’observation est noté N. Les valeurs de la variable x sont notées x1, x2,…,
xN

10


4.1. Tableau statistique à simple entrée

Le tableau statistique le plus simple sera celui où figureront deux colonnes réservées
respectivement :

- La première, à l’inscription des modalités prises part le caractère, ou des valeurs prises par la
variable désignée par xi ;
- La seconde à l’inscription des effectifs du personnel d’une entreprise d’après le nombre d’enfant à
charge.

Exemple1 : distribution statistique du personnel d’une entreprise d’après le nombre d’enfants à charge

Nombre d’enfant à charge Effectifs Fréquences (%) ECC ECD FCC FCD

0 4
1 15
2 29
3 18
4 10
5 3
6 1
TOTAL 80

Exemple 2 : Distribution statistique de 20 personnes de sexe masculin d’après leur situation


matrimonial (caractère qualitatif)

Situation Effectifs Fréquences ECC ECD FCC(%) FCD(%)


matrimoniale (%)
Célibataire 6
Marié 8
Veuf 3
Divorcé 3
Total 20

Exemple 3 : Distribution statistique de 20 sportifs d’après leurs poids lors d’un contrôle médical
(caractère quantitatif continu)

Situation Effectifs Fréquences ECC ECD FCC(%) FCD(%)


matrimoniale (%)

11


0; 55 1
55; 60 2
60; 65 5
65; 70 3
70; 75 5
75; 80 3
80; 85 1
Total 20

5.2. Tableau de statistique à double entrée

Nous nous sommes jusqu’ici limité à l’observation, sur chaque unité statistique, d’un seul caractère.
Or il est fréquent qu’on soit amené à observer, sur une même unité, deux ou plus de deux caractères.

Exemple 1 : Répartition des enfants de sexe masculin d’une école maternelle d’après leur âge et leur
poids.

Age (en années)


Poids (en KG) 3; 4 4; 5 5; 6 Totaux

0; 15 19 7 1 27
15; 20 32 21 12 65
20; 25 3 28 28 49
25; 30 0 1 1 1

Totaux 54 46 42 142

Exemple 2 : Distribution statistique des élèves d’après le handicap et le sexe

Handicaps
Aveugles et Sourds et Handicapés Total
Sexe amblyopes malentendants moteurs
Filles 74 22 21 117
Garçons 43 72 23 138
Total 117 94 44 255

12


6.Opérateurs SOMME ET PRODUIT

A- L’opérateur somme

Pour exprimer une somme d’éléments de façon compacte, on utilise l’opérateur somme, symbolisé par
la lettre grecque majuscule ‘’Sigma’’

Sigma 𝑜𝑝é𝑟𝑎𝑡𝑒𝑢𝑟 𝑠 𝑚𝑚𝑒

Exemple 1 : Soit quatre valeurs d’une variable x, indicées par i : x1 ; x2 ; x3 ; x4. La somme de ces 4
valeurs est donnée par l’expression :
(

𝑥) = 𝑥$ + 𝑥& + 𝑥' + 𝑥(
)W$

L’expression de gauche se lis ainsi ‘’somme des xi pour i allant de 1 à 4’’. Plus généralement, pour
une somme de n éléments, on écrit :
0

𝑥) = 𝑥$ + 𝑥& + ⋯ + 𝑥(
)W$

Exemple 2 : soit le tableau de valeur suivant. Calculons les expressions :

xi yi
( ( (
1 2 Y 𝑥) Y 𝑦) Y 𝑥²)
-3 3 )W$ )W$ )W$

-4 4
(
(
2 5 Y 𝑥²) 𝑦)
Y( 𝑥) + 𝑦) )
)W$
)W$

Propriétés des sommations

Somme d’une constante :


0

𝑎 = 𝑎 + ⋯ + 𝑎 = 𝑛𝑎 (a constante)
)W$

3 = 3 + 3 + 3 + 3 + 3 = 5×3 = 15.
)W$

Mise en évidence :

(a constante) 13


0 0

𝑎𝑥) = 𝑎 𝑥)
)W$ )W$

'

2×𝑖 = 2 1 + 2 + 3 = 2×6 = 12.


)W$

Somme des n premiers termes :


0
𝑛(𝑛 + 1)
𝑖 = 1 + 2 + 3 + ⋯+ 𝑛 =
2
)W$

Distribution :
0 0 0

(𝑥) + 𝑦) ) = 𝑥) + 𝑦)
)W$ )W$ )W$

0 0 0

(𝑥) − 𝑦) ) = 𝑥) − 𝑦)
)W$ )W$ )W$

Somme des carrées :


0 0 0 0 0

(𝑥) − 𝑦) )² = (𝑥 & ) − 2𝑥) 𝑦) + 𝑦²) ) = 𝑥²) − 2 𝑥) 𝑦) + 𝑦²)


)W$ )W$ )W$ )W$ )W$

7. Travaux dirigés

EXERCICE 1 :

Les caractères suivants sont-ils qualitatifs ou quantitatifs ?

a) Sexe d) taille g) tension artérielle


b) Etat matrimonial e) couleur des yeux h) taux de cholestérol
c) Age f) poids i) région habitée

EXERCICE 2 :

Parmi les caractères quantitatifs suivants, quels sont ceux qui peuvent être considérés comme discrets
et ceux qui peuvent être considérés comme continus ?

a) Chiffre d’affaires des PME


b) Taille des entreprises du secteur tertiaire
c) Nombre de personnes habitant une résidence principale

14


d) Nombre de places de cinéma associé à chaque salle
e) Nombre d’enfants par ménage.

EXERCICE 3 :

On considère l’ensemble des notes obtenue, lors d’un test noté sur 20, par 50 candidats.

10 8 3 12 13 9 12 9 12 11
11 11 8 5 13 14 14 6 12 16
7 11 10 10 2 15 12 10 1 14
11 7 8 10 13 9 13 9 7 13
11 19 9 4 10 8 9 6 7 14

1) Dépouiller ces données et présenter les résultats dans un tableau. (On prendra les classes suivantes :
0; 5 , 5; 7 , : 7; 9 , : 9; 11 , : 11; 13 , 13; 15 , : 15; 20
2) Calculer les fréquences en pourcentages.
3) Calculer les fréquences cumulées croissantes et décroissantes en pourcentage.
4) Quelle est la proportion des candidats ayant une note inférieure à 9 ?
5) Quelle est la proportion des candidats ayant une note supérieure ou égale à 13 ?
6) Quelle est la proportion des candidats ayant une note comprise entre 5 et 20 ?
7) Quelle est la classe dont la densité est la plus forte et celle dont la densité est la plus faible ?

EXERCICE 4 :

Une école spécialisée reçoit trois types d’enfant handicapés :

- Des aveugles et des amblyopes ;


- Des sourds et des malentendants ;
- Des handicapés moteurs.
a) Les effectifs de cette école sont consignés dans le tableau suivant que vous devez compléter.

Handicaps
Aveugles et Sourds et Handicapés Total
Sexe amblyopes malentendants moteurs
Filles 22
Garçons 43 23 138
Total 117 255

b) Exprimer en pourcentage, la fréquence des aveugles et amblyopes dans cet établissement.

Dans cette école, 80% des enfants sont internes, calculer le nombre d’élèves vivant à l’internat.

15


EXERCICE 5 :

Compléter le tableau suivant :

Classes Centres Fréquences Fréquences Densités


cumulées
10; 20 ….. 0,08 ….. …..
20; 30 ….. 0,21 ….. …..
30; 40 ….. …… 0,55 …..
40; 60 ….. …… 0,86 …..
60; 80 ….. …… ….. …..

]
NB : Les densités sont calculées avec les fréquences (di= 1 )
@1

EXERCICE 6 :

Vous faites une enquête dans une maternité auprès de 60 femmes et vous étudiez l’âge de la mère à la
date de la naissance de leur premier enfant.

23 24 18 19 35 26 28 24 22 19

19 17 22 26 31 28 29 21 20 22

23 18 20 27 29 24 24 22 23 23

32 29 27 21 22 23 24 28 32 30

25 26 23 20 29 35 38 19 20 22

24 23 31 26 27 20 21 22 23 28
1) Quelle
est
la population
étudiée ?
2) Quel est le nombre d’individus ?
3) Quel est le caractère étudié ?
4) Le caractère étudié est–il discret ou continu ?
5) Regroupez cette série en fonction des valeurs croissantes du caractère. Faire apparaitre les
effectifs. Après avoir rappelé la notion de fréquence. Calculez les fréquences relatives à
chacune des modalités.

16


EXERCICE 8 : Les variables suivantes sont-elles quantitatives ou qualitatives ?

a) Les marques des voitures garées sur un parking de supermarché


b) Les nationalités des touristes se rendant au festival de Bayreuth.
c) L’âge des auditeurs de Radio rap.
d) Les températures matinales relevées chaque jour.
e) La hauteur des précipitations tombées chaque mois à Danané.
f) Les notes sur 20 obtenues en psychologie par les étudiants de RHCOM.

I- Introduction

Il est parfois indispensable de recourir à la présentation graphique des données. La représentation


graphique d’une série statistique dépend du caractère étudié. Si la série étudiée est une série à caractère
qualitatif, elle peut être représentée soit par un diagramme à barre ou en bande, un diagramme
circulaire ou semi circulaire.

17


Si la série étudiée est une série à caractère quantitatif, elle peut être représentée par un diagramme en
bâtons (variable discrète), par un histogramme (variable continue).

Il y a aussi les diagrammes spécifiques : diagramme triangulaire, cartographique, pyramide des


âges.

I. SITUATION

Une enquête statistique a été effectuée sur 400 voitures d’occasion de modèle courant appartement à
des marques françaises vendues par l’intermédiaire d’une revue de vente de particulier. Quatre
caractères ont été étudiés :

• Trois (03) caractères quantitatifs (caractères mesurables)


- Puissance fiscale ;
- Kilométrage ;
- Prix.
• Un (01) caractère qualitatif (caractère non mesurable)
- Marques
II. DIAGRAMME EN BATONS

On construit un diagramme en bâtons quand les valeurs de la variable sont peu nombreuses
(essentiellement caractères quantitatifs à variable discrète).

Sur l’axe des abscisses sont marqués chacune des valeurs de la variable (puissance fiscale).

On gradue l’axe des ordonnées afin de porter les effectifs. L’ensemble des bâtons obtenus constitue
un diagramme en bâtons.

NB : dans un diagramme en bâtons, les hauteurs des différents bâtons sont proportionnelles aux
effectifs correspondants.

Exemple :

Puissances fiscales 2 3 4 5 6 7 8 9 10 11 Total


Effectifs 24 55 63 71 47 87 23 10 12 8 400
Fréquences (%)

18


Par exemple, il est aisé de vérifier sur le diagramme que la hauteur du premier bâton (effectif 24)
est double de celle de l’avant –dernier bâton (effectif 12).

4. Histogramme et polygone des effectifs (ou des fréquences)

On construit un histogramme quand les valeurs sont reparties en classes (essentiellement caractère
quantitatif continue).

4.1. Avec classes d’amplitudes égales

Histogramme des effectifs (ou des fréquences)

Dans un histogramme, les aires des différents rectangles sont proportionnelles aux effectifs
correspondants.

Sur l’axe des abscisses on porte les intervalles de classes et on construit des rectangles dont les
aires sont proportionnelles aux effectifs des classes ; pour cela, il suffit d’élever les hauteurs
correspondantes aux effectifs des classes. L’ensemble des rectangles constitue un histogramme.

Exemple :

Kilométrages (km) Effectifs Fréquences (%)


10 000; 20 000 19
20 000; 30 000 68
30 000; 40 000 77
40 000; 50 000 74
50 000; 60 000 45
60 000; 70 000 42
70 000; 80 000 21
80 000; 90 000 26
90 000; 100 000 22
100 000; 110 000 6
Total 400
/

19


Par exemple, il est aisé de vérifier sur le graphique que l’aire du sixième rectangle (effectif 42) est
le double de celle du septième rectangle (effectif 21).

Polygone des effectifs (ou des fréquences)

En joignant les milieux des sommets des rectangles et en complétant le tracé de part et d’autre de
l’histogramme en supposant deux classes de même amplitude d’effectif nul, on obtient un
polygone des effectifs (ou des fréquences).

Ainsi tracé, le polygone des effectifs (ou des fréquences) à même aire que l’histogramme
correspondant ; en effet il y a compensation 2 à 2 des aires des rectangles non communs (exemple
des triangles hachurés sur le graphique précédent).

4.2. Avec classes d’amplitudes inégales

Histogramme des effectifs (ou des fréquences)

On corrige les effectifs et on construit l’histogramme des effectifs corrigés.

- On choisit un intervalle unitaire (généralement celui de la classe la plus petite). Noté au : C’est
le PGCD des amplitudes des classes. au= PGCD (ai).
𝒂
- On détermine le nombre d’intervalles unitaire de chaque classe, noté Ri.Ri = 𝒊
𝒂𝒖
- On détermine la hauteur du rectangle en divisant l’effectif de la classe par le nombre
𝒏
d’intervalles unitaires. Effectifs corrigé = 𝒊
𝑹𝒊
- Construction de l’histogramme : en ordonnées on porte les effectifs par corrigés et en abscisses
les intervalles.

Remarque : on peut également construire l’histogramme des densités.

Exemple :

Effectifs Amplitudes Nombre Effectifs


Prix (en F) (ni) (ai) d’intervalles corrigés
unitaires (Ri)
5 000; 10 000 32
10 000; 15 000 44
15 000; 20 000 73
20 000; 25 000 61

20


25 000; 30 000 68
30 000; 35 000 50
35 000; 45 000 36
45 000; 60 000 36
Total 400
au= 5 000

5. Diagramme à barres ou bandes

On construit un diagramme en bandes ou à barres lorsque le caractère étudié est qualitatif.

On porte sur l’axe des abscisses les modalités des caractères, et sur l’axe des ordonnées les effectifs
ou les fréquences. Puis on trace une bande verticale proportionnelle à l’effectif associé à chaque
modalité.

Exemple 1 : le tableau suivant correspond au nombre de véhicules motorisés exportés durant


l’année 1991, après une entreprise française, vers les pays du proche orient.

Arabie Saoudite 1700


Egypte 1 050
Irak 2 190

21


Israël 310
Jordanie 1 960
Syrie 2 570

Le caractère étant qualitatif, on peut utiliser un diagramme à bande pour représenter ce phénomène.
En effet, ce type de diagramme permet une comparaison des effectifs associés à chaque modalité.

Exemple 2 : La répartition des étudiants d’une faculté de Droit et Sciences Economiques en


fonction de leur niveau d’étude et de leur spécialité est la suivante :

Droit Sciences Economiques


ère
DEUG 1 Année 650 324
DEUG 2ème Année 296 132
LICENCE 217 92
MAITRISE 148 78
TROISIEME CYCLE 52 23

Pour pouvoir comparer les filières droit et sciences économiques, nous allons représenter sur le
même diagramme les effectifs associés à chaque année étude.

22


6. Diagramme à secteur (ou diagramme circulaire)

On construit un diagramme à secteur dans le cas d’un caractère qualitatif.

Exemple :

Marques Effectifs Fréquences (en %)


Citroën 81
Peugeot 114
Renault 116
Simca 3
Talbot 36
Total 400

On trace des secteurs dont les mesures des angles au centre sont proportionnelles aux fréquences
exprimées en pourcentages.

Citroën :

Peugeot :

Renault :

Simca :

Talbot :

Diagramme semi –circulaire

Peugeot :

Renault :

Simca :

Talbot :

23


7. Diagramme spécifiques

7.1. Le diagramme triangulaire

On utilise un diagramme triangulaire lorsqu’on est en présence de statistique tertiaires, c'est-à-dire de


valeurs numériques reparties sur trois postes. On utilise un triangle équilatéral, dans lequel on situe les
différents individus en fonction des trois valeurs associées à chaque poste.

Exemple : On considère cinq populations notées A, B, C, D, E. on répartit les individus en fonctions


de leurs préférences en matière de spectacles. On obtient :

CINEMA THEATRE CONCERT


A 140 110 80
B 290 210 220
C 70 80 60
D 430 250 130
E 160 220 200

Représenter sur un même diagramme triangulaire ces cinq populations

24


7.2. La pyramide des âges :

Lorsque l’on répartit une population en fonction de l’âge et du sexe des individus, on représente le
phénomène à l’aide d’un diagramme particulier appelé pyramide des âges.

Une pyramide des âges est un graphique qui indique la composition d’une population par classes d’âge
et par sexe, à un moment donné. La population concernée peut être celle d’un pays (c’est le cas le plus
fréquent), mais aussi celle d’un groupe de pays, d’un continent, ou d’unités spatiales plus petites, par
exemple une ville ou une entreprise. Quelle qu’en soit la présentation au niveau des détails (effectifs
des classes présentés en chiffres absolus , en pour –cent de la population totale ou en pour –cent de la
population de chaque sexe), une pyramide des âge donne des renseignements très précieux sur
l’histoire de la population concernée : elle montre en particulier la répartition entre jeunes, adultes et
personnes âgées, répartition qui dépend en premier lieu de l’évolution de la natalité et de la mortalité ;
elle porte la trace des « accidents » qui ont pu toucher la population étudiée.

Attention : Toutefois comme c’est le cas pour tous les indicateurs statistiques, une pyramide des âges
fournit des informations brutes qui permettent de formuler des constats, mais qui ne donnent pas à
elles seules l’explication de ces constats ! Pour expliquer ou interpréter ces informations, il est
nécessaire d’avoir recours à d’autres documents relatifs à la population que l’on étudie.

Construction de la pyramide des âges

Une pyramide des âges est un graphique ordonné selon deux axes :

- L’axe vertical correspond aux différents âges de la population. Le 0 correspondent à l’année


de référence de la pyramide : c’est la ligne qui contient tous les individus qui viennent de naître
à la date des statistiques utilisées pour construire la pyramide. L’axe vertical permet de
retrouver les années de naissances, de plus en plus éloignées à mesures que l’on s’élève sur cet
axe.

En général, pour la commodité de la lecture, les pyramides des âges regroupent les individus par
tranches de 5 ans, parfois de 10 ans : ainsi, la tranche 0-5 ans contient toute la population née durant
les cinq dernières années ;

- L’axe horizontal indique l’effectif de la population contenu dans chaque tranche d’âge ;
l’échelle peut être fondée sur des quantités relatives (généralement des pourcentages). Le
recours aux pourcentages permet d’effectuer plus facilement des comparaisons entre les
pyramides des âges de populations d’effectifs très différents ;
- Le graphique est divisé en deux parties, une pour le sexe masculin, l’autre pour le sexe féminin.

Interprétation de la pyramide des âges

Une pyramide « en champignons » (base étroite et sommet large) présente un déficit de jeune
salarié face à une population plus âgée. Cela peut conduire à une perte de compétences, un déficit
de connaissance (transmission des savoirs) une altération des valeurs de l’entreprise et de la
mobilité interne….

25


Une pyramide « en violon » fait apparaître une coexistence intergénérationnelle de populations
salariées. Le resserrement observé en son centre ouvre potentiellement sur des différences
culturelles, des divergences de visions et de méthodes de travail entre les générations.
Pour éviter ces risques, il faut mettre en place une véritable.

Une pyramide « en poire écrasée » présente une population salariée jeune… mais aussi peu
expérimentée. L’importance de l’expérience à peut être été occultée et le recrutement est figé. La
mise en place une gestion prévisionnelle des emplois et des compétences (formation, évolution de
carrière…) est nécessaire.

Une pyramide « en ballon de rugby » est plus harmonieuse. Elle traduit certainement une
stratégie de recrutement régulière et une gestion des parcours professionnels…

Exemple : la société POUSSIN IVOIRE, société ivoirienne de production de poussins est implantée à
AGNIBILEKRO et présente les caractéristiques suivantes au niveau de son effectif :

Tranches d’âges Hommes Femmes


Moins de 25 ans 10 05
25-29 ans 15 05
30-34 ans 50 10

26


35-39 ans 55 15
40-44 ans 90 25
45-49 ans 100 35
50-54 ans 40 15
55-60ans 20 10
TAF : Faites la pyramide des âges de cette entreprise

7.3. Le diagramme polaire

On construit un diagramme polaire pour comparer les variations d’une série statistique présentant une
périodicité dans le temps (mois, trimestre, année…).
Exemple : On s’est intéressé aux livraisons d’essence SUPER dans une station de la ville d’Abidjan
(livraisons trimestrielles en millions de m3)

Trimestres
1 2 3 4
Années

2001 1 050 1 300 1 500 1 300


2002 1 050 1 400 1 750 1 350
2003 1 100 1 100 1 850 1 450
2004 1 150 1 700 2 000 1 550

Représenter graphiquement cette série chronologique

27


8. Travaux dirigés

EXERCICE 1 :
L’hôtel dans lequel vous travaillez est équipé de 25 chambres. 6 dont le prix d’une nuitée est 100F , 5
dont le prix d’une nuitée est 120 F , 4 dont le prix d’une nuitée est 140 F , 7 dont le prix d’une nuitée
est 180F, 3 dont le prix d’une nuitée est 200 F . Sa fréquentation lors de la semaine écoulée est
représentée par le graphique ci-dessous.
a) Quel nom donne –t-on à ce graphique ?
b) Compléter le tableau.

Prix d’une nuitée (en F) 100 120 140 180 200


Nombre de chambres … … … … …

c) Calculer par rapport au nombre total de chambres, le pourcentage d’occupation de cet hôtel

EXERCICE 2 :
Une bibliothèque vient de dépenser 672 750 F pour l’acquisition d’un certain nombre de livres. Il est
établi une répartition de ces livres d’après leur prix.
a) Sachant que le prix moyen d’un livre est 2 990 F, déterminer le nombre total de livres achetés.
b) Reproduire et compléter le tableau ci-dessous :

Prix d’un livre en Nombre de livres Effectifs cumulés Fréquences (en %)


francs (classes) (effectifs) croissants
500; 1000 4
1000; 2000 54 24
2 000; 3 000 32
3 000; 5 0000 32
5 000; 8 000 8

28


Total 100

c) Tracer l’histogramme de cette série :


Echelles : abscisse : 1 cm pour 500 F Ordonnée : 1 cm pour 2 livres

EXERCICE 3 :

D’après une étude sur 500 demandeurs d’emploi de moins de 25 ans, classées d’après l’ancienneté
de leur demande d’emploi, on a obtenu le diagramme circulaire ci-dessous :

a) Compléter le tableau statistique suivant :

Ancienneté de la demande (en Fréquences (%)


mois) Effectifs

29


Total
b) Tracer l’histogramme des effectifs
Echelle : 1 cm pour 3 mois en abscisse
1 cm pour 20 demandeurs d’emploi en ordonnées

EXERCICE 4 :
Le tableau suivant donne les résultats d’une enquête sur le poids (en Kg) des individus d’une
population :
48 72 54 80 58 70 69 58 57 60

85 94 78 81 64 49 54 57 57 62

63 69 72 71 82 87 64 65 73 58

61 67 49 52 60 66 69 89 84 82

73 70 72 58 64 51 65 77 79 80

59 57 81 78 76 79 68 67 53 59
1) Classer ces résultats par classes d’amplitudes 5 : 45; 50 ,…
2) Calculer les fréquences et les fréquences cumulées en pourcentages
3) Construire l’histogramme et le polygone des fréquences.

30


4) Construire la courbe des fréquences cumulées croissantes.

5) Déterminer graphiquement la proportion d’individus pesant moins de 75 kg


6) Comparer ce résultat avec la valeur calculée (question 2)

EXERCICE 5

A l’aide de l’histogramme ci-dessous, reconstituer le tableau suivant :


Nombres d’intervalles
Nombre de pièces Effectifs unitaires Effectifs corrigés

31


Les tableaux de nombres, et les représentations graphiques donnent une vue d’ensemble du phénomène
étudié.
Le statisticien s’efforce de caractériser chaque distribution à l’aide de quelques paramètres
remarquables afin de pouvoir, en particulier, comparer deux ou plusieurs statistiques en caractérisant
l’ordre de grandeur des observations. Ils s’expriment dans la même unité que les observations.
I- Le mode
1.1. Définition
On appelle mode d’une série statistique la valeur de la variable quia le plus grand effectif (ou la plus
grande fréquence).
Pour une distribution groupée dont les classes sont d’égales amplitudes, on appelle classe modale, la
classe d’effectifs maximum.

32


Attention ! Si les classes sont d’amplitudes inégales, une classe d’effectifs maximum n’est pas
forcément classes modales.
Remarque
- Graphiquement, sur un diagramme en bâtons, le mode est l’abscisse du bâton le plus haut.
- Une série statistique peut être bimodale ou multimodale

1.2. Détermination

Cas d’un caractère quantitatif discret

Exemple : Répartition des logements d’une résidence d’après le nombre de pièces :


Les logements de 4 pièces sont plus nombreux. Le mode est 4.

Nombres de pièces Effectifs Fréquences


1 37
2 59
3 53
4 82
5 15
6 4
Total 250

Cas d’un caractère quantitatif avec regroupement en classes

a) Toutes les classes ont la même amplitude


Dans ce cas le mode correspond au centre de la classe qui a l’effectif simple le plus grand.
Exemple : Lors d’un recensement de la population ivoirienne, on a relevé le nombre de naissances
suivant l’âge des mères. On obtient le tableau suivant :
Age de la mère (en années) 15; 20 20; 25 25; 30 30; 35 35; 40 40; 45 45; 50

Effectifs (nombres de 35 230 270 180 80 25 10


naissances en milliers)

Quel est l’âge modal ?


La classe modale est 25; 30 , elle correspondant au plus grand effectif. On prend comme mode la
valeur centrale de cette classe. L’âge modal est donc 27,5 soit 27 ans 6 mois.
b) Toutes les classes n’ont pas la même amplitude
Dans ce cas, le mode correspond au centre de la classe qui a l’effectif corrigé le plus élevé (ou la
densité). Graphiquement, sur un histogramme, le mode est l’abscisse du milieu du plus haut rectangle.
Exemple : le ci- dessous représente la série statistique des auditeurs de plus de 15 ans du poste de
radio RTL.

33


Heures d’écoute Effectifs (nombre Nombre d’intervalles Effectifs corrigés
d’auditeur en milliers) unitaires

5𝐻 − 6𝐻 500
6ℎ − 7ℎ 2 500
7ℎ − 8ℎ 2 800
8ℎ − 9ℎ 3 000
9ℎ − 12ℎ 7 200
12ℎ − 13ℎ 2 800
13ℎ − 15ℎ 3 000
15ℎ − 18ℎ 3 000
18ℎ − 20ℎ 2 200
20ℎ − 23ℎ 1 200

Quelle est l’heure modale d’écoute ?


bAc
La classe modale est 8ℎ − 9ℎ , d’où l’heure modale est =8,5 soit 8h30 min.
&
Remarque : le mode n’a de signification véritable que si l’effectif correspondant est nettement
supérieur aux effectifs présentés par les autres valeurs de la variable.
Le mode ne doit être retenu que s’il est unique (série unimodale)

2. La médiane
2.1. Définition
La médiane, notée Me, est le quantile d’ordre 50%. C’est la valeur qui partage la série, préalablement
classé, en deux séries aux effectifs égaux. Dans la première série, on trouve les valeurs inférieures à la
médiane. Dans la seconde série on trouve les valeurs supérieures à la médiane.
La médiane ne se calcule que pour les données quantitatives et son mode de calcul dépend du type de
données.

2.2. Détermination
2.2.1. Calcul de la médiane
𝑵
Si l’effectif total (N) est pair, alors la médiane se trouve au rang : RMe= . On a une classe médiane.
𝟐
𝑵A𝟏
Si l’effectif total (N) est impair, alors la médiane se trouve au rang : RMe= .
𝟐

a) Cas d’une variable quantitative discrète


Principe :
- Il faut ordonner les valeurs prises par la variable en ordre croissant ou décroissant ;
- Calculer le rang de la médiane ;
- Déterminer la valeur de la médiane suivant les valeurs croissantes ou décroissantes de la
variable. Dans le cas où l’effectif total est pair, on obtient d’abord une classe médiane. La
médiane sera le centre de cette médiane.

34


Exemple 1 : (Effectifpair) : on a relevé les tailles (en cm) de 10 adolescents du même âge :
161 ; 163 ; 164, 166 ; 169 ; 170 ; 173 ; 174 ; 175.
On a : N=10, RMe=
Suivant l’ordre croissant, Me = 169 et suivant l’ordre décroissant, Me = 170. La classe médiane est
donc :

Exemple 2 : (effectif impair) : un élève obtient au cours du trimestre les notes suivantes : 14 7 9 18
10 16 20 4 11 12 15
Ordonnons ces notes :
4 7 9 10 11 12 14 15 16 18 20
RMe = (11+1) /2= 6. D’où Me = 12.

b) Cas d’une variable quantitative continue


Principe :
- Calculer les effectifs cumulés croissants ou décroissants ;
- Calculer le rang de la médiane ;
- Ecrire l’égalité d’interpolation linéaire entre les ordonnées et les abscisses. Puis on tire la
médiane.
- Graphiquement, on obtient la médiane en projetant sur l’axe des abscisses le point
d’intersection de la courbe des effectifs cumulés croissant et décroissants.
- Exemple 1 : (effectif impair) : l’étude des prix d’un article dans 83 magasins donne les résultats
suivants :

Prix (en F) Effectifs Effectifs cumulés croissants


600; 630 17
630; 660 22
660; 690 12
690; 720 13
720; 750 9
750; 780 6
780; 810 4
Total 83

Exemple 2 : (effectifs pair) : une administration qui dispose d’un parc de véhicules a relevé pour 140
d’entre eux les distances parcourues au moment de leurs mise à la reforme.
Distances parcourues Effectifs Effectifs cumulés Effectifs cumulés
( en milliers de KM ) croissants décroissants
80; 85 10
85; 90 14
90; 95 36
95; 100 24
100; 105 20
105; 110 28
110; 130 8
TOTAL 140

35


La distance médiane est parcourue est 97 000 km.

c) Cas de valeurs avec effectifs groupés

Exemple : On a révélé la puissance des voitures d’une entreprise, on a trouvé les résultats suivants :

Puissances Effectifs Effectifs cumulés Effectifs cumulés


croissants décroissants
2 39
3 47
4 56
5 68
6 11
7 27
8 9
Total 257

L’effectif de la population est impair, la médiane occupe le rang : (257+1)/2= 128


L’examen de la colonne des effectifs cumulés croissants montre que la 128e valeur est égale à 4.
Or cette valeur ne correspond pas exactement à la définition de la médiane : il n’y a pas autant de
valeurs inférieures à 4 que de valeurs supérieures à 4. D’une manière générale, dans ce cas, la
médiane n’a pas grande signification.

2.2.2. Détermination graphique de la médiane


La courbe des effectifs cumulés croissant (ou la courbe des effectifs cumulés décroissants) permet
de déterminer graphiquement la médiane.
Pour obtenir la courbe des effectifs cumulés croissants de l’exemple 1 du 2.2.1.b) portons :
- En abscisse ; les intervalles de classe
- En ordonnée : les effectifs cumulés croissants
A chaque limite supérieure d’une classe, faisons correspondre l’effectif cumulé croissant de la classe,
et plaçons sur le graphique le point correspondant. Par exemple pour la classe 630; 660 , dont
l’effectif cumulé est 39, nous obtenons la courbe des effectifs cumulés croissants.
Nous déterminons alors graphiquement la 42e valeur en lisant l’abscisse du point de la courbe dont
l’ordonnée est 42. Nous lisons sur le graphique que la valeur de la médiane est comprise entre 667 et
668.

Remarque : l’abscisse du point d’intersection des courbes des effectifs cumulé croissants et
décroissant donne directement la valeur de la médiane (exemple 2 du 3.2.1.b)
36


Remarque : la médiane donne idée satisfaisante de la tendance centrale d’une distribution statistique.
Elle n’est pas influencée par les valeurs aberrantes de la variable qui pourraient figurer dans la
distribution.

3. Les moyennes
3.1. La moyenne arithmétique simple

Un élève a obtenue les notes suivantes en statistique


9 13 14 12 16 6 10 8
cA$'A$(A$&A$hAhA$iAb
Sa moyenne arithmétique est : 𝑋 = = 11
b

D’une manière générale, une variable x prenant les valeurs x1 ,x2,x3,….xN, la moyenne arithmétique de
jk Ajl Ajm A⋯Ajn
ces valeurs est : 𝑋 =
o
Pour simplifier l’écriture, nous posons :
𝑋) = 𝑋$ + 𝑋& + 𝑋' + ⋯ + 𝑋o

𝑋) Représente donc la somme des N valeurs de la variable (i prend toutes les valeurs entières de 1 à
N).
Nous avons donc la formule de la moyenne arithmétique simple :

37


𝑋) 1
𝑋= = 𝑋)
𝑁 𝑁

3.2. La moyenne arithmétique pondérée


a) Cas de valeur de la variable avec effectifs groupés

Exemple : Aux épreuves du BTS un candidat a obtenu les notes suivantes :


Epreuves Coefficient Notes
Expression française 3 15
Mathématiques 3 8
Exécution des tâches d’ordre comptable 6 7
Travaux relatifs à la vie et à l’organisation de l’entreprise 2 18

Quelle est la moyenne obtenue ?


$XAbApA$b
Le nombre =12 n’a pas de signification car nous devons tenir compte des coefficients des
(
différents matières.
15×3 + 8×3 + 7×6 + 18×2
𝑋=
3+3+6+2
Les coefficients 3, 3,6 et 2 sont appelés coefficients de pondérations. Un coefficient de pondération
indique dans le nombre de fois que la valeur correspondante est prise.
D’une manière générale, soient x1, x2,x3,….xk, les différentes valeurs d’une variable X, et n1,n2,n3,….,nk
les coefficients de pondérations correspondants.
jk 0k Ajl 0l Ajm 0m A⋯jq 0q
La moyenne arithmétique pondérée est : 𝑋 =
0k A0l A0m A⋯A0q

Posons : 𝑋) 𝑛) = 𝑋$ 𝑛$ + 𝑋& 𝑛& + 𝑋' 𝑛' + ⋯ 𝑋r 𝑛r ;


𝑛) = 𝑛$ + 𝑛& + 𝑛' + ⋯ + 𝑛r = 𝑁
j1 01
N est l’effectif total de la population. La formule de la moyenne arithmétique pondérée est : 𝑋 =
o
Pratiquement, on dispose les calculs ainsi :
Notes (Xi) Effectifs (ni) Produit Xi.ni
15 3
8 3
7 6
18 2
Total 14

b) Cas d’une répartition en classes des valeurs de la variable

38


Exemple : Au cours du mois d’octobre 1986 les cantines scolaires d’une commune de la région
parisienne ont servi un certain nombre de repas dont le décompte suit :
Prix du repas 0; 5 5; 7 7; 9 9; 11 11; 13 13; 15 15; 20
(F)
Effectifs
(nombre de 46 69 134 184 261 178 48
repas)

Calculer le prix moyen d’un repas.


Nous ne connaissons pas la répartition des prix des repas à l’intérieur de chaque classe.
Nous convenons que toutes les valeurs appartenant à une même classe sont égales à la valeur centrale
de la classe.
Par exemple, nous avons 46 prix de repas de 0 à 5f : ces 46+ prix seront considérés comme égaux à)
2,50 f, valeur centrale de la classe
Pratiquement on dispose les calculs ainsi :

Prix du repas (F) Effectifs (ni) Centre (Ci) Produit Ci.ni


0; 5 46
5; 7 69
7; 9 134
9; 11 184
11; 13 261
13; 15 178
15; 20 48
Total 920

𝐶) 𝑛)
𝑋=
𝑁
c ciX
𝑋= = 10,76 𝐹, par défaut. Le prix d’un repas est 10,76 F.
c&i

4.1. Définition
On appelle quantile d’ordre k les valeur G1,G2,…,Gk-1 qui divisent la série en k parties d’effectifs
égaux.
Par exemple les quartiles Q1, Q2 , Q3 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Les déciles, D1, D2,…, D9 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Les Centiles C1, C2,…C99 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Sur la série brute, les quantiles se déterminent en ordonnant les valeurs et en faisant des paquets égaux
en effectifs.
Dans les lignes qui suivent nous allons nous intéresser aux quartiles. Toute fois la méthode de
détermination reste la même pour les autres quantiles. Trois quartiles partagent la série en 4 séries de
même taille :
25% des observations sont inférieures au 1er quartile Q25 ;
50% des observations sont inférieures aux 2èmes quartiles Q50 ;
75% des observations sont inférieures au 3ème quartile Q75.

39


4.2. Détermination algébrique des quartiles
Exemple : soit la série statistique suivante
Distance (km) 2; 8 8; 14 14; 20 20; 26 26; 30 Total

Nombre d’élèves (ni) 24 60 56 40 20 200

Effectifs cumulés croissants 24 84 140 180 200

Calculer les trois quartiles.

RESOLUTION

5. Travaux dirigés
EXERCICE 1
Calculer la moyenne géométrique de la série suivante :
1, 2, 4, 8, 16, 32, 64

EXERCICE 2
Dans une bibliothèque, l’ensemble des abonnés a été reparti suivant le nombre d’ouvrages empruntés
durant un mois :
xi 0 1 2 3 4 5 6 7
ni 18 39 57 64 42 33 21 14

40


Calculer les différents paramètres de position de cette série (mode, médiane, moyennes, quartiles et
déciles)

EXERCICE 3

Le tableau suivant donne la répartition d’une population par tranches d’âge :


Classes 0; 10 10; 20 20; 30 30; 40 40; 50 50; 60 60; 70 70; 80
Nombres 18 44 68 54 42 36 16 10

Calculer les quartiles et les déciles de cette série statistique.

EXERCICE 4

Une entreprise établit une statistique portant sur les salaires de ses employés.
a) A l’aide de la courbe des effectifs cumulés croissant représentée ci-dessous, établir un tableau
indique :
- Les classes de salaires
- Les effectifs
- Les effectifs cumulés croissants
c) Calculer le salaire modal
d) Calculer le salaire médian. Vérifier le graphique
e) Calculer le salaire moyen (au franc le plus proche)

EXERCICE 5
On dispose la série statistique suivante, relative aux exploitations agricoles d’une certaine région,
classées d’après leur superficie :
Superficie (en hectares) Nombre d’exploitations
0; 1 27
1; 2 35
2; 3 29
3; 5 54
5; 10 105
10; 20 70
20; 40 40
TOTAL
a) Calculer la superficie modale
b) Calculer la superficie moyenne
c) Présenter, sur un graphique, la courbe des effectifs cumulés croissants et la courbe des effectifs
cumulés décroissants. Donner la signification du point d’intersection des deux courbes. Vérifier
ces coordonnées par le calcul.

41


EXERCICE 6
En mai 2009, les étudiants d’une classe de Communication d’entreprise ont obtenue les notes
suivantes, en statistique appliquée, lors d’un devoir :

6 2 7,5 11,5 12,75 12,75 3,75

10,75 11 6 13,5 12,25 4 9,50

12,75 11 8 13 4 5,50 10,25

8,75 15 8,25 15,75

a) Partir de cette série de nombre, calculer la note moyenne et la note médiane


b) Présenter sous forme de tableau la distribution des effectifs en regroupant les valeurs du
caractère en 7 classes d’amplitude 2 :
( 2; 4 ; 4; 6 ; … 14; 16 )
c) A partir du tableau obtenu, calculer la note moyenne et la note médiane.
d) La note moyenne et la note médiane sont-elles identiques dans les deux cas ? justifier cette
différence. Celle-ci est elle importante ?

EXERCICE 7 :
Calculer les quartiles et les déciles de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 18

42


EXERCICE 8 :
Jean –Claude B. est un fervent adepte de la chasse sous marine en apnée. Sa proie préférée est le bar.
Voici son témoignage : « lors de ma dernière plongée, j’ai harponné au total 3 bars, dont le poids
moyen était de 1,5 kilogramme et le poids médian de 1,2 kilogrammes.
Jean – Claude B. a-t-il capturé ce jour là un bar dépassant le poids de 2 kg ?

43


En complément du chapitre précédent qui étudiait les caractéristiques des tendances centrales d’une
distribution, le présent chapitre s’intéresse à la variabilité des données au sein d’une série. Ainsi, une
fois la moyenne connue, on peut compléter la connaissance d’une série pour apprécier dans quelle
mesure les données sont dispersées ou au contraire concentrées autour de la moyenne.
Sauf dans le cas très rare d’une série statistique où toutes les valeurs sont identiques (Par exemple un
élève qui a 15 sur 20 dans toutes ses matières) il existe toujours une certaine variabilité des données
dans une série. Ainsi, le prix au mètre carré varie plus ou moins d’une maison à l’autre, le prix d’un
produit varie aussi d’un magasin à l’autre. Les salaires varient d’une entreprise à l’autre, de la même
que en général, les notes d’un élève dans les différentes, matières de son cursus.
Les caractéristiques de dispersion sont nombreuses. Nous étudierons ici les plus fréquemment
utilisées : l’étendue ou l’intervalle de variation, la variance et l’écart- type.
I. Activité
Des étudiants ont effectué deux devoirs. Les notes sont les suivantes :
Devoir 1 : 0-3-4-5-5-6-8,5-11-11-11-15-17,5-20
Devoir 2 : 7-7-7,5-7,5-8-8-8,5-9,5-10,5-10,5-11-11-11
$$p $$p
𝑛𝑜𝑡𝑒 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ∶ =9 𝑛𝑜𝑡𝑒 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ∶ =9
$' $'
Devoir 1 𝑛𝑜𝑡𝑒 𝑚é𝑑𝑖𝑎𝑛𝑒 ∶ 8,5 Devoir 2 𝑛𝑜𝑡𝑒 𝑚é𝑑𝑖𝑎𝑛𝑒 ∶ 8,5
𝑛𝑜 𝑒 𝑚𝑜𝑑𝑎𝑙𝑒: 11 𝑛𝑜𝑡𝑒 𝑚𝑜𝑑𝑎𝑙𝑒: 11

44


Nous constatons que ces deux séries ont même mode, même médiane, même moyenne arithmétique,
et cependant elles sont bien différentes. Les paramètres de position sont insuffisants pour les
caractériser. Il est alors nécessaire de mettre en évidence la dispersion des observations : c’est le rôle
des paramètres de dispersion.

2. l’étendue ou intervalle de variation


2.1. Définition

L’étendue est la différence des valeurs extrême de la variable. Autrement dit, c’est la différence entre
la valeur la plus élevée et la valeur la plus faible prise par la variable.
NB : plus l’étendue est faible, moins les valeurs sont dispersées ; et elles sont regroupées autour des
paramètres de position.

2.2. Détermination
a) cas d’une variable discrète avec effectifs groupés
Voici la répartition des comptables selon le nombre de missions effectuées :
Nombre de missions (Xi) 0 1 2 3 5 Total
Nombre de comptables (ni) 9 16 13 6 6 60
Déterminer l’étendue de cette série.
5 est la valeur maximum et 0 est la valeur minimum au niveau des modalités. L’étendue est donc :

45

46


47

48

Vous aimerez peut-être aussi