Académique Documents
Professionnel Documents
Culture Documents
REPRESENTATION
GRAPHIQUES……………………………………………………………………………………….24
LES PARAMETRES DE
POSITION…………………………………………………………………………..………………..44
LES PARAMETRES DE
DISPERSION…………………………………………………..…………………………………….60
Ce chapitre introductif est consacré à la définition de la statistique ainsi que des différents termes qui
en constituent le vocabulaire de base.
Dans le langage courant le mot « statistiques » désigne un ensemble de données souvent numériques
sur un phénomène.
Ainsi, les statistiques constituent un ensemble d’information dont on devra analyser les caractéristiques
principales afin de traduire les réalités qu’elles représentent.
Quant à la « la statistique », elle désigne l’ensemble des méthodes ayant pour but d’analyser les
statistique. La statistique est donc l’étude mathématique des statistiques en vue d’en tirer des décisions.
La statistique descriptive appartient cependant à un ensemble plus vaste, la statistique générale, qui se
divise en deux branches : statistique descriptive, et la statistique mathématique (ou statistique
‘’inférentielle’’). Dont l’objet est de formuler des lois de comportement à partir d’observation souvent
incomplètes. Cette dernière intervient dans les enquêtes et les sondages. Elle s’appuie non seulement
sur la statistique descriptive, mais aussi sur le calcul des probabilités.
Statistique descriptive
Statistique générale
Statistique inférentielle
Il suffit d’allumer son ordinateur ou d’écouter les informations à la radio pour constater que les
statistiques sont partout. Ceci relève que le monde moderne est presque entièrement tourné vers le
quantitatif et le mesurable. D’où l’intérêt de la statistique, discipline relativement récente, mais qui
correspond parfaitement à cette orientation du monde moderne.
La statistique s’applique à la plupart des disciplines : agronomie, biologie , démographie (les données
collectées permettent l’étude des moralités), économie , sociologie, linguistique, psychologie, le
marketing ( la création et la mise sur le marché d’un nouveau produit nécessite l’utilisation de
technique de sondage consistant à interroger un échantillon de la population ), la modélisation
statistique ou économique (elle permet de représenter une réalité par des relations pour par exemple
prévoir la variable futur ou quantifier l’effet d’un choc sur une variable donnée)…
1. Démarche statistique
- La conception : elle définit les objectifs généraux et spécifiques à atteindre, la population
statistique, les unités statistiques, les caractères à étudie, la nomenclature retenue. Elle prépare la
phase de la collecte.
- La collecte des données : c’est la phase d’exécution de l’enquête, de chiffrement
- L’apurement : elle comporte la conception des masques de saisies, la saisie elle-même, la phase de
vérification de contrôle, de redressement, de traitements des points particuliers.
- L’analyse des données : représentation sous forme de tableaux, graphiques, calcul des
caractéristiques de tendance centrale et de dispersion, et éventuellement la modélisation.
- Les recommandations : sur la base des résultats obtenus.
Comme le mathématicien, le statisticien doit d’abord définir avec précision l’ensemble de référence
sur lequel vont porter les observations ; cet ensemble est appelé ensemble statistique ou population
statistique. La population statistique est donc l’ensemble sur lequel porte une étude. C’est l’ensemble
dans lequel le statisticien opère, c'est-à-dire l’ensemble des unités observées.
Chaque élément de la population statistique est un individu ou une unité statistique. Lorsque la
population est trop importante pour être connue entièrement, on prélève un échantillon. Les relations
qui existent qui existent entre la population, les échantillons et les unités statistiques sont résumées
dans le schéma ci-dessous :
Dans une population, par exemple celle des étudiants d’une faculté, les unités sont repérées par le nom
et prénom des étudiants (on a donc une liste). Si l’on souhaite étudier cette population, on va retenir
certains critères d’étude comme le sexe, la filière principale à laquelle chaque étudiant se rattache, les
matières optionnelles qu’il a choisies, l’âge, le poids, la taille, etc.
Parmi ces critères, certains sont quantitatifs, comme l’âge, le poids, la taille. On peut en effectuer des
calculs numériques sur ces critères : poids moyen, taille maximale, taille minimale, etc. D’autres
critères ne sont pas quantifiables, car on ne peut pas effectuer de calculs dessus. Ils sont qualitatifs.
C’est le cas du sexe par exemple. On peut connaitre l’effectif masculin et féminin d’une population,
mais la notion de « sexe moyen » n’a pas de sens et ne peut d’ailleurs pas être calculée.
Afin de différencier les deux types de critères, les critères qualitatifs sont appelés des caractères et les
critères quantitatifs et on qualifie de valeurs les différents chiffres d’une variable.
Le caractère (variable) statistique est donc l’aspect particulier de l’individu auquel on s’intéresse.
Quant aux modalités, ce sont les différentes rubriques associées à des caractères. Autrement dit, ce
sont les différentes valeurs possibles du caractère étudié. Ainsi, le caractère « sexe » comporte deux
modalités.
Exemples :
- Si l’on dresse une statistique du personnel d’une entreprise d’après l’ancienneté de ses membres,
l’ensemble du personnel constitue la population, chaque membre de ce personnel est une unité
statistique, et le caractère statistique est l’ancienneté de chacun de ses membres.
- Si l’on dresse une statistique du parc automobile d’un département (ensemble des voitures
immatriculées dans ce département) à une date donnée d’après la marque des voitures, la
population est ce parc automobile, l’unité statistique, chacune des voitures, et le caractère
statistique la marque de chaque voiture.
Les modalités d’un caractère qualitatif, si elles ne peuvent pas être mesurées quantitativement, sont
parfois susceptibles d’être classées. Ce sont des modalités ordinales.
(a) Nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e) très bonne , (f) excellente
Il s’agit de modalités ordinales puisqu’elles peuvent être hiérarchisées : une prestation excellente est
meilleure qu’une prestation bonne, etc. La différence avec des valeurs quantitatives est qu’on ne peut
dire, par exemple, si une prestation jugée excellente est deux fois ou quatre fois meilleure qu’une
prestation décrite comme moyenne. On ne peut effectuer un classement, non une quantification.
Exemple 2 : Des chemises sont classées par taille : XS, S, M, L, XL, XXL, XXXL. Il s’agit de
modalités faussement ordinales. En réalité il existe un tableau de correspondance qui explicitera à
quelle taille en cm chacune de ces catégories correspond.
Les modalités d’un caractère qualitatif qui ne peuvent pas être classées ou hiérarchisées sont dites
nominales.
Il est clair qu’aucune comparaison ni hiérarchisation ne peuvent être établies entre ces modalités. Elles
sont nominales.
Remarque : Certaines modalités purement nominales sont parfois codées avec des chiffres. Par
exemple, le sexe des individus d’une population sera codé par ‘’1’’ pour les hommes et par ‘’2’’ pour
les femmes. Il s’agit bien là d’une tentative de quantification d’une variable purement nominale. On
parle alors de variables pseudo-numériques. On peut en effet de cette façon calculer une moyenne, qui
sera en fait la proportion des hommes dans la population ou dans l’échantillon.
Une variable quantitative peut-être discrète ou continue. Lorsque le nombre de valeurs possibles est
fini (exemple : le nombre d’enfants, le nombre de pièces d’un logement, etc.), la variable est discrète.
Lorsque le nombre de valeurs possibles de la variable est infini (exemple : la taille, le poids ou le
revenu des ménages), la variable est continue.
Une fois les unités statistiques d’une population répertoriées, celles-ci sont présentées dans des
tableaux, de diverses manières : effectifs ou fréquences absolues, fréquences relatives, pourcentages,
ratios, indices et taux. Il convient de définir ces termes avec précision :
Il s’agit de la répartition brute des données. Lorsque les données sont présentées individuellement,
chaque donnée à la même fréquence unitaire d’apparition, leur effectif ou fréquence absolue est égale
à 1. Lorsque les données sont regroupées par valeur ou modalités, les effectifs ou fréquences absolue
correspondent au nombre de données qui ont la valeur ou modalité ou encore qui sont groupées dans
une classe donnée.
𝑁 = 𝑛$ + 𝑛& + 𝑛' + 𝑛( = 𝑛)
La fréquence relative est égale à la fréquence absolue (effectif) divisée par l’effectif total. On a donc :
𝑛)
𝑓) = 𝑒𝑡 𝑓) + 𝑓& + ⋯ + 𝑓) = 1
𝑛
Le pourcentage des données qui correspondent à une modalité, à une valeur ou à une classe s’obtient
en multipliant la fréquence relative correspondante par 100. C’est-a-dire :
01
𝑓) = ×100et 𝑓$ + 𝑓& + ⋯ + 𝑓4 = 𝑓) = 100
0
Exemple : le tableau suivant indique la répartition des ménages en fonction du nombre d’ampoules
utilisées à leur domicile.
Effectifs ou Fréquences Fréquence en
Classes fréquences relatives pourcentages
absolues (𝑓) )
(𝑛) )
2−5 21
5 − 10 63
0 − 15 16
Total 100
Les colonnes 2 (fréquences absolues) et 4 (fréquences en pourcentages) contiennent les mêmes valeurs
car l’effectif total est égal à 100. Si celui-ci était différent de 100, les valeurs contenues dans les deux
colonnes seraient différentes.
Par convention, une classe est un intervalle fermé à gauche et ouvert à droite, du type 𝑎; 𝑏 . Elle est
dite « bornée » si a ≠ −∞et 𝑏 ≠ +∞.
L’effectif 𝑛) de la classe numéro i est le nombre d’individu dont le caractère prend une valeur
supérieure ou égale à 𝑎 et strictement inférieur à b.
Le centre d’une classe bornée est égal à la moyenne arithmétique des deux bornes de la classe. On a :
@AB
𝐶) = .
&
L’amplitude d’une classe bornée est égale à la différence entre la borne supérieure et la borne inférieur
de cette classe. On a : 𝑎) = 𝑏 − 𝑎.
La densité d’une classe bornée est égale au quotient de l’effectif de cette classe par son amplitude. On
𝒏
a :𝒅𝒊 = 𝒊 .
𝒂𝒊
NB : on calcule les densités lorsque les classes sont d’amplitudes inégales (mais finies).
L’effectif cumulé croissant de la valeur de rang k (ou de la classe de rang k) est la somme des effectifs
des modalités ou valeurs depuis la première jusqu’à celle de rang k incluse (on définit de même la
fréquence cumulée décroissante)
Un ratio est une fraction qui divise deux quantités. Les fréquences relatives sont des ratios puisqu’elles
divisent deux quantités. Plus généralement, les ratios sont très utilisés en statistiques.
Exemple 1 : Soit la série de pièces défectueuses produites par 10 machines au cours d’une semaine
donnée.
8,16,9,33,14,5,3,7,10,7
Ces chiffres sont des taux car ils sont exprimés dans l’unité « semaine ». Cette unité est « I ». On dit
par conséquent 8 pièces par semaine, 16 pièces par semaine, etc.
Un indice est le ratio d’une quantité à une autre quantité qui sert de référence, multiplié par 100.
Exemple 3 : Soit la série de pièces défectueuses produites par 10 machines au cours d’une semaine
donnée de l’exemple 1. Divisions chacune des valeurs de la série par la valeur la plus faible et
multiplions ensuite chaque valeur par 100. Le résultat est une série d’indices, la « base 100 » étant la
machine numéro7.
266,7 ; 533,3 ; 300 ; 1100 ; 466,7 ; 166,7 ; 100 ; 233,3 ; 333,3 ; 233,3
3. Méthode d’observation
3.2.1. Dénombrement instantané. Dénombrement continu
Le dénombrement que suppose toute statistique peut être instantané ou au contraire continu. Ainsi la
population d’un pays à une date donnée peut être connue à l’aide d’un recensement effectué à cette
même date (dénombrement instantané) ou à, partir d’un recensement antérieur, par addition ou
soustraction, suivant le cas, des nombres des naissances, des décès, des émigrés, des immigrés
(dénombrement continu).
Etude complète d’une population (enquête exhaustive), son recensement, c'est-à-dire l’examen de
toutes les unités qui la composent, n’est pas toujours possible. Cette étude quand elle est possible peut
demander du temps, et son coût peut être élevé. Il peut aussi arriver que les unités statistiques observées
soient détruites à l’occasion de leur examen. Pour ces diverses raisons on peut être conduit à observer
qu’une partie de la population, c'est-à-dire à procéder à un sondage (enquête partielle). Les unités
étudiées à l’occasion du sondage constituent un échantillon. L’étude de cet échantillon fournira des
informations et conduira à des conclusions qui pourront être étendues avec précaution, à la population
complète (population mère).
4.2.3. Questionnaires
Lorsque les unités statistiques sur lesquelles porte l’observation sont des personnes, elles peuvent être
soumises à un questionnaire. Destiné à fournir des renseignements nombreux et aussi exact que
possible, un questionnaire doit présenter un certain nombre de qualités :
- Les questions ouvertes ou l’on peut librement exposer ses raisons.
Supposons qu’on ait à dresser une statistique portant sur la situation matrimoniale de vingt
personnes de sexe masculin. On a retenu pour ce caractère, qualificatif les modalités suivantes :
célibataire, marié, veuf, divorcé.
Pour faciliter le dépouillement on a établi le code suivant les différentes situations matrimoniales
possibles se verront affecter des numéros :
Célibataire : 1 marié : 2 veuf : 3 divorcé : 4
Les vingt personnes interrogées ont fourni les réponses suivantes :
2 1 1 4 1 4 3 2 2 2
3 2 1 1 4 2 2 1 2 3
Le dépouillement va consister à compter combien, parmi les vingt unités statistiques observées,
répondent à la modalité codée1, à la modalité codée2, et ainsi de suite. Exécuté de façon manuelle
le dépouillement pourra se présenter de la façon suivante :
Si les modalités que peut présenter le caractère qualitatif étudié sont très nombreuses, elles pourront
faire l’objet d’une véritable nomenclature.
4.3.2. Dépouillement dans le cas d’un caractère quantitatif (ou variable statistique)
Exemple1 : supposons que vingt sportifs aient été pesés à l’occasion d’un contrôle médical. Les
résultats sont les suivants, l’unité de poids retenue étant le kilogramme :
77,45 62,2 67,82 71,28 74,37
81,29 78,54 63,22 59,47 61,33
56,41 63,23 63,28 71,66 68,72
54,93 71,44 74,31 77,82 67,41
Il est bien certain que, dans pareil cas, pour pouvoir dresser une statistique, il faudra diviser le
domaine de variation de la variable, ici de 54,93 kg à 81,29kg en intervalles (ou classes), de
préférence amplitude constante.
Par exemple le dépouillement pourra se présenter comme suit :
Classes (d’amplitude 5 kg) Effectifs
De 50 à 55
De 55 à 60
De 60 à 65
De 65 à 70
De 70 à 75
De 75 à 80
Plus de 80
TOTAL
Exemple2 : On a questionné 100 ménages sur le nombre d’ampoules électrique utilisées dans leur
domicile. Dans le premier tableau, les données sont regroupées par nombre d’ampoules. Dans le
second tableau, elles sont regroupées par classes.
4. Séries statistiques
On appelle série statistique la suite des valeurs prises par une variable x sur les unités
d’observation.
Le nombre d’unités d’observation est noté N. Les valeurs de la variable x sont notées x1, x2,…,
xN
10
4.1. Tableau statistique à simple entrée
Le tableau statistique le plus simple sera celui où figureront deux colonnes réservées
respectivement :
- La première, à l’inscription des modalités prises part le caractère, ou des valeurs prises par la
variable désignée par xi ;
- La seconde à l’inscription des effectifs du personnel d’une entreprise d’après le nombre d’enfant à
charge.
Exemple1 : distribution statistique du personnel d’une entreprise d’après le nombre d’enfants à charge
Nombre d’enfant à charge Effectifs Fréquences (%) ECC ECD FCC FCD
0 4
1 15
2 29
3 18
4 10
5 3
6 1
TOTAL 80
Exemple 3 : Distribution statistique de 20 sportifs d’après leurs poids lors d’un contrôle médical
(caractère quantitatif continu)
11
0; 55 1
55; 60 2
60; 65 5
65; 70 3
70; 75 5
75; 80 3
80; 85 1
Total 20
Nous nous sommes jusqu’ici limité à l’observation, sur chaque unité statistique, d’un seul caractère.
Or il est fréquent qu’on soit amené à observer, sur une même unité, deux ou plus de deux caractères.
Exemple 1 : Répartition des enfants de sexe masculin d’une école maternelle d’après leur âge et leur
poids.
0; 15 19 7 1 27
15; 20 32 21 12 65
20; 25 3 28 28 49
25; 30 0 1 1 1
Totaux 54 46 42 142
Handicaps
Aveugles et Sourds et Handicapés Total
Sexe amblyopes malentendants moteurs
Filles 74 22 21 117
Garçons 43 72 23 138
Total 117 94 44 255
12
6.Opérateurs SOMME ET PRODUIT
A- L’opérateur somme
Pour exprimer une somme d’éléments de façon compacte, on utilise l’opérateur somme, symbolisé par
la lettre grecque majuscule ‘’Sigma’’
Exemple 1 : Soit quatre valeurs d’une variable x, indicées par i : x1 ; x2 ; x3 ; x4. La somme de ces 4
valeurs est donnée par l’expression :
(
𝑥) = 𝑥$ + 𝑥& + 𝑥' + 𝑥(
)W$
L’expression de gauche se lis ainsi ‘’somme des xi pour i allant de 1 à 4’’. Plus généralement, pour
une somme de n éléments, on écrit :
0
𝑥) = 𝑥$ + 𝑥& + ⋯ + 𝑥(
)W$
xi yi
( ( (
1 2 Y 𝑥) Y 𝑦) Y 𝑥²)
-3 3 )W$ )W$ )W$
-4 4
(
(
2 5 Y 𝑥²) 𝑦)
Y( 𝑥) + 𝑦) )
)W$
)W$
𝑎 = 𝑎 + ⋯ + 𝑎 = 𝑛𝑎 (a constante)
)W$
3 = 3 + 3 + 3 + 3 + 3 = 5×3 = 15.
)W$
Mise en évidence :
(a constante) 13
0 0
𝑎𝑥) = 𝑎 𝑥)
)W$ )W$
'
Distribution :
0 0 0
(𝑥) + 𝑦) ) = 𝑥) + 𝑦)
)W$ )W$ )W$
0 0 0
(𝑥) − 𝑦) ) = 𝑥) − 𝑦)
)W$ )W$ )W$
7. Travaux dirigés
EXERCICE 1 :
EXERCICE 2 :
Parmi les caractères quantitatifs suivants, quels sont ceux qui peuvent être considérés comme discrets
et ceux qui peuvent être considérés comme continus ?
14
d) Nombre de places de cinéma associé à chaque salle
e) Nombre d’enfants par ménage.
EXERCICE 3 :
On considère l’ensemble des notes obtenue, lors d’un test noté sur 20, par 50 candidats.
10 8 3 12 13 9 12 9 12 11
11 11 8 5 13 14 14 6 12 16
7 11 10 10 2 15 12 10 1 14
11 7 8 10 13 9 13 9 7 13
11 19 9 4 10 8 9 6 7 14
1) Dépouiller ces données et présenter les résultats dans un tableau. (On prendra les classes suivantes :
0; 5 , 5; 7 , : 7; 9 , : 9; 11 , : 11; 13 , 13; 15 , : 15; 20
2) Calculer les fréquences en pourcentages.
3) Calculer les fréquences cumulées croissantes et décroissantes en pourcentage.
4) Quelle est la proportion des candidats ayant une note inférieure à 9 ?
5) Quelle est la proportion des candidats ayant une note supérieure ou égale à 13 ?
6) Quelle est la proportion des candidats ayant une note comprise entre 5 et 20 ?
7) Quelle est la classe dont la densité est la plus forte et celle dont la densité est la plus faible ?
EXERCICE 4 :
Handicaps
Aveugles et Sourds et Handicapés Total
Sexe amblyopes malentendants moteurs
Filles 22
Garçons 43 23 138
Total 117 255
Dans cette école, 80% des enfants sont internes, calculer le nombre d’élèves vivant à l’internat.
15
EXERCICE 5 :
]
NB : Les densités sont calculées avec les fréquences (di= 1 )
@1
EXERCICE 6 :
Vous faites une enquête dans une maternité auprès de 60 femmes et vous étudiez l’âge de la mère à la
date de la naissance de leur premier enfant.
23 24 18 19 35 26 28 24 22 19
19 17 22 26 31 28 29 21 20 22
23 18 20 27 29 24 24 22 23 23
32 29 27 21 22 23 24 28 32 30
25 26 23 20 29 35 38 19 20 22
24 23 31 26 27 20 21 22 23 28
1) Quelle
est
la population
étudiée ?
2) Quel est le nombre d’individus ?
3) Quel est le caractère étudié ?
4) Le caractère étudié est–il discret ou continu ?
5) Regroupez cette série en fonction des valeurs croissantes du caractère. Faire apparaitre les
effectifs. Après avoir rappelé la notion de fréquence. Calculez les fréquences relatives à
chacune des modalités.
16
EXERCICE 8 : Les variables suivantes sont-elles quantitatives ou qualitatives ?
I- Introduction
17
Si la série étudiée est une série à caractère quantitatif, elle peut être représentée par un diagramme en
bâtons (variable discrète), par un histogramme (variable continue).
I. SITUATION
Une enquête statistique a été effectuée sur 400 voitures d’occasion de modèle courant appartement à
des marques françaises vendues par l’intermédiaire d’une revue de vente de particulier. Quatre
caractères ont été étudiés :
On construit un diagramme en bâtons quand les valeurs de la variable sont peu nombreuses
(essentiellement caractères quantitatifs à variable discrète).
Sur l’axe des abscisses sont marqués chacune des valeurs de la variable (puissance fiscale).
On gradue l’axe des ordonnées afin de porter les effectifs. L’ensemble des bâtons obtenus constitue
un diagramme en bâtons.
NB : dans un diagramme en bâtons, les hauteurs des différents bâtons sont proportionnelles aux
effectifs correspondants.
Exemple :
18
Par exemple, il est aisé de vérifier sur le diagramme que la hauteur du premier bâton (effectif 24)
est double de celle de l’avant –dernier bâton (effectif 12).
On construit un histogramme quand les valeurs sont reparties en classes (essentiellement caractère
quantitatif continue).
Dans un histogramme, les aires des différents rectangles sont proportionnelles aux effectifs
correspondants.
Sur l’axe des abscisses on porte les intervalles de classes et on construit des rectangles dont les
aires sont proportionnelles aux effectifs des classes ; pour cela, il suffit d’élever les hauteurs
correspondantes aux effectifs des classes. L’ensemble des rectangles constitue un histogramme.
Exemple :
19
Par exemple, il est aisé de vérifier sur le graphique que l’aire du sixième rectangle (effectif 42) est
le double de celle du septième rectangle (effectif 21).
En joignant les milieux des sommets des rectangles et en complétant le tracé de part et d’autre de
l’histogramme en supposant deux classes de même amplitude d’effectif nul, on obtient un
polygone des effectifs (ou des fréquences).
Ainsi tracé, le polygone des effectifs (ou des fréquences) à même aire que l’histogramme
correspondant ; en effet il y a compensation 2 à 2 des aires des rectangles non communs (exemple
des triangles hachurés sur le graphique précédent).
- On choisit un intervalle unitaire (généralement celui de la classe la plus petite). Noté au : C’est
le PGCD des amplitudes des classes. au= PGCD (ai).
𝒂
- On détermine le nombre d’intervalles unitaire de chaque classe, noté Ri.Ri = 𝒊
𝒂𝒖
- On détermine la hauteur du rectangle en divisant l’effectif de la classe par le nombre
𝒏
d’intervalles unitaires. Effectifs corrigé = 𝒊
𝑹𝒊
- Construction de l’histogramme : en ordonnées on porte les effectifs par corrigés et en abscisses
les intervalles.
Exemple :
20
25 000; 30 000 68
30 000; 35 000 50
35 000; 45 000 36
45 000; 60 000 36
Total 400
au= 5 000
On porte sur l’axe des abscisses les modalités des caractères, et sur l’axe des ordonnées les effectifs
ou les fréquences. Puis on trace une bande verticale proportionnelle à l’effectif associé à chaque
modalité.
21
Israël 310
Jordanie 1 960
Syrie 2 570
Le caractère étant qualitatif, on peut utiliser un diagramme à bande pour représenter ce phénomène.
En effet, ce type de diagramme permet une comparaison des effectifs associés à chaque modalité.
Pour pouvoir comparer les filières droit et sciences économiques, nous allons représenter sur le
même diagramme les effectifs associés à chaque année étude.
22
6. Diagramme à secteur (ou diagramme circulaire)
Exemple :
On trace des secteurs dont les mesures des angles au centre sont proportionnelles aux fréquences
exprimées en pourcentages.
Citroën :
Peugeot :
Renault :
Simca :
Talbot :
Peugeot :
Renault :
Simca :
Talbot :
23
7. Diagramme spécifiques
24
7.2. La pyramide des âges :
Lorsque l’on répartit une population en fonction de l’âge et du sexe des individus, on représente le
phénomène à l’aide d’un diagramme particulier appelé pyramide des âges.
Une pyramide des âges est un graphique qui indique la composition d’une population par classes d’âge
et par sexe, à un moment donné. La population concernée peut être celle d’un pays (c’est le cas le plus
fréquent), mais aussi celle d’un groupe de pays, d’un continent, ou d’unités spatiales plus petites, par
exemple une ville ou une entreprise. Quelle qu’en soit la présentation au niveau des détails (effectifs
des classes présentés en chiffres absolus , en pour –cent de la population totale ou en pour –cent de la
population de chaque sexe), une pyramide des âge donne des renseignements très précieux sur
l’histoire de la population concernée : elle montre en particulier la répartition entre jeunes, adultes et
personnes âgées, répartition qui dépend en premier lieu de l’évolution de la natalité et de la mortalité ;
elle porte la trace des « accidents » qui ont pu toucher la population étudiée.
Attention : Toutefois comme c’est le cas pour tous les indicateurs statistiques, une pyramide des âges
fournit des informations brutes qui permettent de formuler des constats, mais qui ne donnent pas à
elles seules l’explication de ces constats ! Pour expliquer ou interpréter ces informations, il est
nécessaire d’avoir recours à d’autres documents relatifs à la population que l’on étudie.
Une pyramide des âges est un graphique ordonné selon deux axes :
En général, pour la commodité de la lecture, les pyramides des âges regroupent les individus par
tranches de 5 ans, parfois de 10 ans : ainsi, la tranche 0-5 ans contient toute la population née durant
les cinq dernières années ;
- L’axe horizontal indique l’effectif de la population contenu dans chaque tranche d’âge ;
l’échelle peut être fondée sur des quantités relatives (généralement des pourcentages). Le
recours aux pourcentages permet d’effectuer plus facilement des comparaisons entre les
pyramides des âges de populations d’effectifs très différents ;
- Le graphique est divisé en deux parties, une pour le sexe masculin, l’autre pour le sexe féminin.
Une pyramide « en champignons » (base étroite et sommet large) présente un déficit de jeune
salarié face à une population plus âgée. Cela peut conduire à une perte de compétences, un déficit
de connaissance (transmission des savoirs) une altération des valeurs de l’entreprise et de la
mobilité interne….
25
Une pyramide « en violon » fait apparaître une coexistence intergénérationnelle de populations
salariées. Le resserrement observé en son centre ouvre potentiellement sur des différences
culturelles, des divergences de visions et de méthodes de travail entre les générations.
Pour éviter ces risques, il faut mettre en place une véritable.
Une pyramide « en poire écrasée » présente une population salariée jeune… mais aussi peu
expérimentée. L’importance de l’expérience à peut être été occultée et le recrutement est figé. La
mise en place une gestion prévisionnelle des emplois et des compétences (formation, évolution de
carrière…) est nécessaire.
Une pyramide « en ballon de rugby » est plus harmonieuse. Elle traduit certainement une
stratégie de recrutement régulière et une gestion des parcours professionnels…
Exemple : la société POUSSIN IVOIRE, société ivoirienne de production de poussins est implantée à
AGNIBILEKRO et présente les caractéristiques suivantes au niveau de son effectif :
26
35-39 ans 55 15
40-44 ans 90 25
45-49 ans 100 35
50-54 ans 40 15
55-60ans 20 10
TAF : Faites la pyramide des âges de cette entreprise
On construit un diagramme polaire pour comparer les variations d’une série statistique présentant une
périodicité dans le temps (mois, trimestre, année…).
Exemple : On s’est intéressé aux livraisons d’essence SUPER dans une station de la ville d’Abidjan
(livraisons trimestrielles en millions de m3)
Trimestres
1 2 3 4
Années
27
8. Travaux dirigés
EXERCICE 1 :
L’hôtel dans lequel vous travaillez est équipé de 25 chambres. 6 dont le prix d’une nuitée est 100F , 5
dont le prix d’une nuitée est 120 F , 4 dont le prix d’une nuitée est 140 F , 7 dont le prix d’une nuitée
est 180F, 3 dont le prix d’une nuitée est 200 F . Sa fréquentation lors de la semaine écoulée est
représentée par le graphique ci-dessous.
a) Quel nom donne –t-on à ce graphique ?
b) Compléter le tableau.
c) Calculer par rapport au nombre total de chambres, le pourcentage d’occupation de cet hôtel
EXERCICE 2 :
Une bibliothèque vient de dépenser 672 750 F pour l’acquisition d’un certain nombre de livres. Il est
établi une répartition de ces livres d’après leur prix.
a) Sachant que le prix moyen d’un livre est 2 990 F, déterminer le nombre total de livres achetés.
b) Reproduire et compléter le tableau ci-dessous :
28
Total 100
EXERCICE 3 :
D’après une étude sur 500 demandeurs d’emploi de moins de 25 ans, classées d’après l’ancienneté
de leur demande d’emploi, on a obtenu le diagramme circulaire ci-dessous :
29
Total
b) Tracer l’histogramme des effectifs
Echelle : 1 cm pour 3 mois en abscisse
1 cm pour 20 demandeurs d’emploi en ordonnées
EXERCICE 4 :
Le tableau suivant donne les résultats d’une enquête sur le poids (en Kg) des individus d’une
population :
48 72 54 80 58 70 69 58 57 60
85 94 78 81 64 49 54 57 57 62
63 69 72 71 82 87 64 65 73 58
61 67 49 52 60 66 69 89 84 82
73 70 72 58 64 51 65 77 79 80
59 57 81 78 76 79 68 67 53 59
1) Classer ces résultats par classes d’amplitudes 5 : 45; 50 ,…
2) Calculer les fréquences et les fréquences cumulées en pourcentages
3) Construire l’histogramme et le polygone des fréquences.
30
4) Construire la courbe des fréquences cumulées croissantes.
EXERCICE 5
31
Les tableaux de nombres, et les représentations graphiques donnent une vue d’ensemble du phénomène
étudié.
Le statisticien s’efforce de caractériser chaque distribution à l’aide de quelques paramètres
remarquables afin de pouvoir, en particulier, comparer deux ou plusieurs statistiques en caractérisant
l’ordre de grandeur des observations. Ils s’expriment dans la même unité que les observations.
I- Le mode
1.1. Définition
On appelle mode d’une série statistique la valeur de la variable quia le plus grand effectif (ou la plus
grande fréquence).
Pour une distribution groupée dont les classes sont d’égales amplitudes, on appelle classe modale, la
classe d’effectifs maximum.
32
Attention ! Si les classes sont d’amplitudes inégales, une classe d’effectifs maximum n’est pas
forcément classes modales.
Remarque
- Graphiquement, sur un diagramme en bâtons, le mode est l’abscisse du bâton le plus haut.
- Une série statistique peut être bimodale ou multimodale
1.2. Détermination
33
Heures d’écoute Effectifs (nombre Nombre d’intervalles Effectifs corrigés
d’auditeur en milliers) unitaires
5𝐻 − 6𝐻 500
6ℎ − 7ℎ 2 500
7ℎ − 8ℎ 2 800
8ℎ − 9ℎ 3 000
9ℎ − 12ℎ 7 200
12ℎ − 13ℎ 2 800
13ℎ − 15ℎ 3 000
15ℎ − 18ℎ 3 000
18ℎ − 20ℎ 2 200
20ℎ − 23ℎ 1 200
2. La médiane
2.1. Définition
La médiane, notée Me, est le quantile d’ordre 50%. C’est la valeur qui partage la série, préalablement
classé, en deux séries aux effectifs égaux. Dans la première série, on trouve les valeurs inférieures à la
médiane. Dans la seconde série on trouve les valeurs supérieures à la médiane.
La médiane ne se calcule que pour les données quantitatives et son mode de calcul dépend du type de
données.
2.2. Détermination
2.2.1. Calcul de la médiane
𝑵
Si l’effectif total (N) est pair, alors la médiane se trouve au rang : RMe= . On a une classe médiane.
𝟐
𝑵A𝟏
Si l’effectif total (N) est impair, alors la médiane se trouve au rang : RMe= .
𝟐
34
Exemple 1 : (Effectifpair) : on a relevé les tailles (en cm) de 10 adolescents du même âge :
161 ; 163 ; 164, 166 ; 169 ; 170 ; 173 ; 174 ; 175.
On a : N=10, RMe=
Suivant l’ordre croissant, Me = 169 et suivant l’ordre décroissant, Me = 170. La classe médiane est
donc :
Exemple 2 : (effectif impair) : un élève obtient au cours du trimestre les notes suivantes : 14 7 9 18
10 16 20 4 11 12 15
Ordonnons ces notes :
4 7 9 10 11 12 14 15 16 18 20
RMe = (11+1) /2= 6. D’où Me = 12.
Exemple 2 : (effectifs pair) : une administration qui dispose d’un parc de véhicules a relevé pour 140
d’entre eux les distances parcourues au moment de leurs mise à la reforme.
Distances parcourues Effectifs Effectifs cumulés Effectifs cumulés
( en milliers de KM ) croissants décroissants
80; 85 10
85; 90 14
90; 95 36
95; 100 24
100; 105 20
105; 110 28
110; 130 8
TOTAL 140
35
La distance médiane est parcourue est 97 000 km.
Exemple : On a révélé la puissance des voitures d’une entreprise, on a trouvé les résultats suivants :
Remarque : l’abscisse du point d’intersection des courbes des effectifs cumulé croissants et
décroissant donne directement la valeur de la médiane (exemple 2 du 3.2.1.b)
36
Remarque : la médiane donne idée satisfaisante de la tendance centrale d’une distribution statistique.
Elle n’est pas influencée par les valeurs aberrantes de la variable qui pourraient figurer dans la
distribution.
3. Les moyennes
3.1. La moyenne arithmétique simple
D’une manière générale, une variable x prenant les valeurs x1 ,x2,x3,….xN, la moyenne arithmétique de
jk Ajl Ajm A⋯Ajn
ces valeurs est : 𝑋 =
o
Pour simplifier l’écriture, nous posons :
𝑋) = 𝑋$ + 𝑋& + 𝑋' + ⋯ + 𝑋o
𝑋) Représente donc la somme des N valeurs de la variable (i prend toutes les valeurs entières de 1 à
N).
Nous avons donc la formule de la moyenne arithmétique simple :
37
𝑋) 1
𝑋= = 𝑋)
𝑁 𝑁
38
Exemple : Au cours du mois d’octobre 1986 les cantines scolaires d’une commune de la région
parisienne ont servi un certain nombre de repas dont le décompte suit :
Prix du repas 0; 5 5; 7 7; 9 9; 11 11; 13 13; 15 15; 20
(F)
Effectifs
(nombre de 46 69 134 184 261 178 48
repas)
𝐶) 𝑛)
𝑋=
𝑁
c ciX
𝑋= = 10,76 𝐹, par défaut. Le prix d’un repas est 10,76 F.
c&i
4.1. Définition
On appelle quantile d’ordre k les valeur G1,G2,…,Gk-1 qui divisent la série en k parties d’effectifs
égaux.
Par exemple les quartiles Q1, Q2 , Q3 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Les déciles, D1, D2,…, D9 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Les Centiles C1, C2,…C99 divisent la série statistique ordonnée en 4 parties d’effectifs égaux.
Sur la série brute, les quantiles se déterminent en ordonnant les valeurs et en faisant des paquets égaux
en effectifs.
Dans les lignes qui suivent nous allons nous intéresser aux quartiles. Toute fois la méthode de
détermination reste la même pour les autres quantiles. Trois quartiles partagent la série en 4 séries de
même taille :
25% des observations sont inférieures au 1er quartile Q25 ;
50% des observations sont inférieures aux 2èmes quartiles Q50 ;
75% des observations sont inférieures au 3ème quartile Q75.
39
4.2. Détermination algébrique des quartiles
Exemple : soit la série statistique suivante
Distance (km) 2; 8 8; 14 14; 20 20; 26 26; 30 Total
RESOLUTION
5. Travaux dirigés
EXERCICE 1
Calculer la moyenne géométrique de la série suivante :
1, 2, 4, 8, 16, 32, 64
EXERCICE 2
Dans une bibliothèque, l’ensemble des abonnés a été reparti suivant le nombre d’ouvrages empruntés
durant un mois :
xi 0 1 2 3 4 5 6 7
ni 18 39 57 64 42 33 21 14
40
Calculer les différents paramètres de position de cette série (mode, médiane, moyennes, quartiles et
déciles)
EXERCICE 3
EXERCICE 4
Une entreprise établit une statistique portant sur les salaires de ses employés.
a) A l’aide de la courbe des effectifs cumulés croissant représentée ci-dessous, établir un tableau
indique :
- Les classes de salaires
- Les effectifs
- Les effectifs cumulés croissants
c) Calculer le salaire modal
d) Calculer le salaire médian. Vérifier le graphique
e) Calculer le salaire moyen (au franc le plus proche)
EXERCICE 5
On dispose la série statistique suivante, relative aux exploitations agricoles d’une certaine région,
classées d’après leur superficie :
Superficie (en hectares) Nombre d’exploitations
0; 1 27
1; 2 35
2; 3 29
3; 5 54
5; 10 105
10; 20 70
20; 40 40
TOTAL
a) Calculer la superficie modale
b) Calculer la superficie moyenne
c) Présenter, sur un graphique, la courbe des effectifs cumulés croissants et la courbe des effectifs
cumulés décroissants. Donner la signification du point d’intersection des deux courbes. Vérifier
ces coordonnées par le calcul.
41
EXERCICE 6
En mai 2009, les étudiants d’une classe de Communication d’entreprise ont obtenue les notes
suivantes, en statistique appliquée, lors d’un devoir :
EXERCICE 7 :
Calculer les quartiles et les déciles de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 18
42
EXERCICE 8 :
Jean –Claude B. est un fervent adepte de la chasse sous marine en apnée. Sa proie préférée est le bar.
Voici son témoignage : « lors de ma dernière plongée, j’ai harponné au total 3 bars, dont le poids
moyen était de 1,5 kilogramme et le poids médian de 1,2 kilogrammes.
Jean – Claude B. a-t-il capturé ce jour là un bar dépassant le poids de 2 kg ?
43
En complément du chapitre précédent qui étudiait les caractéristiques des tendances centrales d’une
distribution, le présent chapitre s’intéresse à la variabilité des données au sein d’une série. Ainsi, une
fois la moyenne connue, on peut compléter la connaissance d’une série pour apprécier dans quelle
mesure les données sont dispersées ou au contraire concentrées autour de la moyenne.
Sauf dans le cas très rare d’une série statistique où toutes les valeurs sont identiques (Par exemple un
élève qui a 15 sur 20 dans toutes ses matières) il existe toujours une certaine variabilité des données
dans une série. Ainsi, le prix au mètre carré varie plus ou moins d’une maison à l’autre, le prix d’un
produit varie aussi d’un magasin à l’autre. Les salaires varient d’une entreprise à l’autre, de la même
que en général, les notes d’un élève dans les différentes, matières de son cursus.
Les caractéristiques de dispersion sont nombreuses. Nous étudierons ici les plus fréquemment
utilisées : l’étendue ou l’intervalle de variation, la variance et l’écart- type.
I. Activité
Des étudiants ont effectué deux devoirs. Les notes sont les suivantes :
Devoir 1 : 0-3-4-5-5-6-8,5-11-11-11-15-17,5-20
Devoir 2 : 7-7-7,5-7,5-8-8-8,5-9,5-10,5-10,5-11-11-11
$$p $$p
𝑛𝑜𝑡𝑒 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ∶ =9 𝑛𝑜𝑡𝑒 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ∶ =9
$' $'
Devoir 1 𝑛𝑜𝑡𝑒 𝑚é𝑑𝑖𝑎𝑛𝑒 ∶ 8,5 Devoir 2 𝑛𝑜𝑡𝑒 𝑚é𝑑𝑖𝑎𝑛𝑒 ∶ 8,5
𝑛𝑜 𝑒 𝑚𝑜𝑑𝑎𝑙𝑒: 11 𝑛𝑜𝑡𝑒 𝑚𝑜𝑑𝑎𝑙𝑒: 11
44
Nous constatons que ces deux séries ont même mode, même médiane, même moyenne arithmétique,
et cependant elles sont bien différentes. Les paramètres de position sont insuffisants pour les
caractériser. Il est alors nécessaire de mettre en évidence la dispersion des observations : c’est le rôle
des paramètres de dispersion.
L’étendue est la différence des valeurs extrême de la variable. Autrement dit, c’est la différence entre
la valeur la plus élevée et la valeur la plus faible prise par la variable.
NB : plus l’étendue est faible, moins les valeurs sont dispersées ; et elles sont regroupées autour des
paramètres de position.
2.2. Détermination
a) cas d’une variable discrète avec effectifs groupés
Voici la répartition des comptables selon le nombre de missions effectuées :
Nombre de missions (Xi) 0 1 2 3 5 Total
Nombre de comptables (ni) 9 16 13 6 6 60
Déterminer l’étendue de cette série.
5 est la valeur maximum et 0 est la valeur minimum au niveau des modalités. L’étendue est donc :
45
46
47
48