Vous êtes sur la page 1sur 14

Chapitre 1

Les concepts de base


de la Statistique Descriptive, notion de base

Définition de la statistique :
C’est l’ensemble des méthodes et techniques ayant pour objet de collecter, de rassembler, de traiter,
d’analyser et d’interpréter des données numériques relatives à un ensemble d’objets, d’individus ou
d’éléments qui permettent de tirer des conclusions, d’aider à la bonne décision et /ou de faire des
prévisions.
Vocabulaire statistique :
Population :
L’ensemble des objets de même nature que l’on soumet à une étude statistique s’appelle : la
population
Individu :
Chaque élément de la population est appelé individu ou unité statistique.
(Exemple : Une population d’entreprises : l’individu est l’entreprise).

1
Effectif :
C’est le nombre d’unités statistiques formant la population
Caractère :
Toute propriété commune aux individus d’une population s’appelle : un caractère. Un caractère
peut être soit qualitatif soit quantitatif.
Caractère qualitatif :
Un caractère est dit qualitatif lorsqu’il n’est ni mesurable ni repérable.
Exemple : La profession – la nationalité – la situation familiale …
Caractère quantitatif :
Un caractère est dit quantitatif lorsqu’il est mesurable ou repérable.
Exemple : L’âge – le poids – le revenu annuel – la température.

2
La modalité :
C’est une particularité qui accompagne un fait. Chaque caractère pouvant présenter plusieurs
modalités.
(Exemple : le caractère nationalité peut avoir comme modalités :
« Tunisienne – Marocaine – française … » )

Les variables statistiques :


C’est une application définie sur la population étudiée et à valeurs dans un ensemble déterminé.
Le caractère quantitatif lui correspond une variable statistique qui est la mesure du caractère. Celle
– ci peut être soit discrète soit continue.

La variable statistique discrète :


Une variable statistique est dite discrète lorsqu’elle ne peut prendre que des valeurs entières.
Exemple : Le nombre d’enfants dans une famille: 0 ; 1 ; 2 ; …

La variable statistique continue :


Une variable statistique est continue lorsqu’elle peut prendre pour valeur numérique tout réel
d’un intervalle de l’ensemble IR.
Exemple : Le chiffre d’affaires (174587425.85 DT) ; Le salaire : 700.63 D …

3
Pour les exemples suivants, on vous demande de déterminer la population, l’unité
statistique, le caractère étudié, le type de caractère et les modalités correspondantes
Exemple 1:
On a enquêté 20 employés d’une entreprise dont on veut étudier leur situation familiale.
Le caractère situation familiale peut prendre les modalités suivantes :
Célibataire : C ; Marié : M ; Veuf : V ; Divorcé : D
Les résultats bruts sont les suivants :
M – M – M – M – C – C – C – D – D – C – C – C – D – V – V – M – M – M – M – C.
La population : l’ensemble des 20 employés.
L’unité statistique : un employé.
Le caractère : situation familiale.
Type de caractère : qualitatif.
Les Modalités : célibataire – marié – veuf – divorcé.
Les résultats peuvent être consignés dans le tableau suivant sous forme simple et claire.

Variable statistique (xi) Effectif (ni) (nombre


(Situation familiale) d’employés)

4
C 7
M 8
V 2
D 3
Total  ni = 20

Exemple 2 :
Soit un échantillon de 50 familles, les résultats d’une enquête concernant le nombre d’enfants par
famille sont les suivants :
5–4–6–3–2–0–1–6–4–3
1–0–1–5–4–6–3–2–6–6
5–4–3–6–5–1–1–3–0–2
3–0–4–6–5–2–1–0–1–5
4–3–3–2–6–5–1–0–6–1
La population : l’ensemble des 50 familles.
L’unité statistique : une famille.
Le caractère étudié : nombre d’enfants par famille.
Le type de caractère : quantitatif.
La variable statistique : discrète.
Les modalités : 0–1–2–3–4–5–6.
Dans les résultats bruts les différentes valeurs prises par la variable statistique sont : 0 – 1 – 2 – 3 –
4–5–6.

5
On présente les résultats dans un tableau statistique comme le cas d’un caractère qualitatif.
Variable statistique (xi) Effectif (ni)
(nombre d’enfants) (nombre de familles)
0 6
1 9
2 5
3 8
4 6
5 7
6 9
Total  ni = 50
Exemple 3 :
On a pesé 20 élèves d’une classe.
Les résultats xi sont les suivants : unité le kilogramme.
77,45 – 62,20 – 67,82 – 71,28 – 74,47
81,29 – 78,54 – 63,22 – 59,47 – 61,33
56,41 – 63,23 – 63,28 – 71,66 – 68,72
54,93 – 71,44 – 74,31 – 77,82 – 67,41.
La population : l’ensemble des 20 élèves
L’unité statistique : un élève
Le caractère étudié : le poids de l’élève en kg
Le type de caractère : quantitatif
La variable statistique : continue.

6
Notions de base : L’exemple suivant sera utilisé comme illustration des notions de base.
Classes Effectif (ni)
[50– 60[ 3
[60 – 70[ 8
[70 – 80[ 8
[80 – 90[ 1
Total n i = 20

borne inf  borne sup


Le centre de la classe ci =
2
50  60 60  70
Exemple: [50,60[ ; c1 = = 55 _____ [60,70[ c2 = = 65
2 2

L’amplitude de chaque classe ai = borne sup  borne inf


Exemple: [50,60[ ; a1=60 - 50=10
L’effectif total N : On appelle effectif total la somme des effectifs ni.
N= n i = n1 + n2 + n3 + …

Exemple : Pour n1=3, n2=8, n3=8, n4=1, Calculer N ? N=∑4𝑖=1 𝑛𝑖 = 3 + 8 + 8 + 1 = 20


La fréquence absolue ni : C’est l’effectif ni
Exemple : n1=3 est la fréquence absolue associé à la classe [50– 60[

7
La fréquence relative fi : On appelle fréquence relative fi le rapport de l’effectif ni, attaché à la valeur xi du
caractère à l’effectif total n.
ni n
fi = = i
 ni N
n1 3 8
Exemples : f1 = = ; f2 = …
N 20 20

n1  n2  n3  ... n N
Remarque : f = = = =1
i
i
N N N

Les fréquences cumulées :


Les fréquences cumulés croissants (𝑛𝑜𝑡é 𝐹𝑖 ↑) : C’est l’opération qui consiste à établir une nouvelle série en
additionnant successivement les fréquences relatives (fi) de la série initiale du haut du tableau vers le bas.

Les fréquences cumulés décroissants (𝑛𝑜𝑡é 𝐹𝑖 ↓): C’est l’opération qui consiste à établir une nouvelle série en
additionnant successivement les fréquences relatives (fi) de la série initiale du bas vers le haut.

8
Chapitre 2
Statistique Descriptive, les représentations graphiques

Généralités :
Un graphique doit comporter les éléments suivants :
- Un titre indiquant la nature du phénomène représenté
- Des indications (légendes, échelles …).
Le graphique dépend de la nature du caractère observé que ce soit qualitatif soit quantitatif.

Représentations graphiques d’une distribution à caractère qualitatif.


Selon la variable observée, il existe de nombreuses représentations d’une série à caractère qualitatif qui
peuvent être utilisé.

Cependant les deux plus employés sont :


- Diagramme en tuyaux d’orgue ou diagramme en barre
- Diagramme en secteur.

9
Veufs
60 8% Célibataires
50 25%
Divorcés
40 17%
30
Effectifs (ni)
20
10
0

Mariés
50%

Diagramme en barre des touristes visitant la Tunisie Diagramme en secteur de la situation familiale des employés

Représentations graphiques d’une distribution à caractère quantitatif


Selon que la variable correspondante au caractère quantitatif est discrète ou continue, la représentation
graphique sera différente.

10
Variable discrète :
Diagramme en bâtons
Fréquences(%)
120%
Nombre
140 des étoiles 100%
120 80%
100
60%
80
60 40%
40 20%
20 0%
0 1 2 3 4 5
1 2
Nombre 3
d'étoiles 4 5
Diagramme en bâton des effectifs d’hôtels par étoile Diagramme en bâtons des fréquences d’hôtels par étoile

Fi Diagramme en escalier (Courbe cumulative) :

100%
90%
70%
55%

25%

0 1 2 3 4 5 6 Nombre

des étoiles

11
Caractère quantitatif continu :

L’histogramme est la représentation appropriée du caractère quantitatif continu.


2.2.3.2.1. Cas de classes de mêmes amplitudes :

Remarque 1 : En joignant par des segments les milieux des bases supérieures des rectangles constituant
l’histogramme, on obtient le polygone des fréquences.

0.35

0.3

0.25

0.2
Fréquences (fi)
0.15

0.1

0.05

0
[10 – 12[ [12 – 14[ [14 – 16[ [16 – 18[ [18 – 20[ [20 – 22[ [22 – 24[ [24 – 26[

Histogramme des fréquences relatives et Polygone des fréquences

12
Remarque 2 : on trace le polygone des fréquences cumulés ou la courbe des fréquences cumulées
croissants (Fi) en joignant par des segments de droites les coordonnées des points ayant pour abscisses les
bornes supérieures des classes et pour ordonnées les Fi (fréquences cumulées correspondantes).
1.2

0.8

0.6

0.4

0.2

0
12 14 161 182 203 22
4 245 26 6 7 8

Polygone des fréquences cumulées.

Cas de classes d’amplitudes différentes :


On utilise les fréquences corrigées (fic) pour représenter l’histogramme. Ceci consiste à choisir l’amplitude la
𝑓𝑖
plus fréquente sinon la plus petite noté k. 𝑓𝑖𝑐 = ∗𝑘
𝑎𝑖

13
14

Vous aimerez peut-être aussi