Vous êtes sur la page 1sur 10

Chapitre 1 : Statistique descriptive à une seule variable

Introduction :

La statistique descriptive est une méthode scientifique qui recueille,


ordonne, analyse et interprète des données numériques. Pour pouvoir
effectivement avoir une meilleure lisibilité, en général on va représenter
ses données graphiquement.

1. Vocabulaire élémentaire de la statistique :


1.1 Population, individu et échantillon :
 La population statistique est un ensemble d’éléments sur lesquels
va porter l’étude statistique.
 Chaque élément de la population statistique est appelé unité
statistique ou individu.
 Tout sous ensemble d’une population statistique est appelé
échantillon.
 Le nombre d’individus de la population statistique est noté par
N.

Exemple de populations statistiques :

 Les étudiants d’une classe. L’unité statistique : un étudiant.


 Le parc automobile d’une usine. L’unité statistique :
l’automobile du parc de l’usine.
1.2 caractère ou variable statistique :
 C’est une caractéristique observez chez tous les individus de la
population. Il est noté par des lettres majuscules : X, Y, Z…

Exemple de caractères : la nationalité, l’âge, le poids…

 Les différentes situations (numériques ou pas) que peut prendre


une variable statistique sont appelées modalités. On note les
modalités en utilisant la même lettre que le caractère, mais en
minuscule et indicée.
Ainsi, on note généralement xi la i-ème modalité du caractère X et yj
la j-ème modalité du caractère Y.

Exemple de modalités : le caractère « sexe » peut prendre deux modalités


masculin et féminin.

 Les caractères sont classés en deux catégories : les caractères


qualitatifs et les caractères quantitatifs.
1.2.1 Caractère qualitatif : un caractère est dit « qualitatif » si ses
différentes modalités sont « non mesurables ».
Exemple : le groupe sanguin, la nationalité, la couleur des yeux.
1.2.2 Caractère quantitatif : un caractère est dit « quantitatif » si ses
différentes modalités sont « mesurables ».

Exemple : nombre de frères et sœurs, la moyenne obtenue au bac…

 On distingue deux types de caractères quantitatifs : caractères


quantitatifs discrets et caractères quantitatifs continus.
1.2.2.1 caractère quantitatif discret : un caractère est quantitatif discret
s’il prend des valeurs isolées souvent des entiers.

Exemple : nombre d’enfants par foyer, la pointure des souliers.

1.2.2.2 caractère quantitatif continu : un caractère est quantitatif continu


s’il prend des valeurs dans un intervalle de l’ensemble des nombres réels
ℝ.

Exemple : âge, taille, salaire….


Remarque : les caractères quantitatifs qui sont liés au temps (âge,
vitesse), à la masse (poids), à la monnaie (prix, salaire), et à l’espace
(longueur, surface) sont considérés comme continus.

2. Effectifs et fréquences :
Désignons par X un caractère, par x1, x2, x3, ….xp ses p modalités.

 L’effectif ni d’une modalité xi d’un caractère X est le nombre


d’individus présentant cette modalité (le nombre d’apparitions
de la modalité xi).
 La somme des effectifs des différentes modalités d’un caractère X
est égale à l’effectif total N de la population.
𝑝

𝑁 = ∑ 𝑛𝑖
𝑖=1

 La fréquence fi d’une modalité xi d’un caractère X est le rapport :


𝑛𝑖
𝑓𝑖 =
𝑁
𝑓𝑖 Représente la proportion d’individus présentant la modalité xi.
 La somme des fréquences des différentes modalités d’un caractère
𝑝
X est toujours égale à 1. ∑𝑖=1 𝑓𝑖 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑝 = 1
Exemple : on interroge un ensemble de 10 étudiants sur leur
hébergement. L’étudiant répond par R s’il est résident dans une
cité universitaire, par NR dans le cas contraire. Les données sont
présentées comme suit : R, R, NR, R, NR, NR, R, R, R, NR.
1. Déterminer la population statistique, le caractère et son type.
2. Trouver les effectifs et les fréquences de chaque modalité.
 La fréquence cumulée croissante 𝐹𝑖↑ (respectivement 𝐹𝑖↓ ) d’une
modalité xi est la somme de la fréquence de cette modalité xi et
celles de toutes les modalités qui la précédent (resp. qui la
suivent) ; autrement dit,
𝐹𝑖↑ = ∑𝑖𝑘=1 𝑓𝑘 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖
𝑝
𝐹𝑖↓ = ∑𝑘=𝑖 𝑓𝑘 = 𝑓𝑖 + 𝑓𝑖+1 + ⋯ + 𝑓𝑝
 L’effectif cumulé croissant 𝑁𝑖↑ (respectivement 𝑁𝑖↓ ) d’une
modalité xi est la somme de l’effectif de cette modalité xi et celles de
toutes les modalités qui la précédent (resp. qui la suivent) ;
autrement dit,
𝑁𝑖↑ = ∑𝑖𝑘=1 𝑛𝑘 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖
𝑝
𝑁𝑖↓ = ∑𝑘=𝑖 𝑛𝑘 = 𝑛𝑖 + 𝑛𝑖+1 + ⋯ + 𝑛𝑝
3. Tableaux statistiques :
En cours d’une étude statistique les données sont recueillies de façon
désordonnée, pour leur donner un sens et une utilité, il faut les
ordonner, les classer et les traiter en utilisant les tableaux
statistiques.

3.1 caractère qualitatif :


Soit une population de N individus, décrite suivant un caractère
qualitatif C constitué de l modalités c1, c2,……, cl.
La présentation dans un tableau statistique consiste à dénombrer
pour chacune des modalités Ci, combien d’individus (ni) présentent
une des modalités du caractère puis de les ordonner selon les
effectifs (ni) du plus petit au plus grand (ou le contraire).
Le tableau statistique se présente alors sous la forme suivante :
Modalités Ci du caractère C1 C2 ……………… Cl total
Nombre d’individus ni n1 n2 ………………… nl N
Une série statistique ou distribution statistique est constitué de
l’ensemble des couples {(Ci, ni)}.
Exemple : revenons à l’exemple précédent de l’hébergement.
Le tableau statistique est présenté comme suit :
Les modalités R NR total
Les effectifs 6 4 N=10
3.2 Caractère quantitatif discret :
Le tableau statistique est analogue à celui obtenu pour un caractère
qualitatif. Soit X un caractère quantitatif discret et soient x1, x2, …, xk
les différentes valeurs de X avec 𝑥1 < 𝑥2 < 𝑥3 < ⋯ < 𝑥𝑘 . Le tableau
statistique sera donc sous la forme :
Les valeurs 𝑥𝑖 x1 x 2 … xk total
Les effectifs ni n1 n2 … nk N
3.3 Caractère quantitatif continu :
Un caractère quantitatif continu peut prendre une infinité de valeurs
dans un intervalle de ℝ. Alors pour construire le tableau statistique, il
faut tout d’abord procéder à des regroupements en classe [𝑒𝑖−1 , 𝑒𝑖 [
(intervalles disjoints). Si [𝑒𝑖−1 , 𝑒𝑖 [ désigne la classe « i », on note, de
manière générale :
 𝑒𝑖−1 : la borne inférieure de la classe « i ».
 𝑒𝑖 : la borne supérieure de la classe « i ».
𝐞𝐢−𝟏 +𝐞𝐢
 𝐂𝐢 = : le centre de la classe « i ».
𝟐
 𝒂𝒊 = 𝒆𝒊 − 𝒆𝒊−𝟏 : l’amplitude de la classe « i ».

Comment construit les classes d’un caractère quantitatif continu ?

1. Déterminons le nombre de classe P en utilisant la règle de


STURGE :
𝐉 = 𝟏 + 𝟑. 𝟑 𝐥𝐨𝐠(𝐍)

Avec P= l’entier le plus proche de J.


2. Calculer l’étendue 𝐸 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 où 𝑥𝑚𝑎𝑥 𝑒𝑡 𝑥𝑚𝑖𝑛 désignent la
plus grande et la plus petite valeur d’un caractère quantitatif
continu.
𝐸
3. Calculer l’amplitude « a » des classes. On a 𝑎 = .
𝑃
4. On construit alors les P classes :
[𝑥𝑚𝑖𝑛 , 𝑥𝑚𝑖𝑛 + 𝑎[,[𝑥𝑚𝑖𝑛 + 𝑎, 𝑥𝑚𝑖𝑛 + 2𝑎[ ,… [𝑥𝑚𝑖𝑛 + (𝑃 − 1)𝑎, 𝑥𝑚𝑖𝑛 + 𝑃𝑎[
5. S’assurer que chaque valeur appartient à une et une seule classe.

Lorsqu’on détermine les classes, le tableau statistique d’un caractère


quantitatif continu s’écrit de la manière suivante :

Les classes [𝑒0 , 𝑒1 [ [𝑒1 , 𝑒2 [ [𝑒𝑝−1 , 𝑒𝑝 [ total


Les effectifs ni n1 n2 np N
4. Les paramètres statistiques :
4.1 Les paramètres de position :
4.1.1 Le mode : noté Mo
- si X est un caractère quantitatif discret, le mode est la
valeur xi qui correspond au plus grand effectif ou à la plus
grande fréquence.

Exemple : Déterminer le mode des séries statistiques suivantes :


a) {4, 5, 8, 8, 9, 10, 11}.
b) {4, 4, 5, 8, 8, 8, 9, 9, 9, 10, 11, 12}
- Si X est un caractère quantitatif continu dont les classes
sont de même amplitude, la classe [𝑒𝑖−1 , 𝑒𝑖 [ qui correspond
au plus grand effectif ou à la plus grande fréquence est
appelée classe modale. La valeur de Mo est donné par :
α1
Mo = ei−1 + ai ( ) où
α1 + α2
 ei−1 : la borne inférieure de la classe modale.
 𝒂𝒊 = 𝒆𝒊 − 𝒆𝒊−𝟏 : l’amplitude de la classe modale.
 α1 : la différence entre l’effectif (ou fréquence) de la
classe modale et l’effectif (ou fréquence) de la classe
qui la précède.
 α2 : la différence entre l’effectif (ou fréquence) de la
classe modale et l’effectif (ou fréquence) de la classe
qui suivante.
Exemple : Soit le tableau suivant :

Les classes [50, 60[ [60, 70[ [70, 80[ [80, 90[ [90, 100[
Les effectifs 20 60 50 40 30
4.1.2 La médiane : notée Me
La médiane est la valeur qui partage la série statistique ordonnée en
deux séries de même effectif. Il y a donc autant de valeurs inférieures à
la médiane que de valeurs supérieures à la médiane.
Comment déterminer la médiane ?
 Caractère quantitatif discret : on doit d’abord ranger (ordonner) la
série statistique dans l’ordre croissant, par la suite on peut avoir
deux cas :
- Si l’effectif total N est un nombre impair alors 𝑀𝑒 = 𝑥𝑁+1 .
2
𝑥𝑁 𝑥𝑁
+1
- Si l’effectif total N est un nombre pair alors 𝑀𝑒 = 2
+ 2
.
2 2
Exemple : déterminer la médiane des séries statistiques suivantes :
14, 6, 11, 10, 5, 9, 8
12, 10, 8, 9, 15, 14, 7, 11,15, 8
Remarque : lorsque l’effectif total N est petit, on peut facilement
ordonner la série statistique et déduire la médiane comme
précédemment. Mais lorsque l’effectif total N est grand, il est
préférable de déterminer la médiane à partir du tableau statistique en

utilisant la ligne des 𝑁𝑖 .
Exemple : soit le tableau statistique suivant :
xi 0 1 2 3 4 5
ni 4 14 34 29 16 3

 Caractère quantitatif continu : pour calculer la médiane, on


commence par déterminer la classe médiane [𝑒𝑖−1 , 𝑒𝑖 [ qui
𝑁 ↑
correspond à 𝑑𝑒𝑠 𝑁𝑖 ou à0.5 𝑑𝑒𝑠 𝐹𝑖↑ . La valeur de Me est
2
donnée par :
N ↑ ↑
−𝑁𝑖−1 0.5−𝐹𝑖−1
Me = ei−1 + ai 2
Ou Me = ei−1 + ai avec
ni fi
 ei−1 : la borne inférieure de la classe médiane.
 𝒂𝒊 = 𝒆𝒊 − 𝒆𝒊−𝟏 : l’amplitude de la classe médiane.
 ni (resp fi ) : l’effectif (resp fréquence) de la classe
médiane.
↑ ↑
 𝑁𝑖−1 (resp 𝐹𝑖−1 ) : l’effectif cumulé croissant ( resp
fréquence cumulée croissante) de la classe précèdent
la classe médiane.
Exemple : soit le tableau suivant :

Les classes [10, 20[ [20, 30[ [30, 40[ [40, 50[
ni 15 20 60 5

4.1.3 la moyenne arithmétique : notée 𝑥̅


 caractère quantitatif discret : la moyenne arithmétique 𝑥̅ d’une série
{(xi, ni)} est donnée par :
1
𝑥̅ = 𝑁 ∑𝑘𝑖=1 𝑛𝑖 𝑥𝑖 = ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 Où
 x1, x2, …, xk sont les différentes valeurs du caractère X.
 n1, n2, …, nk leurs effectifs correspondants.
 f1, f2, …, fk leurs fréquences.
 caractère quantitatif continu : la moyenne arithmétique 𝑥̅ d’une
série {([𝑒𝑖−1 , 𝑒𝑖 [, ni)} est donnée par :
1 𝑝 𝑝
𝑥̅ = 𝑁 ∑𝑖=1 𝑛𝑖 𝑐𝑖 = ∑𝑖=1 𝑓𝑖 𝑐𝑖 Où
 c1, c2, …, cp désignent les centres des classes.
 n1, n2, …, np leurs effectifs.
 f1, f2, …, fp leurs fréquences.

4.1.4 Les quartiles : les quartiles d’une série statistique sont les trois valeurs
Q1, Q2 et Q3 du caractère qui partagent la série statistique ordonnée en
quatre parties de même effectif.
 Q1 est appelé premier quartile ; 25% des valeurs du caractère lui
sont inférieures et 75% supérieures.
 Q3 est appelé troisième quartile ; 75% des valeurs du caractère
lui sont inférieures et 25% supérieures.
 Le deuxième quartile Q2 est égale à la médiane Me.
Comment déterminer les quartiles ?
 caractère quantitatif discret : on doit d’abord ordonner la série
statistique dans l’ordre croissant, par la suite on peut avoir deux
cas :
 si l’effectif total N n’est pas un multiple de 4, alors les
quartiles Q1 et Q3 sont les termes de rang immédiatement
𝑁 3𝑁
supérieurs à et à respectivement.
4 4
 si l’effectif total N est un multiple de 4, alors les quartiles Q1 et
𝑁 3𝑁
Q3 sont les termes de rang et respectivement.
4 4

Exemple : déterminer les quartiles de la série statistique suivante :

16, 7, 11, 1, 2, 17, 10, 5, 11, 9.

 caractère quantitatif continu :


 pour Q1, on détermine la classe [𝑒𝑖−1 , 𝑒𝑖 [ qui correspond à
𝑁
𝑑𝑒𝑠 𝑁𝑖↑ ou à0.25 𝑑𝑒𝑠 𝐹𝑖↑ . La valeur de Q1 est donnée
4
par :
N ↑ ↑
−𝑁𝑖−1 0.25−𝐹𝑖−1
4
Q1 = ei−1 + ai Ou Q1 = ei−1 + ai
ni fi
 pour Q3, on détermine la classe [𝑒𝑖−1 , 𝑒𝑖 [ qui correspond à
3𝑁
𝑑𝑒𝑠 𝑁𝑖↑ ou à0.75 𝑑𝑒𝑠 𝐹𝑖↑ . La valeur de Q3 est donnée
4
par :
3N ↑ ↑
−𝑁𝑖−1 0.75−𝐹𝑖−1
4
Q 3 = ei−1 + ai Ou Q 3 = ei−1 + ai
ni fi

Exemple : soit le tableau suivant :

Les classes [6, 8[ [8, 10[ [10, 12[ [12, 14[ [14, 16[
ni 9 4 5 5 7
4.2 Les paramètres de dispersion :
4.2.1 Etendue : noté E
L’étendue d’une série statistique est la différence entre la plus grande
valeur x max et la plus petite valeur x min du caractère.
𝐸 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
4.2.2 Variance et écart -type :
La variance V(x) est donnée par :
1
𝑉 (𝑥 ) = ∑ 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑁
𝑖
L’écart- type est la racine carrée de la variance
𝜎(𝑥) = √𝑉(𝑥)

Vous aimerez peut-être aussi