Vous êtes sur la page 1sur 44

Année universi-

taire : 2022-2023

Statistique
Statistique

R I
A
Descriptive
H T
OK
M
L1
Maths.

1
Probabilitées et Statistiques H. MOKHTARI
Table des matières
C HAPITRE 1 N OTIONS DE BASE VOCABULAIRE STATISTIQUE PAGE 2
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
II Concepts de base de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Individu (Unité statistique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4 Caractère (variable statistique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5 Modalités (valeurs) d'un caractère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6 Effectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

I
7 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
8 Distribution statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

R
9 Fréquences relatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
III Types des caractères . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

A
1 Caractère qualitatif (variable statistique qualitative) . . . . . . . . . . . . . . . . 7

T
2 Caractère quantitatif (variable statistique quantitative) . . . . . . . . . . . . . . 8
IV Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

H
1 Cas d'une variable statistique qualitative ou quantitative discrète . . . . 10
2 Cas d'une variable statistique quantitative continue . . . . . . . . . . . . . . . . 11

K
V Représentations graphiques d'une série statistique . . . . . . . . . . . . . . . . . . . . . . 12
1 Cas de variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

O
2 Cas de variables quantitatives discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Cas de variables quantitatives continues . . . . . . . . . . . . . . . . . . . . . . . . . . 21

M
C HAPITRE 2 R EPRÉSENTATION NUMÉRIQUE DES DONNÉES PAGE 26
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
II Paramètres de position (caractéristiques de tendance centrale) . . . . . . . . . . 26
1 Ces des variables discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2 Ces des variables continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
III Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1 Ces des variables discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2 Ces des variables continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

1
Probabilitées et Statistiques H. MOKHTARI
01 N OTIONS DE BASE VOCABULAIRE STATISTIQUE

Contenu
1 Introduction

2 Concepts de base de la statistique

3 Types des caractères

4 Tableau statistique

RI
5 Représentations graphiques d'une série statistique

T
Introduction

A
H
La statistique est une science qui consiste à étudier la collecte de données, leur analyse,

K
leur traitement, l'interprétation des résultats et leur présentation afin de rendre les données
compréhensibles par tous. La statistique descriptive est un outil mathématique permet-

O
tant d'étudier les caractéristiques d'un ensemble d'unités (appelé population) en fonction
de critères de description bien déterminés. Elle sert à :

M
• Explorer, découvrir l'information contenue dans les données.

• Classer et à présenter graphiquement et numériquement les données observées


de n'importe quel phénomène, afin de les traiter, les modéliser et interpréter
les faits aux quels ces données sont relatives.

Le terme statistique désigne à la fois un ensemble de données d'observations , et l'activité


qui consiste en leur traitement et leur interprétation.
Avant de commencer, précisons un peu de vocabulaire couramment utilisé en statistique.

II Concepts de base de la statistique


Les deux éléments importants à maîtriser dans une étude statistique sont les individus et
les variables statistiques.
On commence par les deux définitions : Population et individus statistiques.

2
Probabilitées et Statistiques H. MOKHTARI
1. Population
Définition (Population statistique)

La population statistique (ou univers statistique ) représente un ensemble de


personnes ou d'objets de même nature que l'on va étudier, analyser. Cet ensemble est
noté par Ω.

Exemple :
• On considère l'ensemble des étudiants de la section E Maths. On s'intéresse à l'étude
de leurs notes. Dans ce cas
Ω = Ensemble des étudiants.

RI
• L'ensemble des étudiants de la faculté des sciences.

A
2. Échantillon

H T
Définition (Échantillon)

K
Un échantillon de taille n est un sous-ensemble (une partie) formé de n
individus de la population.

MO
3. Individu (Unité statistique)
Définition (Individu ou unité statistique)

On appelle individu ou unité statistique l'élément unique d'une population


il est noté ω, (ω dans Ω).
Ω,

Remarques
• La population et l'individu (Ω et ω) peuvent être des ensembles des personnes ,
d'objets ou d'animaux , etc, · · · .
• L'individu est un objet pour lequel nous cherchons à recueillir de l'information.

3
Probabilitées et Statistiques H. MOKHTARI
Exemples :
• On reprend le même exemple indiqué ci-dessus, l'individu est
ω = Un étudiant de la section.

• Un étudiant des étudiants de la faculté des sciences.

4. Caractère (variable statistique)


Maintenant, on donnera la définition d'une variable statistique (ou caractère).

Définition (Caractère ou variable statistique)

I
On appelle caractère (ou variable statistique , dénotée V .S ) toute application :

A R
X : Ω →C,

où C est l'ensemble des valeurs du caractère X (c'est ce qui est mesuré ou observé sur

T
les individus).

H
Exemple :

K
Les caractères ci-après sont des variables statistiques : La couleur, l'âge, le sexe, le

O
poids, la taille, la marque, le modèle, le nombre d'enfants, le prix, la surface, etc.

M
5. Modalités (valeurs) d'un caractère
Définition (Modalités d'un caractère)

Les Modalités d'un caractère ou d'une variable statistique sont les différentes valeurs
que peut prendre celle-ci.

Exemple :

• Le caractère sexe présente deux modalités : Masculin, Féminin .

• Le caractère groupe sanguin présente quatre modalités : A , B , AB , O .

• L'état civil comporte quatre modalités : célibataire , marié , veuf(ve) ,


divorcé .
• Le caractère nombre d'enfants dans un ménage présente plusieurs modalités : 0,
1, 2, · · · .

4
Probabilitées et Statistiques H. MOKHTARI
Notation
Généralement, on note une variable statistique par une lettre majuscule X , Y , · · ·
et ses modalités par la même lettre minuscule affectée d'indices : x1 , x2 , · · · pour
la variable X ou y 1 , y 2 , · · · pour la variable Y .

6. Effectif
Définition (Effectif)
Lorsque la population de taille n est répartie sur les différentes modalités, nous obte-
nus pour chacune d'elle un nombre : c'est le nombre d'individus ayant cette modalité,
on l'appel l'effectif . Ce nombre est souvent noté n .

I
Généralement, on note l'effectif correspondant à la modalité xi , par ni = 1, k tel que

R
n = n1 + n2 + . . . + nk .

A
Remarque

T
⋆ L'effectif partiel est le nombre d'apparitions d'une valeur du caractère.

H
⋆ L'effectif total (la taille de l'échantillon) est la somme des effectifs partiels .

OK
7. Série statistique

M
Définition (Série statistique)

L'ensemble des données d'une variable statistique (xi , ni ), i = 1, k , constitués de


la modalité xi et de l'effectif ni correspondant forment une suite qu'on appelle
série statistique .

Remarques
• Si l'étude statistique porte sur un seul critère , on dit que la série statistique est
simple (ou univariée ).

• Si l'étude porte sur deux critères , la série statistique est dite double (ou
bivariée ).

• Si l'étude porte sur plusieurs critères , la série statistique est dite multiple .

5
Probabilitées et Statistiques H. MOKHTARI
Exemple :

• Étudier la longueur des pétales sur une population d'iris donne une série statis-
tique simple .

• Étudier la longueur et la largeur des pétales donne une série statistique double .

8. Distribution statistique
Soit une population concernant n individus. Le classement des individus de cette population
selon les différentes modalités du caractère donne naissance à une distribution statistique
généralement présentée dans un tableau statistique.

I
9. Fréquences relatives

R
Définition (Fréquence ou fréquence relative)

TA
On appelle "fréquence" ou "fréquence relative" d'un caractère est le nombre
d'individus possédant ce caractère divisé par l'effectif total de la population. Elle est

H
donnée par :

K
ni
fi = , i = 1, 2, 3, · · · , k,
n

O
avec

k ∑ k n
i 1∑ k 1
fi = = ni = × n = 1 0 ≤ f i ≤ 1.

M
et
i =1 i =1 n n i =1 n

Remarque


k n1 n2 nk n1 + n2 + · · · + nk
fi = f1 + f2 + · · · + fk = + +···+ = = 1.
i =1 n n n n

Remarque
• La somme des effectifs est toujours égale au nombre d'individus de la population :
n 1 + n 2 + · · · + n k = n.

• La somme des fréquences est toujours égale à 1 :

f 1 + f 2 + · · · + f k = 1.

6
Probabilitées et Statistiques H. MOKHTARI
• Lors de l'utilisation de la calculatrice, il peut arriver que la somme des fréquences
ne soit pas exactement égale à 1 à cause des arrondis de calculs.

III Types des caractères


Les variables statistiques peuvent être classées en deux types contenant chacun deux sous-
catégories : Variables statistiques qualitatives et variables statistiques quantitatives.

1 Variables statistiques qualitatives.

(a) Variables statistiques qualitatives nominales.

I
(b) Variables statistiques qualitatives ordinales.

R
2 Variables statistiques quantitatives.

A
(a) Variables statistiques quantitatives discrètes.

T
(b) Variables statistiques quantitatives continues.

H
1. Caractère qualitatif (variable statistique qualitative)

K
Définition (Variable statistique qualitative)

O
Une variable statistique est dite qualitative si les modalités

M
ne sont pas mesurables ou si elles sont désignées par des noms .

Exemple :
Le sexe (masculin, féminin), la profession (enseignement, architecture, · · · ), l'état ma-
trimonial (marié, divorcé, célibataire).

Les modalités d'un caractère qualitatif peuvent être classées sur deux sous-catégories :
nominal ou ordinal .

Définition (Variable nominale)

On dit qu'une variable statistique qualitative est nominale si ses modalités


ne peuvent pas être ordonnées .

7
Probabilitées et Statistiques H. MOKHTARI
Exemple :
• La couleur des yeux (noire, bleue, verte).
• Le Sexe (masculin, féminin).
• La situation familiale (célibataire, marié(e), veuf(ve), en couple, · · · ).

Définition (Variable ordinale)

On dit qu'une variable statistique qualitative est ordinale si ses différentes


modalités peuvent être ordonnées (classées) dans un certain ordre naturel.

I
Exemple :

R
La mention au Bac (excellent, très bien, bien, assez bien, passable).

TA
2. Caractère quantitatif (variable statistique quantita-

H
tive)

K
Définition (Variable statistique quantitative)

O
Une variable statistique est dite quantitative ou numérique si ses différentes
modalités sont mesurables , numériques . Les différentes modalités d'une va-

M
riable statistique quantitative constituent l'ensemble des valeurs numériques que peut
prendre la variable statistique.

Les modalités d'un caractère quantitatif peuvent être classées sur deux sous-catégories :
discret ou continu .

Définition (Caractère discret)

On dit qu'une variable statistique quantitative est discrète si ses modalités sont des
valeurs numériques (elle prend un nombre fini de valeurs).

8
Probabilitées et Statistiques H. MOKHTARI
Exemples :
1 Nombre d'enfants dans une famille, nombre de pièces défectueuses dans un lot.
2 Un quartier est composé de 50 ménages et la variable X représente le nombre
de personnes par ménage. Les valeurs de la variable sont :
1 1 1 1 1 2 2 2 2 2
2 2 2 2 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 4
4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 6 6 6 8 8

Nous avons

I
• Population : (Ω) ensemble des ménages.

R
• Individu (ω) un ménage.

A
• Caractère (Variable statistique) nombre de personnes par ménage :

T
X

X : ω −→ X (ω) .

H
On lit, au ménage ω, on associe X (ω) = nombre de personnes dans ce mé-

K
nage.

O
Définition (Caractère continu)

M
On dit qu'une variable statistique quantitative est continue si ses modalités sont
dans un intervalle de R, ne sont pas en nombre fini (le nombre de ces valeurs
est toujours infini ).
Une variable statistique continue peut prendre une infinité de valeurs possibles.
Le domaine de la variable est alors R ou un intervalle dans R.

Exemples :
1 Soit l'ensemble des nouveaux nés au C.H.U d'une ville pendant les 3 premiers
mois de 2023. Nous désignons par X le poids des nouveaux nés. On suppose
que : xmin = 2, 701 et xmax = 5, 001.
2 Généralement, toutes les grandeurs liées à l'espace (longueur, surface, volume),
au temps, à l'âge, à la durée de vie, à la masse (poids), au poids ou encore
aux combinaisons de ces éléments (vitesse, débit, densité) sont des variables
statistiques continues.

9
Probabilitées et Statistiques H. MOKHTARI
IV Tableau statistique

Définition (tableau statistique)

Un tableau statistique est un outil utilisé afin de présenter des données chiffrées,
après leur rangement par ordre croissant, sous forme de deux colonnes. La première
colonne de gauche est toujours réservée aux modalités du caractère à étudier, tandis
que celle de droite est utilisée pour indiquer les effectifs ou les fréquences relatives
correspondants aux différentes modalités.
Un tableau statistique fait intervenir les notions assez élémentaires de modalité
x i , d'effectif n i , de fréquence f i (ou pourcentage ), d'effectif cumulé Ni et de
fréquence cumulée Fi .

RI
1. Cas d'une variable statistique qualitative ou quantita-
tive discrète

TA
Soit X une variable statistique discrète qui prend les valeurs (modalités) x1 , x2 , · · · , xk
avec x1 ≤ x2 ≤ · · · ≤ xk et on suppose qu'il existe ni individus ayant la valeur xi . Le tableau

H
statistique correspondant à une variable statistique quantitative discrète est présenté sous
la forme suivante :

K
Modalités xi x1 x2 ··· xk Total

O
k
Effectifs ni n1 n2 ··· nk n= ni
i =1

k
Fréquences relatives

M
fi f1 f2 ··· fk fi = 1
i =1

ni
où fi = représente la proportion d'individus ayant la valeur x i , i = 1, k .
N
Exemple :
On s'interesse aux types d'activités principales de 40 entreprises. Il y a 5 types possibles
(catégories) : I (Industrie), T (Transport), C (Communications), S (Services), A
(Autres). Les données sont résumées dans le tableau suivant :

Activité principale I T C S A Total


Nombre d'entreprise 15 10 8 3 4 40

• La population : Entreprises, de taille : 40.

• Le caractère : Les activités principales (catégories).

• Les modalités : I (Industrie), T (Transport), C (Communication), S (Services)


et A (Autres).

10
Probabilitées et Statistiques H. MOKHTARI
• Tableau statistique :

Modalités I T C S A Total
ni 15 10 8 3 4 40
fi 0.375 0.25 0.2 0.075 0.1 1

2. Cas d'une variable statistique quantitative continue


Définition (Classe de valeurs)

On appelle classe de valeurs de la variable statistique X un intervalle de type


[a, b[ tel que X ∈ [a, b[ si et seulement si a ≤ X (w ) < b , c'est à dire, que les valeurs du

I
caractère sont dans la classe [a, b[.
Lorsque le nombre d'observations est grand , on procède au

R
classement des données . Le classement des données consiste à regrouper les
différentes observations sous forme d'intervalles disjoints et cela en utilisant la

A
formule de Sturges suivante :

T
k = 1 + 3.3 log10 (n) .

H
Ces intervalles sont des modalités de la variable statistique continue X . On les appelle

K
classes notée L i . La classe L i est donnée par :

O
L i = [e i −1 , e i [ , i = 1, · · · , k,

avec

M
• e i −1 : borne inférieure . • ei : borne supérieure .

• Amplitude de la classe L i notée ai est : a i = e i − e i −1 .

e i −1 + e i
• Centre de la classe Li noté ci est : ci = .
2

Le tableau statistique d'une variable statistique continue est représenté sous la forme :

Modalités L i L 1 = [e 0 , e 1 [ L 2 = [e 1 , e 2 [ ··· L i = [e i −1 , e i [ ··· L k = [e k−1 , e k [ Total



k
Effectifs ni n1 n2 ··· ni ··· nk n= ni
i =1
n1 n2 ni nk ∑
k
Fréquences fi f1 = f2 = ··· fi = ··· fk = fi = 1
n n n n i =1
e0 + e1 e1 + e2 e i −1 + e i e k−1 + e k
Centres ci c1 = c2 = ··· ci = ··· ck =
2 2 2 2

où f i représente la proportion d'individus ayant la valeur de la variable statistique appar-


tenant à la classe L i , i = 1, k .

11
Probabilitées et Statistiques H. MOKHTARI
Exemple :
On mesure la taille de 50 étudiants de la section E Maths (en centimètres) :
152 152 152 153 153 153 154 154 154 155
155 156 156 156 156 156 157 157 157 158
158 159 159 160 160 160 160 161 161 162
162 162 163 164 164 164 164 165 166 167
168 168 168 169 169 170 170 170 170 170

On a les classes de tailles définies comme suit :


[151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[

Le tableau statistique correspondant à la variable statistique taille des étudiants est le

I
suivant :

R
151 + 155 157 + 159 159 + 163
c1 = = 153, c2 = = 157, c3 = = 161,

A
2 2 2
163 + 167 167 + 171
c4 = = 165, c5 = = 169.

T
2 2

H
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50

K
fi 0.18 0.24 0.22 0.14 0.22 1
Centres ci 153 157 161 165 169

MO
Représentations graphiques d’une série statistique

Une série statistique peut être représentée de différentes façons : sous forme de liste, de
tableau, de graphique, etc.
La représentation graphique d'une série statistique peut faciliter son étude et permettre de
comparer plusieurs séries plus rapidement.
Il existe différents types de représentations graphiques d'une série statistique :
• Diagramme en barres ( tuyaux d'orgue ),

• Diagramme circulaire ,

• Diagramme en bâtons ,

• Histogramme ,

• Polygone des effectifs , · · ·.


Le choix d'une représentation dépend du type de série et du message que l'on veut faire
passer.

12
Probabilitées et Statistiques H. MOKHTARI
1. Cas de variables qualitatives
Les représentations graphiques des variables qualitatives permettent de visualiser et
comparer les fréquences des différentes modalités. Elles consistent à faire correspondre
aux fréquences des surfaces proportionnelles.
À partir de l'observation d'un caractère qualitatif (nominal et ordinal), deux diagrammes
permettent de représenter cette variable :
• Le diagramme en bandes dit tuyaux d'orgue ou diagramme en barres.

• Le diagramme circulaire ou Diagramme par secteur .

a - Tuyaux d'orgue (diagramme en barres ou en bandes)

RI
Définition (Tuyaux d'orgue ou diagramme en barres)

A
Le diagramme en tuyaux d'orgue ou diagramme en barres ou bandes consiste

T
à représenter les fréquences (ou les effectifs) des différentes modalités d'une variable
qualitative à l'aide de barres rectangulaires verticales parallèles de telle sorte que :

H
• Toutes les barres ont la même largeur à la base.

K
• La hauteur de chaque barre représente la valeur de la fréquence (l'axe des ordonnées

O
est gradué suivant les valeurs des fréquences).
• Les barres sont toutes espacées de la même distance (elles ne se collent pas).

M
• Le nom de chaque modalité doit apparaître en dessous de chaque barre.
• Dans le cas de variables qualitatives ordinales, il faut conserver l'ordre naturel des
modalités.

Pour le construire
Pour obtenir un diagramme en barres, on trace un repère formé de deux axes gradués
orthogonaux.
• De façon arbitraire, on place sur l'axe des abscisses les modalités.
• Sur l'axe des ordonnées, on place les effectifs ou les fréquences de chaque modalité.

13
Probabilitées et Statistiques H. MOKHTARI
Attention
• Il ne faut jamais coller les barres . Le fait de coller les barres est réservé aux
histogrammes.
• Il faut toujours donner une épaisseur aux barres . En particulier, il ne faut ja-
mais faire juste un trait, le fait de ne faire qu'un trait est réservé aux diagrammes
en bâtons.

Remarque
Généralement, les différentes modalités sont ordonnées sur le graphique dans le
sens des effectifs croissants ou décroissants.

I
Remarque

R
Le principal difficulté de ce type de graphique est la représentation côte à côte plu-
sieurs distributions. Cette difficulté incite parfois à changer la représentation en empi-

A
lant les barres. Comme pour le diagramme circulaire, ce type de graphique ne convient

T
pas lorsque le nombre de modalités est important.

H
Remarque

K
Les "barres" peuvent être élargies pour une meilleure lisibilité. De plus ce type de
graphique ne nécessite pas une origine, on choisit les valeurs min et max de l'axe des

O
abscisses qui permettent d'avoir la meilleure lisibilité.

M
Exemple :
Le tableau suivant donne la répartition selon le groupe sanguin de 40 individus pris
au hasard dans une population :
Groupe Sanguin A B AB O Total
Effectifs 20 10 5 5 40

Pour obtenir un diagramme en barres, on trace un repère formé d'un axe horizontal
non gradué et d'un axe vertical gradué.
• Sur l'axe horizontal, on trace des rectangles de même largeur, représentant les mo-
dalités, que l'on place à des distances régulières les uns des autres A , B , AB et
O.

• Les hauteurs des rectangles sont proportionnelles aux effectifs ou aux fréquences
des modalités.

14
Probabilitées et Statistiques H. MOKHTARI
On obtient le diagramme en barres suivant :
ni

20
15
10 A
B
5 AB
O
xi
Diagramme en barres représentant la répartition selon le groupe sanguin de

I
40 individus pris au hasard dans une population

R
Remarque

A
1 Étant donné que les modalités sont qualitatives, il n'y a pas d'ordre entre elles.

T
2 Ce type de graphique permet aussi de comparer les résultats sur différentes

H
années ou différentes populations.

K
b - Diagramme circulaire (diagramme par secteur)

O
Définition (Diagramme en secteur ou circulaire)

M
Le diagramme circulaire consiste à représenter l'échantillon total par un cercle
dont la surface sera divisée en plusieurs secteurs d'angles proportionnels aux fré-
quences (ou aux effectifs) de chacune des différentes modalités. On le trouve aussi
sous le nom de "diagramme en secteur" ou "diagramme en camembert" en ré-
férence aux portions de ce fromage.
Le degré de la modalité d'un secteur (les angles θi ) est déterminé à l'aide de la règle
de trois de la manière suivante :
}
n −→ 360◦ n i × 360
=⇒ θi = .
n i −→ θi n

15
Probabilitées et Statistiques H. MOKHTARI
Pour le construire
• Calculer les angles θi associés à chacune des valeurs du caractère étudié.
• Dessiner un cercle.
• Placer un premier rayon.
• Construire les angles les uns à la suite des autres.

Remarque
Le diagramme circulaire est rarement utilisé pour re-
présenter les variables qualitatives ordinales pour lesquelles
l'ordre des modalités a son importance . Ce type de graphique n'est pas adapté

I
lorsque le nombre de modalités devient trop important, on préférera représenter les

R
fréquences sur un diagramme en barres.

A
Exemple :

T
On reprend les données de l'exemple précédent :

H
• Calculons les θi :

OK
n 1 × 360 20 × 360 n 2 × 360 10 × 360
θ1 = = = 180◦ , θ2 = = = 90◦ ,
n 40 n 40
n 3 × 360 5 × 360 n 4 × 360 5 × 360
θ3 = = = 45◦ , θ4 = = = 45◦ .

M
n 40 n 540

• Tableau statistique :

Groupe Sanguin A B AB O Total


Effectifs 20 10 5 5 40
Angle en degrés 180 ◦
90 ◦
45 ◦
45◦ 360◦

16
Probabilitées et Statistiques H. MOKHTARI
On reprend les données de l'exemple précédent :
• Représentation graphique :

180%

45%
90%
45%

RI
Diagramme circulaire représentant la répartition selon le groupe
sanguin de 40 individus pris au hasard dans une population

TA
À partir de l'observation d'un caractère quantitatif (discret et continu) , deux dia-
grammes permettent de représenter cette variable :

H
• Le diagramme en bâtons.

K
• L'histogramme.

O
2. Cas de variables quantitatives discrètes

M
Les effectifs ni (resp. les fréquences relatives f i ) pour une variable statistique quantitative
discrète sont représentés par un diagramme en bâtons.

a - Le diagramme en bâtons
Définition (Diagramme en bâtons)

Le diagramme en bâtons consiste à représenter les effectifs (ni ) (resp. les fré-
( )
quences relatives f i ) des différentes modalités d'une variable statistique quantitative
( )
discrète à l'aide des segments verticaux de coordonnées (xi , 0) et xi , f i :
• Le segment est parallèle à l'axe des ordonnées (ou perpendiculaire à l'axe des abs-
cisses suivant le point de vue).
• Il se situe en abscisse au niveau de la modalité xi .

• Il va de 0 à f i .

17
Probabilitées et Statistiques H. MOKHTARI
Pour le construire
Pour obtenir un diagramme en bâtons, on trace un repère formé de deux axes gradués
orthogonaux.
• Sur l'axe des abscisses , on place les valeurs des différentes modalités x1 , x2 , xi
prises par la variable.
• Sur l'axe des ordonnées , on place les effectifs ou les fréquences relatives cor-
respondant aux différentes valeurs.
• Pour chaque valeur xi , on trace un trait (bâton) perpendiculaire à l'axe des abscisses
dont la hauteur est proportionnelle à l'effectif ni ou aux fréquences relatives f i .

Il faut bien choisir les unités pour que le diagramme soit le plus lisible possible.

I
Définition (Polygone des fréquences)

A R
La courbe obtenue en joignant (en reliant) par les segments de droite les som-
mets de chaque bâton est appelée polygone des effectifs . Il permet de représenter

T
sous forme de courbe, la distribution des fréquences (resp. des fréquences relatives).

KH
Exemple :
La section E Maths est composée de 80 étudiants et la variable représente leurs

O
X
notes du module probabilités et statistiques.
Les notes ont été rassemblées dans le tableau suivant :

M
Notes 11 13 14 16 18 Total
Effectif 30 20 15 10 5 80
Fréquences relatives 0.375 0.25 0.1875 0.125 0.0625 1

La représentation graphique de cette série de données est illustrée par le diagramme


en bâtons de la figure suivante :

18
Probabilitées et Statistiques H. MOKHTARI
ni

S1
30
25
S2
20
S3
15
S4
10
S5
5

I
xi
Diagramme en barres représentant les notes des étudiants de la section E

R
Maths

A
Attention

T
Contrairement aux diagrammes en barres , les segments des

H
diagrammes en bâtons n'ont pas d'épaisseurs .

OK
b - Effectifs cumulés et fréquences cumulées

M
Définition (Effectifs cumulés croissants et fréquences cumulées croissantes)

L'effectif cumulé croissant Ni+ (resp. fréquence cumulée croissante ) Fi+ cor-
( )
respondant à la valeur xi i = 1, k est le nombre d'individus (resp. proportion
( )
d'individus) ayant une valeur de la variable X inférieure ou égale à xi i = 1, k ou
( )
bien strictement inférieure à xi +1 i = 1, k .
• Les effectifs cumulés croissants : • Les fréquences cumulées croissantes :

N1+ = n 1 , F 1+ = f 1 ,
N2+ = n 1 + n 2 = N1+ + n 2 , F 2+ = f 1 + f 2 = F 1+ + f 2 ,
.. ..
. .
Ni+ = n 1 + n 2 + · · · + n i = Ni+−1 + n i , F i+ = f 1 + f 2 + · · · + f i = F i+−1 + f i ,
.. ..
. .
Nk+ = n 1 + n 2 + . . . + n k = Nk−1
+
+ n k = n. F k+ = f 1 + f 2 + · · · + f k = F k−1
+
+ f k = 1.

19
Probabilitées et Statistiques H. MOKHTARI
Définition (Effectifs cumulés décroissants et fréquences cumulées décrois-
santes)

L'effectif cumulé décroissant Ni− (resp. fréquence cumulée décroissante Fi− )


( )
correspondant à la valeur xi i = 1, k est le nombre d'individus (resp. proportion
( )
d'individus) ayant une valeur de la variable X supérieure ou égale à xi i = 1, k ou
( )
bien strictement supérieure à xi +1 i = 1, k .
On a :
• Les effectifs cumulés décroissants : • Les fréquences cumulées décroissantes :

N1− = N , F 1− = 1,

I
N2− = n 2 + n 3 + · · · + n k = N1− − n 1 , F 2− = f 2 + f 3 + · · · + f k = F 1− − f 1 ,
.. ..
. .

R
Ni− = n i + n i +1 + · · · + n k = Ni−−1 − n i −1 , F i− = f i + f i +1 + · · · + f k = F i−−1 − f i −1 ,
.. ..

A
. .
Nk− = n k = Nk−1

F k− = f k = F k−1

T
− n k−1 . − f k−1 .

H
Remarque

K
Ni+ Ni−
F i+ = et F i− = , i = 1, 2, · · · , k.

O
N N

Exemple :

M
( ) ( )
Nous calculons les effectifs cumulés ( croissants Ni+ et décroissants Ni− ) et les
( ) ( )
fréquences cumulées (croissantes Fi+ et décroissantes Fi− ) pour la série statistique
de l'exemple précédent :
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04

Remarque (Représentation graphique des effectifs (resp. fréquences) crois-


sants et décroissants (resp. croissantes et décroissantes))

Les Ni+ et les Fi+ sont représentés par la courbe en escalier cumulative croissante
tandis que les Ni− et les Fi− sont représentés par la courbe en
escalier cumulative décroissante .

Probabilitées et Statistiques
20
H. MOKHTARI
3. Cas de variables quantitatives continues
a - L'histogramme
Définition (Histogramme)

L'histogramme est utilisé pour représenter les variables statistiques


quantitatives continues , en regroupant les données par classe, dont les va-
leurs sont réparties en classes, c'est-à-dire que les valeurs sont réparties dans des
intervalles.

Pour le construire

I
• Généralement, on met le caractère étudié en abscisse et les effectifs correspondants
en ordonnée.

R
• Il faut bien choisir les unités pour que le diagramme soit le plus lisible possible.

TA
Les effectifs ni (resp. les fréquences relatives f i ) pour une variable statistique continue
sont représentés par un histogramme . On distingue deux cas :

H
Classes ayant la même amplitude (Amplitudes des classes égales)

OK
Pour le construire
Pour obtenir un histogramme, on trace un repère formé de deux axes gradués ortho-

M
gonaux.
• Sur l'axe des abscisses , on place les extrémités (les bornes ) des différentes
classes .
• Sur l'axe des ordonnées , on place les effectifs (n i ) ou les fréquences relatives
( )
f i correspondant aux différentes classes.

• On trace pour chaque classe L i un rectangle dont la largeur est proportionnelle à


l'amplitude de la classe et la longueur est proportionnelle à l'effectif ni (resp. la
fréquence f i ).

Exemple :
Dans une entreprise, pour être vendues, les pommes de terre sont triées selon leur
calibre. On a regroupé les résultats dans le tableau suivant.
Calibre en mm C 1 = [60, 65[ C 2 = [65, 70[ C 3 = [70, 75[ C 4 = [75, 80[
Quantité en kg 105 135 120 90

21
Probabilitées et Statistiques H. MOKHTARI
On obtient l'histogramme correspondant :
ni

135
120
105
90

I
C1 C2 C3 C4

A R
H T
xi
Histogramme représentant le calibre de pommes de terre

OK
Remarque
Le polygone est la ligne polygonale obtenue en joignant les points milieux consé-

M
cutifs des sommets des rectangles de l'histogramme. On commence et on termine
le polygone des fréquences en ajoutant une classe de fréquence nulle avant la
première classe et une autre après la dernière classe .

Classes ayant d'amplitudes inégales (Amplitudes des classes différentes)

Pour le construire
• Sur l'axe des abscisses , on place les limites (les bornes ) des différentes
classes .
ni
• Sur l'axe des ordonnées , on place les effectifs corrigés n i0 = ou les
ai
f
fréquences corrigés f i0 = i correspondant aux différentes classes, où ai est
ai
l'amplitude de la classe correspondante à ni ou f i .

22
Probabilitées et Statistiques H. MOKHTARI
• On trace pour chaque classe L i un rectangle dont la largeur est proportionnelle à
l'amplitude de la classe et la longueur est proportionnelle à l'effectif corrigé ni0
(resp. la fréquence corrigée f i0 ).

Exemple :
Le tableau suivant donne la répartition de 94 enfants de 11 ans ayant passé un examen
médical, selon leur taille (en centimètres)

Taille [131, 135[ [135, 139[ [139, 141[ [141, 143[ [143, 147[ [147, 151[ Total
Effectifs 4 12 16 24 24 14 94

Les classes sont d'amplitudes différentes, on doit corriger les effectifs :

I
Effectifs ni 4 12 16 24 24 14 94

R
Amplitudes ai 4 4 2 2 4 4
n
Effectif corrigé ni0 = i 1 3 8 12 6 3.5

A
ai

T
12

H
1 élève
10

OK
8

M
6

0
L'histogramme de cette série est : 131 135 139141143 147 151 155

23
Probabilitées et Statistiques H. MOKHTARI
Remarque
Pour tracer un histogramme dans le cas où les amplitudes sont inégales
( différentes ), on utilise la méthode des effectifs corrigés (ou les
fréquences corrigées ), qui consiste à multiplier l'effectif de chaque classe
par le rapport entre l'amplitude de la plus petite classe sur l'amplitude de la classe
considérée, on obtient ainsi les effectifs rectifiés ( corrigés ) notés :

la plus petite amplitude


n i0 = n i × .
l'amplitude de la classe i

b - Effectifs cumulés et fréquences cumulées

RI
Définition

A
Les effectifs cumulés ( croissants Ni+ et décroissants Ni− ) (resp. les
fréquences cumulées croissantes Fi+ et décroissantes Fi− ) d'une variable statis-

T
tique continue sont calculés de la même manière qu'une variable statistique

H
discrète .

K
Remarque (Représentation graphique des effectifs (resp. fréquences) crois-
sants)

O
Les effectifs cumulés croissants Ni+ (resp. les fréquences cumulées croissantes

M
F i+ ) sont représentés par un graphe appelé courbe cumulative croissante .
Sur l'axe des abscisses on place les bornes des différentes classes , sur
l'axe des ordonnées , on place les Ni+ (resp. Fi+ ). Puis on relie par des segments
continus les points :
( ) ( )
(e 0 , 0) , e 1 , N1+ , · · · , e i , Ni+ , · · · , (e k , N ) ,
( ( ) ( ) )
resp . (e 0 , 0) , e 1 , F 1+ , · · · , e i , F i+ , · · · , (e k , 1) .

En d'autre terme, on relie les points de l'abscisse (la borne supérieure de la classe L i )
et l'ordonnée la valeur de Ni+ ou Fi+ .

24
Probabilitées et Statistiques H. MOKHTARI
Remarque (Représentation graphique des effectifs (resp. fréquences) décrois-
sants)

Les effectifs cumulés décroissants Ni− (resp. les


fréquences cumulées décroissantes Fi− ) sont représentés par un graphe ap-
pelé courbe cumulative décroissante , sur l'axe des abscisses on place les
bornes des différentes classes , sur l'axe des ordonnées , on place les Ni− (resp.
F i− ). Puis on relie par des segments continus les points :
( ) ( )
(e 0 , N ) , e 1 , N2− , · · · , e i −1 , Ni− , · · · , (e k , 0) ,
( ( ) ( ) )
resp . (e 0 , 1) , e 1 , F 2− , · · · , e i −1 , F i− , · · · , (e k , 0) .

En d'autre terme, on relie les points de l'abscisse (la borne inférieure de la classe L i )

I
et l'ordonnée la valeur de Ni− ou Fi− .

A R
H T
OK
M

25
Probabilitées et Statistiques H. MOKHTARI
02 R EPRÉSENTATION NUMÉRIQUE DES DONNÉES

Contenu
1 Introduction
2 Paramètres de position (caractéristiques de tendance centrale)
3 Paramètres de dispersion

I
I Introduction

R
Ces paramètres donnent une idée de l'ordre de grandeur des valeurs constituant la sé-

A
rie ainsi que la position où semblent se concentrer les valeurs de cette série. Les princi-
pales caractéristiques de tendance centrale utilisés de façon courante sont : le mode ,

T
la médiane , la moyenne arithmétique et les quantiles .

H
II Paramètres de position (caractéristiques de tendance centrale)

K
1. Ces des variables discrètes

O
a - Mode

M
Définition (Mode)

Le mode d'une série statistique est le seul paramètre de position qui s'applique
à tous les types de caractères ( qualitatif ou quantitatif ), il est la modalité du
caractère qui correspond au plus grand effectif (ou la plus grande fréquence ).
Généralement, on le note par Mo .

Exemples :
• On demande à des patients en ophtalmologie quelle couleur de teinture des lunettes
leur est le plus agréable. On obtient les résultats suivants :
xi Rouge Vert Bleu Jaune Total
ni 41 6 41 12 100

Cette série statistique est bimodale, car elle possède deux modes : le rouge et le
bleu.

26
Probabilitées et Statistiques H. MOKHTARI
• Un responsable du service marketing d'une grande marque d'ordinateurs (por-
tables et de bureau) fait une enquête dans une université pour savoir combien
d'ordinateurs (portables ou de bureau) il y a dans le foyer de chaque étudiant.
Les données sont les suivantes.
Nombre d'ordinateurs 0 1 2 3 4 5 Total
Nombre d'étudiants 300 876 1235 984 225 154 3774

D'après le tableau ci-dessus, le plus grand effectif est max (ni ) = 1235, la modalité
qui correspond au max (ni ) est x2 = 2. Alors, le mode est Mo = 2.

Définition (Distribution multimodale)

Une distribution est dite unimodale si elle ne possède qu'un seul mode .

I

Elle est dite bimodale si elle en possède deux modes .

R

Elle est dite multimodale si elle en possède plusieurs modes (c'est-à-dire au

A

moins deux).

H T
Remarque

K
Le mode peut ne pas exister et, même s'il existe, peut ne pas être unique (il
peut exister plusieurs modes ).

O
Remarque

M
Graphiquement ( diagramme en bâtons ) le mode correspond à l'abscisse du
plus haut bâton .

b - Médiane
Définition (Médiane)

La médiane Me d'une série statistique ordonnée par ordre croissant est un


nombre qui divise (partage) la population en deux sous-ensembles d'individus
d'effectifs égaux . La médiane Me est donc la valeur de la variable statistique pour
1 1
laquelle la fréquence cumulée est égale à c. à.d F (Me) = .
2 2

27
Probabilitées et Statistiques H. MOKHTARI
Remarque 1 : Calcul de la médiane dans le cas discret)
Le calcul de la médiane se fait par deux méthodes différentes :
Méthode 1 :
1 On ordonne par ordre croissant les valeurs de la série statistique
(x 1 ≤ x 2 ≤ · · · ≤ x n ).

2 On distingue deux cas :


• Si l'effectif total n est impair (n = 2k + 1, k ∈ N), alors la médiane Me est la
valeur du caractère situé au rang k + 1, c'est-à-dire Me = xk+1 ou bien la Me
est la valeur du milieu .
• Si l'effectif total n est pair (n = 2k, k ∈ N), alors la médiane Me est

I
la moyenne arithmétique des deux valeurs du milieu , c'est-à-dire
x k + x k+1

R
Me = .
2

A
Exemple pour la méthode 1 (Cas d'échantillons n impair :)

T
On considère la série statistique :

KH
5 2 11 5 3 5 11 7 5 1 7 3 13 5 2 7 1.

• Ordonner la série :

O
On a : 1 ≤ 2 ≤ 3 ≤ 5 ≤ 7 ≤ 11 ≤ 13.
1 1 2 2 3 3 5 5 5 5 5 7 7 7 11 11 13.

M
• Calculons la médiane :
n = 17 = 2k + 1, avec k = 8, alors la médiane Me est :
Me = x k+1 = x 9 = 5.

Exemple pour la méthode 1 (Cas d'échantillons n pair :)

On considère la série statistique :


9 5 2 6 6 9 4 6 7 3 9 4 8 3 8 6 7 3 9 9
4 2 4 6 7 8 3 9 5 3 6 9 1 7 4 6 9 4 2 9

• Ordonner la série :
On a : 1 ≤ 2 ≤ 3 ≤ 4 ≤ 5 ≤ 6 ≤ 7 ≤ 8 ≤ 9.
1 2 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 6 6 6
6 6 6 6 7 7 7 7 8 8 8 9 9 9 9 9 9 9 9 9

28
Probabilitées et Statistiques H. MOKHTARI
• Calculons la médiane :
On a : n = 40 = 2k , avec k = 20, alors la médiane Me est :
x k + x k+1 x 20 + x 21 6 + 6
Me = = = = 6.
2 2 2

Remarque 2 : Calcul de la médiane dans le cas discret)

Méthode 2 :
Dans ce cas la détermination de la médiane se fait par trois étapes :
1 On calcule les Ni+ ou les Fi+ .
n
2 On identifie le plus petit Ni+ supérieur ou égal à ou la plus petite F i+

I
2
supérieure ou égale à 0.5.

R
3 La médiane Me est alors la valeur de la variable statistique qui correspond à Ni+

A
ou Fi+ .

T
Exemple pour la méthode 2 :)

H
Un quartier est composé de 50 ménages et la variable X représente le nombre de

K
personnes par ménage. Le tableau statistique est le suivant :
Total

O
xi 1 2 3 4 5 6 8
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1

M
Ni+ 5 14 29 39 45 48 50
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1

D'après le tableau statistique ci-dessus, on a :


n 50
• Le plus petit Ni+ supérieur ou égale à = = 25 est Ni+ = 29, donc la médiane est
2 2
Me = x 3 = 3.

• La plus petite F i+ supérieure ou égale à 0.5 est F i+ = 0.58, donc la médiane est Me =
x 3 = 3.

Remarque
La Médiane Me d'une série statistique d'effectif total n est la valeur de la variable
n n +1
qui correspond à l'effectif cumulé si n est pair et si n est impair .
2 2

29
Probabilitées et Statistiques H. MOKHTARI
Remarque (Calcul de médiane)
On suppose que les modalités x1 < · · · < xi < · · · < xk sont ordonnées et nous rappelons

que Fi = ki=1 f i représente la fréquence cumulée jusqu'à la modalité xk . La médiane
Me est la première valeur pour laquelle les fréquences cumulées dépassent 50%
c'est-à-dire que Me est égale à la modalité xk vérifiant à la fois :
F i ≥ 0, 5 F k−1 < 0, 5.

Proposition
La médiane est unique .

I
Me

R
c - Moyenne arithmétique

TA
La moyenne arithmétique représente le barycentre de la série statistique, autour de laquelle
sont ensuite calculés les paramètres de dispersion.

H
Définition (Moyenne arithmétique)

K
Étant donné un échantillon de n observations x1 , · · · , xn . La

O
moyenne arithmétique d'une série statistique est le quotient de la
somme de tous les nombres de cette série par l'effectif total , notée X̄ , est

M
donnée par la formule suivante :
1∑ k ∑ k
X̄ = ni xi = f i xi .
n i =1 i =1

Exemples :
Le tableau suivant présente le nombre d'enfants par famille (variable X ) observé dans
un échantillon de 100 familles :
xi 0 1 2 3 4 5 Total
ni 2 9 10 42 25 12 112
fi 0.02 0.09 0.1 0.42 0.25 0.12 1
ni xi 0 9 20 126 100 60 315

La moyenne arithmétique de la série statistique de l'exemple ci-dessus qui correspond


au nombre d'enfants par famille observé dans un échantillon de 100 familles est :

30
Probabilitées et Statistiques H. MOKHTARI
1 ∑ 6
X= ni xi
100 i =1
1
= (0 × 2 + 1 × 9 + 2 × 10 + 3 × 42 + 4 × 25 + 5 × 12)
100
1
= (0 + 9 + 20 + 126 + 100 + 60)
100
1
= (315)
100
= 3, 15.

d - Quartiles

I
Définition (Quartiles)

R
On considère une série de données rangées dans l'ordre croissant.

A
Les quartiles sont des données de la série qui la partagent en quatre parties à

T
peu près de même effectif .

H
Remarques

K
Il existe trois quartiles :

O
( )
• Le premier quartile Q 1 est le plus petit effectif cumulé Ni+ supérieur ou
n ( )
égal à ou la plus petite fréquence cumulée Fi+ supérieure ou égale à

M
4
0.25.Le premier quartile Q1 est alors la valeur de la variable statistique qui
correspond à Ni+ ou Fi+ .
• Le deuxième quartile Q2 est égal à la médiane Me .
( )
• Le troisième quartile Q3 est le plus petit effectif cumulé Ni+ supérieur ou
3n ( +)
égal à ou la plus petite fréquence cumulée Fi supérieure ou égale
4
à 0.75. Le troisième quartile Q3 est alors la valeur de la variable statistique qui
correspond à Ni+ ou Fi+ .

Remarque

F (Q 1 ) = 0.25, F (Q 3 ) = 0.75.

31
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Un quartier est composé de 50 ménages et la variable X représente le nombre de
personnes par ménage. Les valeurs de la variable sont :
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04

n 50
• Le premier quartile Q 1 : Pour trouver Q 1 , on calcule = = 12.5. Alors, la valeur de
4 4

I
Q 1 est la 13-ème donnée de la série statistique ordonnée, c'est-à-dire Q 1 = x 13 = 2.

R
n 50
• Le deuxième quartile Q 2 : Pour trouver Q 2 , on calcule = = 25. Alors, la valeur de
2 2
Q 2 est la 25-ème donnée de la série statistique ordonnée, c'est-à-dire Q 2 = x 25 = 3.

TA
3n 150
• Le troisième quartile Q 3 : Pour trouver Q 3 , on calcule = = 37.5. Alors, la
4 4
valeur de Q 3 est la 38-ème donnée de la série statistique ordonnée, c'est-à-dire

H
Q 3 = x 38 = 4.

K
Remarque

O
• Les quartiles d'une série sont des données de la série .

M
• La médiane d'une série n'est pas forcément une donnée de la série .

Remarque
Lorsque les modalités x1 , x2 , · · · , xn sont rangées dans l'ordre croissant, alors on a :
• Si l'effectif total n est un multiple de 4 alors les quartiles Q1 et Q3 sont les
n 3n
valeurs du caractère de rang et , respectivement.
4 4

• Si l'effectif total n n'est pas un multiple de 4 alors les quartiles Q 1 et Q 3 sont les
[n ] [ ]
3n
valeurs du caractère de rang +1 et + 1, respectivement.
4 4

32
Probabilitées et Statistiques H. MOKHTARI
Exemple :
1 Un élève a obtenu les 10 notes suivantes : 5, 6, 8, 10, 11, 13, 14, 15, 17, 18. Comme
10 10
= 2, 5 alors Q 1 = 8 (note de rang 3 ) comme 3 × = 7, 5 alors Q 3 = 15 (note de
4 4
rang 8).
8
2 Un élève a obtenu les 8 notes suivantes : 3, 5, 7, 10, 12, 13, 15, 18 Comme =2
4
8
alors Q 1 = 5 (note de rang 2) comme 3 × =6 alors Q 3 = 13 (note de rang 6).
4

2. Ces des variables continues


a - Mode

RI
Pour calculer le mode d'une manière exacte, nous allons déterminer d'abord la classe mo-
dale.

A
Définition (Classe modale)

T
Pour un caractère continu, on parle de classe modale . Si les classes ont

H
la même amplitude ai la classe modale est la classe qui correspond au
plus grand effectif (ou la plus grande fréquence relative ), elle est notée C Mo .

OK
Remarque (Cas des amplitudes égales)

M
On suppose que la classe modale est C Mo = [e i −1 , e i [ et les amplitudes des classes
sont égales , le mode est égal à :
( )
∆1
Mo = e i −1 + a i , (2.1)
∆1 + ∆2


• e i −1 : La borne inférieure de la classe modale.
• ai : Les amplitudes des classes.
• ∆1 = n i − n i −1 ou ∆1 = f i − f i −1 .
• ∆2 = n i − n i +1 ou ∆2 = f i − f i +1 .

33
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Si on reprend l'exemple taille des 50 étudiants de la section E Maths (en centimètres),
on a :
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50
fi 0.16 0.24 0.24 0.14 0.22 1
Centres ci 153 157 161 165 169

• La classe modale : La classe modale est la classe qui correspond au plus grand
effectif ni (max (ni ) = 12), alors la classe modale est : C Mo = [e i −1 , e i [ = [e 1 , e 2 [ =
[155, 159[.

• L'amplitude est a i = e 2 − e 1 = 159 − 155 = 4.

I
• ∆1 = n 2 − n 1 = 12 − 9 = 3 ou ∆1 = f 2 − f 1 = 0.24 − 0.18 = 0.06.

R
• ∆2 = n 2 − n 3 = 12 − 1 = 1 ou ∆2 = f 2 − f 3 = 0.24 − 0.22 = 0.02.

A
• Le mode :

T
( ) ( ) ( )
∆1 3 0.06
Mo = e i −1 + a i = 155 + 4 = 155 + 4 = 158.
∆1 + ∆2 3+1 0.06 + 0.02

KH
Remarque (Cas des amplitudes inégales)

O
Dans le cas où les amplitudes sont différentes ( inégales ), on utilise toujours la
n
formule (2.1), mais avec les effectifs corrigés ni0 = i ou les fréquences corrigées

M
ai
fi
f i0 = .
ai

Exemple :
Si on reprend l'exemple de la répartition de 94 enfants de 11 ans ayant passé un
examen médical, selon leur taille (en centimètres), on a :

Taille [131, 135[ [135, 139[ [139, 141[ [141, 143[ [143, 147[ [147, 151[ Total
ni 4 12 16 24 24 14 94
ai 4 4 2 2 4 4
ni
n i0 = 1 3 8 12 6 3.5
ai

• La classe modale : La classe ( ) modale est la classe qui correspond au plus grand
effectif corrigé ni0 (max ni0 = 12), alors la classe modale est : C Mo = [e i −1 , e i [ =
[e 3 , e 4 [ = [141, 143[.

34
Probabilitées et Statistiques H. MOKHTARI
• L'amplitude est a i = e 4 − e 3 = 143 − 141 = 2.

• ∆01 = n 40 − n 30 = 12 − 8 = 4.

• ∆02 = n 40 − n 50 = 12 − 6 = 6.

• Le mode :
( ) ( )
∆01 4
Mo = e i −1 + a i = 141 + 2 = 141.8.
∆01 + ∆02 4+6

b - Médiane

I
Pour calculer la médiane d'une manière exacte, nous allons déterminer d'abord la classe
médiane.

R
Définition (Classe médiane)

A
La classe médiane correspond à l'effectif (ou fréquence ) cumulé croissant

T
vérifiant :

H
n
Ni+−1 ≤ ≤ Ni+ ou F i+−1 ≤ 0.5 ≤ F i+ ,
2

K
elle est notée par C Me , donc la classe médiane est C Me = [e i −1 , e i [.
La classe médiane est C Me = [e i −1 , e i [, la médiane Me associée à cette classe est égale

O
à:
n 

M
− Ni+−1 ( )
  0, 5 − F i+−1
Me = e i −1 + a i  2 , ou Me = e i −1 + a i .
ni fi

Exemple :
Considérons une distribution statistique représentée par le tableau suivant :
Classes [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 50[ [50, 60[ Total
ni 9 27 36 45 27 6 150
fi 0.06 0.18 0.24 0.3 0.18 0.04 1
Ni+ 9 36 72 117 144 150
Fi 0.06 0.24 0.48 0.78 0.96 1

Pour trouver la classe modale, on cherche les fréquences cumulées qui vérifiées Fi+−1 ≤
0.5 ≤ F i+ . D'après le tableau statistique ci-dessus, on a 0, 48 < 0.5 < 0, 78 alors la classe
médiane est [35, 40[ et donc la médiane est donnée par
( ) ( )
0, 5 − F i+−1 0, 5 − 0, 48
Me = e i −1 + a i = 35 + 5 = 35, 33.
fi 0, 3

35
Probabilitées et Statistiques H. MOKHTARI
c - Moyenne arithmétique
La moyenne arithmétique représente le barycentre de la série statistique, autour de laquelle
sont ensuite calculés les paramètres de dispersion.

Définition (Moyenne)

La moyenne arithmétique X̄ d'une variable statistique continue est donnée par


la formule suivante :
1∑ k ∑ k
X̄ = ni ci = f i ci ,
n i =1 i =1

où ci est le centre de la classe [e i −1 , e i [.

RI
Exemple :

A
Le tableau suivant donne la durée (en heures) passée chaque jour devant la télévision
pour 1000 personnes :

T
Durées (H) [0, 2[ [2, 4[ [4, 6[ [6, 8[ [8, 10[ Total

H
ni 100 200 500 150 50 1000
fi 0.1 0.2 0.5 0.15 0.05 1

K
ci 1 3 5 7 9
ni ci 100 600 2500 1050 450 4700

O
La moyenne arithmétique qui correspond à la durée passée chaque jour devant la
télévision pour 1000 personnes est :

M
1∑ 5
X̄ = ni ci
n i =1
1
= (100 × 1 + 200 × 3 + 500 × 5 + 150 × 7 + 50 × 9)
1000
1
= (100 + 600 + 2500 + 1050 + 450)
1000
1
= (4700)
1000
= 4, 7.

36
Probabilitées et Statistiques H. MOKHTARI
d - Quartiles
Définition (Le premier quartile Q 1 )

La classe du premier quartile correspond à l'effectif (ou fréquence )


cumulé croissant vérifiant :
n
Ni+−1 ≤ ≤ Ni+ et F i+−1 ≤ 0.25 ≤ F i+ .
4

elle est notée par CQ 1 , donc la classe du premier quartile est CQ 1 = [e i −1 , e i [. Le


premier quartile Q1 est donné par :
n 
− Ni+−1 ( )
0.25 − F i+−1

I
 
Q 1 = e i −1 + a i  4  ou Q 1 = e i −1 + a i .
ni fi

A R
Définition (Le deuxième quartile Q 2 )

T
La classe du deuxième quartile correspond à l'effectif (ou fréquence )

H
cumulé croissant vérifiant :

K
n
Ni+−1 ≤ ≤ Ni+ ou F i+−1 ≤ 0.5 ≤ F i+ ,
2

O
elle est notée par CQ 2 . On a CQ 2 = C Me et le deuxième quartile Q 2 = Me .

M
Définition (Le troisième quartile Q 3 )

La classe du troisième quartile correspond à l'effectif (ou fréquence )


cumulé croissant vérifiant :
3n
Ni+−1 ≤ ≤ Ni+ ou F i+−1 ≤ 0.75 ≤ F i+ ,
4

elle est notée par CQ 3 , donc la classe du troisième quartile est CQ 3 = [e i −1 , e i [. Le


troisième quartile Q 3 est donné par :
 
3n + ( )
 4 − Ni −1  0.75 − F i+−1
Q 3 = e i −1 + a i 


 ou Q 3 = e i −1 + a i .
ni fi

37
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Le tableau statistique correspondant à la variable statistique taille des 50 étudiants de
la section E Maths est le suivant :
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50
fi 0.18 0.24 0.22 0.14 0.22 1
Centres ci 153 157 161 165 169
Ni+ 9 21 32 39 50
F i+ 0.18 0.42 0.64 0.78 1

• Le premier quartile Q 1 : La classe du premier quartile CQ 1 est : CQ 1 = [e i −1 , e i [ =


[155, 159[, car c'est la première classe où la fréquence cumulée F i+ dépasse 0.25.
Donc

I
( ) ( )
0.25 − F i+−1 0.25 − 0.18

R
Q 1 = e i −1 + a i . = 155 + 4 = 156, 17.
fi 0.24

A
• Le deuxième quartile Q 2 : La classe du deuxième quartile CQ 2 est : CQ 2 =

T
[e i −1 , e i [ = [159, 163[, car c'est la première classe où la fréquence cumulée F i+ dé-
passe 0.5. Donc

H
( ) ( )
0.5 − F i+−1 0.5 − 0.42
Q 2 = e i −1 + a i = 159 + 4 = 160, 46.

K
fi 0.22

O
• Le troisième quartile Q 3 : La classe du troisième quartile CQ 3 est : CQ 3 = [e i −1 , e i [ =
[163, 167[, car c'est la première classe où la fréquence cumulée F i+ dépasse 0.75.
Donc

M
( ) ( )
0.75 − F i+−1 0.75 − 0.64
Q 3 = e i −1 + a i = 163 + 4 = 166, 15.
fi 0.14

III Paramètres de dispersion

1. Ces des variables discrètes


Les paramètres de dispersion sont calculés dans le but de mesurer la dispersion des diffé-
rentes valeurs de la variable statistique autour d'une valeur centrale comme la moyenne.
Les caractéristiques de dispersion les plus fréquemment utilisées en statistique sont :
L'étendue , la variance , l'écart-type , l'intervalle interquartile et l'écart interquartile .

38
Probabilitées et Statistiques H. MOKHTARI
a - Étendue
Définition (Étendue)

L'étendue (notée E ) est la différence entre la plus grande (x max ) et la


plus petite (xmin ) des valeurs observées.

E = x max − x min .

b - Variance

I
Définition (Variance)

R
La variance (notée V (X )) est donnée par la formule suivante :

A
1 ∑ k ( )2 ∑ k ( )2
V (X ) = n i x i − X̄ = f i x i − X̄ .

T
N i =1 i =1

Pour des calculs simples, on utilise généralement la formule suivante :

KH
1 ∑ k
2 2
∑ k
V (X ) = n i x i − X̄ = f i x i2 − X̄ 2 .
N i =1 i =1

O
c - Écart-type

M
Définition (Écart-type)

L'écart-type (noté σ (X )) est donné par la formule suivante :



σ (X ) = V (X ).

• Si σ (X ) est grand , alors les différentes valeurs de la variable statistique X sont


fortement dispersées autour de la moyenne.
• Si σ (X )est petit , alors les différentes valeurs de la variable statistique X sont
faiblement dispersées autour de la moyenne.

39
Probabilitées et Statistiques H. MOKHTARI
d - Écart interquartile
Définition (Écart interquartile)

On appelle écart interquartile (noté E IQ ), la différence entre le troisième et


le premier quartile (Q 3 et Q 1 ), il est donné par la formule suivante :

E IQ = Q 3 −Q 1 .

e - Intervalle interquartile

I
Définition (Intervalle interquartile)

R
L'intervalle interquartile (noté IQ ) est donné par :

A
IQ = [Q 1 ,Q 3 ] .

T
C'est donc l'intervalle qui contient 50% des observations en laissant 25% à droite et

H
25% à gauche .

K
Exemple :

O
Si on reprend l'exemple d'un quartier composé de 50 ménages.
Tableau statistique :

M
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04
ni xi 5 18 45 40 30 16 16 170
n i x i2 5 36 135 160 150 108 128 722

Les paramètres de disposition :

• Étendu E :
E = x max − x min = 8 − 1 = 7.

40
Probabilitées et Statistiques H. MOKHTARI
• Variance V (X ) : Pour calculer la variance, on calcule tout d'abord la moyenne X̄ :
1∑ 7 1
X̄ = ni xi = (170) = 3, 4.
n i =1 50

Alors, la variance est :


1∑ 7 1
V (X ) = n i x i2 − X̄ 2 = (722) − (3.4)2
n i =1 50
= 2, 88.

• Écart-type σ (X ) :
√ √

I
σ (X ) = V (X ) = 2, 88 = 1, 69.

R
• Écart interquartile E IQ :

A
E IQ = Q 3 −Q 1 = 4 − 2 = 2.

T
• Intervalle interquartile IQ :

H
IQ = [2, 4] .

OK
2. Ces des variables continues
a - Variance

M
Définition (Variance)

La variance (notée V (X )) est donnée par la formule suivante :

1∑ k ( )2 ∑ k ( )2
V (X )= n i c i − X̄ = f i c i − X̄
n i =1 i =1
1 ∑ k ∑ k
= n i c i2 − X̄ 2 = f i c i2 − X̄ 2 .
N i =1 i =1

b - Écart-type
Définition (Écart-type)

L'écart-type (noté σ (X )) est donné par la formule suivante :



σ (X ) = V (X ).

41
Probabilitées et Statistiques H. MOKHTARI
c - Écart interquartile
Définition (Écart interquartile)

L'écart interquartile (noté E IQ ) est donné par la formule suivante :

E IQ = Q 3 −Q 1 .

d - Intervalle interquartile
Définition (Intervalle interquartile)

I
L'intervalle interquartile (noté IQ ) est donné par :

R
IQ = [Q 1 ,Q 3 ] .

TA
Exemple :

H
Le tableau statistique suivant représente les mesures de la taille de 50 étudiants de la
section E Maths (en centimètres) :

K
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total

O
ni 9 12 11 7 11 50
fi 0.18 0.24 0.22 0.14 0.22 1

M
ci 153 157 161 165 169
Ni+ 9 21 32 39 50
F i+ 0.18 0.42 0.64 0.78 1

Les paramètres de dispersion de l'exemple ci-dessus sont donnés par :

• Étendue E :
E = e k − e 0 = 171 − 151 = 20.

• Variance V (X ) :
Pour calculer la variance, on calcule tout d'abord la moyenne arithmétique X̄ :
1∑ 6 1
X̄ = ni ci = (8046) = 160, 92.
n i =1 50

Alors
1∑ 6 1
V (X ) = n i c i2 − X̄ 2 = (1296346) − (160, 92)2 = 31, 6736.
n i =1 50

42
Probabilitées et Statistiques H. MOKHTARI
• Écart-type σ (X ) :
√ p
σ (X ) = V (X ) = 31.6736 = 5, 62.

• Écart interquartile E IQ :
Pour trouver l'écart interquartile, on calcule tout d'abord les quartiles Q 1 et Q 3 :
• Le premier quartile Q 1 : La classe du premier quartile CQ 1 est : CQ 1 =
[e i −1 , e i [ = [155, 159[, car c'est la première classe où la fréquence cumulée
F i+ dépasse 0.25. Donc
( ) ( )
0.25 − F i+−1 0.25 − 0.18
Q 1 = e i −1 + a i . = 155 + 4 = 156, 17.
fi 0.24

I
• Le troisième quartile Q 3 : La classe du troisième quartile CQ 3 est : CQ 3 =

R
[e i −1 , e i [ = [163, 167[, car c'est la première classe où la fréquence cumulée F i+
dépasse 0.75. Donc

A
( ) ( )
0.75 − F i+−1

T
0.75 − 0.64
Q 3 = e i −1 + a i = 163 + 4 = 166, 15.
fi 0.14

KH
E IQ = Q 3 −Q 1 = 166.15 − 156.17 = 9.98.

O
• Intervalle interquartile IQ :

IQ = [Q 1 ,Q 3 ] = [156.17, 166.15] .

43
Probabilitées et Statistiques H. MOKHTARI

Vous aimerez peut-être aussi