Académique Documents
Professionnel Documents
Culture Documents
taire : 2022-2023
Statistique
Statistique
R I
A
Descriptive
H T
OK
M
L1
Maths.
1
Probabilitées et Statistiques H. MOKHTARI
Table des matières
C HAPITRE 1 N OTIONS DE BASE VOCABULAIRE STATISTIQUE PAGE 2
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
II Concepts de base de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Individu (Unité statistique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4 Caractère (variable statistique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5 Modalités (valeurs) d'un caractère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6 Effectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I
7 Série statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
8 Distribution statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
R
9 Fréquences relatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
III Types des caractères . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
A
1 Caractère qualitatif (variable statistique qualitative) . . . . . . . . . . . . . . . . 7
T
2 Caractère quantitatif (variable statistique quantitative) . . . . . . . . . . . . . . 8
IV Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
H
1 Cas d'une variable statistique qualitative ou quantitative discrète . . . . 10
2 Cas d'une variable statistique quantitative continue . . . . . . . . . . . . . . . . 11
K
V Représentations graphiques d'une série statistique . . . . . . . . . . . . . . . . . . . . . . 12
1 Cas de variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
O
2 Cas de variables quantitatives discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Cas de variables quantitatives continues . . . . . . . . . . . . . . . . . . . . . . . . . . 21
M
C HAPITRE 2 R EPRÉSENTATION NUMÉRIQUE DES DONNÉES PAGE 26
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
II Paramètres de position (caractéristiques de tendance centrale) . . . . . . . . . . 26
1 Ces des variables discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2 Ces des variables continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
III Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1 Ces des variables discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2 Ces des variables continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1
Probabilitées et Statistiques H. MOKHTARI
01 N OTIONS DE BASE VOCABULAIRE STATISTIQUE
Contenu
1 Introduction
4 Tableau statistique
RI
5 Représentations graphiques d'une série statistique
T
Introduction
A
H
La statistique est une science qui consiste à étudier la collecte de données, leur analyse,
K
leur traitement, l'interprétation des résultats et leur présentation afin de rendre les données
compréhensibles par tous. La statistique descriptive est un outil mathématique permet-
O
tant d'étudier les caractéristiques d'un ensemble d'unités (appelé population) en fonction
de critères de description bien déterminés. Elle sert à :
M
• Explorer, découvrir l'information contenue dans les données.
2
Probabilitées et Statistiques H. MOKHTARI
1. Population
Définition (Population statistique)
Exemple :
• On considère l'ensemble des étudiants de la section E Maths. On s'intéresse à l'étude
de leurs notes. Dans ce cas
Ω = Ensemble des étudiants.
RI
• L'ensemble des étudiants de la faculté des sciences.
A
2. Échantillon
H T
Définition (Échantillon)
K
Un échantillon de taille n est un sous-ensemble (une partie) formé de n
individus de la population.
MO
3. Individu (Unité statistique)
Définition (Individu ou unité statistique)
Remarques
• La population et l'individu (Ω et ω) peuvent être des ensembles des personnes ,
d'objets ou d'animaux , etc, · · · .
• L'individu est un objet pour lequel nous cherchons à recueillir de l'information.
3
Probabilitées et Statistiques H. MOKHTARI
Exemples :
• On reprend le même exemple indiqué ci-dessus, l'individu est
ω = Un étudiant de la section.
I
On appelle caractère (ou variable statistique , dénotée V .S ) toute application :
A R
X : Ω →C,
où C est l'ensemble des valeurs du caractère X (c'est ce qui est mesuré ou observé sur
T
les individus).
H
Exemple :
K
Les caractères ci-après sont des variables statistiques : La couleur, l'âge, le sexe, le
O
poids, la taille, la marque, le modèle, le nombre d'enfants, le prix, la surface, etc.
M
5. Modalités (valeurs) d'un caractère
Définition (Modalités d'un caractère)
Les Modalités d'un caractère ou d'une variable statistique sont les différentes valeurs
que peut prendre celle-ci.
Exemple :
4
Probabilitées et Statistiques H. MOKHTARI
Notation
Généralement, on note une variable statistique par une lettre majuscule X , Y , · · ·
et ses modalités par la même lettre minuscule affectée d'indices : x1 , x2 , · · · pour
la variable X ou y 1 , y 2 , · · · pour la variable Y .
6. Effectif
Définition (Effectif)
Lorsque la population de taille n est répartie sur les différentes modalités, nous obte-
nus pour chacune d'elle un nombre : c'est le nombre d'individus ayant cette modalité,
on l'appel l'effectif . Ce nombre est souvent noté n .
I
Généralement, on note l'effectif correspondant à la modalité xi , par ni = 1, k tel que
R
n = n1 + n2 + . . . + nk .
A
Remarque
T
⋆ L'effectif partiel est le nombre d'apparitions d'une valeur du caractère.
H
⋆ L'effectif total (la taille de l'échantillon) est la somme des effectifs partiels .
OK
7. Série statistique
M
Définition (Série statistique)
Remarques
• Si l'étude statistique porte sur un seul critère , on dit que la série statistique est
simple (ou univariée ).
• Si l'étude porte sur deux critères , la série statistique est dite double (ou
bivariée ).
• Si l'étude porte sur plusieurs critères , la série statistique est dite multiple .
5
Probabilitées et Statistiques H. MOKHTARI
Exemple :
• Étudier la longueur des pétales sur une population d'iris donne une série statis-
tique simple .
• Étudier la longueur et la largeur des pétales donne une série statistique double .
8. Distribution statistique
Soit une population concernant n individus. Le classement des individus de cette population
selon les différentes modalités du caractère donne naissance à une distribution statistique
généralement présentée dans un tableau statistique.
I
9. Fréquences relatives
R
Définition (Fréquence ou fréquence relative)
TA
On appelle "fréquence" ou "fréquence relative" d'un caractère est le nombre
d'individus possédant ce caractère divisé par l'effectif total de la population. Elle est
H
donnée par :
K
ni
fi = , i = 1, 2, 3, · · · , k,
n
O
avec
∑
k ∑ k n
i 1∑ k 1
fi = = ni = × n = 1 0 ≤ f i ≤ 1.
M
et
i =1 i =1 n n i =1 n
Remarque
∑
k n1 n2 nk n1 + n2 + · · · + nk
fi = f1 + f2 + · · · + fk = + +···+ = = 1.
i =1 n n n n
Remarque
• La somme des effectifs est toujours égale au nombre d'individus de la population :
n 1 + n 2 + · · · + n k = n.
f 1 + f 2 + · · · + f k = 1.
6
Probabilitées et Statistiques H. MOKHTARI
• Lors de l'utilisation de la calculatrice, il peut arriver que la somme des fréquences
ne soit pas exactement égale à 1 à cause des arrondis de calculs.
I
(b) Variables statistiques qualitatives ordinales.
R
2 Variables statistiques quantitatives.
A
(a) Variables statistiques quantitatives discrètes.
T
(b) Variables statistiques quantitatives continues.
H
1. Caractère qualitatif (variable statistique qualitative)
K
Définition (Variable statistique qualitative)
O
Une variable statistique est dite qualitative si les modalités
M
ne sont pas mesurables ou si elles sont désignées par des noms .
Exemple :
Le sexe (masculin, féminin), la profession (enseignement, architecture, · · · ), l'état ma-
trimonial (marié, divorcé, célibataire).
Les modalités d'un caractère qualitatif peuvent être classées sur deux sous-catégories :
nominal ou ordinal .
7
Probabilitées et Statistiques H. MOKHTARI
Exemple :
• La couleur des yeux (noire, bleue, verte).
• Le Sexe (masculin, féminin).
• La situation familiale (célibataire, marié(e), veuf(ve), en couple, · · · ).
I
Exemple :
R
La mention au Bac (excellent, très bien, bien, assez bien, passable).
TA
2. Caractère quantitatif (variable statistique quantita-
H
tive)
K
Définition (Variable statistique quantitative)
O
Une variable statistique est dite quantitative ou numérique si ses différentes
modalités sont mesurables , numériques . Les différentes modalités d'une va-
M
riable statistique quantitative constituent l'ensemble des valeurs numériques que peut
prendre la variable statistique.
Les modalités d'un caractère quantitatif peuvent être classées sur deux sous-catégories :
discret ou continu .
On dit qu'une variable statistique quantitative est discrète si ses modalités sont des
valeurs numériques (elle prend un nombre fini de valeurs).
8
Probabilitées et Statistiques H. MOKHTARI
Exemples :
1 Nombre d'enfants dans une famille, nombre de pièces défectueuses dans un lot.
2 Un quartier est composé de 50 ménages et la variable X représente le nombre
de personnes par ménage. Les valeurs de la variable sont :
1 1 1 1 1 2 2 2 2 2
2 2 2 2 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 4
4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 6 6 6 8 8
Nous avons
I
• Population : (Ω) ensemble des ménages.
R
• Individu (ω) un ménage.
A
• Caractère (Variable statistique) nombre de personnes par ménage :
T
X
X : ω −→ X (ω) .
H
On lit, au ménage ω, on associe X (ω) = nombre de personnes dans ce mé-
K
nage.
O
Définition (Caractère continu)
M
On dit qu'une variable statistique quantitative est continue si ses modalités sont
dans un intervalle de R, ne sont pas en nombre fini (le nombre de ces valeurs
est toujours infini ).
Une variable statistique continue peut prendre une infinité de valeurs possibles.
Le domaine de la variable est alors R ou un intervalle dans R.
Exemples :
1 Soit l'ensemble des nouveaux nés au C.H.U d'une ville pendant les 3 premiers
mois de 2023. Nous désignons par X le poids des nouveaux nés. On suppose
que : xmin = 2, 701 et xmax = 5, 001.
2 Généralement, toutes les grandeurs liées à l'espace (longueur, surface, volume),
au temps, à l'âge, à la durée de vie, à la masse (poids), au poids ou encore
aux combinaisons de ces éléments (vitesse, débit, densité) sont des variables
statistiques continues.
9
Probabilitées et Statistiques H. MOKHTARI
IV Tableau statistique
Un tableau statistique est un outil utilisé afin de présenter des données chiffrées,
après leur rangement par ordre croissant, sous forme de deux colonnes. La première
colonne de gauche est toujours réservée aux modalités du caractère à étudier, tandis
que celle de droite est utilisée pour indiquer les effectifs ou les fréquences relatives
correspondants aux différentes modalités.
Un tableau statistique fait intervenir les notions assez élémentaires de modalité
x i , d'effectif n i , de fréquence f i (ou pourcentage ), d'effectif cumulé Ni et de
fréquence cumulée Fi .
RI
1. Cas d'une variable statistique qualitative ou quantita-
tive discrète
TA
Soit X une variable statistique discrète qui prend les valeurs (modalités) x1 , x2 , · · · , xk
avec x1 ≤ x2 ≤ · · · ≤ xk et on suppose qu'il existe ni individus ayant la valeur xi . Le tableau
H
statistique correspondant à une variable statistique quantitative discrète est présenté sous
la forme suivante :
K
Modalités xi x1 x2 ··· xk Total
∑
O
k
Effectifs ni n1 n2 ··· nk n= ni
i =1
∑
k
Fréquences relatives
M
fi f1 f2 ··· fk fi = 1
i =1
ni
où fi = représente la proportion d'individus ayant la valeur x i , i = 1, k .
N
Exemple :
On s'interesse aux types d'activités principales de 40 entreprises. Il y a 5 types possibles
(catégories) : I (Industrie), T (Transport), C (Communications), S (Services), A
(Autres). Les données sont résumées dans le tableau suivant :
10
Probabilitées et Statistiques H. MOKHTARI
• Tableau statistique :
Modalités I T C S A Total
ni 15 10 8 3 4 40
fi 0.375 0.25 0.2 0.075 0.1 1
I
caractère sont dans la classe [a, b[.
Lorsque le nombre d'observations est grand , on procède au
R
classement des données . Le classement des données consiste à regrouper les
différentes observations sous forme d'intervalles disjoints et cela en utilisant la
A
formule de Sturges suivante :
T
k = 1 + 3.3 log10 (n) .
H
Ces intervalles sont des modalités de la variable statistique continue X . On les appelle
K
classes notée L i . La classe L i est donnée par :
O
L i = [e i −1 , e i [ , i = 1, · · · , k,
avec
M
• e i −1 : borne inférieure . • ei : borne supérieure .
e i −1 + e i
• Centre de la classe Li noté ci est : ci = .
2
Le tableau statistique d'une variable statistique continue est représenté sous la forme :
11
Probabilitées et Statistiques H. MOKHTARI
Exemple :
On mesure la taille de 50 étudiants de la section E Maths (en centimètres) :
152 152 152 153 153 153 154 154 154 155
155 156 156 156 156 156 157 157 157 158
158 159 159 160 160 160 160 161 161 162
162 162 163 164 164 164 164 165 166 167
168 168 168 169 169 170 170 170 170 170
I
suivant :
R
151 + 155 157 + 159 159 + 163
c1 = = 153, c2 = = 157, c3 = = 161,
A
2 2 2
163 + 167 167 + 171
c4 = = 165, c5 = = 169.
T
2 2
H
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50
K
fi 0.18 0.24 0.22 0.14 0.22 1
Centres ci 153 157 161 165 169
MO
Représentations graphiques d’une série statistique
Une série statistique peut être représentée de différentes façons : sous forme de liste, de
tableau, de graphique, etc.
La représentation graphique d'une série statistique peut faciliter son étude et permettre de
comparer plusieurs séries plus rapidement.
Il existe différents types de représentations graphiques d'une série statistique :
• Diagramme en barres ( tuyaux d'orgue ),
• Diagramme circulaire ,
• Diagramme en bâtons ,
• Histogramme ,
12
Probabilitées et Statistiques H. MOKHTARI
1. Cas de variables qualitatives
Les représentations graphiques des variables qualitatives permettent de visualiser et
comparer les fréquences des différentes modalités. Elles consistent à faire correspondre
aux fréquences des surfaces proportionnelles.
À partir de l'observation d'un caractère qualitatif (nominal et ordinal), deux diagrammes
permettent de représenter cette variable :
• Le diagramme en bandes dit tuyaux d'orgue ou diagramme en barres.
RI
Définition (Tuyaux d'orgue ou diagramme en barres)
A
Le diagramme en tuyaux d'orgue ou diagramme en barres ou bandes consiste
T
à représenter les fréquences (ou les effectifs) des différentes modalités d'une variable
qualitative à l'aide de barres rectangulaires verticales parallèles de telle sorte que :
H
• Toutes les barres ont la même largeur à la base.
K
• La hauteur de chaque barre représente la valeur de la fréquence (l'axe des ordonnées
O
est gradué suivant les valeurs des fréquences).
• Les barres sont toutes espacées de la même distance (elles ne se collent pas).
M
• Le nom de chaque modalité doit apparaître en dessous de chaque barre.
• Dans le cas de variables qualitatives ordinales, il faut conserver l'ordre naturel des
modalités.
Pour le construire
Pour obtenir un diagramme en barres, on trace un repère formé de deux axes gradués
orthogonaux.
• De façon arbitraire, on place sur l'axe des abscisses les modalités.
• Sur l'axe des ordonnées, on place les effectifs ou les fréquences de chaque modalité.
13
Probabilitées et Statistiques H. MOKHTARI
Attention
• Il ne faut jamais coller les barres . Le fait de coller les barres est réservé aux
histogrammes.
• Il faut toujours donner une épaisseur aux barres . En particulier, il ne faut ja-
mais faire juste un trait, le fait de ne faire qu'un trait est réservé aux diagrammes
en bâtons.
Remarque
Généralement, les différentes modalités sont ordonnées sur le graphique dans le
sens des effectifs croissants ou décroissants.
I
Remarque
R
Le principal difficulté de ce type de graphique est la représentation côte à côte plu-
sieurs distributions. Cette difficulté incite parfois à changer la représentation en empi-
A
lant les barres. Comme pour le diagramme circulaire, ce type de graphique ne convient
T
pas lorsque le nombre de modalités est important.
H
Remarque
K
Les "barres" peuvent être élargies pour une meilleure lisibilité. De plus ce type de
graphique ne nécessite pas une origine, on choisit les valeurs min et max de l'axe des
O
abscisses qui permettent d'avoir la meilleure lisibilité.
M
Exemple :
Le tableau suivant donne la répartition selon le groupe sanguin de 40 individus pris
au hasard dans une population :
Groupe Sanguin A B AB O Total
Effectifs 20 10 5 5 40
Pour obtenir un diagramme en barres, on trace un repère formé d'un axe horizontal
non gradué et d'un axe vertical gradué.
• Sur l'axe horizontal, on trace des rectangles de même largeur, représentant les mo-
dalités, que l'on place à des distances régulières les uns des autres A , B , AB et
O.
• Les hauteurs des rectangles sont proportionnelles aux effectifs ou aux fréquences
des modalités.
14
Probabilitées et Statistiques H. MOKHTARI
On obtient le diagramme en barres suivant :
ni
20
15
10 A
B
5 AB
O
xi
Diagramme en barres représentant la répartition selon le groupe sanguin de
I
40 individus pris au hasard dans une population
R
Remarque
A
1 Étant donné que les modalités sont qualitatives, il n'y a pas d'ordre entre elles.
T
2 Ce type de graphique permet aussi de comparer les résultats sur différentes
H
années ou différentes populations.
K
b - Diagramme circulaire (diagramme par secteur)
O
Définition (Diagramme en secteur ou circulaire)
M
Le diagramme circulaire consiste à représenter l'échantillon total par un cercle
dont la surface sera divisée en plusieurs secteurs d'angles proportionnels aux fré-
quences (ou aux effectifs) de chacune des différentes modalités. On le trouve aussi
sous le nom de "diagramme en secteur" ou "diagramme en camembert" en ré-
férence aux portions de ce fromage.
Le degré de la modalité d'un secteur (les angles θi ) est déterminé à l'aide de la règle
de trois de la manière suivante :
}
n −→ 360◦ n i × 360
=⇒ θi = .
n i −→ θi n
15
Probabilitées et Statistiques H. MOKHTARI
Pour le construire
• Calculer les angles θi associés à chacune des valeurs du caractère étudié.
• Dessiner un cercle.
• Placer un premier rayon.
• Construire les angles les uns à la suite des autres.
Remarque
Le diagramme circulaire est rarement utilisé pour re-
présenter les variables qualitatives ordinales pour lesquelles
l'ordre des modalités a son importance . Ce type de graphique n'est pas adapté
I
lorsque le nombre de modalités devient trop important, on préférera représenter les
R
fréquences sur un diagramme en barres.
A
Exemple :
T
On reprend les données de l'exemple précédent :
H
• Calculons les θi :
OK
n 1 × 360 20 × 360 n 2 × 360 10 × 360
θ1 = = = 180◦ , θ2 = = = 90◦ ,
n 40 n 40
n 3 × 360 5 × 360 n 4 × 360 5 × 360
θ3 = = = 45◦ , θ4 = = = 45◦ .
M
n 40 n 540
• Tableau statistique :
16
Probabilitées et Statistiques H. MOKHTARI
On reprend les données de l'exemple précédent :
• Représentation graphique :
180%
45%
90%
45%
RI
Diagramme circulaire représentant la répartition selon le groupe
sanguin de 40 individus pris au hasard dans une population
TA
À partir de l'observation d'un caractère quantitatif (discret et continu) , deux dia-
grammes permettent de représenter cette variable :
H
• Le diagramme en bâtons.
K
• L'histogramme.
O
2. Cas de variables quantitatives discrètes
M
Les effectifs ni (resp. les fréquences relatives f i ) pour une variable statistique quantitative
discrète sont représentés par un diagramme en bâtons.
a - Le diagramme en bâtons
Définition (Diagramme en bâtons)
Le diagramme en bâtons consiste à représenter les effectifs (ni ) (resp. les fré-
( )
quences relatives f i ) des différentes modalités d'une variable statistique quantitative
( )
discrète à l'aide des segments verticaux de coordonnées (xi , 0) et xi , f i :
• Le segment est parallèle à l'axe des ordonnées (ou perpendiculaire à l'axe des abs-
cisses suivant le point de vue).
• Il se situe en abscisse au niveau de la modalité xi .
• Il va de 0 à f i .
17
Probabilitées et Statistiques H. MOKHTARI
Pour le construire
Pour obtenir un diagramme en bâtons, on trace un repère formé de deux axes gradués
orthogonaux.
• Sur l'axe des abscisses , on place les valeurs des différentes modalités x1 , x2 , xi
prises par la variable.
• Sur l'axe des ordonnées , on place les effectifs ou les fréquences relatives cor-
respondant aux différentes valeurs.
• Pour chaque valeur xi , on trace un trait (bâton) perpendiculaire à l'axe des abscisses
dont la hauteur est proportionnelle à l'effectif ni ou aux fréquences relatives f i .
Il faut bien choisir les unités pour que le diagramme soit le plus lisible possible.
I
Définition (Polygone des fréquences)
A R
La courbe obtenue en joignant (en reliant) par les segments de droite les som-
mets de chaque bâton est appelée polygone des effectifs . Il permet de représenter
T
sous forme de courbe, la distribution des fréquences (resp. des fréquences relatives).
KH
Exemple :
La section E Maths est composée de 80 étudiants et la variable représente leurs
O
X
notes du module probabilités et statistiques.
Les notes ont été rassemblées dans le tableau suivant :
M
Notes 11 13 14 16 18 Total
Effectif 30 20 15 10 5 80
Fréquences relatives 0.375 0.25 0.1875 0.125 0.0625 1
18
Probabilitées et Statistiques H. MOKHTARI
ni
S1
30
25
S2
20
S3
15
S4
10
S5
5
I
xi
Diagramme en barres représentant les notes des étudiants de la section E
R
Maths
A
Attention
T
Contrairement aux diagrammes en barres , les segments des
H
diagrammes en bâtons n'ont pas d'épaisseurs .
OK
b - Effectifs cumulés et fréquences cumulées
M
Définition (Effectifs cumulés croissants et fréquences cumulées croissantes)
L'effectif cumulé croissant Ni+ (resp. fréquence cumulée croissante ) Fi+ cor-
( )
respondant à la valeur xi i = 1, k est le nombre d'individus (resp. proportion
( )
d'individus) ayant une valeur de la variable X inférieure ou égale à xi i = 1, k ou
( )
bien strictement inférieure à xi +1 i = 1, k .
• Les effectifs cumulés croissants : • Les fréquences cumulées croissantes :
N1+ = n 1 , F 1+ = f 1 ,
N2+ = n 1 + n 2 = N1+ + n 2 , F 2+ = f 1 + f 2 = F 1+ + f 2 ,
.. ..
. .
Ni+ = n 1 + n 2 + · · · + n i = Ni+−1 + n i , F i+ = f 1 + f 2 + · · · + f i = F i+−1 + f i ,
.. ..
. .
Nk+ = n 1 + n 2 + . . . + n k = Nk−1
+
+ n k = n. F k+ = f 1 + f 2 + · · · + f k = F k−1
+
+ f k = 1.
19
Probabilitées et Statistiques H. MOKHTARI
Définition (Effectifs cumulés décroissants et fréquences cumulées décrois-
santes)
N1− = N , F 1− = 1,
I
N2− = n 2 + n 3 + · · · + n k = N1− − n 1 , F 2− = f 2 + f 3 + · · · + f k = F 1− − f 1 ,
.. ..
. .
R
Ni− = n i + n i +1 + · · · + n k = Ni−−1 − n i −1 , F i− = f i + f i +1 + · · · + f k = F i−−1 − f i −1 ,
.. ..
A
. .
Nk− = n k = Nk−1
−
F k− = f k = F k−1
−
T
− n k−1 . − f k−1 .
H
Remarque
K
Ni+ Ni−
F i+ = et F i− = , i = 1, 2, · · · , k.
O
N N
Exemple :
M
( ) ( )
Nous calculons les effectifs cumulés ( croissants Ni+ et décroissants Ni− ) et les
( ) ( )
fréquences cumulées (croissantes Fi+ et décroissantes Fi− ) pour la série statistique
de l'exemple précédent :
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04
Les Ni+ et les Fi+ sont représentés par la courbe en escalier cumulative croissante
tandis que les Ni− et les Fi− sont représentés par la courbe en
escalier cumulative décroissante .
Probabilitées et Statistiques
20
H. MOKHTARI
3. Cas de variables quantitatives continues
a - L'histogramme
Définition (Histogramme)
Pour le construire
I
• Généralement, on met le caractère étudié en abscisse et les effectifs correspondants
en ordonnée.
R
• Il faut bien choisir les unités pour que le diagramme soit le plus lisible possible.
TA
Les effectifs ni (resp. les fréquences relatives f i ) pour une variable statistique continue
sont représentés par un histogramme . On distingue deux cas :
H
Classes ayant la même amplitude (Amplitudes des classes égales)
OK
Pour le construire
Pour obtenir un histogramme, on trace un repère formé de deux axes gradués ortho-
M
gonaux.
• Sur l'axe des abscisses , on place les extrémités (les bornes ) des différentes
classes .
• Sur l'axe des ordonnées , on place les effectifs (n i ) ou les fréquences relatives
( )
f i correspondant aux différentes classes.
Exemple :
Dans une entreprise, pour être vendues, les pommes de terre sont triées selon leur
calibre. On a regroupé les résultats dans le tableau suivant.
Calibre en mm C 1 = [60, 65[ C 2 = [65, 70[ C 3 = [70, 75[ C 4 = [75, 80[
Quantité en kg 105 135 120 90
21
Probabilitées et Statistiques H. MOKHTARI
On obtient l'histogramme correspondant :
ni
135
120
105
90
I
C1 C2 C3 C4
A R
H T
xi
Histogramme représentant le calibre de pommes de terre
OK
Remarque
Le polygone est la ligne polygonale obtenue en joignant les points milieux consé-
M
cutifs des sommets des rectangles de l'histogramme. On commence et on termine
le polygone des fréquences en ajoutant une classe de fréquence nulle avant la
première classe et une autre après la dernière classe .
Pour le construire
• Sur l'axe des abscisses , on place les limites (les bornes ) des différentes
classes .
ni
• Sur l'axe des ordonnées , on place les effectifs corrigés n i0 = ou les
ai
f
fréquences corrigés f i0 = i correspondant aux différentes classes, où ai est
ai
l'amplitude de la classe correspondante à ni ou f i .
22
Probabilitées et Statistiques H. MOKHTARI
• On trace pour chaque classe L i un rectangle dont la largeur est proportionnelle à
l'amplitude de la classe et la longueur est proportionnelle à l'effectif corrigé ni0
(resp. la fréquence corrigée f i0 ).
Exemple :
Le tableau suivant donne la répartition de 94 enfants de 11 ans ayant passé un examen
médical, selon leur taille (en centimètres)
Taille [131, 135[ [135, 139[ [139, 141[ [141, 143[ [143, 147[ [147, 151[ Total
Effectifs 4 12 16 24 24 14 94
I
Effectifs ni 4 12 16 24 24 14 94
R
Amplitudes ai 4 4 2 2 4 4
n
Effectif corrigé ni0 = i 1 3 8 12 6 3.5
A
ai
T
12
H
1 élève
10
OK
8
M
6
0
L'histogramme de cette série est : 131 135 139141143 147 151 155
23
Probabilitées et Statistiques H. MOKHTARI
Remarque
Pour tracer un histogramme dans le cas où les amplitudes sont inégales
( différentes ), on utilise la méthode des effectifs corrigés (ou les
fréquences corrigées ), qui consiste à multiplier l'effectif de chaque classe
par le rapport entre l'amplitude de la plus petite classe sur l'amplitude de la classe
considérée, on obtient ainsi les effectifs rectifiés ( corrigés ) notés :
RI
Définition
A
Les effectifs cumulés ( croissants Ni+ et décroissants Ni− ) (resp. les
fréquences cumulées croissantes Fi+ et décroissantes Fi− ) d'une variable statis-
T
tique continue sont calculés de la même manière qu'une variable statistique
H
discrète .
K
Remarque (Représentation graphique des effectifs (resp. fréquences) crois-
sants)
O
Les effectifs cumulés croissants Ni+ (resp. les fréquences cumulées croissantes
M
F i+ ) sont représentés par un graphe appelé courbe cumulative croissante .
Sur l'axe des abscisses on place les bornes des différentes classes , sur
l'axe des ordonnées , on place les Ni+ (resp. Fi+ ). Puis on relie par des segments
continus les points :
( ) ( )
(e 0 , 0) , e 1 , N1+ , · · · , e i , Ni+ , · · · , (e k , N ) ,
( ( ) ( ) )
resp . (e 0 , 0) , e 1 , F 1+ , · · · , e i , F i+ , · · · , (e k , 1) .
En d'autre terme, on relie les points de l'abscisse (la borne supérieure de la classe L i )
et l'ordonnée la valeur de Ni+ ou Fi+ .
24
Probabilitées et Statistiques H. MOKHTARI
Remarque (Représentation graphique des effectifs (resp. fréquences) décrois-
sants)
En d'autre terme, on relie les points de l'abscisse (la borne inférieure de la classe L i )
I
et l'ordonnée la valeur de Ni− ou Fi− .
A R
H T
OK
M
25
Probabilitées et Statistiques H. MOKHTARI
02 R EPRÉSENTATION NUMÉRIQUE DES DONNÉES
Contenu
1 Introduction
2 Paramètres de position (caractéristiques de tendance centrale)
3 Paramètres de dispersion
I
I Introduction
R
Ces paramètres donnent une idée de l'ordre de grandeur des valeurs constituant la sé-
A
rie ainsi que la position où semblent se concentrer les valeurs de cette série. Les princi-
pales caractéristiques de tendance centrale utilisés de façon courante sont : le mode ,
T
la médiane , la moyenne arithmétique et les quantiles .
H
II Paramètres de position (caractéristiques de tendance centrale)
K
1. Ces des variables discrètes
O
a - Mode
M
Définition (Mode)
Le mode d'une série statistique est le seul paramètre de position qui s'applique
à tous les types de caractères ( qualitatif ou quantitatif ), il est la modalité du
caractère qui correspond au plus grand effectif (ou la plus grande fréquence ).
Généralement, on le note par Mo .
Exemples :
• On demande à des patients en ophtalmologie quelle couleur de teinture des lunettes
leur est le plus agréable. On obtient les résultats suivants :
xi Rouge Vert Bleu Jaune Total
ni 41 6 41 12 100
Cette série statistique est bimodale, car elle possède deux modes : le rouge et le
bleu.
26
Probabilitées et Statistiques H. MOKHTARI
• Un responsable du service marketing d'une grande marque d'ordinateurs (por-
tables et de bureau) fait une enquête dans une université pour savoir combien
d'ordinateurs (portables ou de bureau) il y a dans le foyer de chaque étudiant.
Les données sont les suivantes.
Nombre d'ordinateurs 0 1 2 3 4 5 Total
Nombre d'étudiants 300 876 1235 984 225 154 3774
D'après le tableau ci-dessus, le plus grand effectif est max (ni ) = 1235, la modalité
qui correspond au max (ni ) est x2 = 2. Alors, le mode est Mo = 2.
Une distribution est dite unimodale si elle ne possède qu'un seul mode .
I
•
R
•
A
•
moins deux).
H T
Remarque
K
Le mode peut ne pas exister et, même s'il existe, peut ne pas être unique (il
peut exister plusieurs modes ).
O
Remarque
M
Graphiquement ( diagramme en bâtons ) le mode correspond à l'abscisse du
plus haut bâton .
b - Médiane
Définition (Médiane)
27
Probabilitées et Statistiques H. MOKHTARI
Remarque 1 : Calcul de la médiane dans le cas discret)
Le calcul de la médiane se fait par deux méthodes différentes :
Méthode 1 :
1 On ordonne par ordre croissant les valeurs de la série statistique
(x 1 ≤ x 2 ≤ · · · ≤ x n ).
I
la moyenne arithmétique des deux valeurs du milieu , c'est-à-dire
x k + x k+1
R
Me = .
2
A
Exemple pour la méthode 1 (Cas d'échantillons n impair :)
T
On considère la série statistique :
KH
5 2 11 5 3 5 11 7 5 1 7 3 13 5 2 7 1.
• Ordonner la série :
O
On a : 1 ≤ 2 ≤ 3 ≤ 5 ≤ 7 ≤ 11 ≤ 13.
1 1 2 2 3 3 5 5 5 5 5 7 7 7 11 11 13.
M
• Calculons la médiane :
n = 17 = 2k + 1, avec k = 8, alors la médiane Me est :
Me = x k+1 = x 9 = 5.
• Ordonner la série :
On a : 1 ≤ 2 ≤ 3 ≤ 4 ≤ 5 ≤ 6 ≤ 7 ≤ 8 ≤ 9.
1 2 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 6 6 6
6 6 6 6 7 7 7 7 8 8 8 9 9 9 9 9 9 9 9 9
28
Probabilitées et Statistiques H. MOKHTARI
• Calculons la médiane :
On a : n = 40 = 2k , avec k = 20, alors la médiane Me est :
x k + x k+1 x 20 + x 21 6 + 6
Me = = = = 6.
2 2 2
Méthode 2 :
Dans ce cas la détermination de la médiane se fait par trois étapes :
1 On calcule les Ni+ ou les Fi+ .
n
2 On identifie le plus petit Ni+ supérieur ou égal à ou la plus petite F i+
I
2
supérieure ou égale à 0.5.
R
3 La médiane Me est alors la valeur de la variable statistique qui correspond à Ni+
A
ou Fi+ .
T
Exemple pour la méthode 2 :)
H
Un quartier est composé de 50 ménages et la variable X représente le nombre de
K
personnes par ménage. Le tableau statistique est le suivant :
Total
O
xi 1 2 3 4 5 6 8
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
M
Ni+ 5 14 29 39 45 48 50
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
• La plus petite F i+ supérieure ou égale à 0.5 est F i+ = 0.58, donc la médiane est Me =
x 3 = 3.
Remarque
La Médiane Me d'une série statistique d'effectif total n est la valeur de la variable
n n +1
qui correspond à l'effectif cumulé si n est pair et si n est impair .
2 2
29
Probabilitées et Statistiques H. MOKHTARI
Remarque (Calcul de médiane)
On suppose que les modalités x1 < · · · < xi < · · · < xk sont ordonnées et nous rappelons
∑
que Fi = ki=1 f i représente la fréquence cumulée jusqu'à la modalité xk . La médiane
Me est la première valeur pour laquelle les fréquences cumulées dépassent 50%
c'est-à-dire que Me est égale à la modalité xk vérifiant à la fois :
F i ≥ 0, 5 F k−1 < 0, 5.
Proposition
La médiane est unique .
I
Me
R
c - Moyenne arithmétique
TA
La moyenne arithmétique représente le barycentre de la série statistique, autour de laquelle
sont ensuite calculés les paramètres de dispersion.
H
Définition (Moyenne arithmétique)
K
Étant donné un échantillon de n observations x1 , · · · , xn . La
O
moyenne arithmétique d'une série statistique est le quotient de la
somme de tous les nombres de cette série par l'effectif total , notée X̄ , est
M
donnée par la formule suivante :
1∑ k ∑ k
X̄ = ni xi = f i xi .
n i =1 i =1
Exemples :
Le tableau suivant présente le nombre d'enfants par famille (variable X ) observé dans
un échantillon de 100 familles :
xi 0 1 2 3 4 5 Total
ni 2 9 10 42 25 12 112
fi 0.02 0.09 0.1 0.42 0.25 0.12 1
ni xi 0 9 20 126 100 60 315
30
Probabilitées et Statistiques H. MOKHTARI
1 ∑ 6
X= ni xi
100 i =1
1
= (0 × 2 + 1 × 9 + 2 × 10 + 3 × 42 + 4 × 25 + 5 × 12)
100
1
= (0 + 9 + 20 + 126 + 100 + 60)
100
1
= (315)
100
= 3, 15.
d - Quartiles
I
Définition (Quartiles)
R
On considère une série de données rangées dans l'ordre croissant.
A
Les quartiles sont des données de la série qui la partagent en quatre parties à
T
peu près de même effectif .
H
Remarques
K
Il existe trois quartiles :
O
( )
• Le premier quartile Q 1 est le plus petit effectif cumulé Ni+ supérieur ou
n ( )
égal à ou la plus petite fréquence cumulée Fi+ supérieure ou égale à
M
4
0.25.Le premier quartile Q1 est alors la valeur de la variable statistique qui
correspond à Ni+ ou Fi+ .
• Le deuxième quartile Q2 est égal à la médiane Me .
( )
• Le troisième quartile Q3 est le plus petit effectif cumulé Ni+ supérieur ou
3n ( +)
égal à ou la plus petite fréquence cumulée Fi supérieure ou égale
4
à 0.75. Le troisième quartile Q3 est alors la valeur de la variable statistique qui
correspond à Ni+ ou Fi+ .
Remarque
F (Q 1 ) = 0.25, F (Q 3 ) = 0.75.
31
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Un quartier est composé de 50 ménages et la variable X représente le nombre de
personnes par ménage. Les valeurs de la variable sont :
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04
n 50
• Le premier quartile Q 1 : Pour trouver Q 1 , on calcule = = 12.5. Alors, la valeur de
4 4
I
Q 1 est la 13-ème donnée de la série statistique ordonnée, c'est-à-dire Q 1 = x 13 = 2.
R
n 50
• Le deuxième quartile Q 2 : Pour trouver Q 2 , on calcule = = 25. Alors, la valeur de
2 2
Q 2 est la 25-ème donnée de la série statistique ordonnée, c'est-à-dire Q 2 = x 25 = 3.
TA
3n 150
• Le troisième quartile Q 3 : Pour trouver Q 3 , on calcule = = 37.5. Alors, la
4 4
valeur de Q 3 est la 38-ème donnée de la série statistique ordonnée, c'est-à-dire
H
Q 3 = x 38 = 4.
K
Remarque
O
• Les quartiles d'une série sont des données de la série .
M
• La médiane d'une série n'est pas forcément une donnée de la série .
Remarque
Lorsque les modalités x1 , x2 , · · · , xn sont rangées dans l'ordre croissant, alors on a :
• Si l'effectif total n est un multiple de 4 alors les quartiles Q1 et Q3 sont les
n 3n
valeurs du caractère de rang et , respectivement.
4 4
• Si l'effectif total n n'est pas un multiple de 4 alors les quartiles Q 1 et Q 3 sont les
[n ] [ ]
3n
valeurs du caractère de rang +1 et + 1, respectivement.
4 4
32
Probabilitées et Statistiques H. MOKHTARI
Exemple :
1 Un élève a obtenu les 10 notes suivantes : 5, 6, 8, 10, 11, 13, 14, 15, 17, 18. Comme
10 10
= 2, 5 alors Q 1 = 8 (note de rang 3 ) comme 3 × = 7, 5 alors Q 3 = 15 (note de
4 4
rang 8).
8
2 Un élève a obtenu les 8 notes suivantes : 3, 5, 7, 10, 12, 13, 15, 18 Comme =2
4
8
alors Q 1 = 5 (note de rang 2) comme 3 × =6 alors Q 3 = 13 (note de rang 6).
4
RI
Pour calculer le mode d'une manière exacte, nous allons déterminer d'abord la classe mo-
dale.
A
Définition (Classe modale)
T
Pour un caractère continu, on parle de classe modale . Si les classes ont
H
la même amplitude ai la classe modale est la classe qui correspond au
plus grand effectif (ou la plus grande fréquence relative ), elle est notée C Mo .
OK
Remarque (Cas des amplitudes égales)
M
On suppose que la classe modale est C Mo = [e i −1 , e i [ et les amplitudes des classes
sont égales , le mode est égal à :
( )
∆1
Mo = e i −1 + a i , (2.1)
∆1 + ∆2
où
• e i −1 : La borne inférieure de la classe modale.
• ai : Les amplitudes des classes.
• ∆1 = n i − n i −1 ou ∆1 = f i − f i −1 .
• ∆2 = n i − n i +1 ou ∆2 = f i − f i +1 .
33
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Si on reprend l'exemple taille des 50 étudiants de la section E Maths (en centimètres),
on a :
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50
fi 0.16 0.24 0.24 0.14 0.22 1
Centres ci 153 157 161 165 169
• La classe modale : La classe modale est la classe qui correspond au plus grand
effectif ni (max (ni ) = 12), alors la classe modale est : C Mo = [e i −1 , e i [ = [e 1 , e 2 [ =
[155, 159[.
I
• ∆1 = n 2 − n 1 = 12 − 9 = 3 ou ∆1 = f 2 − f 1 = 0.24 − 0.18 = 0.06.
R
• ∆2 = n 2 − n 3 = 12 − 1 = 1 ou ∆2 = f 2 − f 3 = 0.24 − 0.22 = 0.02.
A
• Le mode :
T
( ) ( ) ( )
∆1 3 0.06
Mo = e i −1 + a i = 155 + 4 = 155 + 4 = 158.
∆1 + ∆2 3+1 0.06 + 0.02
KH
Remarque (Cas des amplitudes inégales)
O
Dans le cas où les amplitudes sont différentes ( inégales ), on utilise toujours la
n
formule (2.1), mais avec les effectifs corrigés ni0 = i ou les fréquences corrigées
M
ai
fi
f i0 = .
ai
Exemple :
Si on reprend l'exemple de la répartition de 94 enfants de 11 ans ayant passé un
examen médical, selon leur taille (en centimètres), on a :
Taille [131, 135[ [135, 139[ [139, 141[ [141, 143[ [143, 147[ [147, 151[ Total
ni 4 12 16 24 24 14 94
ai 4 4 2 2 4 4
ni
n i0 = 1 3 8 12 6 3.5
ai
• La classe modale : La classe ( ) modale est la classe qui correspond au plus grand
effectif corrigé ni0 (max ni0 = 12), alors la classe modale est : C Mo = [e i −1 , e i [ =
[e 3 , e 4 [ = [141, 143[.
34
Probabilitées et Statistiques H. MOKHTARI
• L'amplitude est a i = e 4 − e 3 = 143 − 141 = 2.
• ∆01 = n 40 − n 30 = 12 − 8 = 4.
• ∆02 = n 40 − n 50 = 12 − 6 = 6.
• Le mode :
( ) ( )
∆01 4
Mo = e i −1 + a i = 141 + 2 = 141.8.
∆01 + ∆02 4+6
b - Médiane
I
Pour calculer la médiane d'une manière exacte, nous allons déterminer d'abord la classe
médiane.
R
Définition (Classe médiane)
A
La classe médiane correspond à l'effectif (ou fréquence ) cumulé croissant
T
vérifiant :
H
n
Ni+−1 ≤ ≤ Ni+ ou F i+−1 ≤ 0.5 ≤ F i+ ,
2
K
elle est notée par C Me , donc la classe médiane est C Me = [e i −1 , e i [.
La classe médiane est C Me = [e i −1 , e i [, la médiane Me associée à cette classe est égale
O
à:
n
M
− Ni+−1 ( )
0, 5 − F i+−1
Me = e i −1 + a i 2 , ou Me = e i −1 + a i .
ni fi
Exemple :
Considérons une distribution statistique représentée par le tableau suivant :
Classes [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 50[ [50, 60[ Total
ni 9 27 36 45 27 6 150
fi 0.06 0.18 0.24 0.3 0.18 0.04 1
Ni+ 9 36 72 117 144 150
Fi 0.06 0.24 0.48 0.78 0.96 1
Pour trouver la classe modale, on cherche les fréquences cumulées qui vérifiées Fi+−1 ≤
0.5 ≤ F i+ . D'après le tableau statistique ci-dessus, on a 0, 48 < 0.5 < 0, 78 alors la classe
médiane est [35, 40[ et donc la médiane est donnée par
( ) ( )
0, 5 − F i+−1 0, 5 − 0, 48
Me = e i −1 + a i = 35 + 5 = 35, 33.
fi 0, 3
35
Probabilitées et Statistiques H. MOKHTARI
c - Moyenne arithmétique
La moyenne arithmétique représente le barycentre de la série statistique, autour de laquelle
sont ensuite calculés les paramètres de dispersion.
Définition (Moyenne)
RI
Exemple :
A
Le tableau suivant donne la durée (en heures) passée chaque jour devant la télévision
pour 1000 personnes :
T
Durées (H) [0, 2[ [2, 4[ [4, 6[ [6, 8[ [8, 10[ Total
H
ni 100 200 500 150 50 1000
fi 0.1 0.2 0.5 0.15 0.05 1
K
ci 1 3 5 7 9
ni ci 100 600 2500 1050 450 4700
O
La moyenne arithmétique qui correspond à la durée passée chaque jour devant la
télévision pour 1000 personnes est :
M
1∑ 5
X̄ = ni ci
n i =1
1
= (100 × 1 + 200 × 3 + 500 × 5 + 150 × 7 + 50 × 9)
1000
1
= (100 + 600 + 2500 + 1050 + 450)
1000
1
= (4700)
1000
= 4, 7.
36
Probabilitées et Statistiques H. MOKHTARI
d - Quartiles
Définition (Le premier quartile Q 1 )
I
Q 1 = e i −1 + a i 4 ou Q 1 = e i −1 + a i .
ni fi
A R
Définition (Le deuxième quartile Q 2 )
T
La classe du deuxième quartile correspond à l'effectif (ou fréquence )
H
cumulé croissant vérifiant :
K
n
Ni+−1 ≤ ≤ Ni+ ou F i+−1 ≤ 0.5 ≤ F i+ ,
2
O
elle est notée par CQ 2 . On a CQ 2 = C Me et le deuxième quartile Q 2 = Me .
M
Définition (Le troisième quartile Q 3 )
37
Probabilitées et Statistiques H. MOKHTARI
Exemple :
Le tableau statistique correspondant à la variable statistique taille des 50 étudiants de
la section E Maths est le suivant :
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
ni 9 12 11 7 11 50
fi 0.18 0.24 0.22 0.14 0.22 1
Centres ci 153 157 161 165 169
Ni+ 9 21 32 39 50
F i+ 0.18 0.42 0.64 0.78 1
I
( ) ( )
0.25 − F i+−1 0.25 − 0.18
R
Q 1 = e i −1 + a i . = 155 + 4 = 156, 17.
fi 0.24
A
• Le deuxième quartile Q 2 : La classe du deuxième quartile CQ 2 est : CQ 2 =
T
[e i −1 , e i [ = [159, 163[, car c'est la première classe où la fréquence cumulée F i+ dé-
passe 0.5. Donc
H
( ) ( )
0.5 − F i+−1 0.5 − 0.42
Q 2 = e i −1 + a i = 159 + 4 = 160, 46.
K
fi 0.22
O
• Le troisième quartile Q 3 : La classe du troisième quartile CQ 3 est : CQ 3 = [e i −1 , e i [ =
[163, 167[, car c'est la première classe où la fréquence cumulée F i+ dépasse 0.75.
Donc
M
( ) ( )
0.75 − F i+−1 0.75 − 0.64
Q 3 = e i −1 + a i = 163 + 4 = 166, 15.
fi 0.14
38
Probabilitées et Statistiques H. MOKHTARI
a - Étendue
Définition (Étendue)
E = x max − x min .
b - Variance
I
Définition (Variance)
R
La variance (notée V (X )) est donnée par la formule suivante :
A
1 ∑ k ( )2 ∑ k ( )2
V (X ) = n i x i − X̄ = f i x i − X̄ .
T
N i =1 i =1
KH
1 ∑ k
2 2
∑ k
V (X ) = n i x i − X̄ = f i x i2 − X̄ 2 .
N i =1 i =1
O
c - Écart-type
M
Définition (Écart-type)
39
Probabilitées et Statistiques H. MOKHTARI
d - Écart interquartile
Définition (Écart interquartile)
E IQ = Q 3 −Q 1 .
e - Intervalle interquartile
I
Définition (Intervalle interquartile)
R
L'intervalle interquartile (noté IQ ) est donné par :
A
IQ = [Q 1 ,Q 3 ] .
T
C'est donc l'intervalle qui contient 50% des observations en laissant 25% à droite et
H
25% à gauche .
K
Exemple :
O
Si on reprend l'exemple d'un quartier composé de 50 ménages.
Tableau statistique :
M
xi 1 2 3 4 5 6 8 Total
ni 5 9 15 10 6 3 2 50
fi 0.1 0.18 0.3 0.2 0.12 0.06 0.04 1
Ni+ 5 14 29 39 45 48 50
Ni− 50 45 36 21 11 5 2
F i+ 0.1 0.28 0.58 0.78 0.9 0.96 1
F i− 1 0.9 0.72 0.42 0.22 0.1 0.04
ni xi 5 18 45 40 30 16 16 170
n i x i2 5 36 135 160 150 108 128 722
• Étendu E :
E = x max − x min = 8 − 1 = 7.
40
Probabilitées et Statistiques H. MOKHTARI
• Variance V (X ) : Pour calculer la variance, on calcule tout d'abord la moyenne X̄ :
1∑ 7 1
X̄ = ni xi = (170) = 3, 4.
n i =1 50
• Écart-type σ (X ) :
√ √
I
σ (X ) = V (X ) = 2, 88 = 1, 69.
R
• Écart interquartile E IQ :
A
E IQ = Q 3 −Q 1 = 4 − 2 = 2.
T
• Intervalle interquartile IQ :
H
IQ = [2, 4] .
OK
2. Ces des variables continues
a - Variance
M
Définition (Variance)
1∑ k ( )2 ∑ k ( )2
V (X )= n i c i − X̄ = f i c i − X̄
n i =1 i =1
1 ∑ k ∑ k
= n i c i2 − X̄ 2 = f i c i2 − X̄ 2 .
N i =1 i =1
b - Écart-type
Définition (Écart-type)
41
Probabilitées et Statistiques H. MOKHTARI
c - Écart interquartile
Définition (Écart interquartile)
E IQ = Q 3 −Q 1 .
d - Intervalle interquartile
Définition (Intervalle interquartile)
I
L'intervalle interquartile (noté IQ ) est donné par :
R
IQ = [Q 1 ,Q 3 ] .
TA
Exemple :
H
Le tableau statistique suivant représente les mesures de la taille de 50 étudiants de la
section E Maths (en centimètres) :
K
Classes L i [151, 155[ [155, 159[ [159, 163[ [163, 167[ [167, 171[ Total
O
ni 9 12 11 7 11 50
fi 0.18 0.24 0.22 0.14 0.22 1
M
ci 153 157 161 165 169
Ni+ 9 21 32 39 50
F i+ 0.18 0.42 0.64 0.78 1
• Étendue E :
E = e k − e 0 = 171 − 151 = 20.
• Variance V (X ) :
Pour calculer la variance, on calcule tout d'abord la moyenne arithmétique X̄ :
1∑ 6 1
X̄ = ni ci = (8046) = 160, 92.
n i =1 50
Alors
1∑ 6 1
V (X ) = n i c i2 − X̄ 2 = (1296346) − (160, 92)2 = 31, 6736.
n i =1 50
42
Probabilitées et Statistiques H. MOKHTARI
• Écart-type σ (X ) :
√ p
σ (X ) = V (X ) = 31.6736 = 5, 62.
• Écart interquartile E IQ :
Pour trouver l'écart interquartile, on calcule tout d'abord les quartiles Q 1 et Q 3 :
• Le premier quartile Q 1 : La classe du premier quartile CQ 1 est : CQ 1 =
[e i −1 , e i [ = [155, 159[, car c'est la première classe où la fréquence cumulée
F i+ dépasse 0.25. Donc
( ) ( )
0.25 − F i+−1 0.25 − 0.18
Q 1 = e i −1 + a i . = 155 + 4 = 156, 17.
fi 0.24
I
• Le troisième quartile Q 3 : La classe du troisième quartile CQ 3 est : CQ 3 =
R
[e i −1 , e i [ = [163, 167[, car c'est la première classe où la fréquence cumulée F i+
dépasse 0.75. Donc
A
( ) ( )
0.75 − F i+−1
T
0.75 − 0.64
Q 3 = e i −1 + a i = 163 + 4 = 166, 15.
fi 0.14
KH
E IQ = Q 3 −Q 1 = 166.15 − 156.17 = 9.98.
O
• Intervalle interquartile IQ :
IQ = [Q 1 ,Q 3 ] = [156.17, 166.15] .
43
Probabilitées et Statistiques H. MOKHTARI