Vous êtes sur la page 1sur 25

UMMTO, Faculté des Sciences Année universitaire: 2021-2022

Département M.I Module: Probabilités et statistique


Enseignants: Ammoura.M; Harrache.F Sections: L1, MI

Chapitre 2: Statistique Descriptive

1 Notions de base et vocabulaire statistique


1.1 Introduction
La statistique descriptive est une méthode scientifique qui permet de recueillir, organiser,
classer, résumer et présenter des informations statistiques en vue de les analyser pour les
rendre utilisables et pour permettre leurs interprétations.
Son utilisation intensive dans de nombreux domaines tels les sciences expérimentales (bi-
ologie, physique, agronomie, médecine,. . . ), les sciences humaines, l’économie, etc,. . . ,
démontre l’intérêt qu’on lui porte.

1.2 Concepts de base de la statistique


1.2.1 Population et échantillon
On appelle population l’ensemble sur lequel porte notre étude statistique. Cet ensemble est
noté généralement par Ω. Une population peut être de nature très variée (êtres humains,
animaux, plantes, bactéries,. . .)
Lorsque l’on n’observe qu’une partie de la population, on parle de sondage. La partie de la
population étudiée est appelée échantillon et on cherche toujours à généraliser les résultats
obtenus sur l’échantillon à toute la population.

Exemples:

ˆ On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de


frères et soeurs de chaque étudiant. Dans ce cas: Ω est l’ensemble des étudiants.

ˆ Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la population


est alors constituée de l’ensemble des véhicules susceptibles de circuler dans cette ville
à une date donnée. Dans ce cas: Ω est l’ensemble des véhicules.

1
1.2.2 Individu (Unité statistique)
On appelle individu ou unité statistique tout élément de la population Ω, il est noté ω ∈ Ω.
L’unité statistique est un objet pour lequel nous sommes intéressés à recueillir de l’information.

Exemple:

ˆ Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section.

1.2.3 Variable statistique (caractère)


Le caractère est ce qu’on observe sur chacun des individus de la population. On le
représente souvent par une lettre majuscule: X, Y,. . ..
Les valeurs que peut prendre une variable statistique sont appelées modalités.
Une variable doit donc présenter au minimum deux modalités.

Exemples: la couleur, le sexe, le poids, la taille, la marque, le modèle, l’espèce, le prix,


la surface, etc.
La variable Sexe a deux modalités: masculin ou féminin.

Les variables statistiques peuvent être classées selon leurs nature en deux catégories:

Variable qualitative: Une variable qualitative est une variable qui ne prend pas de
valeurs numériques. Elle peut être:
• Nominale: si les modalités ne sont pas ordonnées (exemple: couleur des yeux, sexe,
nationalité, marques d’ordinateur, état matrimonial...etc).
• Ordinale: si les modalités sont naturellement ordonnées, hiérarchisées. (Exemple: men-
tion des examens: très bien, bien, assez bien, passable).

Variable quantitative: Une variable est dite quantitative lorsque ses différentes
valeurs sont mesurables. Il y a deux types de variables quantitatives:
• Variable quantitative discrète: Une variable quantitative est dite discrète si elle
prend un nombre fini ou dénombrable de valeurs (valeurs numériques isolées).

Exemple: La variable nombre d’enfants par famille, dont les valeurs sont:0, 1, 2, 3, etc,
est une variable quantitative discrète.

• Variable quantitative continue: Une variable quantitative est dite continue si elle
prend toutes ses valeurs dans des intervalles de l’ensemble des nombres réels.

Exemple: La variable ”taille en cm” observée sur un échantillon de 500 individus est
une variable quantitative continue, dont les résultats sont les suivants: 100 individus leurs
tailles sont comprise dans l’intervalle [150, 160[, 250 individus dans l’intervalle [160, 170[et
150 dans l’intervalle [170, 185].

2
1.2.4 Observations
Une variable donne lieu à plusieurs observations. Si la variable est notée X, alors on
notera par x1 , x2 , x3 , . . . , xn les observations et on constitue ainsi une série statistique, où
n représente le nombre d’observations, on l’appelle aussi effectif total
Exemple: Soit un échantillon de dix individus, la variable âge observée peut prendre
les valeurs suivantes : x1 = 31, x2 = 40, x3 = 25, x4 = 30, x5 = 35, x6 = 40, x7 = 28, x8 =
42, x9 = 33, x10 = 37. Dans ce cas la taille de l’échantillon est n=10.

1.3 Tableaux statistiques et représentations graphiques


Au cours d’une étude statistique les données sont recueillies de façon désordonnée, pour
leur donner un sens, il faut les ordonner, les classer et les présenter sous forme de tableaux
et/ou de graphiques. La présentation de l’information statistique qualitative ou quantita-
tive sous forme de tableau statistique représente une étape très importante et indispensable
pour les opérations statistiques.
Un tableau statistique est constitué des modalités, xi et des effectifs ni . Les effectifs ni ,
ni
sont également appelés fréquences absolues par différence avec le rapport fi = appelé
N
fréquence relative ou fréquence, et qui est la proportion d’individus présentant la modalité
xi .
De façon générale, tout tableau statistique doit comporter un titre, mentionner sa source,
et dans certains cas (caractères quantitatifs notamment), l’unité utilisée (francs, dollars, g,
kg, m,km, milliers, millions · · · ) doit être précisée. De plus, les modalités doivent être in-
compatibles (un individu ne peut correspondre à plus d’une modalité) et exhaustives (elles
doivent représenter tous les individus).
Les représentations graphiques sont très utiles comme moyens de description. Elles ont
souvent un plus grand impact visuel qu’un tableau et peuvent aider à une meilleure
compréhension des données concernées. Il existe plusieurs sortes de représentations graphiques.
Cela dépond de la nature du caractère étudié.

Remarque 1. • La taille de la population étudiée (échantillon) s’appelle effectif total et


k
P
est égale à la somme des effectifs partiels, N = ni .
i=1
• On peut remplacer fi par fi × 100 qui représente alors un pourcentage.
k
P
• La somme des fréquences relatives est égale à 1, ( fi = 1).
i=1

1.3.1 Cas d’une variable qualitative


Lorsque le caractère étudié est qualitatif, les différentes modalités du caractère sont notées
Mi , et le tableau statistique est constitué de Mi , ni ou /et fi qui sont les fréquences cor-
respendantes, comme on le voit dans le tableau suivant:

3
Modalités Mi du caractère M1 M2 ··· Mk Total
Nombres d’individus ni (Effectifs) n1 n2 ··· nk N
Une variable qualitative peut être représentée graphiquement de deux manières.

Diagramme circulaire Les diagrammes circulaires, ou semi-circulaires, consistent


à partager un disque ou un demi-disque, en tranches, ou secteurs, correspondant aux
modalités observées et dont la surface est proportionnelle à l’effectif, ou à la fréquence, de
la modalité.
Le degré d’un secteur est déterminé à l’aide de la règle de trois de la manière suivante:

N −→ 360o
ni −→ di
d’où
ni
di = × 360o = fi × 360o
N
Exemple: On a étudié le régime des études sur échantillon de 200 étudiants d’un lycée
donné, les résultats obtenus sont les suivants:
régime des études Externe Interne Demi pentionnaire Total
Nombres d’étudiants ni (Effectifs) 70 50 80 200
Fréquences fi 0.35 0.25 0.40 1
Calculons le degré correspondant aux différents secteurs:

d1 = f1 × 360o = 0.35 × 360o = 126o

d2 = f2 × 360o = 0.25 × 360o = 90o


d3 = f3 × 360o = 0.40 × 360o = 144o
D’où on obtient la représentation suivante:

4
Diagramme en barres (Tuyaux d’orgue) Il consiste à porter en abscisse les modalités
de la variable étudiée, au dessus des quelles on trace des tuyaux d’orgue de même largeur,
et en ordonnée les effectifs ou les fréquences qui vont déterminer leurs hauteurs.

5
1.3.2 Cas d’une variable Quantitative discrète
Si on note x1 , · · · , xk les différentes valeurs d’un caractère quantitatif discret et les effectifs
partiels respectifs n1 , · · · , nk , on peut représenter cette série par un tableau du type suivant:

Valeurs xi x1 x2 ··· xk
Effectifs ni n1 n2 ··· nk
Le graphe associé à cette distribution est le diagramme en bâtons qui est un ensemble de
barres verticales (bâtons) correspondant aux valeurs de la variable et dont la hauteur est
proportionnelle à la fréquence de la valeur considérée. Les valeurs de la variable sont notées
en abscisses et les fréquences (ou effectifs) en ordonnées. La courbe obtenue en joignant
par des segments de droite les extrémités des bâtons est appelée le polygône des effectifs.

Exemple: Répartition des logements selon le nombre de pièces.

Nombres de pièces xi 1 2 3 4 5 6 Total


Effectifs ni 5 10 20 30 25 10 100

6
On veut représenter cette distribution sous la forme d’un diagramme en bâtons. À
chaque valeur xi correspond un bâton. Les hauteurs des bâtons sont proportionnelles aux
effectifs ni .

Figure 3: Diagramme représentatif de la répartition des logements selon le nombre de


pièces, en bleu le polygône des effectifs.

1.3.3 Cas d’une variable Quantitative continue


Cette représentation sera obligatoirement choisie s’il s’agit d’une variable continue. Les k
classes sont alors disjointes et leur réunion recouvre la totalité des valeurs possibles. On les
note généralement [ei ; ei+1 [. Par convention la borne supérieure est exclue de cette classe,
sauf pour la dernière classe (la dernière classe peut être fermée).

ˆ Le nombre ni est l’effectif de la ieme classe.


ei + ei+1
ˆ On appelle centre d’une classe [ei , ei+1 [ la valeur ci = .
2
ˆ On appelle amplitude d’une classe [ei , ei+1 [ la valeur ai = ei+1 − ei .

7
D’une manière générale une série statistique classée peut se représenter à l’aide d’un
tableau du type suivant:

Classes [e1 , e2 [ [e2 , e3 [ · · · [ek , ek+1 [


Effectifs ni n1 n2 ··· nk

Remarque 2. Il est parfois difficile de préciser les classes extrêmes, on utilise souvent
des classes ouvertes “plus de” ou “moins de” qui ne possèdent pas de centre de classe. En
l’absence d’informations complémentaires, on prendra alors comme centre un nombre situé
à une demi amplitude de la borne de cette classe ouverte.

Remarque 3. Dans le cas où les classes sont d’amplitudes différentes, on choisit pour la
classe ouverte l’amplitude de la classe voisine.

Dans le cas de la variable continue, le graphique est appelé histogramme. On trace des
rectangles qui ont comme largeur l’amplitude de la classe mesurée sur l’axe des abscisses
et dont les aires sont proportionnelles aux effectifs partiels (ni ) (ou aux fréquences fi ).

Important: Les hauteurs des différents rectangles ne sont pas proportionnelles aux
effectifs partiels (sauf si les classes ont la même amplitude) mais les aires doivent l’être.

Remarque 4. Si les classes ont la même amplitude, on peut retrouver le polygône des
effectifs (ou des fréquences) en prenant comme valeur pour chaque élément de la classe le
centre.

Exemple: Considérons la série statistique suivante qui décrit la charge de rupture d’un
fil.

Classes [720; 760[ [760; 800[ [800; 840[ [840; 880[ [880; 920[ 920et plus
Effectifs ni 10 23 4 15 32 16
On dresse le graphe correspondants,

8
Figure 4: Diagramme représentatif de la de la série précédente, en rouge le polygône des
effectifs.
Dans le cas où les amplitudes sont différentes, pour tracer l’histogramme on utilise la
méthode des effectifs rectifiés, qui consiste à multiplier l’effectif de chaque classe par le
rapport entre l’amplitude de la plus petite classe sur l’amplitude de la classe considérée,
on obtient ainsi les effectifs rectifiés noté:
la plus petite amplitude
ni ′ = ni × .
l’amplitude de la classe i
On peut aussi représenter l’histogramme autrement, en utilisant comme hauteurs des
ni fi
rectangles les quantités (appelés densités) ou . (voir TD)
ai ai
Règle de STURGES: Cette règle est utilisée pour déterminer le nombre de classes
à utiliser pour représenter une variable statistique continue.
Le nombre de classes est égal à l’entier le plus proche de la quantité: 1 + 3, 3 log n . Par
exemple, pour un échantillon de taille n=200, on doit utiliser 1 + 3, 3 log 200 = 8, 59 ≃ 9
classes.

9
L’amplitude constante de ces classes sera égale à:
Xmax − Xmin
a= .
nombre de classes

1.4 Fréquences cumulées et effectifs cumulés


Soit x1 , · · · , xk (d’effectifs respectifs n1 , · · · , nk ) une série à valeurs isolées telle que x1 <
x2 < · · · < xk .

On appelle effectif cumulé croissant (noté Ni ) de la valeur xi la somme des effectifs


partiels de xi et de toutes les valeurs de la série qui sont inférieures à xi , c’est-à-dire:

Ni = n1 + n2 + · · · + ni .

On appelle fréquence cumulée croissante de la valeur xi le nombre:

Fi = f1 + f2 + · · · + fi .

Pour une série classée on définit de la même manière l’effectif cumulé d’une classe (respec-
tivement la fréquence cumulée) comme étant la somme des effectifs partiels ( respectivement
des fréquences) de cette classe et de toutes celles qui la précèdent.

La fonction des fréquences cumulées est définie comme suit: F : R → [0, 1] telle que
- ∀x < min{xi }, F (x) = 0.

- ∀x ≥ max{xi }, F (x) = 1.
Remarque 5. • L’effectif cumulé de la première valeur ou de la première classe est égal à
l’effectif partiel de cette valeur ou de cette classe, et l’effectif cumulé de la dernière valeur
ou de la dernière classe est égal à l’effectif total N .

• La fréquence cumulée de la première valeur ou de la première classe est égale à la


fréquence de cette valeur ou de cette classe, et la fréquence cumulée de la dernière valeur
ou de la dernière classe est égale à 1.
Exemple 1: Répartition des logements selon le nombre de pièces.

Nombres de pièces xi 1 2 3 4 5 6 Total


Effectifs ni 5 10 20 30 25 10 100
Effectifs cumulés Ni 5 15 35 65 90 100 \
Fréquences fi 0.05 0.10 0.20 0.30 0.25 0.10 1
Fréquences cumulées Fi 0.05 0.15 0.35 0.65 0.90 1 \
Le polygône des fréquences cumulées est représenté comme suit:

10
Exemple 2: Considérons la série statistique suivante qui décrit la charge de rupture
d’un fil.

Classes [720; 760[ [760; 800[ [800; 840[ [840; 880[ [880; 920[ 920et plus total
ni 5 10 20 30 25 10 100
Ni cumulés 5 15 35 65 90 100 \
Fréquences fi 0.05 0.10 0.20 0.30 0.25 0.10 1
Fi cumulées 0.05 0.15 0.35 0.65 0.90 1 \
Le polygône des fréquences cumulées est représenté comme suit:

2 Représentation numérique des données


Si les tableaux et les représentations graphiques fournissent des indications intéressantes
sur la description des données, il est toujours très utile de déterminer ou de calculer des
paramètres ou des caractéristiques qui indiquent le centre de la distribution, son degré de
dispersion, son degré de symétrie, · · · etc. On considère plusieurs types de caractéristiques
pour une distribution :

11
Les caractéristiques de tendance centrale ou de position.

Les caractéristiques de disposition.

2.1 Caractéristiques de tendance centrale (Paramètres de posi-


tion)
Les paramètres de tendance centrale sont des grandeurs susceptibles de représenter au
mieux un ensemble de données. L’appellation tendance centrale vient du fait que ces
paramètres donnent une idée de ce qui se passe au centre d’une distribution d’un ensemble
de données.

2.2 Le mode:
Le mode Mo d’une série statistique est la valeur du caractère la plus fréquente ou dominante
dans l’échantillon.

- Dans le cas discret, le mode est la valeur xi qui correspond à l’effectif le plus élevé.

- Dans le cas continu, la classe modale (celle qui contient la valeur du mode) est la classe
la plus fréquente. Dans ce cas, le mode se calcule de la manière suivante: Si [ei , ei+1 [
est la classe modale alors:
ni − ni−1
Mo = ei + ai ×
(ni − ni−1 ) + (ni − ni+1 )

Avec:

ei : est la borne inférieure de la classe modale.


ai : est l’amplitude de la classe modale.
ni : est l’effectif de la classe modale.
ni−1 : est l’effectif de la classe qui précède la classe modale.
ni+1 : est l’effectif de la classe qui suit la classe modale.

Si les classes sont d’amplitudes inégales on utilise les effectifs rectifiés, la classe modale
est la classe qui correspond à l’effectif rectifié le plus élevé:

n′i − n′i−1
Mo = ei + ai ×
(n′i − n′i−1 ) + (n′i − n′i+1 )
Remarque 6. Lorsque la distribution a plus d’un mode, on parle d’une distribution mul-
timodale (bimodale, trimodale , etc).

12
Exemple 1: Une enquête faite sur les pointures de 200 filles a fourni les résultats
suivants:

Pointures xi 36 37 38 39 40 41 Total
Effectifs relatifs ni 30 25 70 40 15 20 200
L’effectif le plus élevé est 70 donc le mode Mo = 38.

Exemple 2: Soit le tableau donnant les poids (en kg) de 100 individus.
Poids en kg [56; 58[ [58; 60[ [60; 62[ [62; 64[ [64; 66[ Total
Nombre d’individus ni 5 36 40 15 4 100
Toute les classes ont la même amplitude, donc la classe modale est celle qui a l’effectif
le plus élevé, qui est la classe [60; 62[. La valeur du mode est:

ni − ni−1
Mo = ei + ai ×
(ni − ni−1 ) + (ni − ni+1 )
40 − 36
= 60 + 2 ×
(40 − 36) + (40 − 15)
4
= 60 + 2 ×
4 + 25
= 60, 27kg.
Exemple 3: Le tableau suivant représente la distribution des ouvriers selon le salaire
horaire dans une entreprise.

Salaire horaire (DA) [10; 20[ [20; 30[ [30; 50[ [50; 80[ [80; 90[ Total
Nombre d’ouvriers ni 12 14 32 47 15 200
Les amplitudes ai 10 10 20 30 10 \
Effectifs corrigés n′i 12 14 16 15.66 15 \
Les classes sont d’amplitudes inégales, on doit procéder à la correction des effectifs, on
obtient les valeurs qui figurent dans le tableau.
La classe modale est donc [30; 50[ correspondant à l’effectif corrigé le plus élevé: n′3 = 16.
La valeur du mode est égale:

n′i − n′i−1
Mo = ei + ai ×
(n′i − n′i−1 ) + (n′i − n′i+1 )
16 − 14
= 30 + 20 ×
(16 − 14) + (16 − 15.66)
2
= 30 + 20 ×
2 + 0.34
= 47.09 ≃ 48DA.

13
2.3 La médiane:
La médiane Me , se définie comme la valeur qui divise en deux parties égales les valeurs
observées rangées
 par ordre croissant
 ou décroissant. Mathématiquement, Me est telle que
N
F (Me ) = 0.5 ⇔ n(Me ) = .
2
Dans le calcul de la médiane, on distingue deux cas:

• Si la variable est discrète: On désigne par N le nombre d’observations.

Si N est pair : la médiane est alors égale à la moyenne des valeurs encadrant le milieu de
xp + xp+1
la série.−→ Si N = 2p alors Me = .
2
Si N est impair alors la médiane est égale à la valeur qui se trouve au milieu de la série.
−→ Si N = 2p + 1 alors Me = xp+1 .

• Si la variable est continue et qu’elle est groupée en classe: On cherche la classe


contenant le N/2 individu de l’échantillon. Cette classe est appelée la classe médiane. En
supposant que tous les individus de cette classe sont uniformément répartis à l’intérieur,
la médiane se calcule de la façon suivante:
Si [ei ; ei+1 [ est la classe médiane alors,

0.5 − Fi 0.5 − Fi
Me = ei + ai × = e i + ai ×
Fi+1 − Fi fi
Avec:

ei : est la borne inférieure de la classe médiane.

ai : est l’amplitude de la classe médiane.

fi : est la fréquence de la classe médiane.

Fi : est la fréquence cumulée de la classe qui précède la classe médiane.

Fi+1 : est la fréquence cumulée de la classe médiane.

Si on emploit le effectifs cumulés croissants, la formule deviendrait alors la suivante:


N N
− Ni
2 2
− Ni
Me = ei + ai × = e i + ai ×
Ni+1 − Ni ni
Avec:

N : est l’effectif total.

ni : est l’effectif de la classe médiane.

14
Ni : est l’effectif cumulé de la classe qui précède la classe médiane.

Ni+1 : est l’effectif cumulé de la classe médiane.

Remarque 7. Cette formule donnant la médiane reste valable lorsque les amplitudes ne
sont pas égales.

Exemple 1: Les notes obtenues par quinze étudiants au module de mathématiques


sont les suivantes:
14, 16, 8, 10, 17, 11, 10, 8, 13, 14, 9, 7, 15, 10, 12.
Ordonnons les observations dans l’ordre croissant:

7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 14, 15, 16, 17

L’effectif total N = 15 = 2 × 7 + 1 est un nombre impair alors la médiane Me = x7+1 =


x8 = 11.

Exemple 2: Les notes obtenues par dix étudiants au module de physique sont les
suivantes:
12, 10, 8, 9, 15, 14, 7, 11, 15, 8
Ordonnons la série statistique dans l’ordre croissant:

7, 8, 8, 9, 10, 11, 12, 14, 15, 15


L’effectif total N = 10 = 2 × 5, (p = 5) est un nombre pair alors la médiane est
xp + xp+1 x5 + x 6 10 + 11
Me = = = = 10.5.
2 2 2
Donc 50% des étudiants observés ont eu des notes inférieures à 10, 5.

Exemple 3: Reprenons l’exemple sur l’enquête faite sur les pointures de 200 filles:

Pointures xi 36 37 38 39 40 41 Total
Effectifs relatifs ni 30 25 70 40 15 20 200
Fréquences relatives fi 0.15 0.125 0.35 0.20 0.075 0.10 1
Effectifs cumulés Ni 30 55 125 165 180 200 \
Fréquences cumulées Fi 0.15 0.275 0.625 0.825 0.9 1 \
La valeur de la médianeest Me =  38. C’est la valeur de la variable qui dévise l’effectif to-
N
tal en deux effectifs égaux = 100 , elle correspond au premier effectif cumulé supérieur
2
N
ou égal à qui est donc N3 = 125 (elle correspond aussi à la première fréquence cumulée
2
supérieure ou égale à 0.5 qui est alors F3 = 0.625).
Graphiquement, on procède comme il est illustré dans le figure suivante:

15
Exemple 4: Reprenons l’exemple donnant les poids (en kg) de 100 individus.

Poids en kg [56; 58[ [58; 60[ [60; 62[ [62; 64[ [64; 66[ Total
Nombre d’individus ni 5 36 40 15 4 100
Fréquences fi 0.05 0.36 0.40 0.15 0.04 1
Effectifs cumulés Ni 5 41 81 96 100 \
Fréquences cumulées Fi 0.05 0.41 0.81 0.96 1 \
N
La classe médiane est celle qui a l’effectif cumulé ≥ = 50 (celle qui à la fréquence
2
cumulée ≥ 0.5), qui est alors la classe [60; 62[. La valeur de la médiane est:

0.5 − Fi
Me = ei + ai ×
fi
0.5 − 0.41
= 60 + 2 ×
0.40
0.09
= 60 + 2 ×
0.40
= 60, 45kg.

Graphiquement, on procède comme il est illustré dans le figure suivante:

16
2.4 Les quartiles:
Les quartiles sont les valeurs qui partagent les observations en quatre parties égales:
Le premier quartile noté Q1 , est tel que F (Q1 ) = 0, 25.
Le deuxième quartile noté Q2 est tel que F (Q2 ) = 0, 5, (Q2 = Me ).
Le troisième quartile noté Q3 , est tel que F (Q3 ) = 0, 75.

• Cas d’un caractère quantitatif discret: Avant de déterminer les valeurs des quartiles il
est suggéré d’ordonner les observations dans l’ordre croissant. Selon la taille de l’échantillon
(N ), quatre cas peuvent se présenter:
xp + xp+1 x3p + x3p+1
⋆ Si N = 4p alors, Q1 = et Q3 = .
2 2
xp + xp+1 x3p+1 + x3p+2
⋆ Si N = 4p + 1 alors, Q1 = et Q3 = .
2 2
⋆ Si N = 4p + 2 alors, Q1 = xp+1 et Q3 = x3p+2 .
⋆ Si N = 4p + 3 alors, Q1 = xp+1 et Q3 = x3p+3 .
• Cas d’un caractère quantitatif continu: La méthode d’interpolation utilisée pour le
calcul de la médiane est appliquée dans ce cas pour déterminer les différents quartiles.
Supposons que le premier quartile (respectivement le troisième quartile) est localisé dans
la classe [ei , ei+1 [ alors:
0.25 − Fi 0.25 − Fi
Q 1 = e i + ai × = e i + ai ×
Fi+1 − Fi fi
0.75 − Fi 0.75 − Fi
Q3 = ei + ai × = e i + ai ×
Fi+1 − Fi fi
Avec:
ei : est la borne inférieure de la classe correspendante.
ai : est l’amplitude de la classe correspendante.
fi : est la fréquence de la classe correspendante.
Fi : est la fréquence cumulée de la classe qui précède la classe correspendante.
Fi+1 : est la fréquence cumulée de la classe correspendante.
Si on utilise les effectifs cumulés croissants, la formule deviendrait alors la suivante:
N N
− Ni
4 4
− Ni
Q1 = ei + ai × = e i + ai ×
Ni+1 − Ni ni
3N 3N
4
− Ni 4
− Ni
Q3 = ei + ai × = e i + ai ×
Ni+1 − Ni ni
Avec:

17
N : est l’effectif total.
ni : est l’effectif de la classe correspendante.
Ni : est l’effectif cumulé de la classe qui précède la classe correspendante.
Ni+1 : est l’effectif cumulé de la classe correspendante.
Exemple 1: Les notes obtenues par quinze étudiants au module de mathématiques
sont les suivantes:
14, 16, 8, 10, 17, 11, 10, 8, 13, 14, 9, 7, 15, 10, 12.
Ordonnons les observations dans l’ordre croissant:
7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 14, 15, 16, 17
L’effectif total n = 15 = 4p + 3 avec (p = 3), alors:
Q1 = xp+1 = x4 = 9 et Q3 = x3p+3 = x12 = 14 .

Exemple 2: Les notes obtenues par dix étudiants au module de physique sont les
suivantes:
12, 10, 8, 9, 15, 14, 7, 11, 15, 8, 13, 10, 10
Ordonnons la série statistique dans l’ordre croissant:

7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 15, 15


L’effectif total n = 13 = 4p + 1 avec p = 3, alors:
xp + xp+1 x3 + x 4 8+9
Q1 = = = = 8.5.
2 2 2
x3p+1 + x3p+2 x10 + x11 13 + 14
Q3 = = = = 13.5.
2 2 2
Exemple 3: Reprennons l’exemple sur l’enquête faite sur les pointures de 200 filles:

Pointures xi 36 37 38 39 40 41 Total
Effectifs relatifs ni 30 25 70 40 15 20 200
Fréquences relatives fi 0.15 0.125 0.35 0.20 0.075 0.10 1
Fréquences cumulées Fi 0.15 0.275 0.625 0.825 0.9 1 \
Le premier quartile Q1 = 37, il correspond à la première fréquence cumulée supérieure
ou égale à 0.25 qui est alors F2 = 0.275.
Le troisième quartile Q3 = 39, il correspond à la première fréquence cumulée supérieure
ou égale à 0.75 qui est alors F4 = 0.825.

Exemple 4: Un échantillon de 100 mesures (en mm) de pièces de rechange, fabriquées


dans une entreprise a donné les résultats suivants:

18
Mesures en mm [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[ Total
Effectifs ni 10 30 20 25 15 100
Fréquences fi 0.1 0.3 0.2 0.25 0.15 1
Fréquences cumulées Fi 0.1 0.4 0.6 0.85 1 \
La première fréquence cumulée ≥ 0.25 est F2 = 0.4, donc le premier quartile Q1 est
localisé dans la classe [45; 50[, sa valeur est:

0.25 − Fi
Q1 = ei + ai ×
fi
0.25 − 0.1
= 45 + 5 ×
0.3
0.15
= 45 + 5 ×
0.3
= 47.5mm.

La première fréquence cumulée ≥ 0.75 est F5 = 0.85, donc le troisième quartile Q3 est
localisé dans la classe [55; 60[, sa valeur est:

0.75 − Fi
Q3 = ei + ai ×
fi
0.75 − 0.6
= 55 + 5 ×
0.25
0.15
= 55 + 5 ×
0.25
= 58mm.

2.5 La moyenne arithmétique:


La moyenne arlthmétique notée la plupart du temps X ou x ( se lit: ” x barre”) d’une
variable statistique X se définit comme étant le rapport de la somme des valeurs prises par
cette variable sur leur nombre d’apparition N .
On distingue deux types de moyennes: La moyenne arithmétique simple et la moyenne
arithmétique pondérée.

•Moyenne arithmétique simple: La moyenne arithmétique est considérée comme


simple lorsque les valeurs prises par la variable X n’apparaissent qu’une seule fois chacune,
et elle est égale donc à:
n
1X
X= xi
n i=1
Exemple: La moyenne arithmétique des nombres 11, 10, 5, 12, 13, 8, 7 est:
11 + 10 + 5 + 12 + 13 + 8 + 7
X= ≃ 9.43.
7

19
•Moyenne arithmétique pondérée: Lorsque les valeurs prises par la variable statis-
tique X: x1 , x2 , · · · , xk ont des fréquences d’apparitions respectives n1 , n2 , · · · , nk , la moyenne
arithmétique correspondante est pondérée, et elle est égale à:
k
1 X
X= n i xi
N i=1

Lorsqu’on utilise les fréquences relatives, la moyenne arithmétique pondérée est égale
alors à:
k k k
1 X X ni X
X= n i xi = xi = f i xi
N i=1 i=1
N i=1

Exemple: Distribution d’un petit échantillon de logements selon le nombre de pièces


dans un quartier d’une ville donnée.
Nombre de pièces xi 1 2 3 4 5 6 Total
Nombre de logements ni 22 35 25 12 4 2 100
ni .xi 22 70 75 48 20 12 247
1 P6
X = ni xi = 247
100
= 2.47, donc le nombre moyen de pièces par logement dans le
N i=1
quartier de cette ville est de 2.47 ≃ 2.

1 Pk ei+1 + ei
Si la variable statistique X est continue alors X = ni ci avec ci = est le
N i=1 2
centre de la classe [ei ; ei+1 [.

Exemple: Répartition des salaires horaires des ouvriers d’une entreprise.

salaires en da [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ total
effectifs ni 15 30 25 20 8 2 100
centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
1 6
P 3320
le salaire moyen par heure est égal à: X = n i ci = = 33.20 DA.
n i=1 100

3 Caractéristiques (paramètres) de dispersion


Les paramètres de dispertion permettent de mesurer l’écart des observations par rapport
à une valeur centrale ( en générale la moyenne arithmétique).
Les caractéristiques de dispersion les plus utilisés sont: L’étendue, l’écart absolu moyen,
l’écart interquartile et l’écart type.

20
3.1 L’étendue:
L’étendue est un intervalle de variation permettant de mesurer l’écart entre la plus grande
valeur Xmax et la plus petite valeur Xmin de la variable statistique X.

E = Xmax − Xmin

Exemple: Soit la série statistique suivante: 3, 6, 8, 9, 10, 14, 15, 6, 7, 11, 2, 5, 9. L’étendue
de cette série d’observations est: E = 15 − 2 = 13.
Remarque 8. L’étendue est souvent utilisé en contrôle industriel en raison de la simplicité
et de la rapidité de son calcul, pour tout juste avoir une idée globale sur un phénomène.

3.2 L’écart absolu moyen:


L’écart absolu moyen e de la variable statistique X est la moyenne arithmétique des valeurs
absolues des écarts à la moyenne arithmétique.
On pose donc:
1P n
e= |xi − X| si les n valeurs données x1 , x2 , · · · , xn sont toutes évaluées.
n i=1
1 Pk
e= ni |xi − X| si les données sont regroupées en k valeurs distinctes x1 , x2 , · · · , xk
N i=1
avec des fréquences d’apparitions respectives n1 , n2 , · · · , nk .
1 Pk
e= ni |ci −X| si les données sont regroupées en k classes de fréquences d’apparitions
N i=1
respectives n1 , n2 , · · · , nk , ci étant le centre de la classe [ei ; ei+1 [.
Remarque 9. Si on utilise les fréquences relatives fi au lieu des fréquences absolues
k
P
(effectifs) ni , l’écart absolu moyen devient: e = fi |xi − X|.
i=1

Exemple 1: On donne la série des observations xi : 5, 12, 13, 14, 2, 7, 18, 4, 10, 9.
La moyenne arithmétique de cette variable statistique est:
5 + 12 + 13 + 14 + 2 + 7 + 18 + 4 + 10 + 9
X= = 9, 4.
10
L’écart absolu moyen est donc égale à:
1
e= (|5 − 9.4| + |12 − 9.4| + |13 − 9.4| + |14 − 9.4| + |2 − 9.4| + |7 − 9.4| + |18 − 9.4|
10
+ |4 − 9.4| + |10 − 9.4| + |9 − 9.4|) = 4.

Exemple2: La distribution d’un petit échantillon de logements selon le nombre de


pièces dans un quartier d’une ville donnée.

21
Nombre de pièces xi 1 2 3 4 5 6 Total
Nombre de logements ni 22 35 25 12 4 2 100
ni .xi 22 70 75 48 20 12 247
|xi − X| 1.47 0.47 0.53 1.53 2.53 3.53 \
ni .|xi − X| 32.34 16.45 13.25 18.36 10.12 7.06 97.58
1 P6 247
La moyenne arithmétique X = n i xi = = 2.47.
N i=1 100
1 P6 97.58
L’écart absolu moyen est e = ni |xi − X| = = 0.9758.
N i=1 100
Exemple 3: Répartition des salaires horaires des ouvriers d’une entreprise.

Salaires en DA [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ Total
Effectifs ni 15 30 25 20 8 2 100
Centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
|ci − X| 18.2 8.2 1.8 11.8 21.8 31.8 \
ni .|ci − X| 273 246 45 236 174.4 63.6 1038
1 P 6 3320
Le salaire moyen par heure est égal à: X = n i ci = = 33.20DA.
N i=1 100
6
1 P 1038
L’écart absolu moyen est e = ni |ci − X| = = 10.38.
N i=1 100

3.3 L’écart interquartile:


L’intervalle interquartile est la différence entre les valeurs du troisième et du premier quar-
tile: IQ = Q3 –Q1 .
Autrement dit, c’est l’intervalle qui regroupe 50% des observations, en laissant 25% à droite
et 25% à gauche.
Exemple: Reprennons l’exemple sur l’enquête faite sur les pointures de 200 filles:

Pointures xi 36 37 38 39 40 41 Total
Effectifs relatifs ni 30 25 70 40 15 20 200
Fréquences relatives fi 0.15 0.125 0.35 0.20 0.075 0.10 1
Fréquences cumulées Fi 0.15 0.275 0.625 0.825 0.9 1 \
Le premier quartile Q1 = 37, Le troisième quartile Q3 = 39, l’écart interquartile
IQ = Q3 − Q1 = 39 − 37 = 2.

22
3.4 Ecart-type et variance:
L’écart-type noté σ est défini comme étant la racine carrée de la moyenne des carrés des
écarts par rapport à la moyenne arithmétique X.

• Lorsque les valeurs x1 , x2 , · · · , xn de la variable statistique X ne sont pas répétitives


l’écart-type est simple, et s’écrit de la manière suivante:
v
u n
u1 X
σ=t (xi − X)2
n i=1

• Lorsqu’à chaque valeur x1 , x2 , · · · , xk de la variable statistique X correspond re-


spectivement des effectifs n1 , n2 , · · · , nk l’écart-type est pondéré, et s’écrit de la manière
suivante: v v
u
u1 X k u k
uX
σ=t ni (xi − X)2 = t fi (xi − X)2 .
N i=1 i=1

• Lorsque les données sont regroupées en k classes d’effectifs d’apparitions respectifs


n1 , n2 , · · · , nk et ci étant le centre de la classe [ei ; ei+1 [, l’écart-type s’écrit de la manière
suivante: v
u
u1 X k
σ= t ni (ci − X)2
N i=1

La variance est définie comme étant le carré de l’écart-type:


n
1X
2
V =σ = (xi − X)2
n i=1

Quand les valeurs de la variable statistique sont répétitives, la variance devient:


k k
1 X X
V = σ2 = ni (xi − X)2 = fi (xi − X)2 dans le cas discret.
N i=1 i=1

k k
1 X
2 2
X
V =σ = ni (ci − X) = fi (ci − X)2 dans le cas continu.
N i=1 i=1

1 Pk
Remarque 10. En développant l’expression V = ni (xi − X)2 on obtient une formule
N i=1
1 Pk 2
plus simple V = ni x2i − X .
N i=1

23
Exemple 1: La moyenne arithmétique des nombres 11, 10, 5, 12, 13, 8, 7 est:
11 + 10 + 5 + 12 + 13 + 8 + 7
X= ≃ 9.43.
7
l’écart-type est:

σ = 17 ((11−9.43)2 +(10−9.43)2 +(5−9.43)2 +(12−9.43)2 +(13−9.43)2 +(8−9.43)2+(7−9.43)2 )
r
49.5719
=
7
= 2.66.

Exemple 2: La distribution d’un petit échantillon de logements selon le nombre de


pièces dans un quartier d’une ville donnée.

Nombre de pièces xi 1 2 3 4 5 6 Total


Nombre de logements ni 22 35 25 12 4 2 100
ni .xi 22 70 75 48 20 12 247
ni .x2i 22 140 225 192 100 72 751
P6
n i xi
k=1 247
La moyenne arithmétique X = = = 2.47.
N 100
s r
1 P6 2 751
2
L’écart-type σ = ni xi − X = − (2.47)2 = 1.187.
N i=1 100
Exemple 3: Répartition des salaires horaires des ouvriers d’une entreprise.

Salaires en DA [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ Total
Effectifs ni 15 30 25 20 8 2 100
Centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
c2i 225 650 1225 2025 3025 4225 \
ni .c2i 3375 18750 30625 40500 24200 8450 125900
1 P6 3320
Le salaire moyen par heure est égal à: X = n i ci = = 33.20DA.
N i=1 100
s r
1 P6 2 125900
L’écart-type σ = ni c2i − X = − (33.2)2 = 12.52.
N i=1 100

3.5 Coefficient de variation:


Pour comparer la dispersion de deux séries qui ne sont pas exprimées dans les mêmes
unités, on utilise le coefficient de variation. Cette statistique est une mesure neutre qui

24
s’exprime la plupart du temps en pourcentage, il se calcule en divisant l’écart-type par la
moyenne arithmétique.
σ
α=
X
On peut par exemple comparer l’écart des salaires entre le MAROC (en Dirham) et
l’ALGERIE (en Dinar), l’influence des unités monitaires sur le coefficient de variation
est nulle.

Plus le coefficient de variation est élevé, plus la dispertion est forte.

Exemple 1: Si dans l’entreprise E1 la moyenne des salaires X 1 est 2000 et l’écart-type


σ1 est de 150 alors que dans l’entreprise E2 sont respectivement X 2 = 1600 et σ2 = 120,
comparer les deux distributions statistiques.
Calculons les coefficients de variation:
150
Dans l’entreprise E1 , α1 = = 0.075.
2000
120
Dans l’entreprise E2 , α2 = = 0.075.
1600
Comme α1 = α2 , on peut en conclure que la dispersion relative des salaires est identique
dans l’entreprise E1 et dans l’entreprise E2 .

Exemple 2: Si dans la même entreprise la dispersion relative des salaires des ouvriers
est égale à 0.41 alors que celle des employés est égale à 0.78, que peut-on conclure?
On peut conclure que la répartition des salaires est plus homogène chez les ouvriers que
chez les employés dans cette entreprise.

25

Vous aimerez peut-être aussi