Statistiques L2 GINIE CIVIL

UMMTO, Faculté des Sciences Année universitaire: 2021-2022
Département M.I Module: Probabilités et statistique

Enseignants: Ammoura.M; Harrache.F Sections: L1, MI
Chapitre 2: Statistique Descriptive
1 Notions de base et vocabulaire statistique

1.1 Introduction
La statistique descriptive est une méthode scientifique qui permet de recueillir, organiser,
classer, résumer et présenter des informations statistiques en vue de les analyser pour les
rendre utilisables et pour permettre leurs interprétations.
Son utilisation intensive dans de nombreux domaines tels les sciences expérimentales (bi-
ologie, physique, agronomie, médecine,. . . ), les sciences humaines, l’économie, etc,. . . ,
démontre l’intérêt qu’on lui porte.
1.2 Concepts de base de la statistique

1.2.1 Population et échantillon
On appelle population l’ensemble sur lequel porte notre étude statistique. Cet ensemble est
noté généralement par Ω. Une population peut être de nature très variée (êtres humains,
animaux, plantes, bactéries,. . .)
Lorsque l’on n’observe qu’une partie de la population, on parle de sondage. La partie de la
population étudiée est appelée échantillon et on cherche toujours à généraliser les résultats
obtenus sur l’échantillon à toute la population.
Exemples:
On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de

frères et soeurs de chaque étudiant. Dans ce cas: Ω est l’ensemble des étudiants.
Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la population

est alors constituée de l’ensemble des véhicules susceptibles de circuler dans cette ville
à une date donnée. Dans ce cas: Ω est l’ensemble des véhicules.
1
1.2.2 Individu (Unité statistique)
On appelle individu ou unité statistique tout élément de la population Ω, il est noté ω ∈ Ω.
L’unité statistique est un objet pour lequel nous sommes intéressés à recueillir de l’information.
Exemple:
Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section.
1.2.3 Variable statistique (caractère)

Le caractère est ce qu’on observe sur chacun des individus de la population. On le
représente souvent par une lettre majuscule: X, Y,. . ..
Les valeurs que peut prendre une variable statistique sont appelées modalités.
Une variable doit donc présenter au minimum deux modalités.
Exemples: la couleur, le sexe, le poids, la taille, la marque, le modèle, l’espèce, le prix,

la surface, etc.
La variable Sexe a deux modalités: masculin ou féminin.
Les variables statistiques peuvent être classées selon leurs nature en deux catégories:
Variable qualitative: Une variable qualitative est une variable qui ne prend pas de
valeurs numériques. Elle peut être:
• Nominale: si les modalités ne sont pas ordonnées (exemple: couleur des yeux, sexe,
nationalité, marques d’ordinateur, état matrimonial...etc).
• Ordinale: si les modalités sont naturellement ordonnées, hiérarchisées. (Exemple: men-
tion des examens: très bien, bien, assez bien, passable).
Variable quantitative: Une variable est dite quantitative lorsque ses différentes
valeurs sont mesurables. Il y a deux types de variables quantitatives:
• Variable quantitative discrète: Une variable quantitative est dite discrète si elle
prend un nombre fini ou dénombrable de valeurs (valeurs numériques isolées).
Exemple: La variable nombre d’enfants par famille, dont les valeurs sont:0, 1, 2, 3, etc,
est une variable quantitative discrète.
• Variable quantitative continue: Une variable quantitative est dite continue si elle
prend toutes ses valeurs dans des intervalles de l’ensemble des nombres réels.
Exemple: La variable ”taille en cm” observée sur un échantillon de 500 individus est
une variable quantitative continue, dont les résultats sont les suivants: 100 individus leurs
tailles sont comprise dans l’intervalle [150, 160[, 250 individus dans l’intervalle [160, 170[et
150 dans l’intervalle [170, 185].
2
1.2.4 Observations
Une variable donne lieu à plusieurs observations. Si la variable est notée X, alors on
notera par x1 , x2 , x3 , . . . , xn les observations et on constitue ainsi une série statistique, où
n représente le nombre d’observations, on l’appelle aussi effectif total
Exemple: Soit un échantillon de dix individus, la variable âge observée peut prendre
les valeurs suivantes : x1 = 31, x2 = 40, x3 = 25, x4 = 30, x5 = 35, x6 = 40, x7 = 28, x8 =
42, x9 = 33, x10 = 37. Dans ce cas la taille de l’échantillon est n=10.
1.3 Tableaux statistiques et représentations graphiques

Au cours d’une étude statistique les données sont recueillies de façon désordonnée, pour
leur donner un sens, il faut les ordonner, les classer et les présenter sous forme de tableaux
et/ou de graphiques. La présentation de l’information statistique qualitative ou quantita-
tive sous forme de tableau statistique représente une étape très importante et indispensable
pour les opérations statistiques.
Un tableau statistique est constitué des modalités, xi et des effectifs ni . Les effectifs ni ,
ni
sont également appelés fréquences absolues par différence avec le rapport fi = appelé
N
fréquence relative ou fréquence, et qui est la proportion d’individus présentant la modalité
xi .
De façon générale, tout tableau statistique doit comporter un titre, mentionner sa source,
et dans certains cas (caractères quantitatifs notamment), l’unité utilisée (francs, dollars, g,
kg, m,km, milliers, millions · · · ) doit être précisée. De plus, les modalités doivent être in-
compatibles (un individu ne peut correspondre à plus d’une modalité) et exhaustives (elles
doivent représenter tous les individus).
Les représentations graphiques sont très utiles comme moyens de description. Elles ont
souvent un plus grand impact visuel qu’un tableau et peuvent aider à une meilleure
compréhension des données concernées. Il existe plusieurs sortes de représentations graphiques.
Cela dépond de la nature du caractère étudié.
Remarque 1. • La taille de la population étudiée (échantillon) s’appelle effectif total et

k
P
est égale à la somme des effectifs partiels, N = ni .
i=1
• On peut remplacer fi par fi × 100 qui représente alors un pourcentage.
k
P
• La somme des fréquences relatives est égale à 1, ( fi = 1).
i=1
1.3.1 Cas d’une variable qualitative

Lorsque le caractère étudié est qualitatif, les différentes modalités du caractère sont notées
Mi , et le tableau statistique est constitué de Mi , ni ou /et fi qui sont les fréquences cor-
respendantes, comme on le voit dans le tableau suivant:
3
Modalités Mi du caractère M1 M2 ··· Mk Total
Nombres d’individus ni (Effectifs) n1 n2 ··· nk N
Une variable qualitative peut être représentée graphiquement de deux manières.
Diagramme circulaire Les diagrammes circulaires, ou semi-circulaires, consistent

à partager un disque ou un demi-disque, en tranches, ou secteurs, correspondant aux
modalités observées et dont la surface est proportionnelle à l’effectif, ou à la fréquence, de
la modalité.
Le degré d’un secteur est déterminé à l’aide de la règle de trois de la manière suivante:
N −→ 360o
ni −→ di
d’où
ni
di = × 360o = fi × 360o
N
Exemple: On a étudié le régime des études sur échantillon de 200 étudiants d’un lycée
donné, les résultats obtenus sont les suivants:
régime des études Externe Interne Demi pentionnaire Total
Nombres d’étudiants ni (Effectifs) 70 50 80 200
Fréquences fi 0.35 0.25 0.40 1
Calculons le degré correspondant aux différents secteurs:
d1 = f1 × 360o = 0.35 × 360o = 126o
d2 = f2 × 360o = 0.25 × 360o = 90o

d3 = f3 × 360o = 0.40 × 360o = 144o
D’où on obtient la représentation suivante:
4
Diagramme en barres (Tuyaux d’orgue) Il consiste à porter en abscisse les modalités
de la variable étudiée, au dessus des quelles on trace des tuyaux d’orgue de même largeur,
et en ordonnée les effectifs ou les fréquences qui vont déterminer leurs hauteurs.
5
1.3.2 Cas d’une variable Quantitative discrète
Si on note x1 , · · · , xk les différentes valeurs d’un caractère quantitatif discret et les effectifs
partiels respectifs n1 , · · · , nk , on peut représenter cette série par un tableau du type suivant:
Valeurs xi x1 x2 ··· xk
Effectifs ni n1 n2 ··· nk
Le graphe associé à cette distribution est le diagramme en bâtons qui est un ensemble de
barres verticales (bâtons) correspondant aux valeurs de la variable et dont la hauteur est
proportionnelle à la fréquence de la valeur considérée. Les valeurs de la variable sont notées
en abscisses et les fréquences (ou effectifs) en ordonnées. La courbe obtenue en joignant
par des segments de droite les extrémités des bâtons est appelée le polygône des effectifs.
Exemple: Répartition des logements selon le nombre de pièces.
Nombres de pièces xi 1 2 3 4 5 6 Total

Effectifs ni 5 10 20 30 25 10 100
6
On veut représenter cette distribution sous la forme d’un diagramme en bâtons. À
chaque valeur xi correspond un bâton. Les hauteurs des bâtons sont proportionnelles aux
effectifs ni .
Figure 3: Diagramme représentatif de la répartition des logements selon le nombre de

pièces, en bleu le polygône des effectifs.
1.3.3 Cas d’une variable Quantitative continue

Cette représentation sera obligatoirement choisie s’il s’agit d’une variable continue. Les k
classes sont alors disjointes et leur réunion recouvre la totalité des valeurs possibles. On les
note généralement [ei ; ei+1 [. Par convention la borne supérieure est exclue de cette classe,
sauf pour la dernière classe (la dernière classe peut être fermée).
Le nombre ni est l’effectif de la ieme classe.

ei + ei+1
On appelle centre d’une classe [ei , ei+1 [ la valeur ci = .
2
On appelle amplitude d’une classe [ei , ei+1 [ la valeur ai = ei+1 − ei .
7
D’une manière générale une série statistique classée peut se représenter à l’aide d’un
tableau du type suivant:
Classes [e1 , e2 [ [e2 , e3 [ · · · [ek , ek+1 [

Effectifs ni n1 n2 ··· nk
Remarque 2. Il est parfois difficile de préciser les classes extrêmes, on utilise souvent
des classes ouvertes “plus de” ou “moins de” qui ne possèdent pas de centre de classe. En
l’absence d’informations complémentaires, on prendra alors comme centre un nombre situé
à une demi amplitude de la borne de cette classe ouverte.
Remarque 3. Dans le cas où les classes sont d’amplitudes différentes, on choisit pour la
classe ouverte l’amplitude de la classe voisine.
Dans le cas de la variable continue, le graphique est appelé histogramme. On trace des
rectangles qui ont comme largeur l’amplitude de la classe mesurée sur l’axe des abscisses
et dont les aires sont proportionnelles aux effectifs partiels (ni ) (ou aux fréquences fi ).
Important: Les hauteurs des différents rectangles ne sont pas proportionnelles aux
effectifs partiels (sauf si les classes ont la même amplitude) mais les aires doivent l’être.
Remarque 4. Si les classes ont la même amplitude, on peut retrouver le polygône des
effectifs (ou des fréquences) en prenant comme valeur pour chaque élément de la classe le
centre.
Exemple: Considérons la série statistique suivante qui décrit la charge de rupture d’un
fil.
Classes [720; 760[ [760; 800[ [800; 840[ [840; 880[ [880; 920[ 920et plus
Effectifs ni 10 23 4 15 32 16
On dresse le graphe correspondants,
8
Figure 4: Diagramme représentatif de la de la série précédente, en rouge le polygône des
effectifs.
Dans le cas où les amplitudes sont différentes, pour tracer l’histogramme on utilise la
méthode des effectifs rectifiés, qui consiste à multiplier l’effectif de chaque classe par le
rapport entre l’amplitude de la plus petite classe sur l’amplitude de la classe considérée,
on obtient ainsi les effectifs rectifiés noté:
la plus petite amplitude
ni ′ = ni × .
l’amplitude de la classe i
On peut aussi représenter l’histogramme autrement, en utilisant comme hauteurs des
ni fi
rectangles les quantités (appelés densités) ou . (voir TD)
ai ai
Règle de STURGES: Cette règle est utilisée pour déterminer le nombre de classes
à utiliser pour représenter une variable statistique continue.
Le nombre de classes est égal à l’entier le plus proche de la quantité: 1 + 3, 3 log n . Par
exemple, pour un échantillon de taille n=200, on doit utiliser 1 + 3, 3 log 200 = 8, 59 ≃ 9
classes.
9
L’amplitude constante de ces classes sera égale à:
Xmax − Xmin
a= .
nombre de classes
1.4 Fréquences cumulées et effectifs cumulés

Soit x1 , · · · , xk (d’effectifs respectifs n1 , · · · , nk ) une série à valeurs isolées telle que x1 <
x2 < · · · < xk .
On appelle effectif cumulé croissant (noté Ni ) de la valeur xi la somme des effectifs

partiels de xi et de toutes les valeurs de la série qui sont inférieures à xi , c’est-à-dire:
Ni = n1 + n2 + · · · + ni .
On appelle fréquence cumulée croissante de la valeur xi le nombre:
Fi = f1 + f2 + · · · + fi .
Pour une série classée on définit de la même manière l’effectif cumulé d’une classe (respec-
tivement la fréquence cumulée) comme étant la somme des effectifs partiels ( respectivement
des fréquences) de cette classe et de toutes celles qui la précèdent.
La fonction des fréquences cumulées est définie comme suit: F : R → [0, 1] telle que
- ∀x < min{xi }, F (x) = 0.
- ∀x ≥ max{xi }, F (x) = 1.
Remarque 5. • L’effectif cumulé de la première valeur ou de la première classe est égal à
l’effectif partiel de cette valeur ou de cette classe, et l’effectif cumulé de la dernière valeur
ou de la dernière classe est égal à l’effectif total N .
• La fréquence cumulée de la première valeur ou de la première classe est égale à la

fréquence de cette valeur ou de cette classe, et la fréquence cumulée de la dernière valeur
ou de la dernière classe est égale à 1.
Exemple 1: Répartition des logements selon le nombre de pièces.
Nombres de pièces xi 1 2 3 4 5 6 Total

Effectifs ni 5 10 20 30 25 10 100
Effectifs cumulés Ni 5 15 35 65 90 100 \
Fréquences fi 0.05 0.10 0.20 0.30 0.25 0.10 1
Fréquences cumulées Fi 0.05 0.15 0.35 0.65 0.90 1 \
Le polygône des fréquences cumulées est représenté comme suit:
10
Exemple 2: Considérons la série statistique suivante qui décrit la charge de rupture
d’un fil.
Classes [720; 760[ [760; 800[ [800; 840[ [840; 880[ [880; 920[ 920et plus total
ni 5 10 20 30 25 10 100
Ni cumulés 5 15 35 65 90 100 \
Fréquences fi 0.05 0.10 0.20 0.30 0.25 0.10 1
Fi cumulées 0.05 0.15 0.35 0.65 0.90 1 \
Le polygône des fréquences cumulées est représenté comme suit:
2 Représentation numérique des données

Si les tableaux et les représentations graphiques fournissent des indications intéressantes
sur la description des données, il est toujours très utile de déterminer ou de calculer des
paramètres ou des caractéristiques qui indiquent le centre de la distribution, son degré de
dispersion, son degré de symétrie, · · · etc. On considère plusieurs types de caractéristiques
pour une distribution :
11
Les caractéristiques de tendance centrale ou de position.
Les caractéristiques de disposition.
2.1 Caractéristiques de tendance centrale (Paramètres de posi-

tion)
Les paramètres de tendance centrale sont des grandeurs susceptibles de représenter au
mieux un ensemble de données. L’appellation tendance centrale vient du fait que ces
paramètres donnent une idée de ce qui se passe au centre d’une distribution d’un ensemble
de données.
2.2 Le mode:
Le mode Mo d’une série statistique est la valeur du caractère la plus fréquente ou dominante
dans l’échantillon.
- Dans le cas discret, le mode est la valeur xi qui correspond à l’effectif le plus élevé.
- Dans le cas continu, la classe modale (celle qui contient la valeur du mode) est la classe
la plus fréquente. Dans ce cas, le mode se calcule de la manière suivante: Si [ei , ei+1 [
est la classe modale alors:
ni − ni−1
Mo = ei + ai ×
(ni − ni−1 ) + (ni − ni+1 )
Avec:
ei : est la borne inférieure de la classe modale.

ai : est l’amplitude de la classe modale.
ni : est l’effectif de la classe modale.
ni−1 : est l’effectif de la classe qui précède la classe modale.
ni+1 : est l’effectif de la classe qui suit la classe modale.
Si les classes sont d’amplitudes inégales on utilise les effectifs rectifiés, la classe modale
est la classe qui correspond à l’effectif rectifié le plus élevé:
n′i − n′i−1
Mo = ei + ai ×
(n′i − n′i−1 ) + (n′i − n′i+1 )
Remarque 6. Lorsque la distribution a plus d’un mode, on parle d’une distribution mul-
timodale (bimodale, trimodale , etc).
12
Exemple 1: Une enquête faite sur les pointures de 200 filles a fourni les résultats
suivants:
Pointures xi 36 37 38 39 40 41 Total
Effectifs relatifs ni 30 25 70 40 15 20 200
L’effectif le plus élevé est 70 donc le mode Mo = 38.
Exemple 2: Soit le tableau donnant les poids (en kg) de 100 individus.
Poids en kg [56; 58[ [58; 60[ [60; 62[ [62; 64[ [64; 66[ Total
Nombre d’individus ni 5 36 40 15 4 100
Toute les classes ont la même amplitude, donc la classe modale est celle qui a l’effectif
le plus élevé, qui est la classe [60; 62[. La valeur du mode est:
ni − ni−1
Mo = ei + ai ×
(ni − ni−1 ) + (ni − ni+1 )
40 − 36
= 60 + 2 ×
(40 − 36) + (40 − 15)
4
= 60 + 2 ×
4 + 25
= 60, 27kg.
Exemple 3: Le tableau suivant représente la distribution des ouvriers selon le salaire
horaire dans une entreprise.
Salaire horaire (DA) [10; 20[ [20; 30[ [30; 50[ [50; 80[ [80; 90[ Total
Nombre d’ouvriers ni 12 14 32 47 15 200
Les amplitudes ai 10 10 20 30 10 \
Effectifs corrigés n′i 12 14 16 15.66 15 \
Les classes sont d’amplitudes inégales, on doit procéder à la correction des effectifs, on
obtient les valeurs qui figurent dans le tableau.
La classe modale est donc [30; 50[ correspondant à l’effectif corrigé le plus élevé: n′3 = 16.
La valeur du mode est égale:
n′i − n′i−1
Mo = ei + ai ×
(n′i − n′i−1 ) + (n′i − n′i+1 )
16 − 14
= 30 + 20 ×
(16 − 14) + (16 − 15.66)
2
= 30 + 20 ×
2 + 0.34
= 47.09 ≃ 48DA.
13
2.3 La médiane:
La médiane Me , se définie comme la valeur qui divise en deux parties égales les valeurs
observées rangées
par ordre croissant
ou décroissant. Mathématiquement, Me est telle que
N
F (Me ) = 0.5 ⇔ n(Me ) = .
2
Dans le calcul de la médiane, on distingue deux cas:
• Si la variable est discrète: On désigne par N le nombre d’observations.
Si N est pair : la médiane est alors égale à la moyenne des valeurs encadrant le milieu de
xp + xp+1
la série.−→ Si N = 2p alors Me = .
2
Si N est impair alors la médiane est égale à la valeur qui se trouve au milieu de la série.
−→ Si N = 2p + 1 alors Me = xp+1 .
• Si la variable est continue et qu’elle est groupée en classe: On cherche la classe

contenant le N/2 individu de l’échantillon. Cette classe est appelée la classe médiane. En
supposant que tous les individus de cette classe sont uniformément répartis à l’intérieur,
la médiane se calcule de la façon suivante:
Si [ei ; ei+1 [ est la classe médiane alors,
0.5 − Fi 0.5 − Fi
Me = ei + ai × = e i + ai ×
Fi+1 − Fi fi
Avec:
ei : est la borne inférieure de la classe médiane.
ai : est l’amplitude de la classe médiane.
fi : est la fréquence de la classe médiane.
Fi : est la fréquence cumulée de la classe qui précède la classe médiane.
Fi+1 : est la fréquence cumulée de la classe médiane.
Si on emploit le effectifs cumulés croissants, la formule deviendrait alors la suivante:

N N
− Ni
2 2
− Ni
Me = ei + ai × = e i + ai ×
Ni+1 − Ni ni
Avec:
N : est l’effectif total.
ni : est l’effectif de la classe médiane.
14
Ni : est l’effectif cumulé de la classe qui précède la classe médiane.
Ni+1 : est l’effectif cumulé de la classe médiane.
Remarque 7. Cette formule donnant la médiane reste valable lorsque les amplitudes ne
sont pas égales.
Exemple 1: Les notes obtenues par quinze étudiants au module de mathématiques

sont les suivantes:
14, 16, 8, 10, 17, 11, 10, 8, 13, 14, 9, 7, 15, 10, 12.
Ordonnons les observations dans l’ordre croissant:
7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 14, 15, 16, 17
L’effectif total N = 15 = 2 × 7 + 1 est un nombre impair alors la médiane Me = x7+1 =

x8 = 11.
Exemple 2: Les notes obtenues par dix étudiants au module de physique sont les
suivantes:
12, 10, 8, 9, 15, 14, 7, 11, 15, 8
Ordonnons la série statistique dans l’ordre croissant:
7, 8, 8, 9, 10, 11, 12, 14, 15, 15

L’effectif total N = 10 = 2 × 5, (p = 5) est un nombre pair alors la médiane est
xp + xp+1 x5 + x 6 10 + 11
Me = = = = 10.5.
2 2 2
Donc 50% des étudiants observés ont eu des notes inférieures à 10, 5.
Exemple 3: Reprenons l’exemple sur l’enquête faite sur les pointures de 200 filles:
Fréquences relatives fi 0.15 0.125 0.35 0.20 0.075 0.10 1
Effectifs cumulés Ni 30 55 125 165 180 200 \
La valeur de la médianeest Me = 38. C’est la valeur de la variable qui dévise l’effectif to-
N
tal en deux effectifs égaux = 100 , elle correspond au premier effectif cumulé supérieur
2
N
ou égal à qui est donc N3 = 125 (elle correspond aussi à la première fréquence cumulée
2
supérieure ou égale à 0.5 qui est alors F3 = 0.625).
Graphiquement, on procède comme il est illustré dans le figure suivante:
15
Exemple 4: Reprenons l’exemple donnant les poids (en kg) de 100 individus.
Poids en kg [56; 58[ [58; 60[ [60; 62[ [62; 64[ [64; 66[ Total
Nombre d’individus ni 5 36 40 15 4 100
Fréquences fi 0.05 0.36 0.40 0.15 0.04 1
Effectifs cumulés Ni 5 41 81 96 100 \
Fréquences cumulées Fi 0.05 0.41 0.81 0.96 1 \
N
La classe médiane est celle qui a l’effectif cumulé ≥ = 50 (celle qui à la fréquence
2
cumulée ≥ 0.5), qui est alors la classe [60; 62[. La valeur de la médiane est:
0.5 − Fi
Me = ei + ai ×
fi
0.5 − 0.41
= 60 + 2 ×
0.40
0.09
= 60 + 2 ×
0.40
= 60, 45kg.
Graphiquement, on procède comme il est illustré dans le figure suivante:
16
2.4 Les quartiles:
Les quartiles sont les valeurs qui partagent les observations en quatre parties égales:
Le premier quartile noté Q1 , est tel que F (Q1 ) = 0, 25.
Le deuxième quartile noté Q2 est tel que F (Q2 ) = 0, 5, (Q2 = Me ).
Le troisième quartile noté Q3 , est tel que F (Q3 ) = 0, 75.
• Cas d’un caractère quantitatif discret: Avant de déterminer les valeurs des quartiles il
est suggéré d’ordonner les observations dans l’ordre croissant. Selon la taille de l’échantillon
(N ), quatre cas peuvent se présenter:
xp + xp+1 x3p + x3p+1
⋆ Si N = 4p alors, Q1 = et Q3 = .
2 2
xp + xp+1 x3p+1 + x3p+2
⋆ Si N = 4p + 1 alors, Q1 = et Q3 = .
2 2
⋆ Si N = 4p + 2 alors, Q1 = xp+1 et Q3 = x3p+2 .
⋆ Si N = 4p + 3 alors, Q1 = xp+1 et Q3 = x3p+3 .
• Cas d’un caractère quantitatif continu: La méthode d’interpolation utilisée pour le
calcul de la médiane est appliquée dans ce cas pour déterminer les différents quartiles.
Supposons que le premier quartile (respectivement le troisième quartile) est localisé dans
la classe [ei , ei+1 [ alors:
0.25 − Fi 0.25 − Fi
Q 1 = e i + ai × = e i + ai ×
Fi+1 − Fi fi
0.75 − Fi 0.75 − Fi
Q3 = ei + ai × = e i + ai ×
Fi+1 − Fi fi
Avec:
ei : est la borne inférieure de la classe correspendante.
ai : est l’amplitude de la classe correspendante.
fi : est la fréquence de la classe correspendante.
Fi : est la fréquence cumulée de la classe qui précède la classe correspendante.
Fi+1 : est la fréquence cumulée de la classe correspendante.
Si on utilise les effectifs cumulés croissants, la formule deviendrait alors la suivante:
N N
− Ni
4 4
− Ni
Q1 = ei + ai × = e i + ai ×
Ni+1 − Ni ni
3N 3N
4
− Ni 4
− Ni
Q3 = ei + ai × = e i + ai ×
Ni+1 − Ni ni
Avec:
17
N : est l’effectif total.
ni : est l’effectif de la classe correspendante.
Ni : est l’effectif cumulé de la classe qui précède la classe correspendante.
Ni+1 : est l’effectif cumulé de la classe correspendante.
Exemple 1: Les notes obtenues par quinze étudiants au module de mathématiques
sont les suivantes:
14, 16, 8, 10, 17, 11, 10, 8, 13, 14, 9, 7, 15, 10, 12.
Ordonnons les observations dans l’ordre croissant:
7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 14, 15, 16, 17
L’effectif total n = 15 = 4p + 3 avec (p = 3), alors:
Q1 = xp+1 = x4 = 9 et Q3 = x3p+3 = x12 = 14 .
Exemple 2: Les notes obtenues par dix étudiants au module de physique sont les
suivantes:
12, 10, 8, 9, 15, 14, 7, 11, 15, 8, 13, 10, 10
Ordonnons la série statistique dans l’ordre croissant:
7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 15, 15

L’effectif total n = 13 = 4p + 1 avec p = 3, alors:
xp + xp+1 x3 + x 4 8+9
Q1 = = = = 8.5.
2 2 2
x3p+1 + x3p+2 x10 + x11 13 + 14
Q3 = = = = 13.5.
2 2 2
Exemple 3: Reprennons l’exemple sur l’enquête faite sur les pointures de 200 filles:
Le premier quartile Q1 = 37, il correspond à la première fréquence cumulée supérieure
ou égale à 0.25 qui est alors F2 = 0.275.
Le troisième quartile Q3 = 39, il correspond à la première fréquence cumulée supérieure
ou égale à 0.75 qui est alors F4 = 0.825.
Exemple 4: Un échantillon de 100 mesures (en mm) de pièces de rechange, fabriquées

dans une entreprise a donné les résultats suivants:
18
Mesures en mm [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[ Total
Effectifs ni 10 30 20 25 15 100
Fréquences fi 0.1 0.3 0.2 0.25 0.15 1
Fréquences cumulées Fi 0.1 0.4 0.6 0.85 1 \
La première fréquence cumulée ≥ 0.25 est F2 = 0.4, donc le premier quartile Q1 est
localisé dans la classe [45; 50[, sa valeur est:
0.25 − Fi
Q1 = ei + ai ×
fi
0.25 − 0.1
= 45 + 5 ×
0.3
0.15
= 45 + 5 ×
0.3
= 47.5mm.
La première fréquence cumulée ≥ 0.75 est F5 = 0.85, donc le troisième quartile Q3 est
localisé dans la classe [55; 60[, sa valeur est:
0.75 − Fi
Q3 = ei + ai ×
fi
0.75 − 0.6
= 55 + 5 ×
0.25
0.15
= 55 + 5 ×
0.25
= 58mm.
2.5 La moyenne arithmétique:

La moyenne arlthmétique notée la plupart du temps X ou x ( se lit: ” x barre”) d’une
variable statistique X se définit comme étant le rapport de la somme des valeurs prises par
cette variable sur leur nombre d’apparition N .
On distingue deux types de moyennes: La moyenne arithmétique simple et la moyenne
arithmétique pondérée.
•Moyenne arithmétique simple: La moyenne arithmétique est considérée comme

simple lorsque les valeurs prises par la variable X n’apparaissent qu’une seule fois chacune,
et elle est égale donc à:
n
1X
X= xi
n i=1
Exemple: La moyenne arithmétique des nombres 11, 10, 5, 12, 13, 8, 7 est:
11 + 10 + 5 + 12 + 13 + 8 + 7
X= ≃ 9.43.
7
19
•Moyenne arithmétique pondérée: Lorsque les valeurs prises par la variable statis-
tique X: x1 , x2 , · · · , xk ont des fréquences d’apparitions respectives n1 , n2 , · · · , nk , la moyenne
arithmétique correspondante est pondérée, et elle est égale à:
k
1 X
X= n i xi
N i=1
Lorsqu’on utilise les fréquences relatives, la moyenne arithmétique pondérée est égale
alors à:
k k k
1 X X ni X
X= n i xi = xi = f i xi
N i=1 i=1
N i=1
Exemple: Distribution d’un petit échantillon de logements selon le nombre de pièces

dans un quartier d’une ville donnée.
Nombre de pièces xi 1 2 3 4 5 6 Total
Nombre de logements ni 22 35 25 12 4 2 100
ni .xi 22 70 75 48 20 12 247
1 P6
X = ni xi = 247
100
= 2.47, donc le nombre moyen de pièces par logement dans le
N i=1
quartier de cette ville est de 2.47 ≃ 2.
1 Pk ei+1 + ei
Si la variable statistique X est continue alors X = ni ci avec ci = est le
N i=1 2
centre de la classe [ei ; ei+1 [.
Exemple: Répartition des salaires horaires des ouvriers d’une entreprise.
salaires en da [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ total
effectifs ni 15 30 25 20 8 2 100
centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
1 6
P 3320
le salaire moyen par heure est égal à: X = n i ci = = 33.20 DA.
n i=1 100
3 Caractéristiques (paramètres) de dispersion

Les paramètres de dispertion permettent de mesurer l’écart des observations par rapport
à une valeur centrale ( en générale la moyenne arithmétique).
Les caractéristiques de dispersion les plus utilisés sont: L’étendue, l’écart absolu moyen,
l’écart interquartile et l’écart type.
20
3.1 L’étendue:
L’étendue est un intervalle de variation permettant de mesurer l’écart entre la plus grande
valeur Xmax et la plus petite valeur Xmin de la variable statistique X.
E = Xmax − Xmin
Exemple: Soit la série statistique suivante: 3, 6, 8, 9, 10, 14, 15, 6, 7, 11, 2, 5, 9. L’étendue
de cette série d’observations est: E = 15 − 2 = 13.
Remarque 8. L’étendue est souvent utilisé en contrôle industriel en raison de la simplicité
et de la rapidité de son calcul, pour tout juste avoir une idée globale sur un phénomène.
3.2 L’écart absolu moyen:

L’écart absolu moyen e de la variable statistique X est la moyenne arithmétique des valeurs
absolues des écarts à la moyenne arithmétique.
On pose donc:
1P n
e= |xi − X| si les n valeurs données x1 , x2 , · · · , xn sont toutes évaluées.
n i=1
1 Pk
e= ni |xi − X| si les données sont regroupées en k valeurs distinctes x1 , x2 , · · · , xk
N i=1
avec des fréquences d’apparitions respectives n1 , n2 , · · · , nk .
1 Pk
e= ni |ci −X| si les données sont regroupées en k classes de fréquences d’apparitions
N i=1
respectives n1 , n2 , · · · , nk , ci étant le centre de la classe [ei ; ei+1 [.
Remarque 9. Si on utilise les fréquences relatives fi au lieu des fréquences absolues
k
P
(effectifs) ni , l’écart absolu moyen devient: e = fi |xi − X|.
i=1
Exemple 1: On donne la série des observations xi : 5, 12, 13, 14, 2, 7, 18, 4, 10, 9.
La moyenne arithmétique de cette variable statistique est:
5 + 12 + 13 + 14 + 2 + 7 + 18 + 4 + 10 + 9
X= = 9, 4.
10
L’écart absolu moyen est donc égale à:
1
e= (|5 − 9.4| + |12 − 9.4| + |13 − 9.4| + |14 − 9.4| + |2 − 9.4| + |7 − 9.4| + |18 − 9.4|
10
+ |4 − 9.4| + |10 − 9.4| + |9 − 9.4|) = 4.
Exemple2: La distribution d’un petit échantillon de logements selon le nombre de

pièces dans un quartier d’une ville donnée.
21
ni .xi 22 70 75 48 20 12 247
|xi − X| 1.47 0.47 0.53 1.53 2.53 3.53 \
ni .|xi − X| 32.34 16.45 13.25 18.36 10.12 7.06 97.58
1 P6 247
La moyenne arithmétique X = n i xi = = 2.47.
N i=1 100
1 P6 97.58
L’écart absolu moyen est e = ni |xi − X| = = 0.9758.
N i=1 100
Exemple 3: Répartition des salaires horaires des ouvriers d’une entreprise.
Salaires en DA [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ Total
Effectifs ni 15 30 25 20 8 2 100
Centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
|ci − X| 18.2 8.2 1.8 11.8 21.8 31.8 \
ni .|ci − X| 273 246 45 236 174.4 63.6 1038
1 P 6 3320
Le salaire moyen par heure est égal à: X = n i ci = = 33.20DA.
N i=1 100
6
1 P 1038
L’écart absolu moyen est e = ni |ci − X| = = 10.38.
N i=1 100
3.3 L’écart interquartile:

L’intervalle interquartile est la différence entre les valeurs du troisième et du premier quar-
tile: IQ = Q3 –Q1 .
Autrement dit, c’est l’intervalle qui regroupe 50% des observations, en laissant 25% à droite
et 25% à gauche.
Exemple: Reprennons l’exemple sur l’enquête faite sur les pointures de 200 filles:
Le premier quartile Q1 = 37, Le troisième quartile Q3 = 39, l’écart interquartile
IQ = Q3 − Q1 = 39 − 37 = 2.
22
3.4 Ecart-type et variance:
L’écart-type noté σ est défini comme étant la racine carrée de la moyenne des carrés des
écarts par rapport à la moyenne arithmétique X.
• Lorsque les valeurs x1 , x2 , · · · , xn de la variable statistique X ne sont pas répétitives

l’écart-type est simple, et s’écrit de la manière suivante:
v
u n
u1 X
σ=t (xi − X)2
n i=1
• Lorsqu’à chaque valeur x1 , x2 , · · · , xk de la variable statistique X correspond re-

spectivement des effectifs n1 , n2 , · · · , nk l’écart-type est pondéré, et s’écrit de la manière
suivante: v v
u
u1 X k u k
uX
σ=t ni (xi − X)2 = t fi (xi − X)2 .
N i=1 i=1
• Lorsque les données sont regroupées en k classes d’effectifs d’apparitions respectifs

n1 , n2 , · · · , nk et ci étant le centre de la classe [ei ; ei+1 [, l’écart-type s’écrit de la manière
suivante: v
u
u1 X k
σ= t ni (ci − X)2
N i=1
La variance est définie comme étant le carré de l’écart-type:

n
1X
2
V =σ = (xi − X)2
n i=1
Quand les valeurs de la variable statistique sont répétitives, la variance devient:

k k
1 X X
V = σ2 = ni (xi − X)2 = fi (xi − X)2 dans le cas discret.
N i=1 i=1
k k
1 X
2 2
X
V =σ = ni (ci − X) = fi (ci − X)2 dans le cas continu.
N i=1 i=1
1 Pk
Remarque 10. En développant l’expression V = ni (xi − X)2 on obtient une formule
N i=1
1 Pk 2
plus simple V = ni x2i − X .
N i=1
23
Exemple 1: La moyenne arithmétique des nombres 11, 10, 5, 12, 13, 8, 7 est:
11 + 10 + 5 + 12 + 13 + 8 + 7
X= ≃ 9.43.
7
l’écart-type est:
√
σ = 17 ((11−9.43)2 +(10−9.43)2 +(5−9.43)2 +(12−9.43)2 +(13−9.43)2 +(8−9.43)2+(7−9.43)2 )
r
49.5719
=
7
= 2.66.
Exemple 2: La distribution d’un petit échantillon de logements selon le nombre de

pièces dans un quartier d’une ville donnée.

ni .xi 22 70 75 48 20 12 247
ni .x2i 22 140 225 192 100 72 751
P6
n i xi
k=1 247
La moyenne arithmétique X = = = 2.47.
N 100
s r
1 P6 2 751
2
L’écart-type σ = ni xi − X = − (2.47)2 = 1.187.
N i=1 100
Exemple 3: Répartition des salaires horaires des ouvriers d’une entreprise.
Salaires en DA [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ Total
Effectifs ni 15 30 25 20 8 2 100
Centres des classes ci 15 25 35 45 55 65 \
ni .ci 225 750 875 900 440 130 3320
c2i 225 650 1225 2025 3025 4225 \
ni .c2i 3375 18750 30625 40500 24200 8450 125900
1 P6 3320
Le salaire moyen par heure est égal à: X = n i ci = = 33.20DA.
N i=1 100
s r
1 P6 2 125900
L’écart-type σ = ni c2i − X = − (33.2)2 = 12.52.
N i=1 100
3.5 Coefficient de variation:

Pour comparer la dispersion de deux séries qui ne sont pas exprimées dans les mêmes
unités, on utilise le coefficient de variation. Cette statistique est une mesure neutre qui
24
s’exprime la plupart du temps en pourcentage, il se calcule en divisant l’écart-type par la
moyenne arithmétique.
σ
α=
X
On peut par exemple comparer l’écart des salaires entre le MAROC (en Dirham) et
l’ALGERIE (en Dinar), l’influence des unités monitaires sur le coefficient de variation
est nulle.
Plus le coefficient de variation est élevé, plus la dispertion est forte.
Exemple 1: Si dans l’entreprise E1 la moyenne des salaires X 1 est 2000 et l’écart-type

σ1 est de 150 alors que dans l’entreprise E2 sont respectivement X 2 = 1600 et σ2 = 120,
comparer les deux distributions statistiques.
Calculons les coefficients de variation:
150
Dans l’entreprise E1 , α1 = = 0.075.
2000
120
Dans l’entreprise E2 , α2 = = 0.075.
1600
Comme α1 = α2 , on peut en conclure que la dispersion relative des salaires est identique
dans l’entreprise E1 et dans l’entreprise E2 .
Exemple 2: Si dans la même entreprise la dispersion relative des salaires des ouvriers
est égale à 0.41 alors que celle des employés est égale à 0.78, que peut-on conclure?
On peut conclure que la répartition des salaires est plus homogène chez les ouvriers que
chez les employés dans cette entreprise.
25

Statistiques L2 GINIE CIVIL

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Statistiques L2 GINIE CIVIL

Transféré par

Droits d'auteur :

Formats disponibles

UMMTO, Faculté des Sciences Année universitaire: 2021-2022

Département M.I Module: Probabilités et statistique

Chapitre 2: Statistique Descriptive

1 Notions de base et vocabulaire statistique

1.2 Concepts de base de la statistique

 On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de

 Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la population

 Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section.

1.2.3 Variable statistique (caractère)

Exemples: la couleur, le sexe, le poids, la taille, la marque, le modèle, l’espèce, le prix,

1.3 Tableaux statistiques et représentations graphiques

Remarque 1. • La taille de la population étudiée (échantillon) s’appelle effectif total et

1.3.1 Cas d’une variable qualitative

Diagramme circulaire Les diagrammes circulaires, ou semi-circulaires, consistent

d1 = f1 × 360o = 0.35 × 360o = 126o

d2 = f2 × 360o = 0.25 × 360o = 90o

Exemple: Répartition des logements selon le nombre de pièces.

Nombres de pièces xi 1 2 3 4 5 6 Total

Figure 3: Diagramme représentatif de la répartition des logements selon le nombre de

1.3.3 Cas d’une variable Quantitative continue

 Le nombre ni est l’effectif de la ieme classe.

Classes [e1 , e2 [ [e2 , e3 [ · · · [ek , ek+1 [

1.4 Fréquences cumulées et effectifs cumulés

On appelle effectif cumulé croissant (noté Ni ) de la valeur xi la somme des effectifs

On appelle fréquence cumulée croissante de la valeur xi le nombre:

• La fréquence cumulée de la première valeur ou de la première classe est égale à la

Nombres de pièces xi 1 2 3 4 5 6 Total

2 Représentation numérique des données

Les caractéristiques de disposition.

2.1 Caractéristiques de tendance centrale (Paramètres de posi-

ei : est la borne inférieure de la classe modale.

• Si la variable est discrète: On désigne par N le nombre d’observations.

• Si la variable est continue et qu’elle est groupée en classe: On cherche la classe

ei : est la borne inférieure de la classe médiane.

ai : est l’amplitude de la classe médiane.

fi : est la fréquence de la classe médiane.

Fi : est la fréquence cumulée de la classe qui précède la classe médiane.

Fi+1 : est la fréquence cumulée de la classe médiane.

Si on emploit le effectifs cumulés croissants, la formule deviendrait alors la suivante:

N : est l’effectif total.

ni : est l’effectif de la classe médiane.

Ni+1 : est l’effectif cumulé de la classe médiane.

Exemple 1: Les notes obtenues par quinze étudiants au module de mathématiques

L’effectif total N = 15 = 2 × 7 + 1 est un nombre impair alors la médiane Me = x7+1 =

7, 8, 8, 9, 10, 11, 12, 14, 15, 15

Graphiquement, on procède comme il est illustré dans le figure suivante:

7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 14, 15, 15

Exemple 4: Un échantillon de 100 mesures (en mm) de pièces de rechange, fabriquées

2.5 La moyenne arithmétique:

•Moyenne arithmétique simple: La moyenne arithmétique est considérée comme

Exemple: Distribution d’un petit échantillon de logements selon le nombre de pièces

Exemple: Répartition des salaires horaires des ouvriers d’une entreprise.

3 Caractéristiques (paramètres) de dispersion

3.2 L’écart absolu moyen:

Exemple2: La distribution d’un petit échantillon de logements selon le nombre de

3.3 L’écart interquartile:

• Lorsque les valeurs x1 , x2 , · · · , xn de la variable statistique X ne sont pas répétitives

• Lorsqu’à chaque valeur x1 , x2 , · · · , xk de la variable statistique X correspond re-

• Lorsque les données sont regroupées en k classes d’effectifs d’apparitions respectifs

La variance est définie comme étant le carré de l’écart-type:

Quand les valeurs de la variable statistique sont répétitives, la variance devient:

Exemple 2: La distribution d’un petit échantillon de logements selon le nombre de

Nombre de pièces xi 1 2 3 4 5 6 Total

On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de

Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la population

Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section.

Le nombre ni est l’effectif de la ieme classe.