Académique Documents
Professionnel Documents
Culture Documents
1.1 Introduction
Selon la définition de l’Encyclopedia Universalis:“Le mot statistique désigne à la fois un ensem-
ble de données d’observations et l’activité qui consiste dans leur recueil, leur traitement et leur
intérprétation”. Autrement dit, la statistique est à la fois une science, une méthode et un ensemble
de techniques.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les
champs disciplinaires et explique pourquoi elle est enseignée dans toute les filières universitaires,
de l’économie à la biologie en passant par la psychologie est bien sur des science de l’ingénieur.
La statistique consiste à:
1
2 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE
Remarque 1. Chaque individu d’une population peut être décrit relativement à un ou plusieurs
caractères ou variables statistique.
Exemples:
1. Si le caractère retenu est “le nombre de frères et soeurs”, les modalités peut être 0,1,2,3,...
Les variables statistiques peuvent être classées selon leurs nature en deux catégories:
Variable qualitative:
Une variable est dite qualitative lorsque ses différentes modalités ne sont pas mesurables. C’est
celui dont les modalités ne peuvent pas être ordonnées, c’est-à-dire que si l’on considère deux
modalités de ce caractère prises au hasard, on ne peut pas dire de l’une est inférieure ou égale à
l’autre.
Variable quantitative:
Les différentes modalités d’une variable quantitative constituent l’ensemble des valeurs numériques
que peut prendre la variable. Une variable est dite alors quantitative lorsque ses différentes valeurs
sont mesurables.
Il y a deux types de variables quantitatives:
• Variable quantitative discrète: Une variable quantitative est dite discrète si elle prend
un nombre fini ou dénombrable de valeurs (valeurs numériques isolées).
Exemple: La variable nombre d’enfants par famille, dont les valeurs sont:0, 1, 2, 3, etc, est une
variable quantitative discrète.
• Variable quantitative continue: Une variable quantitative est dite continue si elle prend
toutes ses valeurs dans des intervalles de l’ensemble des nombres réels.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 3
Exemple: La variable ”taille en cm” observée sur un échantillon de 500 individus est une
variable quantitative continue, dont les résultats sont les suivants: 100 individus leurs tailles sont
comprise dans l’intervalle [150, 160[, 250 individus dans l’intervalle [160, 170[et 150 dans l’intervalle
[170, 185].
1.1.3 Observations
Une variable donne lieu à plusieurs observations. Si la variable est notée X, alors on notera par
x1 , x2 , x3 , . . . , xn les observations et on constitue ainsi une série statistique, où n représente le
nombre d’observations. Si les observations portent sur la totalité de la population, on dit que n
est la taille de la population, on l’appelle aussi effectif total. Si les observations n’ont porté que
sur une partie de la population, on dit que n est la taille de l’échantillon de la population observée.
Exemple: Soit un échantillon de dix individus, la variable âge observée peut prendre les
valeurs suivantes : x1 = 31, x2 = 40, x3 = 25, x4 = 30, x5 = 35, x6 = 40, x7 = 28, x8 = 42, x9 =
33, x10 = 37. Dans ce cas la taille de l’échantillon est n=10.
Au cours d’une étude statistique les données sont recueillies de façon désordonnée. Les informa-
tions statistiques collectées sont fastidieuses et pratiquement inexploitables, pour leur donner un
sens eu une utilité, il faut les ordonner, les classer et les présenter sous forme de tableaux et/ou
de graphiques. La présentation de l’information statistique qualitative ou quantitative sous forme
de tableau statistique représente une étape très importante et indispensable pour les opérations
statistiques. Un tableau statistique est constitué des modalités, xi et des effectifs ni . Les effec-
tifs ni , sont également appelés fréquences absolues par différence avec le rapport fi = nNi appelé
fréquence relative ou fréquence, et qui est la proportion d’individus présentant la modalité xi . Les
tableaux statistiques sont ainsi donc des distributions de fréquence qui se présentent différemment
selon la nature du caractère. De façon générale, tout tableau statistique doit comporter un titre,
mentionner sa source, et dans certains cas (caractères quantitatifs notamment), l’unité utilisée
(francs, dollars, g, kg, m,km, milliers, millions · · · ) doit être précisée. De plus, les modalités
doivent être incompatibles (un individu ne peut correspondre à plus d’une modalité) et exhaus-
tives (elles doivent représenter tous les individus).
Les représentations graphiques sont très utiles comme moyens de description. Elles ont souvent
un plus grand impact visuel qu’un tableau et peuvent aider à une meilleure compréhension des
données concernées. Il existe plusieurs sortes de représentations graphiques. Cela dépond de la
nature du caractère étudié.
Remarque 2. • La taille de la population étudiée (échantillon) s’appelle effectif total et est égale
Pk
à la somme des effectifs partiels, N = i=1 ni .
• On peut remplacer fi par fi × 100 qui représente alors un pourcentage.
Pk
• La somme des fréquences relatives est égale à 1, i=1 fi = 1.
4 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE
Diagramme circulaire
N −→ 360o
ni −→ di
d’où
ni
di = × 360o = fi × 360o
N
Exemple: On a étudié le régime des études sur échantillon de 200 étudiants d’un lycée donné,
les résultats obtenus sont les suivants:
régime des études Externe Interne Demi pentionnaire Total
Nombres d’étudiants ni (Effectifs) 70 50 80 200
Fréquences fi 0.35 0.25 0.40 1
Il consiste à porter en abscisse les modalités de la variable étudiée, au dessus des quelles on
trace des tuyaux d’orgue de même largeur, et en ordonnée les effectifs ou les fréquences qui vont
déterminer leurs hauteurs.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 5
Valeurs xi x1 x2 ··· xk
Effectifs ni n1 n2 ··· nk
Le graphe associé à cette distribution est le diagramme en bâtons qui est un ensemble de barres
verticales (bâtons) correspondant aux valeurs de la variable et dont la hauteur est proportionnelle
à la fréquence de la valeur considérée. Les valeurs de la variable sont notées en abscisses et les
fréquences (ou effectifs) en ordonnées. La courbe obtenue en joignant par des segments de droite
les extrémités des bâtons est appelée le polygône des effectifs.
Exemple: Le gérant d’un magasin vendant des articles de consommation courante a relevé
6 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE
pour un article particulier qui semble connaı̂tre une très forte popularité, le nombre d’articles
vendus par jour. Son relevé a porté sur les ventes des mois de Mars et Avril, ce qui correspond à
52 jours de vente. Le relevé des observations se présente comme suit:
P
Nombres d’article xi 5 6 7 8 9 10 11 12 13 14 15 16
Effectifs ni 3 1 3 4 7 5 8 8 3 6 3 1 52
On veut représenter cette distribution sous la forme d’un diagramme en bâtons. À chaque valeur
xi correspond un bâton. Les hauteurs des bâtons sont proportionnelles aux effectifs ni .
Remarque 3. Il est parfois difficile de préciser les classes extrêmes, on utilise souvent des
classes ouvertes “plus de” ou “moins de” qui ne possèdent pas de centre de classe. En l’absence
d’informations complémentaires, on prendra alors comme centre un nombre situé à une demi
amplitude de la borne de cette classe ouverte.
Remarque 4. Dans le cas où les classes sont d’amplitudes différentes, on choisit pour la classe
ouverte l’amplitude de la classe voisine.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 7
Dans le cas de la variable continue, le graphique est appelé histogramme. On trace des rect-
angles qui ont comme largeur l’amplitude de la classe mesurée sur l’axe des abscisses et dont les
aires sont proportionnelles aux effectifs partiels (ni ) (ou aux fréquences fi ).
Important: Les hauteurs des différents rectangles ne sont pas proportionnelles aux effectifs
partiels (sauf si les classes ont la même amplitude) mais les aires doivent l’être.
Remarque 5. Si les classes ont la même amplitude, on peut retrouver le polygône des effectifs
(ou des fréquences) en prenant comme valeur pour chaque élément de la classe le centre.
Dans le cas où les amplitudes sont différentes, pour tracer l’histogramme on utilise la méthode
des effectifs rectifiés, qui consiste à multiplier l’effectif de chaque classe par le rapport entre
l’amplitude de la plus petite classe sur l’amplitude de la classe considérée, on obtient ainsi les
effectifs rectifiés noté:
la plus petite amplitude
ni 0 = ni ×
l’amplitude de la classe i
On peut aussi représenter l’histogramme autrement, en utilisant comme hauteurs des rectan-
gles les quantités naii ou afii .
Règle de STURGES: Cette règle est utilisée pour déterminer le nombre de classes à utiliser
pour représenter une variable statistique continue.
Le nombre de classes est égal à l’entier le plus proche de la quantité: 1 + 3, 3 log n . Par exemple,
pour un échantillon de taille n=200, on doit utiliser 1 + 3, 3 log 200 = 8, 59 ' 9 classes.
L’amplitude constante de ces classes sera égale à:
Xmax − Xmin
a=
nombre de classes
.
Exemple: Dans une gare routière, on évalue le temps d’attente des voyageurs en minutes. on
a obtenu les données suivantes:.
Classes [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[
Effectifs ni 50 100 250 150 100 50