Vous êtes sur la page 1sur 7

Chapter 1

Notions de base et vocabulaire


statistique

1.1 Introduction
Selon la définition de l’Encyclopedia Universalis:“Le mot statistique désigne à la fois un ensem-
ble de données d’observations et l’activité qui consiste dans leur recueil, leur traitement et leur
intérprétation”. Autrement dit, la statistique est à la fois une science, une méthode et un ensemble
de techniques.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les
champs disciplinaires et explique pourquoi elle est enseignée dans toute les filières universitaires,
de l’économie à la biologie en passant par la psychologie est bien sur des science de l’ingénieur.
La statistique consiste à:

• Recueillir des données.

• Présenter et résumer ces données.

• Interpréter les résultats et tires des conclusions sur la population étudiée.

1.1.1 Population, individu et échantillon


La Population est l’ensemble des élèments sur lesquels porte l’étude statistique. Les élèments de
la population sont appelés individus statistique ou unités statistique. La population constitue
l’univers de référence de l’étude. Si la population comporte N individus, on note Ω = {w1 ; ...; wN },
wi désignant pour un i à N les individus qui la composent. Un échantillon de taille n est un
sous-ensemble formé de n individus de la population (n ≤ N ).
Exemples:
On considère l’ensemble des étudiants de Maths-info de UMMTO répartis dans 5 sections. On
s’intéresse à l’âge de chaque étudiant. Dans ce cas:

1. Ω= ensemble des étudiants de Maths Info de UMMTO.

2. Un individu w: est tout étudiant de Maths Info de L’UMMTO.

1
2 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE

3. Une des 5 sections représente un échantillon.

Remarque 1. Chaque individu d’une population peut être décrit relativement à un ou plusieurs
caractères ou variables statistique.

1.1.2 Variable statistique (caractère)


Une variable statistique (on parle aussi de caractère statistique), notée X, est une applica-
tion définie sur une population statistique et à valeurs dans un ensemble M , appelé ensemble des
modalités.
Les modalités correspondent aux valeurs possible de la variable statistique. Une variable statis-
tique définit une partition (division) sur une population, chaque individu appartenant à une et
une seule modalité, si le nombre de modalités est noté r, l’ensemble des modalités de la variable
X sera noté: M = {x1 ; x2 ; ...; xr }.

Exemples:

1. Si le caractère retenu est “le nombre de frères et soeurs”, les modalités peut être 0,1,2,3,...

2. Si la variable est “le sexe”, les modalités sont masculin ou féminin.

Les variables statistiques peuvent être classées selon leurs nature en deux catégories:

Variable qualitative:

Une variable est dite qualitative lorsque ses différentes modalités ne sont pas mesurables. C’est
celui dont les modalités ne peuvent pas être ordonnées, c’est-à-dire que si l’on considère deux
modalités de ce caractère prises au hasard, on ne peut pas dire de l’une est inférieure ou égale à
l’autre.

Exemples: Le sexe, la nationalité, la couleur des yeux, la catégorie socioprofessionnelle.

Variable quantitative:

Les différentes modalités d’une variable quantitative constituent l’ensemble des valeurs numériques
que peut prendre la variable. Une variable est dite alors quantitative lorsque ses différentes valeurs
sont mesurables.
Il y a deux types de variables quantitatives:

• Variable quantitative discrète: Une variable quantitative est dite discrète si elle prend
un nombre fini ou dénombrable de valeurs (valeurs numériques isolées).

Exemple: La variable nombre d’enfants par famille, dont les valeurs sont:0, 1, 2, 3, etc, est une
variable quantitative discrète.

• Variable quantitative continue: Une variable quantitative est dite continue si elle prend
toutes ses valeurs dans des intervalles de l’ensemble des nombres réels.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 3

Exemple: La variable ”taille en cm” observée sur un échantillon de 500 individus est une
variable quantitative continue, dont les résultats sont les suivants: 100 individus leurs tailles sont
comprise dans l’intervalle [150, 160[, 250 individus dans l’intervalle [160, 170[et 150 dans l’intervalle
[170, 185].

1.1.3 Observations

Une variable donne lieu à plusieurs observations. Si la variable est notée X, alors on notera par
x1 , x2 , x3 , . . . , xn les observations et on constitue ainsi une série statistique, où n représente le
nombre d’observations. Si les observations portent sur la totalité de la population, on dit que n
est la taille de la population, on l’appelle aussi effectif total. Si les observations n’ont porté que
sur une partie de la population, on dit que n est la taille de l’échantillon de la population observée.

Exemple: Soit un échantillon de dix individus, la variable âge observée peut prendre les
valeurs suivantes : x1 = 31, x2 = 40, x3 = 25, x4 = 30, x5 = 35, x6 = 40, x7 = 28, x8 = 42, x9 =
33, x10 = 37. Dans ce cas la taille de l’échantillon est n=10.

1.2 Tableaux statistiques et représentations graphiques

Au cours d’une étude statistique les données sont recueillies de façon désordonnée. Les informa-
tions statistiques collectées sont fastidieuses et pratiquement inexploitables, pour leur donner un
sens eu une utilité, il faut les ordonner, les classer et les présenter sous forme de tableaux et/ou
de graphiques. La présentation de l’information statistique qualitative ou quantitative sous forme
de tableau statistique représente une étape très importante et indispensable pour les opérations
statistiques. Un tableau statistique est constitué des modalités, xi et des effectifs ni . Les effec-
tifs ni , sont également appelés fréquences absolues par différence avec le rapport fi = nNi appelé
fréquence relative ou fréquence, et qui est la proportion d’individus présentant la modalité xi . Les
tableaux statistiques sont ainsi donc des distributions de fréquence qui se présentent différemment
selon la nature du caractère. De façon générale, tout tableau statistique doit comporter un titre,
mentionner sa source, et dans certains cas (caractères quantitatifs notamment), l’unité utilisée
(francs, dollars, g, kg, m,km, milliers, millions · · · ) doit être précisée. De plus, les modalités
doivent être incompatibles (un individu ne peut correspondre à plus d’une modalité) et exhaus-
tives (elles doivent représenter tous les individus).
Les représentations graphiques sont très utiles comme moyens de description. Elles ont souvent
un plus grand impact visuel qu’un tableau et peuvent aider à une meilleure compréhension des
données concernées. Il existe plusieurs sortes de représentations graphiques. Cela dépond de la
nature du caractère étudié.

Remarque 2. • La taille de la population étudiée (échantillon) s’appelle effectif total et est égale
Pk
à la somme des effectifs partiels, N = i=1 ni .
• On peut remplacer fi par fi × 100 qui représente alors un pourcentage.
Pk
• La somme des fréquences relatives est égale à 1, i=1 fi = 1.
4 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE

1.2.1 Cas d’une variable qualitative


Lorsque le caractère étudié est qualitatif, xi va représenter les différents états ou les différentes
modalités du caractère (on les note aussi Mi ), et ni ou fi ses fréquences, comme on le voit avec le
tableau suivant:

Modalités Mi du caractère M1 M2 ··· Mk Total


Nombres d’individus ni (Effectifs) n1 n2 ··· nk N

Une variable qualitative peut être représentée graphiquement de deux manières.

Diagramme circulaire

Les diagrammes circulaires, ou semi-circulaires, consistent à partager un disque ou un demi-disque,


en tranches, ou secteurs, correspondant aux modalités observées et dont la surface est proportion-
nelle à l’effectif, ou à la fréquence, de la modalité (voir figure).
Le degré d’un secteur est déterminé à l’aide de la règle de trois de la manière suivante:

N −→ 360o

ni −→ di

d’où
ni
di = × 360o = fi × 360o
N
Exemple: On a étudié le régime des études sur échantillon de 200 étudiants d’un lycée donné,
les résultats obtenus sont les suivants:
régime des études Externe Interne Demi pentionnaire Total
Nombres d’étudiants ni (Effectifs) 70 50 80 200
Fréquences fi 0.35 0.25 0.40 1

Calculons le degré correspondant aux différents secteurs:

d1 = f1 · 360o = 0.35 × 360o = 126o

d2 = f2 · 360o = 0.25 × 360o = 90o

d3 = f3 · 360o = 0.40 × 360o = 144o

D’où on obtient la représentation suivante:

Diagramme en barres (Tuyaux d’orgue)

Il consiste à porter en abscisse les modalités de la variable étudiée, au dessus des quelles on
trace des tuyaux d’orgue de même largeur, et en ordonnée les effectifs ou les fréquences qui vont
déterminer leurs hauteurs.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 5

Figure 1.1: Diagramme circulaire

Figure 1.2: Diagramme en barres

1.2.2 Cas d’une variable Quantitative discrète


Si on note x1 , · · · , xk les différentes valeurs d’un caractère quantitatif discret et les effectifs partiels
respectifs n1 , · · · , nk , on peut représenter cette série par un tableau du type suivant:

Valeurs xi x1 x2 ··· xk
Effectifs ni n1 n2 ··· nk

Le graphe associé à cette distribution est le diagramme en bâtons qui est un ensemble de barres
verticales (bâtons) correspondant aux valeurs de la variable et dont la hauteur est proportionnelle
à la fréquence de la valeur considérée. Les valeurs de la variable sont notées en abscisses et les
fréquences (ou effectifs) en ordonnées. La courbe obtenue en joignant par des segments de droite
les extrémités des bâtons est appelée le polygône des effectifs.

Exemple: Le gérant d’un magasin vendant des articles de consommation courante a relevé
6 CHAPTER 1. NOTIONS DE BASE ET VOCABULAIRE STATISTIQUE

pour un article particulier qui semble connaı̂tre une très forte popularité, le nombre d’articles
vendus par jour. Son relevé a porté sur les ventes des mois de Mars et Avril, ce qui correspond à
52 jours de vente. Le relevé des observations se présente comme suit:
P
Nombres d’article xi 5 6 7 8 9 10 11 12 13 14 15 16
Effectifs ni 3 1 3 4 7 5 8 8 3 6 3 1 52
On veut représenter cette distribution sous la forme d’un diagramme en bâtons. À chaque valeur

Figure 1.3: Diagramme en bâtons

xi correspond un bâton. Les hauteurs des bâtons sont proportionnelles aux effectifs ni .

1.2.3 Cas d’une variable Quantitative continue


Le nombre de valeurs est encore élevé et la lecture du tableau peu commode. On peut encore
simplifier la restriction des données. Il suffit de créer des classes et de compter l’effectif de chaque
classe. Cette représentation sera obligatoirement choisie s’il s’agit d’une variable continue. Les k
classes sont alors disjointes et leur réunion recouvre la totalité des valeurs possibles. On les note
généralement [ei ; ei+1 [. Par convention la borne supérieure est exclue de cette classe, sauf pour la
dernière classe (la dernière classe peut être fermée). Le nombre ni est l’effectif de la ieme classe.
On appelle centre d’une classe [ei , ei+1 [ la valeur ci = ei +e2 i+1 et l’amplitude de cette classe est
notée ai , telle que: ai = ei+1 − ei .
D’une manière générale une série statistique classée peut se représenter à l’aide d’un tableau du
type suivant:

Classes [e1 , e2 [ [e2 , e3 [ ··· [ek , ek+1 [


Effectifs ni n1 n2 ··· nk

Remarque 3. Il est parfois difficile de préciser les classes extrêmes, on utilise souvent des
classes ouvertes “plus de” ou “moins de” qui ne possèdent pas de centre de classe. En l’absence
d’informations complémentaires, on prendra alors comme centre un nombre situé à une demi
amplitude de la borne de cette classe ouverte.

Remarque 4. Dans le cas où les classes sont d’amplitudes différentes, on choisit pour la classe
ouverte l’amplitude de la classe voisine.
1.2. TABLEAUX STATISTIQUES ET REPRÉSENTATIONS GRAPHIQUES 7

Dans le cas de la variable continue, le graphique est appelé histogramme. On trace des rect-
angles qui ont comme largeur l’amplitude de la classe mesurée sur l’axe des abscisses et dont les
aires sont proportionnelles aux effectifs partiels (ni ) (ou aux fréquences fi ).

Important: Les hauteurs des différents rectangles ne sont pas proportionnelles aux effectifs
partiels (sauf si les classes ont la même amplitude) mais les aires doivent l’être.

Remarque 5. Si les classes ont la même amplitude, on peut retrouver le polygône des effectifs
(ou des fréquences) en prenant comme valeur pour chaque élément de la classe le centre.

Dans le cas où les amplitudes sont différentes, pour tracer l’histogramme on utilise la méthode
des effectifs rectifiés, qui consiste à multiplier l’effectif de chaque classe par le rapport entre
l’amplitude de la plus petite classe sur l’amplitude de la classe considérée, on obtient ainsi les
effectifs rectifiés noté:
la plus petite amplitude
ni 0 = ni ×
l’amplitude de la classe i
On peut aussi représenter l’histogramme autrement, en utilisant comme hauteurs des rectan-
gles les quantités naii ou afii .

Règle de STURGES: Cette règle est utilisée pour déterminer le nombre de classes à utiliser
pour représenter une variable statistique continue.
Le nombre de classes est égal à l’entier le plus proche de la quantité: 1 + 3, 3 log n . Par exemple,
pour un échantillon de taille n=200, on doit utiliser 1 + 3, 3 log 200 = 8, 59 ' 9 classes.
L’amplitude constante de ces classes sera égale à:
Xmax − Xmin
a=
nombre de classes
.
Exemple: Dans une gare routière, on évalue le temps d’attente des voyageurs en minutes. on
a obtenu les données suivantes:.

Classes [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[
Effectifs ni 50 100 250 150 100 50

Figure 1.4: Histogramme des effectifs

Vous aimerez peut-être aussi