Académique Documents
Professionnel Documents
Culture Documents
Statistique descriptive
Chapitre I
1 Définition
1.1 Population et échantillon
Lorsqu’on veut étudier les données concernant les caractéristiques d’un groupe d’individus
ou d’objets, comme la taille et le poids des étudiants ou le nombre de boulons, défectueux
ou non défectueux, fabriqué dans une usine donné, il est souvent impossible ou peut pratique
d’observer le groupe dans sa totalité, surtout s’il est très grand. Au lieu d’examiner le groupe
dans son ensemble, appelé population ou univers, on examine une petite partie du groupe,
appelée échantillon. Si l’échantillon est représentatif, i.e pris au hasard, son analyse permet
souvent de dégager des conclusions pertinentes sur la population.
Une population peut-être finie ou infinie. Par exemple, la population constituée de tous les
boulons produits dans une usine un jour donné est finie, tandis que la population consistant
en tous les résultats possibles (pile, face) lors des lancers d’une pièce est infinie.
1
etc..., la variable indiquant l’age des individus a comme modalités les différentes nombres
représentant les ages possibles des individus formant la population étudiée.
Comme certaines méthodes statistiques s’appliquent à quelque types de caractères et pas à
d’autres, il est nécessaire de distinguer les différentes sortes de variables : les variables qualita-
tives d’une part et las variables quantitatives d’autre part ; et parmi les variables quantitatives,
les variables continues et les variables discrètes.
Une variable est quantitative si ses diverses modalités sont mesurables c’est-à-dire, s’il est
possible de faire correspondre un nombre à chaque modalité. Par exemple l’age, la température,
le revenu, le nombre de membres d’une famille sont toutes des variables quantitatives.
Variables discrètes
Une variable quantitative est discrète si l’étendue des valeurs possibles est dénombrable, c’est-
à-dire si les valeurs peuvent être énumérées sous la forme d’une liste (a1 , a2 , . . .). Par exemple,
le nombre d’enfants dans une famille ; le nombre de mots dans une phrase, le nombre d’acci-
dents survenu dans une journée.
Variables continues
Une variable quantitative est continu si les valeurs possibles ne sont pas dénombrables. L’en-
sembles de ces valeurs est constitué par la totalité de l’intervalle défini selon l’étendue de
la variable. Par exemple le poids d’un nouveau né ; la longueur d’une table ; le volume d’un
chargement.
Une variable est qualitative si ses diverses modalités ne sont pas mesurables. Par exemple,
la variable sexe qui a pour modalités homme et femme , la variable couleur de l’arc-en-
ciel qui a les modalités rouge , jaune , vert , indigo et violet . Les modalités
des variables qualitatives sont donc non numériques.
2 Série statistiques
Considérons une variable x avec k modalités m1 , m2 , . . . , mk observées pour un échantillon
de taille n c’est-à-dire ayant n individus. Désignons par n1 le nombre d’individus ayant pour
modalité m1 , n2 le nombre d’individus ayant pour modalité m2 et ainsi de suite. Les nombres
ainsi obtenus, appelés effectifs ou fréquences, indiquent la répartition des effectifs concer-
nant la variable x. Leur somme est égale au nombre total des individus de l’échantillon,
n1 + n2 + · · · + nn = n.
La répartition des effectifs donnée en termes absolus peut-être définit en termes relatifs,
c’est-à-dire en % ou en fractions. Le résultat est appelée distribution de fréquences.
2
La fréquence relative d’une modalité mi , i = 1, . . . , k, est défini par le rapport :
ni
fi = , i = 1, . . . , k.
n
L’ensemble des ratios f1 , . . . , fk calculés pour les différentes modalités de la variable x est
appelée distribution des fréquences.
Il est clair que la somme des fréquences relatives est égale à l’unité :
f1 + f2 + · · · + fk = 1.
Modalités Effectifs
m1 n1
.. ..
. .
mk nk
Total n
D’autres colonnes peuvent le compléter au fur et à mesure que le traitement statistique
se développe. Le tableau obtenu s’appelle tableau statistique.
3
Classes Effectifs
[e1 , e2 [ n1
.. ..
. .
[ei−1 , ei [ ni
.. ..
. .
[ek−1 , ek [ nk
Total n