Vous êtes sur la page 1sur 4

Première partie

Statistique descriptive

La statistique descriptive a pour but de synthétiser, résumer, structurer l’information


contenue dans les données. Elle utilise pour cela des représentations des données sous forme
de tableaux, de graphiques, d’indicateurs numériques.

Chapitre I

Généralités sur les séries statistiques

1 Définition
1.1 Population et échantillon
Lorsqu’on veut étudier les données concernant les caractéristiques d’un groupe d’individus
ou d’objets, comme la taille et le poids des étudiants ou le nombre de boulons, défectueux
ou non défectueux, fabriqué dans une usine donné, il est souvent impossible ou peut pratique
d’observer le groupe dans sa totalité, surtout s’il est très grand. Au lieu d’examiner le groupe
dans son ensemble, appelé population ou univers, on examine une petite partie du groupe,
appelée échantillon. Si l’échantillon est représentatif, i.e pris au hasard, son analyse permet
souvent de dégager des conclusions pertinentes sur la population.
Une population peut-être finie ou infinie. Par exemple, la population constituée de tous les
boulons produits dans une usine un jour donné est finie, tandis que la population consistant
en tous les résultats possibles (pile, face) lors des lancers d’une pièce est infinie.

1.2 Déscription d’un échantillon


On appelle individu ou unité statistique chaque élément de la population. Chaque indi-
vidu peut-être étudié relativement à un ou plusieurs caractéristiques. Ces caractéristiques
sont appelées caractères, ou variables. Chaque variable peut présenter plusieurs modalités.
Par exemple, la variable décrivant la couleur des yeux a les modalités noirs, bruns, verts,

1
etc..., la variable indiquant l’age des individus a comme modalités les différentes nombres
représentant les ages possibles des individus formant la population étudiée.
Comme certaines méthodes statistiques s’appliquent à quelque types de caractères et pas à
d’autres, il est nécessaire de distinguer les différentes sortes de variables : les variables qualita-
tives d’une part et las variables quantitatives d’autre part ; et parmi les variables quantitatives,
les variables continues et les variables discrètes.

1.2.1 Variables quantitatives

Une variable est quantitative si ses diverses modalités sont mesurables c’est-à-dire, s’il est
possible de faire correspondre un nombre à chaque modalité. Par exemple l’age, la température,
le revenu, le nombre de membres d’une famille sont toutes des variables quantitatives.

Variables discrètes
Une variable quantitative est discrète si l’étendue des valeurs possibles est dénombrable, c’est-
à-dire si les valeurs peuvent être énumérées sous la forme d’une liste (a1 , a2 , . . .). Par exemple,
le nombre d’enfants dans une famille ; le nombre de mots dans une phrase, le nombre d’acci-
dents survenu dans une journée.

Variables continues
Une variable quantitative est continu si les valeurs possibles ne sont pas dénombrables. L’en-
sembles de ces valeurs est constitué par la totalité de l’intervalle défini selon l’étendue de
la variable. Par exemple le poids d’un nouveau né ; la longueur d’une table ; le volume d’un
chargement.

1.2.2 Variables qualitatives

Une variable est qualitative si ses diverses modalités ne sont pas mesurables. Par exemple,
la variable sexe qui a pour modalités  homme et  femme , la variable couleur de l’arc-en-
ciel qui a les modalités  rouge ,  jaune , vert , indigo et  violet . Les modalités
des variables qualitatives sont donc non numériques.

2 Série statistiques
Considérons une variable x avec k modalités m1 , m2 , . . . , mk observées pour un échantillon
de taille n c’est-à-dire ayant n individus. Désignons par n1 le nombre d’individus ayant pour
modalité m1 , n2 le nombre d’individus ayant pour modalité m2 et ainsi de suite. Les nombres
ainsi obtenus, appelés effectifs ou fréquences, indiquent la répartition des effectifs concer-
nant la variable x. Leur somme est égale au nombre total des individus de l’échantillon,
n1 + n2 + · · · + nn = n.

Les couples (mi , ni ), i = 1, . . . , k forment une suite appelée série statistique.

La répartition des effectifs donnée en termes absolus peut-être définit en termes relatifs,
c’est-à-dire en % ou en fractions. Le résultat est appelée distribution de fréquences.

2
La fréquence relative d’une modalité mi , i = 1, . . . , k, est défini par le rapport :
ni
fi = , i = 1, . . . , k.
n
L’ensemble des ratios f1 , . . . , fk calculés pour les différentes modalités de la variable x est
appelée distribution des fréquences.
Il est clair que la somme des fréquences relatives est égale à l’unité :

f1 + f2 + · · · + fk = 1.

2.1 Séries statistiques dans le cas d’une variable discrète


Un travail statistique débute par l’observation sur chaque individu de l’échantillon de
la modalité auquel il se rattache. Après quoi, commence le traitement statistique dont la
première opération est un arrangement tabulaire des effectifs. Le tableau ci-contre nous offre
la répartition des effectifs.

Modalités Effectifs
m1 n1
.. ..
. .
mk nk
Total n
D’autres colonnes peuvent le compléter au fur et à mesure que le traitement statistique
se développe. Le tableau obtenu s’appelle tableau statistique.

2.2 Séries statistiques dans le cas d’une variable continue


Lorsqu’on considère les différentes valeurs de la variable valeur par valeur et quand on les
traite isolément on aura de cette manière admis que la variable est discrète, mais si on répartis
l’étendue en intervalles et que l’on a alors la variable est considéré continu. Dans ce cas, on
subdivise l’étendue parcouru par la variable en intervalles disjoints qui le recouvre en entier,
ces intervalles sont les modalités de la variable et les appelles les classes. Par exemple la classe
numéro i est l’intervalle [ei − ei−1 [. Dans le cas d’une variable continue le nombre de valeurs
distinctes est en principe infini. Pour éviter une répartition des effectifs trop dispersée, pour
permettre une étude commode, on constitue des classes en divisant l’étendue de la série en
un certain nombre d’intervalles contiguës et qui ne chevauchent pas. Ces intervalles, appelés
classes, sont les modalités de la variable. Ainsi, chaque classe contiendra toutes les valeurs
égales ou supérieures à sa limite inférieure mais strictement inférieure à sa limite supérieure.
La i-ème classe est alors l’intervalle [ei−1 , ei [ caractérisé par l’amplitude ai , valeur séparant
ses deux extrémités,
ai = ei − ei−1 ,
et par le centre,
ei + ei−1
ci = .
2
Le tableau statistique peut se présenter comme suit :

3
Classes Effectifs
[e1 , e2 [ n1
.. ..
. .
[ei−1 , ei [ ni
.. ..
. .
[ek−1 , ek [ nk
Total n

2.3 Séries statistiques dans le cas d’une variable qualitative


Comme pour une variable discrète, le traitement statistique consiste à dénombrer, pour
chacune des modalités mi , combien d’individus ni présentent cette modalité. Nous obtenons
un tableau statistique similaire au cas discret à la seule différence qu’ici les modalités ne sont
pas numériques.

Vous aimerez peut-être aussi