Vous êtes sur la page 1sur 12

STATISTIQUE

STATISTIQUE DESCRIPTIVE SIMPLE

I / Introduction

Il n’est pas facile de définir de manière précise et complète la STATISTIQUE.


Historiquement, à l’origine, la statistique a fourni des renseignements sur la
″population″ au sens propre du terme : nombre, répartition par âge, par sexe,
selon l’état matrimonial, la profession, le lieu de résidence… .
De nos jours, les méthodes statistiques sont utilisées dans tous les domaines :
démographie, économie, médecine, épidémiologie, agronomie, industrie,
gestion, contrôle de qualité, sociologie, sondages d’opinion, linguistique,
éducation, psychologie et tellement d’autres.

But de l’Etude Statistique :

- Savoir présenter des données, les décrire et les résumer.


- Savoir dégager, assez rapidement, un certain nombre de renseignements sur
le phénomène décrit par les données.
- Savoir tirer des conclusions sur des populations à partir de calculs conduits
sur des échantillons.
- Savoir faire de “bonnes” prévisions.

II / Terminologie.

Exemple d’un Tableau de Données: (Tableau 1)


Parmi les étudiants d’une certaine université, on a relevé pour 30 d’entres eux,
les données suivantes :

1. Revenus des parents (en DA)


2. Sexe (Homme, Femme)
3. Âge (en années)
4. Ancienneté (en années)
5. Palier d’étude (L, M ou D)
6. Nombre de frères et sœurs.

Mme YAHI -1-


STATISTIQUE

Revenus Sexe Age Anc. Palier Nbre F/S


29472 F 21 2 L 3
21629 M 18 1 L 4
21088 M 20 2 L 3
21369 M 21 4 M 5
20240 F 18 1 L 1
72696 M 23 5 M 2
67580 M 20 3 L 3
37580 M 19 1 L 4
60096 F 22 5 M 3
45900 M 25 7 M 2
19613 M 24 6 M 4
29472 F 27 10 D 4
34060 M 21 2 L 5
25176 M 26 9 D 4
21371 M 18 1 L 2
79356 F 24 6 M 3
57532 M 21 3 L 3
14060 F 23 4 M 4
32513 M 27 8 D 3
41871 F 22 4 M 3
39536 M 19 2 L 2
89553 F 24 5 M 4
23406 M 22 5 M 4
45789 M 18 1 L 1
56213 F 24 6 M 2
23489 M 20 3 L 3
36457 M 22 5 M 3
102589 F 17 1 L 3
95547 M 21 4 M 3
33563 M 23 5 M 2

Le statisticien, quelle que soit sa spécialité, utilise les expressions rappelant qu’à l’origine,
la statistique consistait surtout en l’observation et la description de collectivités humaines:

POPULATION - INDIVIDU – ECHANTILLON – CARACTERE

La population est l’ensemble de référence. C’est l’ensemble étudié, noté en général  .

La taille de la population représente le nombre d’individus de la population. C’est le cardinal


de l’ensemble  , noté│  │. │  │= N

L’individu est une unité statistique. C’est un élément de la population


Un échantillon est un sous-ensemble de la population. La taille de l’échantillon est notée n
avec n  N

Mme YAHI -2-


STATISTIQUE

Un caractère est ce que l’on observe sur l’individu. Il varie d’un individu à l’autre; on
l’appelle variable statistique, noté X, Y, Z……Les modalités, sont les spécificités du
caractère .
Dans notre exemple :
Population : les 20000 étudiants de l’USTHB= {Y1, …, Y20000}
Individu : étudiant
Echantillon : par ex. {y1, …, y30}
Caractère : sexe qui a2 modalités : Masculin et Féminin

Dans cet exemple, il y a 6 caractères différents:


Revenu, Sexe, Age, Ancienneté, Palier d’étude, Nombre de frères et sœurs.

III/ Nature d’un caractère

a. Un Caractère est quantitatif si ses modalités sont mesurables

i) Un caractère quantitatif est discret ou discontinu lorsque ses modalités sont


discrètes. On notera alors les modalités du caractère X par  x1 , x 2 , ....., x k  avec la
convention x1 < x 2 <……< x k k étant le nombre de modalités du caractère

ex : X= le nombre de filles dans une famille de 3 enfants alors les modalités sont 0, 1, 2, 3

ii) Un caractère quantitatif est continu lorsque ses modalités prennent des valeurs
réelles appartenant à un intervalle de R

ex  : le poids, la taille, la glycémie,….

Remarque  : Tout ce qui peut être mesuré avec un instrument de mesure est considéré comme
continu

b. Un Caractère est qualitatif si ses modalités ne sont pas mesurables


c.
i) Un caractère qualitatif est ordinal lorsque ses modalités peuvent être ordonnées.
ex  : Le caractère l’intensité d’une douleur peut être faible, moyenne ou forte

ii) Un caractère qualitatif est nominal lorsque on ne peut pas mettre un ordre sur ses
modalités
ex  : Les modalités Masculin(M) et Féminin (F)du caractère sexe ne peuvent être ordonnées

CARACTERE ou VARIABLE:
(mesuré sur chaque individu et noté X )

QUALITATIF QUANTITATIF

Ordinal Nominal Discret Continu

Mme YAHI -3-


STATISTIQUE

Ex: (Palier: L, M, D) (Sexe: H, F) (nbre de F/S) (Age, Anc., Rev.)

EXERCICE 1

Classer les caractères suivants, selon qu’ils sont quantitatifs discrets, quantitatifs continus ou
qualitatifs : (mettre une croix dans la colonne correspondante) en donnant à chaque fois un
exemple de modalité. (Voir l’exemple de l’âge)

Caractères Quantitatif Discret Quantitatif Continu Qualitatif


Age X 20 ans
Taille
Poids
Sexe
Nom
Année de naissance
Lieu de naissance
Nationalité
Nombre d’enfants
Nombre de pièces (logement)
Catégorie socioprofessionnelle
Salaire
Note à un examen
Taille d’un vêtement
Pointure de chaussures
Groupe sanguin
Couleur des cheveux

Mme YAHI -4-


STATISTIQUE

EXERCICE 2
(Elaboration d’une base de données statistiques)

POPULATION = Etudiants de l’EFTG. ECHANTILLON = Groupe


INDIVIDUS = Les étudiants présents à la séance EFFECTIF = Nombre de présents =

Après avoir choisi quelques caractères, par exemple : Age, Taille, Poids, Nombre de frères et
soeurs, Lieu de résidence, Loisirs, …, (au moins un quantitatif discret, un quantitatif continu,
un qualitatif). Un tour de table permettra de remplir le tableau suivant, la première colonne
demeurant anonyme.

Individu Age Taille Poids Nbre F/S Loisirs Résidence


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

Mme YAHI -5-


STATISTIQUE

34
35

IV/ Tableaux statistiques

L’objet des statistiques est d’étudier des caractères (ou des variables) sur des individus.
La récolte initiale des données conduit à un tableau brut. Comme le tableau 1 précédent.
Ce tableau brut se met sous la forme suivante (Tableau A)
Individu variable
1 X1 Modalité effectif
2 X2 x1 n1
. . x2 n2
. . . .
. . . .
n Xn . .
xk nk

Tableau A Tableau B

Cependant, le nombre d’individus observés étant en général important, ce tableau (A) ne


permet pas d’analyser l’information obtenue. Il est donc nécessaire de créer un tableau
(tableau B), plus synthétique, où les observations identiques (possédant la même modalité)
ont été regroupées.
Ainsi, après avoir mis en ordre les résultats obtenus au cours de l’étude d’un caractère X,
mesuré sur les membres d’une population, une série statistique se présente sous la forme d’un
ensemble de valeurs xi représentant les différentes modalités du caractère. Ces valeurs xi
peuvent se répéter, chacune un nombre ni de fois.

Une série statistique est l’ensemble des couples (xi , ni), i=1,…,k où k est le nombre de
modalités. Elle est présentée sous forme d’un tableau. (Comme dans l’exemple suivant)

On appelle effectif de la modalité xi, le nombre ni d’individus pour lesquels le caractère X


prend la valeur xi.
k
On a n
i 1
i n

On appelle effectif cumulé en xi , le nombre nicum  nic  n1  n2    ni   n j


j 1

On a n kc  n et n1c  n1 . nic  n(i  1 ) c  ni ,  i  2,....., n


ni
On appelle fréquence de xi , le nombre fi 
n
k
On a f
i 1
i 1 et 0  fi  1

i
On appelle fréquence cumulée en xi , le nombre f icum  f ic  f1  f 2    f i  f
j 1
j

De même on a f kc  1 et f 1c  f 1 , et f ic  f ( i  1 ) c  f i ,  i  2,....., n

Mme YAHI -6-


STATISTIQUE

Remarque : toutes ces informations peuvent être résumées dans un tableau appelé tableau de
distribution de la variable.
Pour les différents caractères de l’exemple, il y a 6 séries statistiques.

1) Sexe: qualitatif nominal

xi H F Total
i=1,2
ni 20 10 30
fi 0.67 0.33 1

Modalités

2) Palier d’études: qualitatif ordinal

xi L M D Total
ni 13 14 3 30 i= 1,2,3
fi 0.43 0.47 0.1 1
3) Nombre de frères et soeurs: quantitatif discret.
i xi ni nic fi fic
1 1 2 2 0.07 0.7
2 2 6 8 0.20 0.27
3 3 12 20 0.40 0.67
4 4 8 28 0.26 0.93
5 5 2 30 0.07 1
 30 1
4) Revenus des parents : quantitatif continu.
Il y a lieu de distinguer entre variable discrète et variable classée (regroupées en classes).
Lorsque les modalités d'une variable discrète sont trop nombreuses, il est préférable de
regrouper des modalités pour obtenir une variable classée afin que les tableaux synthétisent
l'information et restent lisibles. Une variable continue est une variable classée. La répartition
des données se fait alors sous forme de regroupement en classes des données voisines. Nous
ne considèrerons que le regroupement en classes de même amplitude, comme suit :

Les classes sont des intervalles fermés à gauche et ouverts à droite, contiguës (adjacentes)
mais qui ne se chevauchent pas. [a0, a1 [ , [a1, a2 [ , [a2, a3 [, ……..,[ak-1, ak [
En général, a0 = Xmin . La dernière classe peut être fermée à droite.
Soit k, le nombre de classes. Alors le nombre de classes à prendre est donné par :
k= E[5log n] (ou bien k = n si n ≤ 50), où n est la taille de la série brute.
Soit a = amplitude de classe (longueur de l’intervalle) et E = étendue de la série = Xmax - Xmin
E E
Alors a = . On prendra le plus petit a, convenable, tel que a ≥
k k
Pour notre exemple des revenus, on a n = 30, et k = n = 30 = 5,48 . On prend k ≈ 5

Mme YAHI -7-


STATISTIQUE

E 88529
E= xmax - xmin = 102589 -14060 = 88529 ; ainsi, a = =  17705,8  20000 .
k 5
On pourrait prendre a0 = 10000, d’où le tableau de distribution de la variable
«
 Revenus »
Classes xi ni nic fi fic
[10000-30000[ 20000 12 12 0.400 0.400
[30000-50000[ 40000 9 21 0.300 0.700
[50000-70000[ 60000 4 25 0.133 0.833
[70000-90000[ 80000 3 28 0.100 0.933
[90000-110000] 100000 2 30 0.067 1
Total 30 1
Le tableau ci-dessus résume toutes les données. A remarquer, que dans le cas d’un caractère
continu le rôle des modalités xi est joué par le centre des classes.
5) Age : quantitatif continu (discret regroupé en classes).
Classes xi ni nic fi fic
[17-19[ 18 5 5 0.167 0.167
[19-21[ 20 5 10 0.167 0.334
[21-23[ 22 9 19 0.300 0.634
[23-25[ 24 7 26 0.233 0.867
[25-27] 26 4 30 0.133 1
Total 30 1
6) Ancienneté : quantitatif continu (discret regroupé en classes).

V/ Représentations graphiques
A. Représentations Graphiques d’une série statistique quantitative :
a) Cas discret
Soit X une variable statistique prenant les modalités x1 , x 2 ,  , x k avec les effectifs
correspondants n1 , n2 , , n k ou les fréquences correspondantes f1 , f 2 ,, f k .
(1) Le diagramme en bâtons:
C’est la représentation sur un graphe du tableau de distribution en mettant en abscisse les
valeurs xi, en ordonnés les effectifs (ou les fréquences) correspondant(e)s et en traçant une
ligne verticale à partir de xi jusqu’à ni (ou fi).
Exemple 1 : Variable « nombre de frères et soeurs »

Effectif ni

Mme YAHI -8-


STATISTIQUE

1 2 3 4 5 xi

(2) Le polygone de fréquences


Est obtenu en joignant les sommets des bâtons du diagramme en bâtons par une ligne brisée.

(3) Le diagramme cumulatif


Est obtenu en joignant les bâtons cumulés ligne en escalier.

Exemple 1: X = Variable « nombre de frères et soeurs » Tracer le diagramme cumulatif

xi ni nic
1 2 2
2 6 8
3 12 20
4 8 28
5 2 30
30

b) Cas continu (série donnée en classes)


Soit X une variable statistique donnée en classes [a0, a1[,[a1, a2[, ……….…., [ak-1, ak[ avec
les effectifs correspondants n1 , n2 , , n k ou les fréquences correspondantes f1 , f 2 ,, f k .

(1) L’Histogramme:
C’est la représentation sur un repère de la série en portant en abscisses les classes (toutes de
même amplitude) et en ordonnés les effectifs (ou les fréquences) et en traçant un rectangle
ayant pour base la classe [ai , ai+1 [ et pour hauteur l’effectif (ou la fréquence )
correspondant(e).
Exemple 2 : variable « Âge »

Effectif

Mme YAHI -9-


STATISTIQUE

17 19 21 23 25 27 xi
(2) Le polygone de fréquences
Est obtenu en joignant les milieux des sommets des rectangles de l’histogramme par une ligne
brisée. On projettera les milieux du premier et du dernier des sommets respectivement sur les
a a
point ( a 0  ,0 ) et ( a k  ,0 )
2 2

(3) La courbe cumulative


Est obtenu en joignant les points ayant pour abscisses les bornes supérieures de classes et pour
ordonnées les effectifs cumulés correspondants ou les fréquences cumulées correspondantes.
On projettera le premier point ainsi obtenu sur le point ( a 0 ,0 )
Exemple 2 : variable « Âge ». Tracer la courbe cumulative

B. Représentations Graphique d’une série statistique qualititative: 


a) Représentation en tuyaux d’orgues (ou diagramme en barre ou diagramme àbandes)

Mme YAHI - 10 -
STATISTIQUE

- les modalités de la variable sont placées sur une droite horizontale (attention: ne pas
orienter cette droite car les modalités ne sont pas mesurables et il n'y a donc pas de relation
d'ordre entre elles.
- les effectifs (ou les fréquences) sont placés sur un axe vertical. La hauteur du tuyau est
proportionnelle à l'effectif.
Attention: les tuyaux ont une certaine épaisseur pour qu'il n'y ait pas de confusion avec les
diagrammes en bâtons réservés à la variable quantitative discrète.
On représente chaque modalité par un rectangle de base commune et de hauteur égale à son
effectif ou sa fréquence.

16

14
12

10
8 B
6
A

2 C
0

Licence Master Doctorat


Représentation en tuyaux d’orgues de la variable « palier »

b) Diagramme en secteurs circulaires

- L'effectif total est représenté par un disque.


- Chaque modalité est représentée par un secteur circulaire dont la surface (donc l'angle au
centre)  i , est proportionnelle à l'effectif correspondant.
On calcule pour chaque modalité du caractère, la valeur de l’angle au centre associé, valeur
qui est proportionnelle à la fréquence. On aura  i  f i  360 :
Exemple : Palier d’étude
Xi ni fi i
L 13 0.43 154.8°
M 14 0.47 169.2°
D 3 0.10 36°
Total 30 1 360°

Mme YAHI - 11 -
STATISTIQUE

D
10% L
43%
M
47%

Remarque : Théoriquement le diagramme à secteurs représente un caractère qualitatif


nominal et le diagramme à bandes un caractère qualitatif ordinal, mais dans la pratique on
utilise souvent le diagramme à bandes pour représenter un caractère nominal car plus facile à
dessiner

Mme YAHI - 12 -

Vous aimerez peut-être aussi