Académique Documents
Professionnel Documents
Culture Documents
I / Introduction
II / Terminologie.
Le statisticien, quelle que soit sa spécialité, utilise les expressions rappelant qu’à l’origine,
la statistique consistait surtout en l’observation et la description de collectivités humaines:
Un caractère est ce que l’on observe sur l’individu. Il varie d’un individu à l’autre; on
l’appelle variable statistique, noté X, Y, Z……Les modalités, sont les spécificités du
caractère .
Dans notre exemple :
Population : les 20000 étudiants de l’USTHB= {Y1, …, Y20000}
Individu : étudiant
Echantillon : par ex. {y1, …, y30}
Caractère : sexe qui a2 modalités : Masculin et Féminin
ex : X= le nombre de filles dans une famille de 3 enfants alors les modalités sont 0, 1, 2, 3
ii) Un caractère quantitatif est continu lorsque ses modalités prennent des valeurs
réelles appartenant à un intervalle de R
Remarque : Tout ce qui peut être mesuré avec un instrument de mesure est considéré comme
continu
ii) Un caractère qualitatif est nominal lorsque on ne peut pas mettre un ordre sur ses
modalités
ex : Les modalités Masculin(M) et Féminin (F)du caractère sexe ne peuvent être ordonnées
CARACTERE ou VARIABLE:
(mesuré sur chaque individu et noté X )
QUALITATIF QUANTITATIF
EXERCICE 1
Classer les caractères suivants, selon qu’ils sont quantitatifs discrets, quantitatifs continus ou
qualitatifs : (mettre une croix dans la colonne correspondante) en donnant à chaque fois un
exemple de modalité. (Voir l’exemple de l’âge)
EXERCICE 2
(Elaboration d’une base de données statistiques)
Après avoir choisi quelques caractères, par exemple : Age, Taille, Poids, Nombre de frères et
soeurs, Lieu de résidence, Loisirs, …, (au moins un quantitatif discret, un quantitatif continu,
un qualitatif). Un tour de table permettra de remplir le tableau suivant, la première colonne
demeurant anonyme.
34
35
L’objet des statistiques est d’étudier des caractères (ou des variables) sur des individus.
La récolte initiale des données conduit à un tableau brut. Comme le tableau 1 précédent.
Ce tableau brut se met sous la forme suivante (Tableau A)
Individu variable
1 X1 Modalité effectif
2 X2 x1 n1
. . x2 n2
. . . .
. . . .
n Xn . .
xk nk
Tableau A Tableau B
Une série statistique est l’ensemble des couples (xi , ni), i=1,…,k où k est le nombre de
modalités. Elle est présentée sous forme d’un tableau. (Comme dans l’exemple suivant)
i
On appelle fréquence cumulée en xi , le nombre f icum f ic f1 f 2 f i f
j 1
j
De même on a f kc 1 et f 1c f 1 , et f ic f ( i 1 ) c f i , i 2,....., n
Remarque : toutes ces informations peuvent être résumées dans un tableau appelé tableau de
distribution de la variable.
Pour les différents caractères de l’exemple, il y a 6 séries statistiques.
xi H F Total
i=1,2
ni 20 10 30
fi 0.67 0.33 1
Modalités
xi L M D Total
ni 13 14 3 30 i= 1,2,3
fi 0.43 0.47 0.1 1
3) Nombre de frères et soeurs: quantitatif discret.
i xi ni nic fi fic
1 1 2 2 0.07 0.7
2 2 6 8 0.20 0.27
3 3 12 20 0.40 0.67
4 4 8 28 0.26 0.93
5 5 2 30 0.07 1
30 1
4) Revenus des parents : quantitatif continu.
Il y a lieu de distinguer entre variable discrète et variable classée (regroupées en classes).
Lorsque les modalités d'une variable discrète sont trop nombreuses, il est préférable de
regrouper des modalités pour obtenir une variable classée afin que les tableaux synthétisent
l'information et restent lisibles. Une variable continue est une variable classée. La répartition
des données se fait alors sous forme de regroupement en classes des données voisines. Nous
ne considèrerons que le regroupement en classes de même amplitude, comme suit :
Les classes sont des intervalles fermés à gauche et ouverts à droite, contiguës (adjacentes)
mais qui ne se chevauchent pas. [a0, a1 [ , [a1, a2 [ , [a2, a3 [, ……..,[ak-1, ak [
En général, a0 = Xmin . La dernière classe peut être fermée à droite.
Soit k, le nombre de classes. Alors le nombre de classes à prendre est donné par :
k= E[5log n] (ou bien k = n si n ≤ 50), où n est la taille de la série brute.
Soit a = amplitude de classe (longueur de l’intervalle) et E = étendue de la série = Xmax - Xmin
E E
Alors a = . On prendra le plus petit a, convenable, tel que a ≥
k k
Pour notre exemple des revenus, on a n = 30, et k = n = 30 = 5,48 . On prend k ≈ 5
E 88529
E= xmax - xmin = 102589 -14060 = 88529 ; ainsi, a = = 17705,8 20000 .
k 5
On pourrait prendre a0 = 10000, d’où le tableau de distribution de la variable
«
Revenus »
Classes xi ni nic fi fic
[10000-30000[ 20000 12 12 0.400 0.400
[30000-50000[ 40000 9 21 0.300 0.700
[50000-70000[ 60000 4 25 0.133 0.833
[70000-90000[ 80000 3 28 0.100 0.933
[90000-110000] 100000 2 30 0.067 1
Total 30 1
Le tableau ci-dessus résume toutes les données. A remarquer, que dans le cas d’un caractère
continu le rôle des modalités xi est joué par le centre des classes.
5) Age : quantitatif continu (discret regroupé en classes).
Classes xi ni nic fi fic
[17-19[ 18 5 5 0.167 0.167
[19-21[ 20 5 10 0.167 0.334
[21-23[ 22 9 19 0.300 0.634
[23-25[ 24 7 26 0.233 0.867
[25-27] 26 4 30 0.133 1
Total 30 1
6) Ancienneté : quantitatif continu (discret regroupé en classes).
V/ Représentations graphiques
A. Représentations Graphiques d’une série statistique quantitative :
a) Cas discret
Soit X une variable statistique prenant les modalités x1 , x 2 , , x k avec les effectifs
correspondants n1 , n2 , , n k ou les fréquences correspondantes f1 , f 2 ,, f k .
(1) Le diagramme en bâtons:
C’est la représentation sur un graphe du tableau de distribution en mettant en abscisse les
valeurs xi, en ordonnés les effectifs (ou les fréquences) correspondant(e)s et en traçant une
ligne verticale à partir de xi jusqu’à ni (ou fi).
Exemple 1 : Variable « nombre de frères et soeurs »
Effectif ni
1 2 3 4 5 xi
xi ni nic
1 2 2
2 6 8
3 12 20
4 8 28
5 2 30
30
(1) L’Histogramme:
C’est la représentation sur un repère de la série en portant en abscisses les classes (toutes de
même amplitude) et en ordonnés les effectifs (ou les fréquences) et en traçant un rectangle
ayant pour base la classe [ai , ai+1 [ et pour hauteur l’effectif (ou la fréquence )
correspondant(e).
Exemple 2 : variable « Âge »
Effectif
17 19 21 23 25 27 xi
(2) Le polygone de fréquences
Est obtenu en joignant les milieux des sommets des rectangles de l’histogramme par une ligne
brisée. On projettera les milieux du premier et du dernier des sommets respectivement sur les
a a
point ( a 0 ,0 ) et ( a k ,0 )
2 2
Mme YAHI - 10 -
STATISTIQUE
- les modalités de la variable sont placées sur une droite horizontale (attention: ne pas
orienter cette droite car les modalités ne sont pas mesurables et il n'y a donc pas de relation
d'ordre entre elles.
- les effectifs (ou les fréquences) sont placés sur un axe vertical. La hauteur du tuyau est
proportionnelle à l'effectif.
Attention: les tuyaux ont une certaine épaisseur pour qu'il n'y ait pas de confusion avec les
diagrammes en bâtons réservés à la variable quantitative discrète.
On représente chaque modalité par un rectangle de base commune et de hauteur égale à son
effectif ou sa fréquence.
16
14
12
10
8 B
6
A
2 C
0
Mme YAHI - 11 -
STATISTIQUE
D
10% L
43%
M
47%
Mme YAHI - 12 -