Académique Documents
Professionnel Documents
Culture Documents
Exemple d’un Tableau de données (Tableau 1): Sur les salariés d’une
petite entreprise, on a relevé pour 30 d’entres eux, les données suivantes :
1
Module statistique et probabilité 2017/2018
Vocabulaire Statistique :
Population: C’est l’ensemble étudié.
Dans l’exemple, tous les salariés de l’entreprise.
Population
::::::::::::::::::::
::::
::::::::::::::::::::::
:::::::::::::::::::::
Echantillon
Unité statistique(ou individu)
CARACTERE ou VARIABLE:
(mesuré sur chaque individu et noté Xl )
QUALITATIF QUANTITATIF
2
Module statistique et probabilité 2017/2018
Définition : Elle représente, pour chaque caractère étudié le couple formé par les
valeurs du caractère (xi) et le nombre ni (ou la fréquence fi = ni /n) d’individus qui
possèdent cette valeur du caractère.
La série ainsi définie est présentée sous forme d’un tableau comme dans l’exemple
suivant:
xi H F Total
i=1,2
ni 20 10 30
fi 0.67 0.33 1
Modalités
xi A B C Total
ni 13 14 3 30 i= 1,2,3
fi 0.43 0.47 0.1 1
xi 0 1 2 3 4 Total
ni 2 6 12 8 2 30 i= 1,2,3,4,5
fi 0.07 0.20 0.40 0.26 0.07 1
Définitions :
b) Les valeurs prises par cette variable sont appelées observations et sont notées xi.
d) Le nombre de fois que l’observation xi se répète dans les données initiales est appelé
effectif de xi, il est noté ni.
3
Module statistique et probabilité 2017/2018
Exemple (suite)
xi (ans) 1 3 4 5 6 7 8 10 Total
ni 2 2 3 8 2 1 3 9 30
ni cumulé 2 4 7 15 17 18 21 30
Remarque : En réalité, la variable Ancienneté (ainsi que les variables Âge et Salaire)
est une variable continue. Pour ce type de variable il est plus logique de présenter les
données dans des intervalles (ou classes) et de construire le tableau de distribution
correspondant.
Pour cela il faut d’abord choisir le nombre de classes à prendre pour représenter toutes
les données et déterminer la longueur (ou amplitude) de ces classes. Ce choix peut-être
arbitraire, c’est-à-dire fixé à l’avance, (voir tableau 3), ou obéir à une règle empirique,
c’es-à-dire qui dépend de l’effectif n.
Soit alors k le nombre de classes (notées [ai, ai+1 [, i = 1, … ,k) et soit amp
l’amplitude de classe, alors on choisira
k n (ATTENTION k doit être ENTIER)
(x - x )
et amp = max min
k
( l’amplitude doit être choisie de manière à ce que toutes les données soient incluses
dans le tableau.)
4
Module statistique et probabilité 2017/2018
Il faut d’abord trier les valeurs Xi par ordre croissant, et choisir une borne inférieure et
une amplitude pour construire les classes.
Ici, on a choisi (de manière arbitraire) k = 10 classes en commençant à 95500 DA.
Avec : amp = 16500 DA.
xi [30 , 34[ [34 , 38[ [38 , 42[ [42 , 46[ [46 , 50[ [50 , 54[ [54 , 58[ [58 , 62] Total
ni 2 1 3 3 9 4 6 2 30
nicum 2 3 6 9 18 22 28 30
fi 0.07 0.03 0.10 0.10 0.30 0.13 0.20 0.07 1
ficum 0.07 0.10 0.20 0.30 0.60 0.73 0.93 1.00
xi [1 , 3[ [3 , 5[ [5 , 7[ [7 , 9[ [9 , 11] Total
ni 2 5 10 4 9 30
nicum 2 7 17 21 30
fi 0.067 0.167 0.333 0.133 0.3 1
ficum 0.067 0.234 0.567 0.700 1
5
Module statistique et probabilité 2017/2018
REPRESENTATION GRAPHIQUE
effectif
12
2
2
0 1 2 3 4 xi
6
Module statistique et probabilité 2017/2018
Effectif
30 34 38 42 46 50 54 58 62 xi
7
Module statistique et probabilité 2017/2018
Nivau
C
10%
A
43%
B
47%
16
14
12
10
8 B
A
6
2
C
0
8
Module statistique et probabilité 2017/2018
Cas d’une variable discrète : Soit (xi , fi), i = 1 ,…,p une série statistique. La
fonction de répartition F associée à cette série est définie sur R par :
0 si x x1
f si x1 x x2
1
f1 f 2 si x2 x x3
F(x) =
f ... f si xi x xi 1
1 i
1 si x x p
Cette fonction est une fonction en escaliers, présentant en chacune des valeurs possible xi
un saut égal à la fréquence correspondante fi .
0 si x 0
0.07 si 0 x 1
0.27 si 1 x 2
F(x) = 0.67 si 2 x 3
0.93 si 3 x 4
1 si x 4
9
Module statistique et probabilité 2017/2018
F(x) 0.5
0 1 2 3 4
x
Cas d’une variable continue : La fonction de répartition est continue et linéaire par
morceaux, elle est définie pour x R sur l’ensemble des classes
a1 , a2 ,..., ai , ai 1 ,...ak , ak 1 qui constituent la série statistique, par
0 si x a1
x - a1
f1 si a1 x a2
a 2 a 1
f x - a2
f2 si a2 x a3
1
a a
3 2
F(x) =
i -1
x - ai
fj fi si ai x ai 1
j 1 ai 1 ai
1 si x ak 1
10
Module statistique et probabilité 2017/2018
0 si x 1
x - 1
0.067 si 1 x 3
2
x - 3
0.067 0.167 si 3 x 5
2
0.234 x - 5
0.333 si 5 x 7
2
F(x) x - 7
0.567 0.133 si 7 x 9
2
0.700 x - 9
0.30 si 9 x 11
2
1 si x 11
Courbe cumulative :
F(x)
11
0.7
0.5
1 3 5 7 9 11 x
11
Module statistique et probabilité 2017/2018
0 si x 30
x - 30
0.07 si 30 x 34
4
x - 34
0.07 0.03 si 34 x 38
4
0.10 x - 38
0.10 si 38 x 42
4
x - 42
0.20 0.10 si 42 x 46
4
F(x) = x - 46
0.30 0.30 si 46 x 50
4
0.60 x - 50
0.13 si 50 x 54
4
x - 54
0.73 0.20 si 54 x 58
4
0.93 x - 58
0.07 si 58 x 62
4
1 si x 62
Compléter :
F(x)
12
Module statistique et probabilité 2017/2018
a/ La moyenne arithmétique :
A partir des données brutes x1 , x2 ,..., xn , la moyenne arithmétique, notée x
a pour expression :
n
1
x (1)
xi
n i 1
p p
1
x ni xi f i xi
n
i 1 i 1
ni
Où p désigne le nombre de valeurs distinctes (ou modalités) de x et f i la
n
fréquence.
Pour une variable statistique continue, on ne connait pas les valeurs exactes
prises par la variable mais seulement le nombre de variables à l’intérieur de
chaque classe. Pour calculer la moyenne arithmétique, on remplace xi par le
centre de la ième classe, noté ci, et l’expression (1) devient:
k k
1
x ni ci f i ci
n
i 1 i 1
Exemples :
on reprend les tableaux de distribution précédents :
5
x
1
ni x i
1
0 * 2 1 * 6 2 * 12 3 * 8 4 * 2 2.06 .
30 30
i 1
13
Module statistique et probabilité 2017/2018
32 * 2 36 * 1 40 * 3 44 * 3 48 * 9 52 * 4
8
1 1
x ni ci
30 i 1 56 * 6 60 * 2
30
48.27
On dira que la moyenne d’âge des salariés de l’entreprise est de 48,27 ans.
b/ Le mode
C’est la valeur la plus fréquente prise par le caractère, c’est-à-dire celle qui se répète
le plus souvent dans les données.
Pour une série discrète, le mode est la valeur de x ayant le plus grand
effectif.
Pour une série continue, on détermine d’abord la classe modale
CMod a Mod , bMod comme étant la classe qui a le plus grand effectif, puis on
calcule le mode par interpolation en posant :
prec
Mod a (b a )
Mod
prec suiv
Mod Mod
Exemples
- Pour la variable « Nbre d’enfts »: d’après le tableau de la page 4, Mod = 2
14
Module statistique et probabilité 2017/2018
c/ La médiane
C’est la valeur, parmi les observations, qui coupe la série en deux : 50% des
observations lui sont inférieures et 50% lui sont supérieures.
1) Pour une série discrète : Soit x1 , x2 ,..., xn une série statistique
discrète,
Si n est impair la médiane, notée Med, est donnée par, Med x n 1
2
1
Si n est pair on a Med xn xn
2 2 2
1
2) Pour une série continue : On détermine d’abord la classe médiane,
C Med a Med , bMed Comme étant la première classe qui contient au moins
n
ncum
med aMed (bMed aMed ) 2
nMed
6
Ce qui veut dire que la moitié des salariés ont un salaire inférieur ou égal à196500
DA .
15
Module statistique et probabilité 2017/2018
15 9
Med 46 4 48,67
9
Ce qui veut dire que la moitié des salariés sont âgés de moins de 48,67 ≈ 48 ans.
Comparaison des indicateurs de position :
d/ Les quantiles :
On généralise la définition de la médiane, en définissant:
- les quartiles : il y en a 3, notés Q1, Q2, Q3, qui découpent la population étudiée en
quatre parts d'effectif égaux (chaque part contient 25% de l'effectif total).
16
Module statistique et probabilité 2017/2018
2. Si n est entier on a
q x
1
x
2 n n 1
n ncum
q a (b a )
n
Q1 = 1, Q2 = Med = 2, Q3 = 3
D2 = 1, D3 = D4 = D5 =Med = D6, = 2 D7 = D8 = D9 = 3
5,1 3
q0,17 38 4 40,8 : ce qui veut dire que 17% des
3
salariés ont un âge inférieur ou égal à 40,8 ans.
On peut aussi trouver les quantiles de tout ordre graphiquement en utilisant la courbe
cumulative : En effet d’après la définition (page 18), le quantile q vérifie
F (q )
Il suffit donc de retrouver sur le graphe de la fonction de répartition, l’abscisse ( q )
qui correspond à l’ordonnée . On distingue le cas discret du cas continu :
17
Module statistique et probabilité 2017/2018
F(x) 1
0,9
0,6
0,28
0,11
0 1 2 3 4 x
18
Module statistique et probabilité 2017/2018
F(x)
1
0,93
0,73
0,60
0,40
0,30 Graphiquement
q0.4 ≈ 47,1
0,20
0,10
0,07
30 34 38 42 46 50 54 58 62
19