Académique Documents
Professionnel Documents
Culture Documents
Chapitre 3
Statistique descriptive une variable
Informatique, robotique
Climatologie, hydrologie, agriculture
Economie, gestion
Biologie, mdecine
Planification urbaine, .
Outil d aide la prise de dcision
H. Moussa
1
Prsentation et Caractrisation
de donnes
Populations et chantillons
Population dindividus
Sondages et recensements
Recensement
enqute mene auprs de toute la population
Sondage
enqute mene auprs dun chantillon
chantillon reprsentatif (non biais) de la
population cible
Quel chantillon choisir ?
chantillon
Individu
Caractre
Qualitatif
Sexe, Qualit,
secteur dactivits,
Quantitatif
ge, dbit de
5
cours deau,
cours boursier,..
Echantillonnage
LEchantillonnage
"Un chantillon est reprsentatif si les units qui le
constituent ont t choisies par un procd tels que tous
les membres de la population ont la mme probabilit
de faire partie de l'chantillon" (Ghiglione
(Ghiglione & Matalon,
Matalon,
1998).
1998
).
Variable statistique
Lobservation statistique
10
statistique infrentielle :
Estimation (moyenne,
variance, cart-type)
Tests de validit
Intervalle de confiance
Partie 1
STATISTIQUE DESCRIPTIVE
UNIVARIE
11
12
Collecte de donnes
Variables discrtes
la variable ne prend qu'un nombre fini de valeurs :
les modalits (xi)
Exemple 1
xi
ni
Effectif de la modalit xi
13
Frquence
Variables continues
la variable prend ses valeurs dans un intervalle
(classe )
fi =
Classe
[xi-1; xi [
14
fi =
effectif attach
xi
effectif total
ni
effectif total
ni =N
15
16
Exemple
n
k =1
Notes
Effectifs
(ni)
[ 0; 5 [
10
[ 5; 8 [
[ 8; 12 [
12
= n1 + n2 + ... + ni 1 + ni
Effectifs
cumuls
(Ni)
Frquences Frquences
cumules
(fi)
(Fi)
Ni
k=1
Fi = fk = f1 + f2 + ...+ fi1 + fi =
[12; 15 [ 11
17
[15; 21 [
N = ni =
Interprtation?
18
Variables continues
Exemple 1
Statistiques du
personnel dune
PME suivant le
nombre denfants
charge
Histogramme
13 13 0,43 0,43
2
3
9
5
22 0,3 0,73
27 0,17 0,90
29 0,07 0,97
30 0,03 1
Total 30
19
Frquences
cumules
Frquences
Variables discrtes
Effectifs
cumuls
Nombre
denfants
charge
Effectifs
Diagramme en btons
Reprsentation graphique
20
Histogramme
Exemple 2:
tude de la taille (en m) dun groupe dindividus
Classes
[1,700 ; 1,720 [
[1,720 ; 1,740 [
[1,740 ; 1,760 [
[1,760 ; 1,780 [
[1,780 ; 1,800 [
[1,800 ; 1,820 [
Nombre denfants par salari
8
6
4
2
0
1.71 1.73 1.75 1.77 1.79 1.81
mme
amplitude :
0,02 m
21
22
Histogramme
n
E
o
F
F
m
E
b
C
r
T
Ie
F
S
Effectifs (ni)
3
3
5
6
4
3
24
TAILLE
taille (m)
23
Effectif
Amplitude
24
Effectifs (ni)
10
30
60
72
40
48
260
F
R
E
Q
U
E
N
C
E
S
E
F
F
E
C
T
I
F
S
25
26
ordonnes
= effectifs cumuls ou
frquences cumules
Abscisses = bornes suprieures des classes
Les points sont relis par des segments de
droite
Classes
Effectifs
ni
[6 - 9[
[9 - 11[
[11 - 14[
Total
7
5
3
15
Frquences
Effectifs
Frquences
cumuls
cumules
fi en %
Ei
Fi en %
7
46,70
46,70
12
33,30
80,00
15
20,00
100,00
100,00
27
28
Effectifs cumuls
12
10
8
6
4
2
0
0
11
14
20
30
Mesures de dispersion
tendue,
cart
cart--type,
type, variance,
cart moyen
Intervalle interquartile
Mesures de tendances
centrale ou de position
31
32
Exemples
Le mode
f
r
q
u
e
n
c
e
f
r
q
u
e
n
c
e
taille
modepour
les femmes
modepour
les hommes
distribution unimodale
distribution bimodale
33
45 68 89 74 62 56 49 52 63
kg
La mdiane
-
34
Avantages
Dtermination graphique aise
Inconvnients du mode
Significatif uniquement si unique
Variable continue : le mode peut varier en
fonction du dcoupage des classes
35
45 68 89 74 62 56 49 52 63
kg
45 68 89 74 62 56 49 52 63
Exemple 1
Poids dun chantillon de 9 personnes :
45 68 89 74 62 56 49 52 63 (kg)
kg
Exemple 2
Si le nombre dindividus est pair, on prend la
moyenne entre les deux valeurs centrales :
mdiane =
56 + 62
2
= 59
37
38
Exemple 3
Classes
Effectifs
ni
[6 - 9[
[9 - 11[
[11 - 14[
Total
7
5
3
15
Effectifs
cumuls
Ni
7
12
15
Frquences
fi en %
46,70
33,30
20,00
100,00
Frquences
cumules
Fi en %
46,70
80,00
100,00
39
100
Me 9
0,50 0,467
=
11 9
0,80 0,467
60
50
40
M'
A M
80
40
20
Soit Me 9,2
0
0
9 Me
11
14
20
Notes
41
Me x i
xi + 1 xi
f ( Me ) f ( x i )
f (xi + 1 ) f (xi )
43
44
Avantages
-
La moyenne arithmtique
Calcul ais
Donne une ide satisfaisante de la tendance centrale
Robuste : elle nest pas influence par les valeurs aberrantes de
la srie.
Minimise la somme des carts moyens
Inconvnients
-
6 7 7 8 10 11
12
12 12 14 17 17 17
2me formule
45
46
47
48
45 68 89 74 62 56 49 52 63
kg
-
Avantages
Meilleure caractristique de position : elle prend en
compte toutes les valeurs dune srie
Elle minimise la somme des carts quadratiques
Les caractristiques de
dispersion
Inconvnients
Moins robuste que la mdiane : elle est influence par
les valeurs aberrantes ( exagrment faibles ou
exagrment leves) de la srie.
49
50
Lintervalle interquartile
Exemple (diapo n
n48),
48), le calcul exact donne :
20 - 0 = 20
Intervalle interquartile : Q3 - Q1
51
52
Exemple
V: variance
54
Courbe de concentration
La courbe de concentration, ou courbe de
Lorenz, joint, par des segments de droite, les
points ayant, pour :
- abscisses : les frquences cumules (en %)
- ordonnes : le rapport des xi ni cumuls sur la
somme totale des xk nk ( en %)
Exemple
ime ordonne = x1 n1 + + xi ni
somme de tous les (x
(xk nk )
Complments de TD N
N3
3
Concentration indice de GiniGiniMdiale
Indice de Gini
Pourcentage cumul du
caractre (qi )
Mdiale
Valeur partageant en 2 fractions de poids
gale la masse cumule des xi ni
Frquences cumules : Fi
fi = Fi Fi-1
10