Académique Documents
Professionnel Documents
Culture Documents
DESCRIPTIVE
Dr AKA Joseph
Maître de Conférences Agrégé
Département de Santé Publique, Biostatistique et Informatique médicale
Laboratoire de Biostatistique, Méthode et Informatique médicale
UFR SMA / UFHB
1
OBJECTIFS
2
PLAN
INTRODUCTION
I. CONCEPTS DE BASE
II. ETUDE DES VARIABLES
III. SERIES STATISTIQUES
IV. CARACTERISTIQUES NUMERIQUES
V. TABULATIONS
VI. GRAPHIQUES
CONCLUSION
3
INTRODUCTION (1/2)
1 - Stat descriptive concerne :
• Enregistrements
• Dépouillement
• Réduction +++
4
INTRODUCTION (2/2)
• Ce chapitre repose sur le but de la statistique :
6
I - CONCEPTS DE BASE (1/2)
1. UNITE STATISTIQUE (US) / ELEMENT STAT
• Concrète, Abstraite
• Toujours identifiable sans ambiguïté
3. ECHANTILLON
• Représentation miniature de la pop. (partie pop.)
• Notion de représentativité
7
I - CONCEPTS DE BASE (2/2)
4. CARACTERE / VARIABLE ALEATOIRE
• Trait commun à toutes les US
• Critère de description de la population
5. MODALITE
• Différentes situations possibles du caract. / US
• Incompatibles et exhaustives
• Variable mesurée ou observée sur chaque US
9
II - ETUDE DES VARIABLES (1/5)
• 02 types de VARIABLE :
− V. ALEATOIRES (VA) +++
− V. NON ALEATOIRES (VNA) !!!
• Exemples
11
II - ETUDE DES VARIABLES (3/5)
On distingue :
• VAQ DISCRETE
• VAQ CONTINUE
12
II - ETUDE DES VARIABLES (4/5)
13
II - ETUDE DES VARIABLES (5/5)
2.2 - VAQ CONTINUE
• Ses valeurs possibles = en nombre infini
sur son intervalle de variation
• Quantité mesurable peut prendre toutes les
valeurs possibles
• Exemples
15
III.1 - S S SIMPLE (1/4)
1. SERIE STAT DISCONTINUE ou DISCRETE (SSD)
• X VA à k valeurs discrètes
x 1 x ........ x ....... x
2 i k
f 1
f ..... f ..... f
2 i k
• DEFINITIONS ++++++
16
DEFINITIONS
f i
f
fr i
i
n
F f f ...... f
i 1 2 i
F r f r f r ..... f r
i 1 2 i
f n
i 1
i
f r 1
i 1 i
17
III.1 - S S SIMPLE (2/4)
2. SERIE STAT CONTINUE (SSC)
• X VA à n valeurs distinctes
x 1 x 2
........ xi ....... xn
1 2...........i.........n
• La valeur x
i du caract = valeur quantifiée du
ième individu
18
NOTION DE CLASSES
k i
e ,e
i 1 i
ei 1 ei
x i
2
a i
ei - ei 1
19
III.1 - S S SIMPLE (3/4)
2. SERIE STAT CONTINUE ET CLASSEE (SSCC)
• X VA à k classes
x 1 x ........ x ....... x
2 i k
f 1
f ..... f ..... f
2 i k
• DEFINITIONS ++++++
20
DEFINITIONS
f i
f
fr i
i
n
F f f ...... f
i 1 2 i
F r f r f r ..... f r
i 1 2 i
f n
i 1
i
f r 1
i 1 i
21
III.1 - S S SIMPLE (4/4)
3. SERIE STAT QUALITATIVE (SSq)
• X VA à k modalités
x 1 x ........ x ....... x
2 i k
f 1
f ..... f ..... f
2 i k
• x
i = la ième modalité et peut se rencontrer f i
fois
f i
f
fr i
i
n
k
f n
i 1
i
f r 1
i 1 i
23
Compréhension sur les séries statistiques
x 1 x ........ x ....... x
2 i k
f 1
f ..... f ..... f
2 i k
• Si X et Y sont 02 VQ et si :
• X et Y sont aléatoires Notion de corrélation
• X contrôlée et Y aléatoire Notion de
corrélation et de régression
25
OBJECTIFS
26
IV - CARACT NUMERIQUES
de TENDANCE CENTRALE (CNTC) +++
• Le Mode
• La Médiane, les quartiles, les percentiles
• La Moyenne arithmétique et géométrique
d’asymétrie
et d’aplatissement
27
IV.1 - CN DE TENDENCE CENTRALE (1/15)
1. Le Mode (Mo) :
• Valeur de la variable dont la
fréquence (absolue/relative) est la
plus élevée
• Exemples
28
IV.1 - CNTC (2/15)
- Exemple : X = groupe sanguin
xi A B O AB
fi 10 15 70 5
- Exemple : X = nombre d’enfants/Etudiant
xi 0 1 2 3
fi 85 10 3 2
29
Que retenir ?
30
IV.1 - CNTC (3/15)
2 - La Médiane (M)
• Valeur de la variable
dont la fréquence
Médiane (M) cumulée est égale à ½
/ p(X=M)=½
• Estimation possible si :
31
IV.1 - CNTC (4/15)
• M = valeur du (k+1)ième
Si n impair observation de la série
ordonnée
n = 2k+1
• Exemple :
3,6,9,10,12,14,16,17,18
32
IV.1 - CNTC (5/15)
33
IV.1 - CNTC (6/15)
F(x)
p(X=M)=1/2
x
M 34
IV.1 - CNTC (7/15)
35
Que retenir ?
36
IV.1 - CNTC (8/15)
3. La Moyenne arithmétique : x
x1 x ........ x ....... x
2 i k
f 1
f ...... f ....... f
2 i k
k
1
Estimateur x fx i
n i 1 i
37
IV.1 - CNTC (9/15)
- Exemple : X = nombre d’enfants/étudiant
xi 0 1 2 3
fi 85 10 3 2
k
- AN : 1
x fx i
n i 1 i
x
1
(85x0) .... (2x3) 0,22 enfts / étud
100
38
IV.1 - CNTC (10/15)
- Exemple : X = Age en année révolue
ki [15-20[ [20-25[ [25-30[ [30-35[ [35-40[
fi 10 15 54 13 8
1 k
- AN :
x fx i
n i 1 i
x
1
(10x17,5) .... (8x37,5) 27,20 ans
100 39
IV.1 - CNTC (11/15)
3. La Moyenne arithmétique : x
x x ........ x ....... x
1 2 i n
41
IV.1 - CNTC (13/15)
AN : 1 n
x xi
n i 1
42
IV.1 - CNTC (14/15)
3. La Moyenne géométrique : x g
x g
n
x .x
1 2
... x i
... xn
n k
1 1
g ln xi g f i ln xi
n i 1 n i 1
x e x
g
Estimateur g
43
IV.1 - CNTC (15/15)
Observations sur les estimateurs de CNTC :
44
Que retenir ?
45
IV - CARACT NUMERIQUES
• de TENDANCE CENTRALE (CNTC) ++++
• Le Mode
• La Médiane, les quartiles
• La Moyenne arithmétique et géométrique
46
IV.2 - CN DE DISPERSION (1/7)
• Renseignent sur la dispersion des
données autour de la tendance centrale
(moyenne)
• Exemples de 2 étudiants A et B
• A : 10 9,5 10,5 10
• B : 02 18 17 03
• Faiblesse des CNTC (de position) ++++
• Nécessité d’adjoindre à la
moyenne sa DISPERSION
47
IV.2 - CND (2/7)
• Dispersion = mesure de la
fluctuation des observations autour
de la moyenne
• Ecart observé entre la valeur
mesurée et la moyenne
Ecart noté ei ou di = ( xi - x
)
Illustration par un diagramme ++++
48
IV.2 - CND (3/7)
2
1. La Variance estimée :
S x
x x
1 2
........ xi ....... xk
f f
1 2
..... f i
..... f k
f x i x
k
1
2
Estimateur S x
2
n 1 i 1 i
49
IV.2 - CND (4/7)
2
1. La Variance estimée : S x
x1 x2 ........ xi xn
.......
1 2...........i.........n
xi x
n
1
S x n 1
2
2
Estimateur
i 1
50
IV.2 - CND (5/7)
• L’Ecart type de X : S x
2
Estimateur
Sx S x
Intérêt de l’écart-type :
• Encadrement des estimations :
Intervalle de Confiance (ICα) +++
Intervalle de Référence (IRα)
• Tests de signification
52
IV.2 - CND (7/7)
2. Le Coefficient de variation : CV
Estimateur CV S x
.100
x
• Indice de dispersion relative sans unité
• Exprimé en pourcentage
54
IV.3 - DISTRIBUTIONS OBS ET CN
• Distributions SYMETRIQUES
- Dist symétriques Uni modale
- Dist symétriques Bimodale
- Dist symétriques Plurimodale
• Distributions ASYMETRIQUES
- Dist asymétriques Uni modale
- Dist asymétriques Bimodale
- Dist asymétriques Plurimodale
55
56
57
OBJECTIFS
58
V - LES TABULATIONS (1/2)
•Tableaux à 1 dimension
- Description d’une VA X à k modalités!!!! +++
•Tableaux à 2 dimensions
- Description et recherche de relation entre 2 VA X et Y +++
•Tableaux à 3 dimensions
- Description et recherche de relation entre 3 VA X, Y et Z +++
•Tableaux à 4 dimensions
- Description et recherche de relation entre 4 VA X, Y, Z et T ++
•Etc.
59
V - LES TABULATIONS (2/2)
OBSERVATIONS :
• Fréquences absolues (effectifs) +++
O
70%
63
VI - LES GRAPHIQUES (4/8)
60
50
40
30
20
10
0
15-20 20-25 25-30 30-35 35-40
50
40
30
20
10
0
15-20 20-25 25-30 30-35 35-40
26
24
y = 33,77- 1,314x
22
20
R² = 0,752
18
16
14
12
10
7 9 11 13 15 17 19
X = nombre de jours pluvieux pendant harmattan
Modélisation de la production
en fonction du nombre de jours pluvieux 67
VI - LES GRAPHIQUES (8/8)
290
y = 142,7 + 1,576x
Temps de réaction en ms
270
R² = 0,865
250
230
210
190
170
150
30 40 50 60 70
Age en année révolue
69
CONCLUSION (2/2)
70
MERCI POUR VOTRE
ATTENTION SOUTENUE
71