Vous êtes sur la page 1sur 71

STATISTIQUE

DESCRIPTIVE
Dr AKA Joseph
Maître de Conférences Agrégé
Département de Santé Publique, Biostatistique et Informatique médicale
Laboratoire de Biostatistique, Méthode et Informatique médicale
UFR SMA / UFHB
1
OBJECTIFS

•Définir les concepts de base


•Définir les différentes variables aléatoires
•Définir les caractéristiques numériques
•Estimer les caractéristiques numériques
•Positionner les CN sur une distribution
•Illustrer les différentes variables aléatoires

2
PLAN
INTRODUCTION
I. CONCEPTS DE BASE
II. ETUDE DES VARIABLES
III. SERIES STATISTIQUES
IV. CARACTERISTIQUES NUMERIQUES
V. TABULATIONS
VI. GRAPHIQUES
CONCLUSION

3
INTRODUCTION (1/2)
1 - Stat descriptive concerne :
• Enregistrements
• Dépouillement
• Réduction +++

2 - REDUCTION = Représentation données


(pratique, condensée, informative)
• Résumés statistiques (moyenne, proportion, variance)
• Tableaux et graphiques

4
INTRODUCTION (2/2)
• Ce chapitre repose sur le but de la statistique :

Etude d’objets de même nature,


présentant des caractéristiques
variables, susceptibles d’être mesurées
ou classées

•Nécessité de définir des éléments de base


de la statistique = concepts de base
5
OBJECTIFS

•Définir les concepts de base

• Définir les différentes variables aléatoires


• Définir les caractéristiques numériques
• Estimer les caractéristiques numériques
• Positionner les CN sur une distribution
• Illustrer les différentes variables aléatoires

6
I - CONCEPTS DE BASE (1/2)
1. UNITE STATISTIQUE (US) / ELEMENT STAT
• Concrète, Abstraite
• Toujours identifiable sans ambiguïté

2. POPULATION STAT / UNIVERS STAT


• Collection d’US (au moins une caract. commune)
• Finie ou infinie

3. ECHANTILLON
• Représentation miniature de la pop. (partie pop.)
• Notion de représentativité
7
I - CONCEPTS DE BASE (2/2)
4. CARACTERE / VARIABLE ALEATOIRE
• Trait commun à toutes les US
• Critère de description de la population

5. MODALITE
• Différentes situations possibles du caract. / US
• Incompatibles et exhaustives
• Variable mesurée ou observée sur chaque US

6. VARIABLE STATISTIQUE / PARAMETRE


• Résultat de l’essai expérimenté ou réalisé
• Modalité observée/mesurée
8
OBJECTIFS

• Définir les concepts de base

•Définir les différentes variables aléatoires


• Définir les caractéristiques numériques
• Estimer les caractéristiques numériques
• Positionner les CN sur une distribution
• Illustrer les différentes variables aléatoires

9
II - ETUDE DES VARIABLES (1/5)
• 02 types de VARIABLE :
− V. ALEATOIRES (VA) +++
− V. NON ALEATOIRES (VNA) !!!

• ETUDE DES VARIABLES ALEATOIRES +++


− La VARIABLE = Quantité que l’on ne peut prédire
avec certitude le résultat (avant la réalisation de
l’expérimentation). Quantité qui mesure le
changement sur une US
VARIABLE ALEATOIRE (VA)

− 02 types VA : VA qualitative et VA Quantitative


10
II - ETUDE DES VARIABLES (2/5)

1. VARIABLE ALEATOIRE QUALITATIVE (VAq)

• Diverses modalités sont OBSERVABLES


• Modalités sont exhaustives et exclusives

• VAq DICHOTOMIQUE (Binaire)


• VAq POLYCHOTOMIQUE

• Exemples

11
II - ETUDE DES VARIABLES (3/5)

2. VARIABLE ALEATOIRE QUANTITATIVE (VAQ)


• Diverses modalités sont MESURABLES
• S’exprime toujours avec une UNITE de MESURE
• Modalités = différentes valeurs possibles de
l’expression de la variable

On distingue :
• VAQ DISCRETE
• VAQ CONTINUE

12
II - ETUDE DES VARIABLES (4/5)

2.1 - VAQ DISCRETE


• Ses valeurs possibles = nombres isolés
ou entiers dans son intervalle de
variation
• Quantité mesurable prend des valeurs
entières
• Exemples

13
II - ETUDE DES VARIABLES (5/5)
2.2 - VAQ CONTINUE
• Ses valeurs possibles = en nombre infini
sur son intervalle de variation
• Quantité mesurable peut prendre toutes les
valeurs possibles
• Exemples

• Classement et notion de classe +++


• Sturges : (nombre de classes k = 1+3,3logn)
14
III - SERIES STATISTIQUES
• Série statistique = Ensemble observations
faites sur US (Echantillon/population)
• Série statistique = Distribution statistique
• Fonction de la Variable Aléatoire (VA) étudiée
• Plusieurs types / nombre de VA étudiées :
- Série statistique simple (SSS) +++
- Série statistique double (SSD) +++
- Etc.

15
III.1 - S S SIMPLE (1/4)
1. SERIE STAT DISCONTINUE ou DISCRETE (SSD)
• X VA à k valeurs discrètes

x 1 x ........ x ....... x
2 i k

f 1
f ..... f ..... f
2 i k

• La valeur x i du caract. peut se rencontrer f i


fois

• DEFINITIONS ++++++
16
DEFINITIONS
f i

f
fr  i

i
n
F  f  f  ......  f
i 1 2 i

F r  f r  f r  .....  f r
i 1 2 i

 f n
i 1
i

 f r 1
i 1 i
17
III.1 - S S SIMPLE (2/4)
2. SERIE STAT CONTINUE (SSC)
• X VA à n valeurs distinctes

x 1 x 2
........ xi ....... xn
1 2...........i.........n

• La valeur x
i du caract = valeur quantifiée du
ième individu

• NOTION DE CLASSES +++++

18
NOTION DE CLASSES

k i
 e ,e 
i 1 i


ei 1 ei
x i

2
a i
 ei - ei 1
19
III.1 - S S SIMPLE (3/4)
2. SERIE STAT CONTINUE ET CLASSEE (SSCC)
• X VA à k classes

x 1 x ........ x ....... x
2 i k

f 1
f ..... f ..... f
2 i k

• La valeur x i du caract. peut se rencontrer f i


fois

• DEFINITIONS ++++++
20
DEFINITIONS
f i

f
fr  i

i
n
F  f  f  ......  f
i 1 2 i

F r  f r  f r  .....  f r
i 1 2 i

 f n
i 1
i

 f r 1
i 1 i
21
III.1 - S S SIMPLE (4/4)
3. SERIE STAT QUALITATIVE (SSq)
• X VA à k modalités

x 1 x ........ x ....... x
2 i k

f 1
f ..... f ..... f
2 i k

• x
i = la ième modalité et peut se rencontrer f i
fois

• MODALITES EXHAUSTIVES et EXCLUSIVES


• DEFINITIONS ++++++
22
DEFINITIONS

f i

f
fr  i

i
n
k

 f n
i 1
i

 f r 1
i 1 i

23
Compréhension sur les séries statistiques

Exemple de X VA étudiée pour laquelle :

x 1 x ........ x ....... x
2 i k

f 1
f ..... f ..... f
2 i k

Définir ? xi et fi et les autres termes

Définitions possibles si l’on définit X VA

Combien de définitions de SS faites-vous ?


24
III.2 - S S DOUBLE

• Etude d’un couple de caractères (X,Y),


mesurables ou observables

• Si X et Y sont 02 VQ et si :
• X et Y sont aléatoires Notion de corrélation
• X contrôlée et Y aléatoire Notion de
corrélation et de régression

• Si X et Y sont 02 VAq Notion de relation


• Si X VAq et Y VAQ Notion de relation

25
OBJECTIFS

• Définir les concepts de base


• Définir les différentes variables aléatoires

•Définir les caractéristiques numériques


•Estimer les caractéristiques numériques

• Positionner les CN sur une distribution


• Illustrer les différentes variables aléatoires

26
IV - CARACT NUMERIQUES
 de TENDANCE CENTRALE (CNTC) +++
• Le Mode
• La Médiane, les quartiles, les percentiles
• La Moyenne arithmétique et géométrique

 de DISPERSION (CND) +++


• La Variance
• Le Coefficient de variation

 d’asymétrie
 et d’aplatissement

27
IV.1 - CN DE TENDENCE CENTRALE (1/15)

1. Le Mode (Mo) :
• Valeur de la variable dont la
fréquence (absolue/relative) est la
plus élevée
• Exemples

28
IV.1 - CNTC (2/15)
- Exemple : X = groupe sanguin

xi A B O AB
fi 10 15 70 5
- Exemple : X = nombre d’enfants/Etudiant

xi 0 1 2 3
fi 85 10 3 2
29
Que retenir ?

Le Mode n’est pas définissable sur


une série statistique continue et
classée
Sur une SSCC, on parle plutôt de
classe modale

30
IV.1 - CNTC (3/15)
2 - La Médiane (M)

• Valeur de la variable
dont la fréquence
Médiane (M) cumulée est égale à ½
/ p(X=M)=½
• Estimation possible si :

31
IV.1 - CNTC (4/15)

• M = valeur du (k+1)ième
Si n impair observation de la série
ordonnée
n = 2k+1
• Exemple :
3,6,9,10,12,14,16,17,18

32
IV.1 - CNTC (5/15)

• Intervalle Médian (IM) =


valeurs du kième et du
Si n pair (k+1)ième observations de la
n = 2k série ordonnée
• Exemple :
130,131,132,133,144,145,146,147

33
IV.1 - CNTC (6/15)
F(x)

p(X=M)=1/2

x
M 34
IV.1 - CNTC (7/15)

• Les Quartiles (q1, q2, q3, q4) :


• Valeurs de la variable qui partagent la
SS ordonnée en 4 groupes d’effectifs
égaux / 1 n, 2 n, 3 n, 4 n
4 4 4 4

• Les percentiles (abaques, ogives)

35
Que retenir ?

La Médiane n’est définissable que


sur une série statistique continue

36
IV.1 - CNTC (8/15)
3. La Moyenne arithmétique : x
x1 x ........ x ....... x
2 i k

f 1
f ...... f ....... f
2 i k

k
1
Estimateur x   fx i
n i 1 i

37
IV.1 - CNTC (9/15)
- Exemple : X = nombre d’enfants/étudiant
xi 0 1 2 3
fi 85 10 3 2
k
- AN : 1
x  fx i
n i 1 i

x
1
(85x0)  ....  (2x3)  0,22 enfts / étud
100
38
IV.1 - CNTC (10/15)
- Exemple : X = Age en année révolue
ki [15-20[ [20-25[ [25-30[ [30-35[ [35-40[

fi 10 15 54 13 8
1 k
- AN :
x  fx i
n i 1 i

x
1
(10x17,5)  ....  (8x37,5)  27,20 ans
100 39
IV.1 - CNTC (11/15)
3. La Moyenne arithmétique : x
x x ........ x ....... x
1 2 i n

1 2..... ......i.... .....n


n
1
Estimateur x   xi
n i 1
40
IV.1 - CNTC (12/15)
• Exemple : X = Taille en cm (n = 30)

166 - 175 - 185 - 176 - 156 - 165 - 163 -


180 - 176 - 178 - 170 - 160 - 169 - 185 -
154 - 149 - 171 - 173 - 168 - 182 - 164 -
177 - 156 - 159 - 160 - 172 - 180 - 180 -
165 - 186

41
IV.1 - CNTC (13/15)
AN : 1 n
x   xi
n i 1

x  166  175  ....  165  185    cm


1
30

42
IV.1 - CNTC (14/15)
3. La Moyenne géométrique : x g

x g
 n
x .x
1 2
... x i
... xn
n k
1 1
g   ln xi g   f i ln xi
n i 1 n i 1
x e  x
g
Estimateur g
43
IV.1 - CNTC (15/15)
 Observations sur les estimateurs de CNTC :

• Médiane très peu influencée par les


points extrêmes
• Moyenne très influencée par les points
extrêmes

• Moy arithmétique : série stat symétrique


• Moy géométrique : série stat asymétrique

44
Que retenir ?

Le Moyenne n’est pas définissable


sur une série statistique qualitative

Sur une SSq, on parle plutôt de


Proportion et ne sera pas abordée
dans ce chapitre

45
IV - CARACT NUMERIQUES
• de TENDANCE CENTRALE (CNTC) ++++
• Le Mode
• La Médiane, les quartiles
• La Moyenne arithmétique et géométrique

• de DISPERSION (CND) ++++


• La Variance
• Le Coefficient de variation

46
IV.2 - CN DE DISPERSION (1/7)
• Renseignent sur la dispersion des
données autour de la tendance centrale
(moyenne)
• Exemples de 2 étudiants A et B
• A : 10 9,5 10,5 10
• B : 02 18 17 03
• Faiblesse des CNTC (de position) ++++

• Nécessité d’adjoindre à la
moyenne sa DISPERSION
47
IV.2 - CND (2/7)
• Dispersion = mesure de la
fluctuation des observations autour
de la moyenne
• Ecart observé entre la valeur
mesurée et la moyenne
 Ecart noté ei ou di = ( xi - x
)
Illustration par un diagramme ++++
48
IV.2 - CND (3/7)
2
1. La Variance estimée :
S x

x x
1 2
........ xi ....... xk

f f
1 2
..... f i
..... f k

f x i  x 
k
1

2
Estimateur S x 
2

n 1 i 1 i

49
IV.2 - CND (4/7)
2
1. La Variance estimée : S x

x1 x2 ........ xi xn
.......
1 2...........i.........n

xi  x 
n
1
S x n 1 
2

2
Estimateur
i 1
50
IV.2 - CND (5/7)
• L’Ecart type de X : S x


2
Estimateur
Sx S x

• L’Ecart type de la moyenne : S x


S
S 
x
Estimateur x
n 51
IV.2 - CND (6/7)

Intérêt de l’écart-type :
• Encadrement des estimations :
 Intervalle de Confiance (ICα) +++
 Intervalle de Référence (IRα)

• Tests de signification
52
IV.2 - CND (7/7)
2. Le Coefficient de variation : CV

Estimateur CV  S x
.100
x
• Indice de dispersion relative sans unité
• Exprimé en pourcentage

• Validation modèles statistiques+++


53
OBJECTIFS

• Définir les concepts de base


• Définir les différentes variables aléatoires
• Définir les caractéristiques numériques
• Estimer les caractéristiques numériques

•Positionner les CN sur une distribution

• Illustrer les différentes variables aléatoires

54
IV.3 - DISTRIBUTIONS OBS ET CN
• Distributions SYMETRIQUES
- Dist symétriques Uni modale
- Dist symétriques Bimodale
- Dist symétriques Plurimodale

• Distributions ASYMETRIQUES
- Dist asymétriques Uni modale
- Dist asymétriques Bimodale
- Dist asymétriques Plurimodale

55
56
57
OBJECTIFS

• Définir les concepts de base


• Définir les différentes variables aléatoires
• Définir les caractéristiques numériques
• Estimer les caractéristiques numériques
• Positionner les CN sur une distribution

•Illustrer les différentes variables aléatoires

58
V - LES TABULATIONS (1/2)
•Tableaux à 1 dimension
- Description d’une VA X à k modalités!!!! +++

•Tableaux à 2 dimensions
- Description et recherche de relation entre 2 VA X et Y +++

•Tableaux à 3 dimensions
- Description et recherche de relation entre 3 VA X, Y et Z +++

•Tableaux à 4 dimensions
- Description et recherche de relation entre 4 VA X, Y, Z et T ++

•Etc.
59
V - LES TABULATIONS (2/2)

 OBSERVATIONS :
• Fréquences absolues (effectifs) +++

• Variables et modalités +++


• X à k modalités (k ≥ 2)
• X et Y à i et j modalités (i = j = 2 ou i ≠ j ≠ 2)
• X, Y et Z à i, j et k modalités (i = j = k = 2 ou i ≠ j ≠ k ≠ 2)

• Tableaux à 3 dimensions Tableaux stratifiés


• Vérification des fréquences absolues : si Z à k=2
a’+a’’ = a , ………., d’+d’’ = d
n1 + n2 = n
60
VI - LES GRAPHIQUES (1/8)
AB A
5% 10% B
15%

O
70%

Diagramme circulaire du groupe sanguin 61


VI - LES GRAPHIQUES (2/8)
90
80
70
60
50
40
30
20
10
0
0 1 2 3

Diagramme en bâton du nombre d’enfants/étudiant


62
VI - LES GRAPHIQUES (3/8)

63
VI - LES GRAPHIQUES (4/8)
60

50

40

30

20

10

0
15-20 20-25 25-30 30-35 35-40

Histogramme des âges 64


VI - LES GRAPHIQUES (5/8)
60

50

40

30

20

10

0
15-20 20-25 25-30 30-35 35-40

Polygone de fréquences absolues des âges 65


VI - LES GRAPHIQUES (6/8)
100
90
80
70
60
50
40
30
20
10
0
15-20 20-25 25-30 30-35 35-40

Polygone de fréquences cumulées des âges 66


VI - LES GRAPHIQUES (7/8)
30
28
Y = production en tonne

26
24
y = 33,77- 1,314x
22
20
R² = 0,752
18
16
14
12
10
7 9 11 13 15 17 19
X = nombre de jours pluvieux pendant harmattan

Modélisation de la production
en fonction du nombre de jours pluvieux 67
VI - LES GRAPHIQUES (8/8)

290
y = 142,7 + 1,576x
Temps de réaction en ms

270
R² = 0,865
250
230
210
190
170
150
30 40 50 60 70
Age en année révolue

Modélisation du temps de réaction en fonction de l’âge


68
CONCLUSION (1/2)

•La vie est une variabilité permanente


intra individu, inter individu mais aussi
qualitative que quantitative rendant
ainsi complexe l’unité statistique, objet
de l’étude

69
CONCLUSION (2/2)

•La statistique descriptive constitue ce


qu’est l’anatomie pour le chirurgien
permettant :
- la description exacte des populations d’où
proviennent les échantillons sans hypothèse
préalable
- La mise en évidence de pistes de recherche qui
pourraient aboutir à des études ponctuelles par la
formulation d’hypothèse

70
MERCI POUR VOTRE
ATTENTION SOUTENUE

71

Vous aimerez peut-être aussi