Vous êtes sur la page 1sur 39

Statistique descriptive

TALHI. R
Service de Biostatistique, Faculté de Médecine d’Oran

Année Universitaire 2020-2021


Plan du cours

I- Introduction
II- Les concepts de base
III- Les tableaux statistiques
IV- Les représentations graphiques
V- Bibliographie
I-Introduction

La statistique descriptive est définie comme un ensemble de méthodes


permettant de décrire et d'analyser, de façon quantifiée, des phénomènes
repérés par des éléments nombreux, de même nature, susceptibles d'être
dénombrés et classés.
La distribution statistique représente des observations classées selon le ou
les caractères étudiés.
Cette distribution est présentée sous forme de
-tableaux statistiques,
-graphiques ou
-Sous forme numérique: moyennes, prévalence, incidence…
II-Les concepts de base
Population

Désigne l’ensemble des entités ou des individus qui font l’objet de l’étude.
L’ensemble de toutes les observations concernant le caractère de l’étude
(constitué d’un nombre d’individu qui peut être élevé).

Exemple: Décès- Accidents- Malades- Enfants âgés de moins de 5 ans


Echantillon

C’est une partie (sous-ensemble) de la population dont l’effectif ( la taille)


est très réduit et qui permet d’effectuer l’étude.
Individu ou unité statistique

Ce sont les éléments qui constituent l’échantillon et la population.


Unité de base sur laquelle on réalise un certain nombre de mesures.

Exemple: une personne, un ménage, une ville…

En langage statistique ; le mot individu peut aussi désigner un objet…


Série statistique

Une série ou distribution statistique est un ensemble d’observations d’un


caractère donnée.

Exemple: les malades suivis dans un service hospitalier et inclus dans


l’étude peuvent constituer une série statistique.
Caractères et variables
Dans une population, par exemple celle des étudiants d’une faculté,
les unités sont repérées par le nom et le prénom (liste)des étudiants.
Si l'on souhaite étudier cette population, on va retenir certains critères
d’étude comme la filière, l’âge, la taille, le poids, la nationalité, le groupe
sanguin…

Parmi ces critères, certains sont quantitatifs et d’autre sont qualitatifs.


Afin de différencier les deux type de critères,
les critères qualitatifs sont appelés des caractères et
les critères quantitatifs des variables.
Modalités d’un caractère

On désigne par modalités les différentes catégories d’un caractère


qualitatif, et
on qualifie de valeurs les différents chiffres d’une variable.

Exemple:
Caractère: sexe
Modalités: masculin, et féminin.
Un caractère est dit qualitatif
quand ses différentes modalités échappent à la mesure.

Exemple : couleur des yeux, profession, nationalité, groupe sanguin…


Le caractère
qualitatif

Nominal: Ordinal :
Les classes sont Les classes peuvent
prédéfinies, nommées être ordonnées selon
mais pas ordonnées. une échelle de valeurs
Exemple: le sexe, le Exemple: le niveau
groupe sanguin… d’instruction, la forme
clinique d’une maladie…
Un caractère est dit quantitatif
quand ses différentes modalités sont mesurables
(exprimées par des chiffres).

Exemple : taille, poids, nombre d’enfants par famille…


Le caractère
quantitatif

Variable stat.
Variable stat. discontinue
continue (discrète)
Elle prend toutes les Elle ne peut prendre
valeurs appartenant à que des valeurs
son intervalle. isolées.
Exemple: la glycémie Exemple: nombre
d’individu par ménage
Unités individuelles et unités groupées

Les unités d’une population, que le critère soit qualitatif ou quantitatif ,


peuvent être présentées individuellement ou regroupées.

Le regroupement peut être effectué par modalités, par valeurs ou par


classes de modalités ou classes de valeurs.

On distingue:
Le regroupement par classes de valeurs d'amplitudes égales , et
Le regroupement par classes d'amplitudes inégales.
Une des méthodes empiriques pour la détermination des
classes d'amplitudes égales :

• Nombre de classes : N = n
(n = effectif de l’échantillon)

• Étendue :
e = limite supérieure de la série – limite inférieure de la série

• Amplitude : k = Étendue / Nombre de classes (k = e/n)


Exemple:

n = 50 Les classes de poids (kg)


limite supérieure de la série = 91 kg
limite inférieure de la série = 30 kg 30 – 39
40 – 49
Alors 50 – 59
N = 50 = 7 classes 60 – 69
e = 91 – 30 = 61 kg 70 – 79
k = 61/7 = 8,71 → k = 9 kg 80 – 89
90 – 99
Le centre de classe (xicc ) est la valeur située au milieu de la classe,
il est égal à la limite inférieure de la classe + la limite supérieure de la
classe divisé par deux.

Dans l’exemple précédent; le centre de la 1ére classe est de 34,5 Kg →


(30+39) / 2 = 34,5 Kg.
III-Tableaux statistiques
Le caractère d’une population peut être présenté par un tableau ,appelé
tableau statistique des données.

Les observations sont résumées dans ce tableau où le nombre de


dimensions est en liaison avec les modalités du caractère étudié.

Principe de base :

-Un tableau (ou un graphe) doit être simple , compréhensible


-Un tableau (ou un graphe) doit avoir :
- un titre clair et explicite (englobant les trois caractéristiques;
de temps, de lieu et de personnes),
- un numéro, et
- une référence (source).
Caractère Qualitatif Nominal

Tableau n°1 : Profil de la pathologie observée dans une consultation


de médecine à Oran durant l’année 1997

Modalités du caractère Effectifs Fréquences


( pathologie observée) (fréquences absolues) relatives
xi ni fi ( % )
(fi = ni /n)

Pathologie ORL 153 12


Intoxications 102 8
Pathologie traumatique 204 16
Pneumopathie 510 40
Dermatoses 255 20
Divers 51 4

Total n = ni= 1275 fi=100


Caractère Quantitatif Discontinu

Nombre d’enfants Nombre de familles Fréquences Fréquences


xi ni relatives Cumulées
fi (%) fi cum (%)

0 4 5 5
1 5 6 11
2 10 13 24
3 16 20 44
4 18 22 66
5 14 18 84
6 7 9 93
7 6 7 100

Total 80 100

Tableau n°2 : Nombre d’enfants par famille


Caractère Quantitatif Continu
Tableau n° 3 : Les pesées de 50 nouveau-nés.

Poids (Kg) Effectifs


xi ni

2.0 - 2.5 2

2.5 - 3.0 4

3.0 - 3.5 6

3.5 - 4.0 30

4.0 - 4.5 8

TOTAL 50
IV-Les représentations graphiques
Les Représentations Graphiques

Les représentations graphiques représentent l'image synthétique des


données (information) présentées dans un tableaux statistique

Une présentation graphique est souvent plus facile à comprendre qu’une


présentation numérique.

Le choix d’un type de graphe dépend de la nature des données du


problème posé, et du caractère à présenter. .
Recommandations:

Le graphique doit toujours être présenté clairement et respecter les normes


suivantes :
- Un titre clair et explicite,
- Un numéro,
- Des axes
- Des unités de mesure
-Une échelle de chaque axe
- La source des données
Caractère Qualitatif
Diagramme en barres (tuyaux d’orgue)→cqo

Figure 1 : Distribution des formes cliniques d’une maladie dans une série
de 941 malades
Diagramme en barres horizontales →cqn

pb psychiatrie

ophtalmo

cancer

gynécologie

traumato.

cardiologie

pb médicaux

chir. Géné.

obstétrique

0% 10% 20% 30% 40%

Figure 2: Demande en soins selon la spécialité


Source : M.F. Mesli et all.Le recours aux soins: Résultats d’une enquête épidémiologique menée à Oran en mars 2002
in Journal Algérien de Médecine, janv-fev 2004, N°90, vol X
Diagramme en bâtons (segments de droite)→cqn

Figure 3: Répartition par nationalité des habitants du Grand-Duché de


Luxembourg en 2001(source Statec)
Représentation en secteurs ( en camembert )→cqn

Allaitement
mixte
59%

Allaitement
exclusif n = 303
41%

Figure 4 : Mode d’allaitement à 3 mois


Caractère Quantitatif
Histogramme → vqc discrétisée

Figure 5: Distribution du poids chez 80 sujets adultes


Polygone de fréquence →vqc

Figure 6: Répartition par classe d’âge d’un échantillon de 245 hypertendus de la


Wilaya d’El Tarf en 2013.
Diagramme en bâtons (segments de droite)→vqd
Courbe des effectifs cumulés croissants (Sigmoïde)→vqc

100
90
80
70
60
50
40
30
20
10
0
38 42 46 50 54 58 62

Figure 7: Courbe cumulative de la taille des membres inférieurs de 58


garçons.
Pyramide → distribution par âge et par sexe d’une
population

Figure 10 : Pyramide des âges - Population française en 1999


V- Bibliographie

• Mesli MF, Mokhtari A. Biostatistique. Édition mai 2007

• Cuggia M. Biostatistique descriptive. Université de Rennes 2006-


2007

• Mazerolle F. Statistique descriptive. Gualino éditeur, Paris 2006.

• Ancelle T. Statistique Épidémiologie. Édition 2002

• Dabis F, Drucker J, Moren A. Épidémiologie d’intervention. Édition


1992

• Schwartz D. Méthodes statistiques.1992

NB: Les références soulignées sont recommandées pour tous les


cours du module de Biostatistique.