Académique Documents
Professionnel Documents
Culture Documents
BIOSTATISTIQUES
STATISTIQUE DESCRIPTIVE
Dr R. DJEKOUNE
Les statistiques ont pour origine le besoin des États pour gérer rationnellement
leurs ressources. Pour cela, il était nécessaire après collecte d'informations de
disposer de méthodes permettant de définir les variations, les évolutions, les
ressemblances ou les différences entre régions, entre années, entre catégories.
1. Populations et échantillons :
Une variable qualitative est une variable susceptible de classement mais pas de
mesure.
C'est une variable qu'on peut classer en deux ou plusieurs catégories mais qu'on
ne peut pas mesurer.
C'est une variable dont les différentes modalités s'expriment par des noms et non
pas par des valeurs numériques comme exemple : le groupe sanguin , grade de
carie dentaire ou l'intensité de la douleur.
Les variables qualitatives peuvent être de deux types : les variables qualitatives
nominales et les variables qualitatives ordinales.
3. Effectif absolu :
L'effectif absolu ou la fréquence absolue d'une population ou d'une partie de la
population est tout simplement le nombre d'unités d'observation qui la ou le
constituent.
4. Fréquences relatives :
Lorsqu'une population est répartie en deux ou plusieurs groupes, l'effectif relatif ou
la fréquence relative d'un groupe est l'effectif absolu de ce même groupe rapporté à
l'effectif absolu de la population totale.
L'effectif relatif est exprimé généralement en pourcentage.
NB : L’emploi des fréquences ou fréquences relatives s’avère utile pour comparer
deux distributions de fréquences établies à partir d’échantillons de taille différente.
5. Fréquences cumulées :
Lorsqu'une population est répartie en plusieurs groupes selon un certain ordre,
l'effectif cumulé ou la fréquence cumulée d'un groupe est égal à la somme des
effectifs de ce même groupe et de tous les groupes antérieurs.
1. Tableaux statistiques
En général une série statistique se présente sous la forme :
Variables Effectifs absolus Fréquences Fréquences
(xi) (ni) (fi)% = 𝑛𝑖/𝑁 cumulées (ficum)%
X1
X2
X3
Total N 100%
Elle est caractérisée par ses limites supérieure et inférieure, son amplitude ou sa
largeur et sa valeur centrale ou centre de classe.
L'amplitude
Ou la largeur de la classe est égale à la différence entre la limite supérieure et la
limite inférieure.
Est la valeur centrale comprise entre les deux limites c'est à dire la somme des
deux limites divisée par deux.
Une valeur ou une modalité ne doit appartenir qu'à une seule classe ; et chaque
classe doit être considérée comme un intervalle semi-ouvert à droite c'est à dire
que la limite supérieure d'une classe n'est pas comptabilisée parmi les valeurs de
cette même classe par contre elle représente la limite inférieure de la classe
suivante. Exp [0 – 5[, [5 – 10[, [10 – 15[…..
Nombre de classes :
Il est arbitraire et n'obéit pas à une règle bien définie mais il doit être toujours
compris entre 3 et 15 pour que la série statistique ne soit ni trop comprimée ni
trop dispersée.
𝐸
𝐴= 𝑛𝑜𝑚𝑏𝑟𝑒
de classe
Diagramme en bâtons :
C’est un ensemble de bâtons ayant pour abscisses des valeurs x1 ………xn du
caractère et chacun des point d’abscisses xi a une ordonnée proportionnelle à
l’effectif ni de xi
Exemple :
Répartition de 150 grenouilles suivant le nombre de vers trématodes (parasites)
Quelles hébergent.
Nb de 0 1 2 3 4 5 6
trématodes par
grenouille
Nb de 11 22 45 40 19 11 2
grenouilles
correspondantes
Fréquence 0 .07 0.14 0.30 0.26 0.12 0.07 0.07
relative
ni
45
40
22
19
11
2
xi
0 1 2 3 4 5 6
Diagramme en bâtons
On obtient en joignant par des segments de droite les extrémités des bâtons.
C’est un graphe linéaire passant par les points ayant pour abscisse x le centre de
la classe ou la valeur du caractère étudié et pour ordonnée « y « l’effectif de la
classe ou du caractère.
ni
42
40
24
20
13
11
1.9 2.2 2.5 2.8 3.1 3.4 3.7 4.0 4.3 4.6
BIOSTATISTIQUES
PARAMETRE DE POSITION
ET
PARAMETRE DE DISPERTION
Dr R. DJEKOUNE
II . PARAMETRE DE POSITION
Ni Xi
m= ∑ ----------
N
Xi = centre de classe pour les variables groupées.
Ni = Effectif correspondant à la modalité Xi.
- Le mode : Le mode ou valeur modale ou encore valeur dominante est la valeur
de la variable qui correspond à l'effectif absolu ou relatif non cumulé le plus
élevé.
Lorsque les données sont groupées en classes, on peut parler de classe modale,
c'est à dire celle qui correspond à l'effectif absolu ou relatif non cumulé le plus
élevé; ou bien on peut faire correspondre a la valeur modale le centre de la
classe modale.
Si une série statistique comprend un seul mode, elle est dite monomodale ; si
elle comprend deux valeurs modales, elle est dite bimodale; et si enfin elle
comprend plus de deux modes, elle est dite multimodale.
d1
( ______* A)
Mo = b inf +
d1 +d2
A : amplitude
Médiane :
- Les quartiles :
Qui divisent la série statistique en quatre parties égales. Ils sont au nombre de trois. Sur
une série de 100 unités le premier quartile correspond à la 25ème unité, le deuxième
correspond à la 50ème unité et n'est rien d'autre que la médiane et le troisième
correspond quant à lui à la 75ème unité.
- Les déciles :
Les paramètres de tendance centrale et les paramètres de position sont insuffisants pour
caractériser une distribution statistique car ils ne donnent qu'une idée sur le centre de
cette distribution et il faut également connaître la manière avec laquelle varient les
termes de la distribution autour de la moyenne.
Cette variabilité est estimée par les paramètres de dispersion qui sont au nombre de
quatre :
- La marge ou l'étendue : qui est égale à la différence entre la plus grande valeur et la
plus petite valeur de la série statistique.
- La variance (S2) : qui est égale à la somme des carrés des écarts par rapport à la
moyenne rapportée à l'effectif total.
∑ ni (xi - m)2
S2 =---------------------
N
OU
S = √ S2
S
CV = -------------------- x 100
m