Vous êtes sur la page 1sur 12

UMBB /faculté des sciences Date : 18/ 04 / 2020

2 ieme année SNV Cours à distance de biostatistique N : 1

Chapitre I : STAISTISQUES DESCRIPTIVE

Ce cours comporte deux parties, la première partie du chapitre concerne la statistique descriptive à
une variable, quant à la deuxième partie elle concerne la statistique descriptive à deux variables.

PARTIE I : statistique descriptive à une variable

La statistique est une branche des mathématiques qui s’intéresse à l’étude


des phénomènes aléatoires, en contre opposé aux mathématiques
déterministes plus familières aux étudiant(e)s, que sont le calcul différentiel,
calcul intégral, géométrie, algèbre, Le mot statistique dont le nom est dérivé de
``state’’ en référence à tout ce qui est étatique, est relativement nouveau,
puisqu’il a été introduit en Allemagne au XVIIème siècle. Par contre la pratique
de la statistique est plus ancienne, elle fut utile aux grands empires et royaumes
antiques. Il s’agissait de bien connaître la population pour administrer sa
répartition sur les territoires, collecter les impôts et gérer les aspects militaires.
De nos jours, on ne peut trouver un domaine qui peut être compris, analysé
sans les méthodes statistiques. Que ce soit dans le domaine des sciences
sociales, sciences de la vie ou sciences de l’ingénieur, les méthodes statistiques
sont omniprésentes pour mettre de l’ordre dans le protocole de travail, elles
permettent quand on est devant un chaos apparent des données, de
déterminer par où commencer et quelles sont les étapes à suivre selon le
contexte pour analyser ces données. En biologie par exemple, le domaine
d'application des bios statistiques est large. Il peut s'agir de biométrie, de
conception méthodologique d'études biologiques ou cliniques, ou encore du
recueil, de l'analyse et du traitement statistique de données recueillis lors
d'études écologiques, biologiques, agronomiques, halieutiques, de santé
publique, de santé environnementale, d'études
épidémiologiques, médicales ou cliniques, pharmaceutiques, agro
pharmaceutiques ect…
La statistique grosso-modo est formée de trois grandes classes : la statistique
descriptive, la statistique inférentielle et la nouvelle branche qu’est la statistique
exploratrice. La première partie de ce cours est consacrée à la statistique
descriptive. La statistique descriptive comme son nom l’indique, se propose de
décrire les données, de les classer et de les présenter sous des formes claires et
compréhensibles. Elle est à la base par exemple de toute organisation du
système d’information d’une entreprise : statistiques de la production ou des
ventes, statistiques financières, statistiques des ressources humaines ect…Elle
est aussi une importante composante en sciences de la nature et de la vie.

I.1 definition de la Statistique descriptive


Il s'agit d'organiser et résumer des observations. On ne fait pas de comparaisons
et on s'intéresse en général à un seul groupe, échantillon ou population. Exemple
: Lorsqu'on calcule le pourcentage de plantes atteintes par un parasite dans une
exploitation agricole, on fait de la statistique descriptive.
I.2 Population
La population désigne un ensemble d'unités statistiques. Les unités statistiques,
aussi appelées individus, sont les entités abstraites qui représentent des personnes,
des animaux ou des objets. La statistique sert à décrire l'ensemble des unités
statistiques qui composent la population.
1.3 Echantillon
Lorsque la population est trop importante, on étudie un échantillon, c'est-à-dire
un sous-ensemble, beaucoup plus petit, de la population. L'échantillon doit être
bien choisi pour pouvoir représenter la population.
1.4 Variables ou caractères statistiques
Un individu donné de la population peut être étudié selon certaines propriétés.
Ces propriétés sont appelées caractères ou variables statistiques. Exemple : une
étude sur les étudiants de l'université peut porter sur les différentes variables : leur
âge, leur sexe, leur nationalité, leur moyenne de l'année, etc.

Différents types de variables statistiques :


-Variable qualitative : Une variable qualitative est une variable qui ne prend
pas de valeurs numériques. Elle peut être :
a. Variable qualitative nominale : C'est une variable qualitative dont les
modalités (ses valeurs) ne sont pas ordonnées (exemple : couleur des
yeux, sexe, nationalité, marques d’ordinateur, célibataire, marié, …etc).
b. Variable qualitative ordinale : C'est une variable qualitative dont les
modalités sont naturellement ordonnées, hiérarchisées. (Exemple :
mention des examens : très bien (TB), bien(B), assez-bien(AB),
passables(P).) ; (les grades dans l’administration oubien dans l’armée
ect…

-Variable quantitative Lorsque la variable peut être exprimée


numériquement, elle est dite quantitative (ou mesurable). Dans ce cas, elle
peut être discrète ou continue.

a .Variable quantitative discrète:

Une variable quantitative est discrète si elle ne peut prendre que des valeurs
isolées, généralement entières. (Exemple : âge, moyenne des notes de l'année,
nombre d'enfants d'une famille; nombre de persone comtaminés par un virus,
…etc.).

b. Variable quantitative continue: Les variables quantitatives continues, ce


sont celles dont les modalités forment un continuum. Ce sont celles qui
peuvent prendre n’importe quelle valeur dans un intervalle raisonnable.
Exemple : La taille, le poids, le revenu,…

Règle de constitution des classes :


Considérons maintenant un échantillon de données provenant d’une
variable quantitative continue ou discrète avec un grand nombre de modalités.
Il est donc inconcevable de dresser un tableau où on énumère les modalités
d’une telle variable, il serait non analysable. Il faut donc grouper ces données en
classes de valeurs. Deux questions se posent alors :
• Combien de classes faut-il former ?
• Quelles seront les largeurs de chacune des classes ?

Le nombre de classes ne devrait être ni inférieur à 5, ni supérieur à 20 (il


varie généralement entre 6 et 12). Ce choix est fonction du nombre d'observations
et de leur dispersion. En pratique, on peut utiliser la formule suivante:
K = 1 + (10/3) log10 ( N)

- k indique le nombre de classes pour une série de N observations


Il s'agit ensuite de choisir l'amplitude (A) des classes. On choisit généralement
la même amplitude :
A=E/K Où E = xmax - xmin (est l’étendue de la série.)

1.5 Effectif et fréquence

L'effectif d'une valeur donnée d'une variable est l'ensemble d'individus présentant
cette valeur. L'effectif total (N) est la somme de tous les effectifs d'une variable.

N = ∑𝒊=𝒏
𝒊=𝟏 𝒏𝒊 = n1 + n2 +……….. + nn
La fréquence relative fi d'une valeur donnée est le rapport de l'effectif
correspondant à l'effectif total. La fréquence totale est toujours égale à 1.

𝒏𝒊
fi = où ∑𝒊=𝒏
𝒊=𝟏 𝒇𝒊 = 1
𝑵
𝒏𝒊
Soit en pourcentage : fi % = 100% où ∑𝒊=𝒏
𝒊=𝟏 𝒇𝒊% = 100%
𝑵

1.6 Effectifs et Fréquences cumulés croissants(es)


Quand les modalités ou les classes d'une variable sont rangées dans l'ordre
croissant les effectifs cumulés croissants (E.C.C) d'une valeur s'obtient en ajoutant
à chaque effectif les effectifs des valeurs qui la précèdent. On procède de la même
façon pour les fréquences cumulées FiCC ou en divisant les effectifs cumulés par
l'effectif total.
𝒋=𝒊 𝒋=𝒊
où EiCC ∑𝒋=𝟏 𝒏𝒋 , FiCC ∑𝒋=𝟏 𝒇𝒋

I.7 tableaux statistiques


Une présentation des données dans un tableau aide à faire les calculs statistiques
plus vite et plus efficacement.
Le tableau dans le cas d’une Variable qualitative
Exemple1 : une étude sur les groupes sanguins d’un échantillon de 30 étudiants
d’une section SNV a donné les résultats figurants sur le tableau suivant :

xi : groupes ni :effectif fi fi ( %) fréquence FiCC


relative( %)
sanguins pour chaque fréquence fréquence
relative cumulée
groupe

AB 7 0,2333 23,33% 0,2333


O 14 0,4667 46,67% 07
A 6 0,20 20,00% 0,9
B 3 0,10 10,00% 1
Totaux 30 1 100%

Dans ce cas : - la Population : 30 etudiants d’une section SNV


- Unité statistique (individu) : chaque etudiant parmi les 30etudiants.
- Variable (caractère) étudiée : les groupes sanguins notée par (xi)
- Nature du caractère : qualitatif nominale
- Effectif total : N = ∑𝟒𝟏 𝒏𝒊 = n1 + n2 + n3 + n4.=30(taille de la population)
- Fréquence totale : f1 + f2 + f3 + f4 = N/N = 1.

1.7.2 Le tableau dans le cas d’une Variable quantitative discrète:

Exemple2 :

Si on considere Une étude sur les notes (/5) d’assiduité et de participation en


travaux dirigés BIOSTAT d’un echantillon de 40 etudiants d’une section SNV
dans ce cas :
- Population : N= 40 etudiants d’une section
- Unité statistique (individu) : chaque etudiant parmi les 40etudiants.
- Variable (caractère) étudiée : la note (/5) notée par (xi)
- Nature du caractère : quantitatif discret
- Effectif total : N = ∑𝟒𝟏 𝒏𝒊 = n1 + n2 + n3 + n4.=40
- Fréquence totale : f1 + f2 + f3 + f4 = N/N = 1.

Dans le Le tableau suivant figurent les effectifs (ni) ,les fréquences (fi) et (fi)% et
les Effectifs et Fréquences cumulés croissants(es) Ei.C.C., F.C.C. et Fi.C.C.%

Fréquences (fi)
variable (xi) Fréquences
note /5 Effectifs (ni) = (ni /40) (fi)% Ei.C.C. Fi.C.C.% Fi.C.C

1 4 0,10 10,00% 4 10,00% 0 ,10

2 7 0,1750 17,50% 11 27,50% 0,2750

3 11 0,2750 27,50% 22 55,00% 0,55

4 9 0,2250 22,50% 31 77,50% 0,7750

5 9 0 ,2250 22,5% 40 100% 1

Totaux N= 40 1 100,00%

4étudiants , soit 10%, ont la note 1/5, 7etudiants, soit 17 ,50 %, ont la note 2/5 ect……

Exemple 3
Restons avec le même échantillon d’étudiants de l’exemple 2 et on s’intéresse
maintenant à la note globale de TD (/20) de chaque étudiant ,les 40 notes
obtenues sont ordonnées d’une façon croissantes :
0 1 2 3 3 4,5 5,5 6,75 7 7 7 7,5 7,5 7,75 7,75 8 8,5 9 10 10 10 10 10 10 10
10,5 10,75 11 11,5 12 12,5 13 13,5 13,75 14 15 16,5 17 18 19.
On regroupe ces notes en classes d’amplitude A=4 pour avoir une variable
(modalités) Variable quantitative continue:

- Population : N= 40 etudiants d’une section


- Unité statistique (individu) : chaque etudiant .
- Variable (caractère) étudiée : la note (/20) les notes sont regroupées en
clases (ci)
- Nature du caractère figurant sur le tableau : quantitatif continue
- Effectif total : N = ∑𝟒𝟏 𝒏𝒊 = n1 + n2 + n3 + n4.=40
- Fréquence totale : f1 + f2 + f3 + f4 = N/N = 1.

Ona le tableau suivant :


I.7.2Le tableau dans le cas d’une Variable quantitative continue:
Note sur 20 effectifs Fréquences (fi) Fréquences (fi)% Ei, (ECC) (FCC), Fi (FCC) ,Fi

Ci Effectifs Fréquences %.
cum. cum.

[0 ; 4[ 5 0,1250 12,50% 5 0,1250 12,50%

[4 ; 8[ 10 0,25 25,00% 15 0,3750 37,50%

[8 ; 12[ 14 0,35 35,00% 29 0,7250 72,50%

[12 ; 16[ 7 0,1750 17,50% 36 0,90 90,00%

[16 ; 20] 4 0,10 10,00% 40 1 100,00%

TOTAUX 40 1 100%

par exemple ,5 étudiants ont une note entre 0 et 3, soit 12,50% et 3 ont une note entre 4et 7 soit
25% ect …..

I.7 Représentations graphiques


Une bonne représentation graphique est très utile pour comprendre plus vite les
observations d'une étude statistique, ce chapitre présente quelques graphiques
classiques pour représenter les effectifs observés dans une étude statistique.

I.7.1 Variables qualitatives


Diagramme en barres : dans ce diagramme, les modalités de la variable sont
placées sur une droite horizontale et les effectifs (ou les fréquences) sont placés
sur un axe vertical. La hauteur de la barre est proportionnelle à l'effectif (figure
2.1). Les barres ont une certaine épaisseur pour qu'il n'y ait pas de confusion avec
les diagrammes en bâtons réservés à des variables quantitatives discrètes (figure
2.3). comme exemple on va reprendre l’exemple

xi ni fi ( %) l’angle
αi xi : les variables statistiques
AB 7 23,33% 84° ni : les effectifs
O 14 46,67% 168° fi : les fréquences
A 6 20,00% 72° αi : les angles
B 3 10,00% 36°
Totaux 30 100% 360°
Fig. 1 Exemple de diagramme en barres.

Diagramme circulaire ou camembert : L'effectif total est représenté par un


disque. Chaque modalité est représentée par un secteur circulaire dont la surface
(pratiquement : l'angle au centre) est proportionnelle à l'effectif correspondant
(figure 2.2). L'angle de chaque modalité se calcule
Angle αi°= fipar :
x 360°

Effectif de chaque modalité


α° = x 360
Effectif total
Fig. 2 Exemple de diagramme circulaire.
I.7.2 Variables quantitatives
- Cas des Variables quantitatives discrètes
Diagramme en bâtons : Les valeurs discrètes xi prises par les variables sont
placées sur
l'axe des abscisses, et les effectifs (ou les fréquences) sur l'axe des ordonnées. La
hauteur du bâton est proportionnelle à l'effectif (figure 3).

Le polygone des fréquences, qui consiste à joindre les extremités superieurs


des batons par une ligne en zig-zag. Le polygone de fréquences est très utile
quand on veut comparer le comportement de la même variable mesurée sur
plusieurs groupes.

Exemple4 :

le tableau suivant présente le nombre d’enfants (xi ) par familles (ni)

variable (xi) Effectifs (ni) Fréquences (fi)

1 4 10,00%
2 7 17,50%
3 11 27,50%
4 9 22,50%
5 6 15,00%
6 3 7,50%
Totaux 40 100,00%

Exemple il y’a 9 familles qui ont 4 enfants et 11 qui ont 3 enfants

Diagrammes en bâtons

12 11
11
10 9
Nombre de familles

9
8 7
7 6
6
5 4
4 3
3
2
1
0
1 2 3 4 5 6
Nombre d'enfants
iagramme en bâtons et Polygone des
fréquences

Fig.3 Exemple de diagramme en bâtons et polygone des fréquences.

Vous aimerez peut-être aussi