Académique Documents
Professionnel Documents
Culture Documents
k_mhadebi@yahoo.fr
Introduction Générale
C’est quoi la biostatistique?
Définition:
La biostatistique est l’application des concepts et principes
statistiques à des données médicales, biologiques et de santé
public.
Exemples:
o Les effets d’un médicament.
o L’effet du niveau du cholestérol sur la pression artérielle.
o Le nombre de patients admis durant les fins de semaine aux
urgences.
o Distribution des pandémies.
o L’étude sur les différentes complications dans le traitement
des patients atteints du virus VIH.
Introduction Générale
Pour mieux comprendre l’objectif et la démarche de la
statistique, en tant que discipline, il convient d’abord de la
définir. A ce niveau, il faut remarquer que le mot
statistique peut couvrir plusieurs définitions, selon que l’on
utilise en singulier ou en pluriel, sous forme définie ou
indéfinie. Il faut donc faire la distinction entre les
statistiques, une statistique et la statistique.
Population
N
Caractéristiques
-moyenne: m
- écart- type: σ
- Proportion: p
Caractéristiques
Echantillon -moyenne: m
Echantillon représentatif - écart- type: σ
n <<< N
de la population - Proportion: p
Chapitre I: Le Vocabulaire Statistique
4. Caractère Statistique
Un caractère statistique est une grandeur attaché à un
individu et qui susceptible de varier d’un individu à un
autre. Il existe deux catégories de caractères statistiques: le
caractère qualitatif et le caractère quantitatif.
o Le caractère qualitatif est appelé « modalité ». Le caractère
qualité d’une pièce peut prendre les modalités ‘bonne’ et
‘mauvaise’. La couleur des yeux peut prendre la modalité
‘noire’, ‘marron’, ‘vert’, ‘bleu’, donc un caractère, ou une
variable, est de nature qualitative s’il ne peut être mesuré
tout en demeurant susceptible de classement, comme le sexe,
la race, l’espèce etc…
Chapitre I: Le Vocabulaire Statistique
Remarque
o On a ∑ ni = N c’est l’effectif total, le nombre total d’individus qui
forme la population.
o Si on divise les effectifs ni par l’effectif total, N, on obtient la
fréquence notée fi, c’est le pourcentage des individus qui ont la
modalité xi
Propriétés de la fréquence
On a 0 ≤ fi ≤ 1 et
Le tableau statistique contenant les couples (xi , fi ) s’appelle la
distribution statistique des fréquences.
Chapitre II: Tableaux statistiques et représentation
graphiques d’une distribution à un seul caractère
Exemple 1.1
Une enquête réalisée sur 20 familles pour étudier leurs
nombres d’enfants. On obtient les résultats suivants:
0 1 3 4 2 1 1 2 3 3
3 2 6 4 3 0 2 1 1 3
Exemple 1.2
Répartition des étudiants d’un amphi selon le nombre de frères et sœurs :
0 18
1 30
2 60
3+ 42
Total
Propriété 2.1
La surface d’un rectangle est proportionnelle à la fréquence.
Chapitre II: Tableaux statistiques et représentation
graphiques d’une distribution à un seul caractère
Propriété 2.1
La surface d’un rectangle est proportionnelle à la fréquence.
Chapitre II: Tableaux statistiques et représentation
graphiques d’une distribution à un seul caractère
Propriétés de F
Remarque
Dans le cas où la variable est continue, il convient d’appliquer la
formule suivante:
Où:
o binf : Borne inférieur de la classe modale
o a : Amplitude de la classe modale
o d1 : La différence entre l’effectif ou la fréquence de la classe
modale et celui de la classe précédente
o d2 : La différence entre l’effectif ou la fréquence de la classe
modale et celui de la classe suivante
Chapitre III: Description numérique d’une
variable statistique
Exemple 3.1
Les coûts ( en dinars) d’intervention de 50 médecins d'une
clinique sont les suivants:
300 380 410 370 380 440 420 340 350 340
380 320 450 480 440 480 320 360 330 410
380 405 430 490 370 330 360 420 340 390
410 450 320 380 410 430 440 470 300 500
430 400 380 320 310 390 410 480 330 370
Détermination Pratique
Cas d’une variable continue
Dans ce cas la fonction cumulative est continue et croissante
sur l’intervalle [0 ; 1]. Par conséquent, F(Me)= 0.5
correspond à une valeur unique. Si cette valeur ne figure
pas dans le tableau statistique on peut la déterminer par
interpolation linéaire.
Chapitre III: Description numérique d’une variable
statistique
Exemple 3.3
Selon l’INS la structure de la population tunisienne par
tranche d’âge pour l’année 1999 est la suivante:
Tranche d’âge [0,5[ [5,15[ [15,60[ 60 ans et plus
Fréquence fi 0,09 0,22 0,6 0,09
Fréquences cumulées Fi
Note 6 8 11 13 15 Total
Nombre d’étudiants 4 7 12 5 2 30
Exemple
On compare la distribution des salaires dans une clinique
Française et une entreprise Américaine. On a:
σ(X1) = 100 Euro
σ(X2) = 70 $
Les coefficients de variation sont:
CV1= 100/1500= 0.067
CV2= 70/800= 0.087
La dispersion relative est plus faible dans la clinique française,
les salaires dans cet clinique sont donc plus homogènes.
Chapitre III: Description numérique d’une variable
statistique
3.3 Les mesures de forme
3.3.1. Les coefficients d’asymétrie
Définition:
Une distribution est dite symétrique si les valeurs sont
dispersées de la même façon à droite et à gauche de la
tendance centrale (moyenne, mode ou médiane)
A- Lorsque la distribution est symétrique, on a Me=Mo=
Chapitre III: Description numérique d’une variable
statistique
Lorsque la distribution est dite asymétrique, la médiane est
généralement comprise entre le mode et la moyenne. Deux
cas se présentent:
B- Si < Me<Mo , la distribution est asymétrique et étalée à
gauche
Chapitre III: Description numérique d’une variable
statistique
C- Si Mo < Me< , la distribution est asymétrique et étalée à
droite
Chapitre III: Description numérique d’une variable
statistique
3.3.2. Le coefficient de Pearson
Pearson propose le coefficient d’asymétrie suivant:
On a alors µ1 = 0 et µ2 = V(X).
Pour les variables continue, on remplace xi par ci les centres des
classes.
Lorsque la distribution est symétrique, les moment d’ordre
impaire sont tous nuls (µ3, µ5, µ7, ……).
Chapitre III: Description numérique d’une variable
statistique
fi
leptokurtique
mésokurtique
platykurtique
xi
Chapitre III: Description numérique d’une variable
statistique
3.3.5. Les caractéristiques de concentration
Pour certaine variables comme le salaire ou le revenu, la
distribution des terres agricoles, il est intéressant de savoir
comment elles sont réparties entres les individus de la
population, c’est l’objet de l’étude de concentration.
A/La courbe de concentration
Soit X une variable statistique continue.
On appelle Valeur globale associée au couple (xi, ni), le produit
défini par VGi = ni xi
On appelle Valeur globale totale, qu’on note VGT
Chapitre III: Description numérique d’une variable
statistique
On appelle Valeur globale relative associée au couple (xi, ni), le
rapport, qu’on note qi défini par: