Académique Documents
Professionnel Documents
Culture Documents
Cours Biostat Bac1sp Desc
Cours Biostat Bac1sp Desc
Titulaire:
Pr Dr Ben Bondo MONGA
Etablissement :Université de Lubumbashi,
Ecole de Santé Publique
Niveau : BAC1 SANTE PUBLIQUE
UE: EPIDEMIOLOGIE, BIOSTATISTIQUE ET
INFORMATIQUE (CODE: EBI1111)
ECUE: STATISTIQUE DESCRIPTIVE
Volume horaire : 75 heures (45 heures
CMI, 15 heures TP, 15 heures TD)
Pré-requis : Cours de Mathématiques de
niveau secondaire.
Objectifs
Objectif général
Initier les participants aux notions de base
de la Biostatistique afin qu’ils puissent
être en mesure d’organiser, d’analyser, de
résumer et de présenter les données
concernant une population obtenues à
partir d’un échantillon.
Les participants devront aussi être
capables d’interpréter des résultats
statistiques d’une étude et d’en tirer les
conclusions adéquates.
Objectifs spécifiques
A l’issue de ce cours, l’apprenant sera capable de :
• Connaitre les différents problèmes abordés par la
Biostatistique
• Définir les termes : statistique, statistiques, unité
statistique, variable, population statistique, échantillon,
série statistique, distribution
• Déterminer les types de variables et les classifier
• Représenter les valeurs d’une variable quantitative et
d’une variable qualitative sous forme de tableau et de
graphique
• Déterminer les paramètres de position et de
dispersion
Objectifs spécifiques
•Représenter une distribution statistique
•Décrire les différentes méthodes d’échantillonnage
•Connaître les éléments de base du calcul des
probabilités et les lois élémentaires (binomiale,
Poisson, normale, Student, Khi2)
•Connaître les propriétés d’un test diagnostic
Compétences
•L’apprenant qui aura suivi ce cours devra développer
les compétences suivantes :
• Variable discrète
• Variable continue
• Variable qualitative binaire
Contenu du cours
• Moyenne
• Médiane
• Mode
• Quantiles
Contenu du cours
• Variance
• Ecart-type
• Etendue
• Ecart interquartile
• Percentiles
Contenu du cours
III.6. Méthodes d’échantillonnage
• Echantillonnage non probabiliste
• Echantillonnage probabiliste
• Aléatoire simple
• Systématique
• Stratifié
• En grappes
• A plusieurs degrés
• A plusieurs phases
Contenu du cours
• Généralités
• Principe et propriétés de la probabilité
• Tests diagnostics
Contenu du cours
• Cours interactifs
• Travaux pratiques individuels et en
groupes
• Travaux dirigés
MATERIELS D’APPRENTISSAGE
• Syllabus
• Vidéoprojecteur
• Ordinateur
• Logiciels : Windows, Microsoft office
( excel)
LIEU DES TRAVAUX PRATIQUES
s
• Statistique (latin « status » état)
– Ensemble cohérent de données numériques
relatives à un groupe d'individus.
– Statistiques démographiques
– Statistiques du chômage
– Statistiques de santé
» Etat de santé de la population
» Activité : Statistiques d’activité hospitalière
–…
Statistique avec ou sans S
• Statistique
– Ensemble des méthodes qui permettent de
rassembler et d'analyser les données numériques.
• Méthodes de mesures, d’échantillonnage, de
présentation des résultats, de modélisation, théorie des
probabilités….
– Paramètre tel que moyenne... calculé à partir d'un
ensemble de données.
A quoi ça sert en en Santé ?
Fiche de synthèse
1 - Activité Hospitalière
Nous pouvons volontiers remplacer le terme " unité " par les
termes " individu" , " sujet ".
DEFINITIONS
Une série statistique est l’ensemble des valeurs observées pour une
ou plusieurs variables sur les n sujets ou éléments de la population.
Une série simple est l’ensemble des n valeurs observées pour une
variable.
Une série statistique est représentée par (x1, x2,......, xi,..... xn), xi
étant la valeur de X pour le ième élément observé, i = 1, ....., n.
Une série simple peut être ordonnée ou non ordonnée. Les valeurs
brutes observées sur les sujets d’un échantillon sont au départ non
ordonnées.
DEFINITIONS
SERIE STATISTIQUE
Par exemple, la série statistique Poids en Kg (x1, x2, x3, x4, x5, x6.,
x7, x8, x9, x10) = (20, 18, 45, 20, 110, 65, 90, 85, 25,45) devient : (x(1),
x(2), x(3), x(4), x(5), x(6)., x(7), x(8), x(9)) = (18, 20, 20, 25, 45, 45, 65, 85,
90, 110) après cette opération.
Une série double est l’ensemble des valeurs observées pour deux
variables : il s’agit alors d’une série de n couples de valeurs.
DEFINITIONS
DISTRIBUTION STATISTIQUE
Par exemple, pour la série statistique Poids en Kg = (18, 20, 20, 25,
45, 45, 65, 85, 90, 110).
Données ordinales
Données qualitatives
xi ni fi fi =
ni
n
Chaque ligne correspond à
une valeur observée
différente. Il y a p valeurs
x1 n1 f1 différentes observées.
ni correspond au nombre
d’observations (effectif) ayant
x2 n2 f2 comme valeur xi
fi correspond à la fréquence
… … … (pourcentage) d’observations
ayant comme valeur xi : f = n
i
ni
xp np fp
S1 p n 1
Distributions groupées
• Données ordinales et xi ni fi Ni Fi
quantitatives.
• x1 est la plus petite x1 n 1 f 1 N1 F 1
valeur, xp la plus grande
des valeurs observées. x2 n 2 f 2 N2 F 2
• Effectifs cumulés Ni
– N2 = n2+n1
… … … …. …
• Fréquences cumulées.
– F2 = f2+f1 xp n p f p Np F p
S1p n 1
Distributions groupées
Ni est l’effectif cumulé c’est dire le
xi ni fi Ni Fi nombre d’observations ayant des
valeurs inférieures ou égales à xi :
i
x1 n 1 f 1 N1 F 1 Ni = n j
j=1
S1p n 1
Distributions groupées en
classes
• Les valeurs sont mises en classes.
• Toutes les distributions relatives à des
variables continues doivent être considérées
comme des distributions groupées, puisque
l'infinité de valeurs admissibles est
condensée en un nombre fini de mesures en
fonction de la précision de la méthode de
mesure utilisée.
A propos des classes
• Leurs valeurs extrêmes sont appelées bornes des
classes.
• Les classes sont mutuellement exclusives.
• L'amplitude de la classe ou intervalle ou module de
classe :
D= borne supérieure - la borne inférieure.
• Le point central ou encore point médian est situé à mi
chemin entre les bornes.
– Ci = Binfi +Di/2
• Dans certains cas la limite inférieure de la première
classe ou supérieure de la dernière classe n'est pas
précisée. On parle de classes ouvertes. A éviter !...
A propos des classes
• L'intervalle de classe est généralement
constant, toutefois, on utilise parfois une
amplitude variable notamment pour les
classes des valeurs extrêmes.
• En cas de classes d'amplitudes différentes, la
densité de fréquence ni/ Di permet de
comparer les effectifs ou les fréquences d'une
classe à l'autre.
• la densité de fréquence est utilisée pour
tracer l’histogramme.
Données quantitatives
continues
• Remarques :
– Si l’on mesure le poids d’un nouveau né avec une
précision de 1g, l’enfant qui pèse 3500g a en fait
un poids compris entre [3499,5g et 3500,5g[.
3500g représente le centre de la classe.
– Si l’on mesure l’âge en années pleines des
individus, une personne de 20 ans a un âge
compris entre [20 ans (inclus) et 21 ans[ (exclu).
20 ans représente la borne inférieure de la classe.
Distribution groupée en
classes
• On remplace la colonne xi par une colonne qui
comprend soit les bornes de classes, soit le
centre de classe ou la borne inférieure de la
classe (données temporelles comme l’âge en
années pleines).
Exemple: la taille
Classe Ci ni fi Ni Fi
[140-160[ 150,0 10 0,05 10 0,05
[160-165[ 162,5 20 0,10 30 0,15 Pour les calculs, le
[165-170[ 167,5 30 0,15 60 0,30 centre de classe Ci est
utilisé en remplacement
[170-175[ 172,5 45 0,23 105 0,53 de xi .
p
f =1
i =1 i
(xi)
0 10 15
1 20
2 15 10
3 5
4 3 5
>4 0
0
0 1 2 3 4 >4
– …….
30
20
• Symétrie – Aplatissement. 10
0
1 2 3 4 5 6 7 8 9 10
Remarques
• Autres représentations :
– Diagramme de Pareto et courbe ABC ;
– Boite à moustache (Box-plot).
• Attention :
– Les tableurs comme Excel ou Calc ne permettent
pas facilement de faire des histogrammes.
Les paramètres statistiques
• Paramètres de position Paramètres de l’échantillon
– Valeurs centrales
• Moyenne arithmétique E n
• Les autres moyennes s o
– géométrique
– harmonique
t i
– quadratique i t
• Médiane Le + souvent m a
• Mode
• Médiale a m
– Les fractiles t i
• Quartiles i t
• Percentiles
o s
• Paramètres de dispersion n E
– Amplitude ou étendue
– Ecart interquartiles
– Variance, Ecart type Paramètres de la population
– Coefficient de variation
• Paramètre d'aplatissement et de symétrie
Moyenne Arithmétique
Population m (mean) Echantillon x (average)
n = 6; T = 160+170+180+180+190+200 = 1080
1080
x= = 180 cm
6
Exemple
Le nombre de familles enquêtées
nombre nombre de
est de 53.
d'enfants familles Le nombre total d’enfants est
(xi) (ni) ni*xi de 77.
0 10 0
La moyenne du nombre d’enfants
1 20 20 par famille est de 77/53 = 1,45.
2 15 30
3 5 15 Attention aux arrondis ici si on
arrondit à une décimale la
4 3 12 moyenne est de 1,5 enfants par
Total 53 77 famille.
Exemple
• Les étudiants de première année de G1 santé sont répartis
dans 3 amphithéâtres avec les données ci-dessous. Quelle est
la moyenne de l’âge en G1 santé ?
• Rappel :
– Dans les distributions en cloche, unimodales
symétriques, mode, médiane et moyenne sont
confondus.
Fractiles
• Quartiles
– Q1: xi tel que Fi = 0,25 => 1/4 des valeurs lui sont
inférieures, 3/4 lui sont supérieures.
– Q2 = Médiane.
– Q3 : xi tel que Fi = 0,75 => 3/4 des valeurs lui sont
inférieures, 1/4 lui sont supérieures.
• Détermination graphique.
• Interpolation linéaire (cf médiane).
• Percentiles
– 10ième percentile : xi tel que Fi = 0,10
Remarques
• On a :
– 50% des individus qui ont des valeurs en dehors de
l’intervalle Q1-Q3 et 50% à l’intérieur.
p
T
x=
n
= f x
i =1
i i
N
T2
SCE = (x i − x) = U − 2
i =1 n
T2
U−
S2 = n
n −1
SCE
S=
n -1
Formules
p ni p
n = ni fi = fi = 1
i =1 n i =1
p
ni xi
x= i =1
p
ni
i =1
p
p ( ni xi )2
i i −
n x 2 i =1
S2 = i =1 n
p
ni − 1
i =1
S= S2
Représentation en Box Plot
• Résume la distribution en terme de
paramètres de position et de dispersion.
Coefficient de variation
• CV est le rapport écart type divisé par la
moyenne.
• CV est un nombre pur, sans unités.
• CV est totalement indépendant des unités.
• Le CV permet de comparer la variabilité de
distributions de variables qui ne sont pas dans
les mêmes unités.
Echantillonnage
• Sondage empirique
• Sondage aléatoire simple
• Sondage stratifié
• Sondage en grappe
• Sondage pseudo-aléatoire
Sondage empirique
• Constituer un échantillon de telle façon qu’un
nombre fixe de personnes à enquêter soit atteint.
• On utilisera volontiers la méthode des quotas,
indiquant à l’enquêteur de s’arrêter lorsqu’il a atteint
le quota voulu dans chaque catégorie:
– X hommes, Y femmes
– Z1 [18– 25 ans[, Z2 [25 – 60 ans[, Z3 [60 ans et +]
– etc…
Sondages probabilistes
• Ensemble de méthodes appelées sondages
probabilistes, parce que chaque unité échantillonnée
a une probabilité connue à l’avance de figurer dans
l’échantillon
• Ceci permet
– de généraliser l’estimation du phénomène à la population
dont est issu l’échantillon
– d’apprécier la marge d’erreur, le degré d’incertitude de
l’estimateur
Sondage aléatoire simple
• Chaque sujet de la population a la même probabilité
d’être inclus dans l’échantillon
• Maximise la possibilité de conclure pour toute la
population
• Base de sondage : liste pré-établie des sujets
– Liste des conducteurs
– Liste des foyers
– Liste des abonnés au téléphone
– …
Sondage aléatoire simple
• Procéder à un tirage au sort des sujets dans la base :
– Programme informatique
– Tables de nombre au hasard
TAS
Échantillon
Population Biostatistique - Pr Ben MONGA
Sondage aléatoire simple
• Le sondage permet de limiter la taille de
l’investigation
• Avantages :
– Réduction des coûts d’investigation
– Meilleure qualité de l’observation chez chaque sujet
(enquête, questionnaire, investigation clinique)
– Délai d’obtention des résultats plus rapide
• Limite :
– il est nécessaire d’avoir une base de sondage fiable
Sondage stratifié
• Dans certains cas, on peut craindre d’obtenir trop peu de
sujets d’un sous-groupe particulier (p.ex. le sexe), alors qu’on
peut supposer une fréquence particulière du phénomène
dans ce sous-groupe.
• exemple 1 : sexe M et F
TAS Échantillon
Population
Sondage stratifié
• Ainsi, connaissant le poids (la proportion) de chaque
strate dans la population, on peut en tenir compte au
moment du calcul des estimateurs
TAS Échantillon
Population Biostatistique - Pr Ben MONGA
Sondage en grappe
• Avantages :
– il n’est pas nécessaire de disposer d’une base de
sondage des individus, une liste des grappes suffit
• Inconvénients :
– le sondage est moins précis que le sondage
aléatoire simple
– L’analyse doit prendre en compte l’effet grappe, ce
qui est plus complexe
Sondage pseudo-aléatoire
L’échantillonnage systématique
1. Numéroter de 1 à N les unités incluses dans votre base de
sondage (N=taille de la population)
2. Déterminer l’intervalle d’échantillonnage (k) en divisant N
par la taille de l’échantillon n. k=N/n
3. Sélectionner au hasard un nombre entre 1 et k. Ce nombre
s’appelle l’origine choisie au hasard et serait le premier
nombre inclus dans votre échantillon.
4. Sélectionnez chaque kème unité après ce premier nombre
jusqu’à atteindre la taille n de votre échantillon
PROBABILITES
1 1 1 1 0 0 0 0 0 0
1 0 1 0 0 1 0 1 0 1
0 1 1 0 1 0 0 1 0 1
0 0 0 0 1 1 1 1 1 1
Rappel de logique
A et B A ou B
A B
Non(A) Non(B)
Non(A et B) Non(A ou B)
Rappels de logique
• Théorèmes de De Morgan
– Non(A et B) = Non(A) ou Non(B)
– Non(A ou B) = Non(A) et Non(B)
• La plupart des problèmes de probabilités n’ont
comme difficulté que l’interprétation logique
de l’énoncé.
Axiomes élémentaires
• 0 < P(A) < 1 : Une probabilité est toujours comprise entre 0 et 1.
• P(A) = 1 : L’événement est toujours réalisé.
• P(A) = 0 : L’événement est impossible.
• Si 2 événements sont exclusifs :
– P(A ou B) = P(A + B) = P(A U B) = P(A) + P(B)
• Exemple : Probabilité d'extraire un cœur ou un carreau = P(Cœur ou Carreau) =
0,25 + 0,25 = 0,5.
– Généralisation P(A+B+C) = P(A)+P(B)+P(C).
– Si 2 événements sont mutuellement exclusifs (mort-vivant) et
constituent l’ensemble des possibles :
• on a P(A)+P(B) = 1 => P(A) = 1-P(B).
– La probabilité de survie à un moment donné est égale à 1 moins la probabilité de
décéder à ce moment.
Evénements non exclusifs
• Les événements peuvent se produire simultanément. Exemples :
« avoir un infarctus du myocarde », « être diabétique ».
• P(A ou B) = P(B ou A)
= P(A) + P(B) - P(A et B)
• Ceci se déduit des relations :
– P(A ou B) = P(A sans B) + P(B sans A) + P(A et B)
– P(A sans B) = P(A) - P(A et B)
– P(B sans A) = P(B) - P(A et B)
• En conclusion :
– P(A ou B) < P(A) + P(B)
– P(A ou B ou C) = P(A) + P(B) + P(C) - P(A et B) - P(B et C) - P(A et C) +
P(A et B et C)
Probabilités conditionnelles
et indépendance
• En médecine, l’utilisation des probabilités
conditionnelles est fréquente et apparaît
naturelle.
– On dira que « un individu a 5 fois plus de chances de
développer une maladie coronarienne s’il fume un
paquet de tabac par jour que si il ne fume pas »…
• La connaissance n’est pas figée : avant la
réalisation d’un test, la probabilité d’une maladie
est p. Que devient-elle si on sait que le test est
positif ?
Probabilité conditionnelle
• Soit deux événements non exclusifs A et B :
– On regarde la probabilité que l’un se réalise alors que
l’autre est déjà réalisé.
• On note P(A/B) la probabilité de A si B est réalisé,
l’inversement du conditionnement P(B/A) est la
probabilité de B si A est réalisé.
• Quelle est la probabilité d’avoir une douleur de la fosse
illiaque droite alors que l’on a une appendicite ?
• Quelle est la probabilité d’avoir une appendicite alors que
j’observe une douleur dans la fosse iliaque droite ?
Probabilité conditionnelle
• Eléments de base :
P( A B)
P( A / B) =
P( B)
P( A B) = P( B A) = P( A / B) * P( B) = P( B / A) * P( A)
• Indépendance :
– Deux événements sont indépendants si la réalisation
de l’un n’influence pas la réalisation de l’autre.
• Exemple : Pluie, rouler avec des pneus lisses : a priori
indépendant; pluie, avoir un accident a priori non
indépendant.
Indépendance
• P(A/B) = P(AB)/P(B) = P(A)
=> P(AB) = P(A)*P(B)
P( B / Ai) * P( Ai)
P( Ai / B) =
P( B / A1) * P( A1) + P( B / A2) * P( A2) + ... + P( B / An) * P( An)
Le tableau à 4 cases
• En médecine, 2 tableaux
Maladie + Maladie - Total
à 4 cases sont très Test + A (VP) B (FP) T+=A+B=VP+FP
Test - C (FN) D (VN) T-=C+D=FN+VN
utilisés et renvoient au Total M+ = A+C = VP+FN M-=B+D=FP+VN n
complémentaires. Exposés
Non exposés
A
C
B
D
E+=A+B
E-=C+D
(1 − prévalence) * ( spécificité )
VPN =
(1 − prévalence) * ( spécificité ) + ( prévalence) * (1 − sensibilté )
VPP et VPN
en fonction de la prévalence
• Pour une sensibilité et
1,00
0,90
– Une augmentation de la
0,70
0,60
0,20
prévalence entraîne une 0,10
épreuve
non E / (1-)
Loi de probabilité :
X prend la valeur 1 à la réalisation de E, et X=0 à la non réalisation de E
P(X=1)=
P(X=0)=1-
n=15, P =0,8
certain événement E lors des n répétitions d'une
0,20
même épreuve"
0,15
X B (n, P) 0,10
n!
p(X = k) = Π k (1 − Π)(n −k) 0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 k
k!(n - k)!
Espérance (moyenne théorique) : n P
(valeur pas toujours prise par la variable!)
variance : n P (1− P)
Cependant cette loi est peu pratique à utiliser lorsque n est grand (calculs fastidieux!)
Tables de la loi binomiale…
Approche par d'autres lois lorsque c'est Biostatistique
possible… - Pr Ben MONGA
Loi Binomiale : exercices
Dans une population donnée, la prévalence de la tuberculose est 5%.
On constitue un échantillon aléatoire de 10 personnes tirées de cette
population.
1. Quelle est la probabilité d’avoir exactement 2 personnes
tuberculeuses parmi les 10?
2. Quelle la probabilité d’avoir tout au plus 2 personnes
tuberculeuses parmi les 10?
3. Quelle la probabilité d’avoir au moins 2 personnes
tuberculeuses parmi les 10?
4. Calculez l’espérance et l’écart-type
Réponse:
la loi Binomiale B (n, P) tend vers une loi de Poisson P () de seul paramètre
(espérance et variance de la loi binomiale approchée par la loi de Poisson).
P(X=k) = e- k / k!
Espérance =; variance= Ecart-type=
Côté pratique
On vérifiera d'abord que les calculs ne peuvent être approchés par une
distribution normale, plus pratique à utiliser
a/ = 4 accidents / j
uniformité sur une courte période de temps : = 2 accidents / 12 h
calcul de P(X=3) avec X suit une loi de Poisson de paramètre =2
P(X=3) =0.18
EXCEL: LOI.POISSON(x;espérance;cumulative) =LOI.POISSON(3;2;FAUX)=
0,18044704
AIRE TOTALE = 1
Taux d’une hormone en mg/ml
Lois continues
Taux d’une hormone en mg/ml
L’augmentation de la taille de l’échantillon
permet des classes de plus en plus fines et fait
tendre la densité de fréquence relative vers
une courbe appelée densité de probabilité.
Densité de probabilité
Les lois de distributions continues (loi
normale, Chi-deux, Student, etc…) sont
entièrement caractérisées par l’équation de
leur fonction de densité de probabilité f(x).
Distribution continue
X
1
ε1 +
P(ε1 X ε 2 ) = ε2
f(x)dx ; avec − f(x)dx = 1
Biostatistique - Pr Ben MONGA
LOIS DE PROBABILITES
LOIS DE DISTRIBUTION CONTINUES
Remarques
P( ε1 X ε2 ) = F(ε 2) − F(ε 2)
+
Moyenne : μx =
−
x f(x)dx
+
σx =
(x − μ x )2 f(x)dx
2
Variance :
−
Lorsqu'une grandeur subit l'influence d'un grand nombre de facteurs (ou paramètres ;
non tous identifiés, voire identifiables!) tous indépendants, qui, pris isolément, ne
contribuent que très faiblement à faire varier la grandeur étudiée, les valeurs prises par
la variable aléatoire (continue) associée à la grandeur se distribuent selon la loi de
Laplace-Gauss (appelée Loi Normale). Cette loi revêt un caractère de généralité. On y
fait très souvent appel en Biologie
X N (m s)
X N ( m s) POPULATION
2
1 x-μ
-2 σ
f(x) =
1
e
σ 2 π • courbe symétrique par rapport à x = m
X
m−s m m+s
Biostatistique - Pr Ben MONGA
LOI NORMALE
• P( Z 0 ) = P( Z > 0 ) = 0.5
• P( -1 Z 1 ) = 0.68
Z
-1,96 −1 1
Biostatistique - Pr Ben MONGA
1,96
LOI NORMALE
X 2 −μ
X2
σ
f(X) dX = g(Z) dZ
X 1 −μ
X1
σ
1 x-μ
-2
f(x) =
1
e σ 1
σ 2 π
2π
1
s 2
a
a
m X1 X2 Biostatistique
X - Pr Ben MONGA
0 Z11 Z2
Z
LOI NORMALE
1
2π Grâce au changement de variable Z = (X - m)/s,
on utilise la table de la loi Normale centrée
réduite pour calculer les probabilités (aires)
d'une loi Normale quelconque.
a
Z
0 t
Biostatistique - Pr Ben MONGA
LOI NORMALE
0 t
Z
0,2
0,15
0,1
0,05
0
-3 -2 -1 0 1 2 3
LOI NORMALE
_( x − m ) 2
1
f(x) = e 2s 2
s 2
0,45
0,4 s=1
0,35
0,3
s = 1,5
0,25
0,2 s=2
0,15
0,1
0,05
0
5 6 7 8 9 10 11 12 13 14 15 16
Utilisation de la loi normale
X suit une loi normale P (X b ) ?
de moyenne m
et d’écart-type s Fonction loi.normale
d’Excel
m b
Utilisation de la loi normale
X suit une loi normale
de moyenne m
et d’écart-type s
Si on suppose
que
p = P(X ≤ b )
est connue et
que l’on
cherche b
m
Il faut utiliser la fonction
loi.normale.inverse d’Excel b
Utilisation de la loi normale
X suit une loi normale P (a X b ) ?
de moyenne m
et d’écart-type s
a m b
Cas particulier très utile
xxxx
xxxxxxx
xxxxxxxx
xxxxxxxxx 95 % des x
xxxxxxxxxx
xxxxxxxxxxx
xxxxxxxxxxx
xxxxxxxxxxx
xxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
m − 1 s
m m + 1 s
Théorème central-limite
• La loi Normale est une « loi limite » pour toutes les lois.
Du Côté d’EXCEL :
Supposons que parmi les diagnostiques, la glycémie est normalement distribuée avec
µ=105mg/100 ml et σ=9mg/100ml.
1. Quelle est la proportion des diabétiques qui possèdent des taux compris entre 90 et
125mg/100ml ?
m=; s=1
P( -Z X Z ) = 1-α = 0.96
α=0.04 => Z1=2.054 et Z2=-2.054
Z1=(X1-95)/10=2.054
X1-95=2.054x10=20.54
X1=20.54+95=115.54
Z2=(X2-95)/10=-2.054
X2=-20.54+95=74.46
PERCENTILE 2 =74.46
PERCENTILE 98 = 115.54
Faire l’exercice 2!