Bio Statistique 20 Final

Biostatistique
Département pharmacie Oran
Année 2008/2009
Faculté de médecine Oran
1
Faculté de médecine
Département de pharmacie
Statistique Descriptive
1-Tableaux et graphes
I- Définition :
Statistique
Sens courant Sens scientifique
Les donné et les chiffre 1- collecté les donné

2- organisé tableaux – graphe
3- analyser
4- décision (conclusion)
1- Au sens « courant »
On emploie le terme de statistique pour designer les données elle-même «Un ensemble de données
numériques » ainsi on parle des statistiques démographiques, économiques, sanitaires, les statistiques des
étudiants Répartition par âge, sexe, année, spécialité …
Généralement se sont les tableaux et les chiffres qui figurent dans les bilans administratifs.
2- Au sens « scientifique »
La statistique est l'ensemble des méthodes des techniques a partir desquelles on: collecte, organise, résume,
présente et analyse des données. Ces techniques nous aident à tirer des conclusions et à prendre des décisions
judicieuses.
La population :
L’ensemble de tous les éléments a étudié.
L’échantillon :
Une partie de la population

Pour généraliser il faut que l’échantillon soit représentatif à la population.
Page 2
II- Les caractère :
1- Caractère quantitatif :
Un caractère et dit quantitatif quand il est par un chiffre ex : poids, l’âge, taille, le taux de glycémie …
2- Caractère qualitatif :
Un Caractère est dit qualitatif quand il n’est pas mesurable ex : la couleur, la douleur, la nationalité …
Dans le caractère quantitatif en distingue deux variables
a- Variable statistique discontinue :
La variable ne peut prendre que des valeurs isolé entière ex : nombre d’enfant par famille
b- Variable statistique continue :
La variable peut prendre tout les valeurs comprise dans un intervalle donner ex : le poids, la taille, l’âge …
III- Tableau et graphe :
a- Caractère qualitatif :
Catégorie Effective (fréquence absolu) ni Fréquence relative fi

Professeur 5 10%
Maitre assistant 25 50%
Infermière 20 40%
Totale n = 50 100%
n = taille de l’échantillon
𝑛𝑖
fi = 𝑛
× 100
Graph :
Soit
Secteur circulaire
30
25
20 Pr
15 INf
10
5 MA
0
Professeur Maitre Infermière
assistant
Page 3
b- Caractère quantitatif :
1- Variable discontinue
Nombre d’enfant par Effective (fréquence

Fréquence relative fi
famille xi absolu) ni
0 5 10%
1 25 50%
2 20 40%
Totale n = 50 100%
Graph :
Diagramme :
30
25
20
15
10
5
0
0 1 2
2- Variable continue :
Poids (Kg) xi Effective (fréquence absolu) ni Fréquence relative fi

40 – 50 5 10%
50 – 60 25 50%
60 – 70 20 40%
Totale n = 50 100%
Graph :
Histogramme
30
25
20
15
10
5 Histogramme
Polygone de fréquence
0
Poids (Kg) xi Page 4
Paramètres de tendance centrale
INTRODUCTION
PARAMETRES DE
TENDANCE
CENTRALE
Paramètres de position
Synthétisent et caractérisent l'ensemble des données par un nombre unique,

une valeur type.
De telle sorte qu'en première approximation la comparaison de deux séries puisse se ramener à la comparaison
de deux nombres.
Le Mode (Mo)
Cas de données non groupées
Le mode est la valeur de la variable statistique la plus fréquente

Exemple
Soit la série statistique:
3, 5, 7, 15, 16, 16, 16, 17, 17, 30
Alors
Mo = 16
Cas de données groupées
Variable statistique discontinue

Le mode et la valeur de la variable statistique qui correspond à l'effectif le plus élevé.
Dans ce cas sa détermination est immédiate
Exemple
Tableau N°1: Nombre d'enfants par famille
Page 5
Nombre d'enfants Xi Nombre de familles ni

0 4
1 5
2 10
3 16
Mo = 4 4 18
5 14
6 7
7 6
TOTAL 80
Interprétation:
Le nombre d'enfants le plus fréquent dans cet échantillon est égal à 4.
Variable statistique continue

Il existe deux méthodes : méthode direct et méthode d’interpolation linéaire
a) Méthode direct
Exemple
Tableau n°2 les pesées de 50 nouveau-née
Poids (Kg) Xi Effective ni

2, 0 – 2,5 2
2,5 – 3,0 4
3,0 – 3,5 6
Class modale 3,5 – 4,0 30
4,0 – 4,5 8
total 50
La classe modale est 3,5 – 4,0 alors le mode est

Mo = (3,5 + 4,0) / 2 = 3,75 Donc Mo = 3,75 Kg
Interprétation :
Le poids le plus fréquent dans cet échantillon égal à 3,75 Kg
b) Méthode d’interpolation linéaire

𝑑1
Mo = bmin + ×k
𝑑 1 +𝑑 2
= 3,76 Kg
k = amplitude
Interprétation :
Le poids le plus fréquent dans cet échantillon égal à 3,76 Kg
Page 6
La médiane (Me)
Cas des données non groupées
La médiane est la valeur de la variable statistique qui divise la série statistique en deux parties égales
(50% de l’effectif lui soit inférieur et 50% supérieur)
- Nombre d’observation impair :
7, 9, 13, 45, 70, 101, 115
Me = 45
- Nombre d’observations pair :
2, 5, 9, 10, 12, 14, 20, 22
Me = (10 +12) / 2 = 11
La demi-somme de l’intervalle médian
Cas des données groupées

la médiane est la valeur de la variable statistique qui occupe le (n / 2)éme rang (détermination direct)
Nombre d’enfants Nombre de familles ni

0 4
1 5
2 10
3 16
4 18
5 14
6 7
7 6
Totale 80
n / 2 = 80 / 2 = 40, la valeur de la variable qui occupe le 40éme rang est égale à 4 donc Me = 4 enfants
Interprétation :
Il ya 50% (soit 40 familles) qui ont moins de 4 enfants et 40 plus de 4 enfants

Il y a deux méthodes : direct, méthode d’interpolation linéaire
a) Méthode direct
Les pesées de 50 nouveau-nées
Page 7
Poids (Kg) Xi Effective ni

2, 0 – 2,5 2
2,5 – 3,0 4
3,0 – 3,5 6
Class médiane 3,5 – 4,0 30
4,0 – 4,5 8
total 50
3,0 – 3,5 alors Me = (3,0 + 3,5) / 2

Donc Me = 3,75 Kg
Interprétation :
Il ya 50% (soit 25) nouveau-née qui ont un poids inferieur à 3,75 Kg et 50% (25) qui on un poids
supérieur à 3,75 Kg
b) Méthode d’interpolation linéaire

𝑛
2
−𝑆
Me = bmin + ×k
𝑛 𝑚𝑒
50
2
−12
Me = 3,5 + × 0,5
30
Me = 3,72
La moyenne arithmétique
Cas des données groupées
(moyenne arithmétique simple)

La moyenne arithmétique est la somme des observations divisée par leur nombre. Elle est notée
𝑥 +𝑥 +𝑥 +𝑥 +𝑥 + …..+𝑥 𝑛
𝑋= 1 2 3 4 5
𝑛
𝑥𝑖
Ce qui donne 𝑋 =
𝑛
Cas des données groupées (moyenne arithmétique pondérée)

S’il y a répétition de certaines observation, c'est-à-dire le nombre x1 se produit n1 fois, x2 se produit
n2 fois, … …, en formule précédente devient
Page 8
𝑛𝑖 𝑥𝑖
𝑋=
𝑛
Exemple :
Nombre d’enfants Nombre de familles ni ni xi

0 4 0
1 5 5
2 10 20
3 16 48
4 18 72
5 14 70
6 7 42
7 6 42
Totale 𝑛𝑖 = 𝑛 = 80 𝑛𝑖 𝑥𝑖 =
299
𝑛𝑖 𝑥𝑖 299
𝑋= = = 3,74
𝑛 80
𝑋 = 4 enfants, il ya en moyenne 4 enfants par famille

Xi = centre de classe
Paramètres de dispersion :
Elles ont pour but de permettre de mesurer la concentration de valeurs observées autour des valeurs
centrales
Elles vont nous données les unes par rapport au autres : sont elles prés de leur centre ? Proches les
une des autres ? sont-elles dispersées ?
1- L’étendue :
c’est la différence entre la plus grande et la plus petite valeur de la série

e = x max – x min
2- L’écart-moyen (écart-absolu moyen) ×
Il est défini comme étant égal à des différentes valeurs absolues, des différences entrent l’observation
et la valeur centrale
𝑛 𝑖 𝑥 𝑖 −𝑋
Em=
𝑛
Page 9
3- La variance :
Elle est définie comme la valeur moyenne des carrées des écarts des valeurs de la série statistique a
leur moyenne arithmétique
𝑛 𝑖𝑥𝑖 2
𝑛 𝑖 𝑥 𝑖 −𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑛
S2 = =
𝑛 𝑛
4- L’écart-type :
C’est la racine carré positive de la variance c’est un paramètre dont l’unité est celle de la variable
𝑛 𝑖𝑥𝑖 2
𝑛 𝑖 𝑥 𝑖 −𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑛
S= =
𝑛 𝑛
5- Le coefficient de variation:
C’est le rapport de l’écart type sur la moyenne arithmétique.

Il est indépendant du choix des limites
𝑆
C.V =
𝑋
Remarque :
C.V ≥ 0.33 la dispersion est importante
C.V < 0.33 la dispersion est moins importante
Application :
Soit le tableau suivant qui représente la répartition des notes dans un examen
Classe xi Effectif ni xi centre de class xi ni 𝑥𝑖 − 𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑋 2
0−4 4 2 8 100 400

4−8 8 6 48 36 288
8 − 12 10 10 100 4 40
12 − 16 14 14 196 4 56
16 − 20 12 18 216 36 432
Totale 48 568 1216
Calculer les paramètres de tendance centrale et de la dispersion
𝑛𝑖 𝑥𝑖 568 𝑛 𝑖 𝑥 𝑖 −𝑋 2
𝑋= = = 11.83
2
S =
𝑛
𝑛 48
𝑑1 4 S2 = 25.33
Mod = bmin + × k = 12 +
× 4 = 14.66 S = 5.033
𝑑 1 +𝑑 2 4+2
𝑛 48 C.V = 0.419
−𝑆 −22
Me = bmin +
2
× k = 12 + 2 × 12,14 C.V > 0.33
𝑛 𝑚𝑒 14 La dispersion est importante
Page 10
Introduction aux calculs des probabilités :
Eléments du calcul des probabilités
1- Dénombrement et analyse combinatoire :
On dit qu’un ensemble est dénommable si on peut numéroter ses éléments pour les compter. L’analyse
combinatoire comprend un ensemble de méthodes qui permettent de déterminer le nombre de tous les résultats
possibles d’une expérience particulière
I. 1- Arrangements :
1-1 arrangement sans répétition :

On appelle arrangement sans répétition ou arrangement tout court, de n éléments p à p (n ≥ p) tout ensemble
ordonné de p de ces élément est donc caractérisé par la nature des «éléments ou par leur ordre
𝑝 𝑛!
D’où 𝐴𝑛 = 𝑛 − 𝑛 − 1 𝑛 − 2 … … 𝑛 − 𝑝 + 1 =
𝑛 −𝑝 !
Exemple1 :
Tiercé dans l’ordre dans une course de 14 chevaux
3 14!
𝐴14 = 14 ∗ 13 ∗ 12 = = 2184 𝑓𝑜𝑖𝑠
14−3 !
Exemple 2 :
Une séquence d’ADN est constituée d’un enchainement de 4 nucléotides [A (Adénine), C (cytosine), G
(guanine), et T (Thymine)]. Il existe différents arrangements possibles de 2 nucléotides ou di nucléotides p=2
et n=4
4!
𝐴24 = = 12 di nucléotides possible
4−2 !
I.2-permutation, sans répétition :
Une permutation de n objet, les permutations de ces n objets constituent un cas particulier des arrangements,
c’est le cas ou n=p
Deux permutations ne différent que par l’offre des objets
𝑛!
Calcule de 𝑃𝑛 = 𝐴𝑛𝑛 = = 𝑛 𝑛 − 1 𝑛 − 2 … . = 𝑛!
𝑛 −𝑛 !
Exemple :
Le nombre de manières de places 8 médecin autour d’une table
P8 = 8 ! = 8(8 – 1) (8 – 2) * …….*1=40320
Possibilités
Page 11
II.- Combinaison :
II.1 Combinaison sans remise
On appelle combinaison de p élément pris parmi n (n ≥ p) tout ensemble que l’on peut former en choisissant p
de ces éléments, sans considération d’ordre. Deux combinaison distinctes différent donc par la nature d’au
𝑝
𝑝 𝐴𝑛 𝑛!
moins un élément calcul de p ou 𝐶𝑛 = =
𝑃! 𝑝! 𝑛 −𝑝 !
Exemple 1 :
combien de manière peut-on avoir le nombre de possibilité de tiercé dans désordre dans une course de 14
chevaux
3 14∗13∗12
𝐶14 = = 364
3∗2∗1
Exemple 2 :
Dans le cadre de l’exemple de séquence d’ADN le nombre de di nucléotides attendus sans tenir compte de
l’ordre des bases dans la séquence est donc
4∗3
𝐶42 = = 6 di nucléotide
2∗1
III- Notions de base de calcul des probabilités
III.1- phénomène déterministes :
Sont prévisibles donnent un résultat qui ne dépend pas d’une loi de probabilité. Ils donnent le même résultat
lorsqu’on répète l’expérience.
III.2- Phénomènes aléatoires :
Sont dus en partie au hasard mais suivant des lois de probabilité. Le résultat est variable mais la répartition des
résultats est prévisible
III.3- Notion de probabilité :
Dans la statistique descriptive on a défini la fréquence relative

𝑛𝑖
𝐹𝑖 = ni : la fréquence absolue (ou le nombre de répétition xi)
𝑛
n : la taille de l’échantillon étudié
Page 12
Convergence en probabilité :
Si l’on répète N fois une expérience dans laquelle la probabilité d’apparition d’un événement A est p ; la
𝑛
fréquence de cet évènement au cours des N expériences, tend vers p lorsque N tend vers l’infini
𝑁
𝑛
N → ∞ => →p
𝑁
𝑓 𝑥𝑖 → 𝑝 𝑥𝑖 quand n → ∞
IV- La probabilité :
Quand une épreuve peut avoir résultat un ensemble de N cas et que n de ces cas sont favorables à un
événement A alors la probabilité que A se réalise
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒

𝑃=
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒
𝑛 𝑛
𝑃 𝐴 = 𝑁 comme 0 ≤ 𝑛 ≤ 𝑁 en divisant par N => 0 ≤ ≤ 1 => 0 ≤ 𝑃 𝐴 ≤1
𝑁
V- Evénement : contraire – impossibilité – certitude :
V.a- Evénement contraire :
Si A est un événement quelconque, alors 𝑃 𝐴 = 1 − 𝑃 𝐴

Ainsi parmi N cas possible, n sont favorables à l’évènement A ; (N-n) sont favorables à 𝐴
𝑁− 𝑛 𝑛
𝑃 𝐴 = =1− =1− 𝑃 𝐴
𝑁 𝑁
V.b- Evénement impossible :
Si le nombre de cas favorables de l’événement impossible A est nul

0
𝑃 𝐴 = =0
𝑁
A est un événement impossible
Ex : aucune chance que la maladie soit présente
V.c- Evénement certain
Si le nombre de cas favorable de l’événement est non nul n=N

𝑁
𝑃 𝐴 = =1
𝑁
A est un événement certain
Ex : maladie est présente
Page 13
VI- Théorème des probabilités totales
Soit A et B deux événement dont le nombre de cas favorable sont respectivement n1 et n2cherchons la
probabilité de l’événement « A ou B » noté A∪B
nombre de cas favorables à « A∪B »
𝑃 𝐴∪𝐵 = 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠
B A
𝑛1 + 𝑛2 𝑛1 𝑛2
𝑃 𝐴∪𝐵 =
𝑁
= +
𝑁 𝑁
=𝑃 𝐴 +𝑃 𝐵 n2 n1
𝑃 𝐴∪𝐵 = 𝑃 𝐴 +𝑃 𝐵
Evénement incompatibles :
Deux événement A et B sont dis incompatibles si la réalisation de l’un exclu la réalisation de l’autre autrement
dit les parties A et B sont disjointes
𝑃 𝐴1 ∪ 𝐴2 ∪ 𝐴3 … … … ∪ 𝐴𝑛 = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ + 𝑃 𝐴𝑛
Evénement compatibles
𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵
𝑃 𝐴∪𝐵∪𝐶 =𝑃 𝐴 +𝑃 𝐵 +𝑃 𝐶 − 𝑃 𝐴∩𝐵 −𝑃 𝐴∩𝐶 −𝑃 𝐵∩𝐶 +𝑃 𝐴∩𝐵∩𝐶
Loi de probabilité Variable aléatoire discrète:
I.1 Variable aléatoire discrète :
Soit une variable pouvant prendre l’ensemble des valeurs : 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 … … 𝑥𝑛 avec les
probabilités 𝑝1 , 𝑝2 , 𝑝3 , 𝑝4 … … 𝑝𝑛 telles que 𝑝1 + 𝑝2 + 𝑝3 + 𝑝4 + ⋯ + 𝑝𝑛 = 𝑃𝑖 = 1
On dit que x est variable discrète si elle ne peut prendre que des valeurs isolées et variable aléatoire si
sa valeur est fixée par le résultat d’une épreuve.
Donc tout les (valeurs) variables qui sont associées à une épreuve aléatoire et qui prennent les valeurs
numérique discontinues s’appellent variable aléatoires discontinues.
I.2 loi de probabilité :
On dit qu’on a définit une loi de probabilité par le tableau :

𝑥𝑖 …………………………………………………... Σ
𝑝𝑖 …………………………………………………... 1
Page 14
Exemple1 :
On jette un dé équilibré une seule foi. Soit x la variable aléatoire désignent le nombre de point
obtenus sur chaque face :
1- Déterminer graphiquement cette loi
Réponse :
1- loi de probabilité
𝑥𝑖 1 2 3 4 5 6 Σ
𝑝𝑖 1/6 1/6 1/6 1/6 1/6 1/6 1
Connaissant toutes les valeurs possibles de la variable 𝑥𝑖 et les valeurs correspondantes de
𝑝𝑖 , on a donc défini la loi de probabilité de cette variable
1/6
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6
En portent les valeurs de 𝑥𝑖 en abscisses et celles des 𝑝𝑖 en ordonnés sur l’axe des cordonné
I.3 Calcule des paramètres de tendance centrale et de dispersion :
I.3.a Espérance mathématique 𝑿 :
L’espérance mathématique d’une variable aléatoire discontinue notée 𝐸 𝑥 , vaut

𝐸 𝑥 = 𝑝1 𝑥1 + 𝑝2 𝑥2 + 𝑝3 𝑥3 + 𝑝4 𝑥4 + ⋯ + 𝑝𝑛 𝑥𝑛
𝐸 𝑥 = 𝑝𝑖 𝑥𝑖
Pour l’exemple 1 :
1 1 1 1 1 1 21
𝐸 𝑥 = ∗1+ ∗2+ ∗3+ ∗4+ ∗5+ ∗6=
6 6 6 6 6 6 6
21
→𝐸 𝑥 =
6
I.3.a Variance :
La variance d’une variable aléatoire discontinue, notée 𝜎 2 𝑥 ou 𝑉(𝑥) est définie par
𝑉 𝑥 = 𝑝𝑖 𝑥𝑖 − 𝐸 𝑥 2
C’est une moyenne de la somme des carrés 𝑥𝑖 par a port a leur espérance mathématique
La formule de définition peut encore s’écrire 𝑉 𝑥 = 𝑝𝑖 𝑥𝑖2 − 𝐸 𝑥 2 (formule pratique)
Page 15
I.4 Définition et représentation graphique de la fonction de répartition :
La fonction de répartition 𝐹(𝑥) est la fonction cumulative qui correspond à la courbe cumulative
(sigmoïde) de la variable statistique, c’est un moyen (outil) pour le calcule des probabilités des lois
C’est une fonction en escalier, toujours croissante.
Exemple :
Soit à déterminer en fonction de répartition de la loi de probabilité définie par
𝑥𝑖 2 5 6 8 Σ 1
𝑝𝑖 0.1 0.4 0.3 0.2 1 0.8

𝑓 𝑥 = 0 𝑝𝑜𝑢𝑟 𝑥 < 2
𝑓 𝑥 = 0.1 𝑝𝑜𝑢𝑟 2 ≤ 𝑥 < 5 0.5
𝑓 𝑥 = 0.1 + 0.4 𝑝𝑜𝑢𝑟 5 ≤ 𝑥 < 6

𝑓 𝑥 = 0.1 + 0.4 + 0.3 𝑝𝑜𝑢𝑟 6 ≤ 𝑥 < 8
0.1
𝑓 𝑥 = 0.1 + 0.4 + 0.3 + 0.2 = 1 𝑝𝑜𝑢𝑟 𝑥 ≥ 8
1 2 3 4 5 6 7 8 9 10 11
LES LOIS USUELLES DE PROBABILITE
1 -La Loi Binomiale (variable aléatoire discrète)
Lorsque les éventualités se réduisent à une alternative (succès ou échec – Malade ou non malade), la variable
aléatoire (nombre de succès, nombre de malades) suit une loi de probabilité appelée LOI BINOMIALE
Soit P la probabilité d'un événement A, donc q = 1-p, est la probabilité de l'événement contraire
La probabilité de réaliser x fois au cours de n épreuves identiques l'événement A est :
𝑝 𝑝 𝑛!
𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥 𝑜𝑢 𝐶𝑛 = 𝑝! 𝑛−𝑝 ! (Combinaison) n  x
n : nombre des épreuves, taille de l'échantillon
p : probabilité élémentaire ( p + q = 1)
n! = n(n-1) (n-2) (n-3) ...1
(5! =5 x 4 x 3 x 2 x 1) lire 5 factoriel.
Paramètres de la loi Binomiale :
L’espérance mathématique :
E (x) = n.p
La variance :
V(x) = n.p.q
L’écart type :
𝑆= 𝑛∗𝑝∗𝑞
Page 16
Conditions d'application de la loi binomiale :
La loi binomiale n’est applicable que si les conditions suivantes sont vérifiées:
1) La variable aléatoire étudiée est discontinue.
2) Les deux évènements indépendants.
3) La probabilité élémentaire est constante durant toute l’épreuve.
Exemple 1 :
Quelle est la probabilité d'avoir 3 garçons dans une famille de 10 enfants ?

Calculer l’espérance mathématique et la variance de cette variable.
Réponse :
Cette variable est discontinue

Il n'y a que 2 éventualités (garçon ou fille)
 elle suit une loi binomiale de paramètres : n = 10 et p = ½.
n = 10, p = ½, q = ½, x = 3
p
et P x = Cn ∗ Px ∗ qn−x
Alors la probabilité d’avoir 3 garçons :
3
13 17 10!
P x = 3 = C10 ∗ ∗ = ∗ ½ 10 = 0.117
2 2 3! 10 − 3 !
P(x=3) = 0,117
Ou bien directement de la table de la loi binomiale : P(x=3) = 0,117
E (x) = n.p = 10 . ½ = 5
La variance :
V(x) = n.p.q = 10 . ½ . ½ = 2,5
Exemple 2
On s’intéresse au nombre de garçons dans une famille de 4 enfants.

Déterminer la probabilité :
1) de n’avoir aucun garçon.
2) d’avoir un garçon.
3) d’avoir quatre garçons.
Réponse :
Il s’agit d’une variable aléatoire discontinue (nombre de garçons) et deux éventualités (garçon ou fille).
𝑝
On a : n = 4, p = ½, q = ½, 𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
Alors :
1) La probabilité de n’avoir aucun garçon :
0
10 14 1
𝑃 𝑥 = 0 = 𝐶4 ∗ ∗ = = 0.062
2 2 16
2) La probabilité d’avoir un garçon :
1
11 13 4
𝑃 𝑥 = 0 = 𝐶4 ∗ ∗ = = 0.250
2 2 16
3) La probabilité d’avoir quatre garçons :
Page 17
14 10 1
𝑃 𝑥 = 0 = 𝐶44 ∗ ∗ = = 0.062
2 2 16
On peut déterminer ces probabilités directement de la table de la loi binomiale
Exemple 3 :
Une intoxication répartie au hasard affecte 10% de l’ensemble des habitants d’une ville. On considère
l’ensemble des familles de 5 personnes. Quelle est la probabilité :
- Que les cinq membres de la famille soient malades ?
- Que 4 des 5 membres de la famille soient malades ?
- Qu’il y ait au moins 3 malades dans la famille ?
- Quelles sont l’espérance mathématique et la variance de cette variable ?
Réponse :
 Variable aléatoire discontinue (nombre de malades)

 Deux éventualités malade ou non malade)
Donc cette variable est régie par une loi binomiale de paramètres
n = 5 et p=0,1 (10%); On a : n=5, p= 0,1 et q=0,9
𝑝
𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
1) 𝑃 𝑥 = 5 = 𝐶55 ∗ 0.15 ∗ 0.90 = 0.000
2) 𝑃 𝑥 = 4 = 𝐶54 ∗ 0.14 ∗ 0.91 = 0.000
3) 𝑃 𝑥 ≥ 3 = p 3 + p 4 + p 5 = 𝐶53 ∗ 0.13 ∗ 0.92 + 𝐶54 ∗ 0.14 ∗ 0.91 + 𝐶55 ∗ 0.15 ∗ 0.90
= 0.000 + 0.000 + 0.008 = 0.008
𝐷𝑜𝑛𝑐 𝑃 𝑥 ≥ 3 = 0.008
E(x) = n.p = 5. 0,1 = 0,5
La variance :
V(x) = n.p.q = 5. 0,1. 0,9 = 0,45
Exercice :
Une maladie touche 6 % d’une population d’un pays donné.

On s’intéresse aux familles de 4 membres. Quelle est la probabilité :
1 - que les quatre membres de la famille soient malades ?
2 - que 2 membres de la famille soient malades ?
3 - qu’il y ait au moins 1 malade dans la famille ?
4 - qu’il y ait au plus 2 malades dans la famille ?
5 - qu’il y ait moins de 3 malades dans la famille ?
6 - qu’il y ait plus de 2 malades dans la famille ?
7 - Calculer l’espérance mathématique et la variance de cette variable.
Page 18
La loi de poisson : (Variable aléatoire discrète)
Définition de la loi de Poisson :
On dit qu’une variable aléatoire discrète suit une loi de Poisson si sa densité de probabilité est donnée sous la
forme:
𝛌𝐱 𝐞−𝛌
𝐏 𝐱 =
𝐱!
Où :
e = 2,71 (base du logarithme népérien) et
 : espérance mathématique E (x), appelée encore en pratique la moyenne.
λ = nP = E x = V x
Paramètres de la loi de Poisson :
L’espérance mathématique : E(x) = 

La variance : V(x) = 
L’espérance mathématique de la loi de Poisson est égale à sa variance.
La loi de Poisson est une loi de probabilité pour les événements rares (probabilité faible) et est utilisée
généralement dans le cas de la variable aléatoire discontinue distribuée dans le temps.
Exemple 1 :
On suppose qu'une variable biologique discontinue est distribuée dans le temps avec une moyenne de 9 unités
par heure. Quelle est la probabilité d'avoir 3 unités durant une heure ? (On suppose que cette variable suit une
loi de Poisson).
Réponse :
On a comme données
E(x) = = 9 unités ; x = 3
x suit la loi de Poisson, donc :
𝜆𝑥 𝑒 −𝜆
𝑃 𝑥 =
𝑥!
93 𝑒 −9
𝑃 𝑥=3 = = 0.015
3!
Ou bien directement de la table 𝑃 𝑥 = 3 = 0.015
Exemple 2 :
On suppose que le standard téléphonique du C.H.U. d'Oran reçoit en moyenne 5 appels par minute.
Sous l'hypothèse que le nombre d'appel pendant un intervalle de temps suit une loi de Poisson, calculer la
probabilité que durant une minute le standard téléphonique reçoit :
- trois appels
- Au plus deux appels.
Page 19
Réponse :
1) On a les données :
E(x) =  = 5 appels par minute ; x = 3
x suit la loi de Poisson, donc :
𝜆𝑥 𝑒 −𝜆
𝑃 𝑥 =
𝑥!
53 𝑒 −5
𝑃 𝑥=3 =
3!
La probabilité de recevoir 3 appels: P (x=3) = 0,140
Ou bien directement de la table : P(x=3) = 0,140.
2) Au plus deux appels :

P( x  2) = P(x=0) + P(x=1) + P(x=2)
50 𝑒 −5 51 𝑒 −5 23 𝑒 −5
𝑃 𝑥=0 = ;𝑃 𝑥 = 1 = ,𝑃 𝑥 = 2 =
0! 1! 2!
P (x=0) = 0,006 ; P (x=1) = 0,033 et P (x=2) = 0,084
Alors
P(x  2) = P(x=0) + P(x=1) + P(x=2)
= 0,006 + 0,033 + 0,084
La probabilité de recevoir au plus 2 appels :
P( x  2) = 0,123
Exercice :
Suite à une vaccination contre le paludisme, dans une population à risque, on estime à 2%, compte tenu du
délai d'immunisation, la proportion de personnes qui seront pourtant atteintes de la maladie. Quelle est la
probabilité de constater, lors d'un contrôle dans un petit village de 100 habitants tous récemment vaccinés, plus
d'une personne malade ? (on supposera l'indépendance des éventualités).
Solution :
P ( x > 1 ) = p(2) + p(3) + p(4) + p(5) + ………………………………

Ou bien P ( x > 1 ) = 1 –  p(0) + p(1) 
𝑝
On a n =100, p = 0,02 et q = 0,98 et 𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
0 1
Alors : 𝑃 𝑥 = 0 = 𝐶100 ∗ 0.020 ∗ 0.98100 = 0.133 et 𝑃 𝑥 = 1 = 𝐶100 ∗ 0.021 ∗ 0.9899 = 0.27
Donc : 𝑃 𝑥 > 1 = 1 − 𝑝 0 + 𝑝 1 = 1 − 0.133 + 0.27 = 0.617
La probabilité de constater, lors d'un contrôle dans un petit village de 100 habitants tous récemment vaccinés,
plus d'une personne malade est égale à 0,617.
Approximation de la loi binominale sur la loi de poisson
Les conditions :
1) 𝑛 ≥ 30 la taille de l’echantillon est trés grande

2) 𝑝 → 0 𝑣𝑜𝑖𝑠𝑖𝑛𝑎𝑔𝑒 𝑑𝑒 0 𝑝 < 0.1
3) 𝜆 = 𝑛𝑝 < 5
Page 20
Exercice :
En jette une pièce de monnaie 7 foi quelle est la probabilité d’avoir 4 foi pille
Condition d’application de la loi binominale
Nombre d’épreuve ≥ 2
L’expérience avec remise
1
Le succès : pille 𝑝 = 2
1
L’échec : face 𝑞 = 2
B(7,1/2)
𝑃 𝑥 = 4 = 𝐶74 0.5 4 0.5 3
𝐸 𝑥 = 𝑛𝑝
𝑉 𝑥 = 𝑛𝑝𝑞
La variable aléatoire continue :

Une fonction qui a une densité de probabilité elle doit vérifier 2 conditions
a- ∀𝑥 ∈ ℝ 𝑓 𝑥 ≥ 0
+∞
b- ∫−∞ 𝑓 𝑥 𝑑𝑥 = 1
Les paramètres de la variable aléatoire continue :
𝑏
𝐸 𝑥 = 𝑥𝑓 𝑥 𝑑𝑥
𝑎
𝑏 𝑏
𝑉 𝑥 = 𝑓 𝑥 𝑥 − 𝐸 𝑥 𝑑𝑥 = 𝑥 2 𝑓 𝑥 𝑑𝑥 − 𝐸 𝑥 2
𝑎 𝑎
Fonction de répartition F(x) :
La recherche du primitif de la fonction de densité de probabilité

𝑥
𝐹 𝑥 = 𝑓 𝑡 𝑑𝑡
0
Application des lois des probabilités (variable aléatoire continue ) :
La loi normale de Laplace – Gauss N (μ , σ) :
 Une variable aléatoire continue x pouvant prendre tout les valeurs réelles x dans l’intervalle de
−∞, +∞, pour 𝜇 ∈ ℝ, pour 𝜎 ∈ ℝ+dont la fonction de densité est :
1 −
1 𝑥−𝜇 2
𝑓 𝑥 =𝑔 𝑥 = 𝑒 2 𝜎
𝜎 2𝜋
 Soit X une variable aléatoire distribuer selon une loi normale et 𝑓(𝑥) la fonction de probabilité de X
alors :
Condition de densité de F
Page 21
∀𝑥 ∈ℝ𝑔 𝑥 >0
+∞
𝑔 𝑥 𝑑𝑥 = 1
−∞
La loi normale repose sur l’estimation de deux paramètres de la population statistique
La moyenne μ
L’écart type σ
La courbure (appelée « fonction de densité de probabilité »)
A la formule suivante
𝐹 𝑥 =𝜇
𝑉 𝑥 = 𝜎2 = 𝑆2
𝜎=𝑆
𝑒 = 2.72; 𝜋 = 3.14
La représentation graphique :
f(x)
Moyenne
Médiane
Mode
Forme de la distribution normale :
1- Symétrique
2- Médiane = Mode = Moyenne
3- En forme de cloche
La loi normale centrée réduite N (0,1) :
En pratique on procède à un changement de cette variable (on dit qu’on nome la variable). Pour cela, on
pratique le changement de X par T tel que :
𝑋−𝜇
𝑇=
𝜎
La nouvelle variable est dite variable est dite variable centrée réduite. De moyenne 𝑡 = 0 est sa variance 𝜎 =
1. Elle est notée N(0,1)
Page 22
Transformation d’une loi normale quelconque en N(0,1) :

La loi normale centré reduite
1 𝑥−𝜇 2
𝑥 𝑥 1 −
𝑃 𝑥1 < 𝑥 < 𝑥2 = ∫𝑥 2 𝑔 𝑥 𝑑𝑥 = ∫𝑥 2 𝜎 2𝜋 𝑒 2 𝜎 𝑑𝑥
1 1
𝑥−𝜇 𝑥 𝜇 𝑑𝑥 𝑥 1 −𝜇
𝑋 → 𝑡 = 𝜎 = 𝜎 − 𝜎 ; 𝑑𝑡 = 𝜎
= 0; 𝑥1 → 𝑡1 = 𝜎
𝑡2 5
1 𝑡2
−
𝑃 𝑡1 < 𝑇 < 𝑡2 = 𝑔 𝑡 𝑑𝑡 = 𝑒 2 𝑑𝑡
2𝜋
𝑡1 −∞
𝑡2
1
𝑔 𝑡 = 2𝜋
𝑒− 2
𝑡1 0 𝑡2
Distribution normale centrale réduite (Utilisation de la table) :
Dans cette table en voit l’aire entre 𝑡 = 0 et 𝑡 ; 𝑝 0 ≤ 𝑇 ≤ 𝑡 = 𝑝(−𝑡 ≤ 𝑇 ≤ 0)
Exemple 1 :
x−μ
Si x suit une loi normale N (μ , σ) de paramètre N (3.2, 2.2) alors 𝑡 = σ
suit une loi normale centré N (0, 1).
Calculer la probabilité 𝑃(𝑥 ≤ 5) ?
5 5
1 −
1 𝑥−𝜇 2
𝑃 𝑥≤5 = 𝑔 𝑥 𝑑𝑥 = 𝑒 2 𝜎 𝑑𝑥
𝜎 2𝜋
−∞ −∞
𝑥 − 𝜇 5 − 3.2
𝑡= = = 0.82
𝜎 3.2
0.82 0.82 0 0.82
1 𝑡2
−
𝑃 𝑡 ≤ 0.82 = 𝑔 𝑡 𝑑𝑡 = 𝑒 2 𝑑𝑡 = 𝑔 𝑡 𝑑𝑡 + 𝑔 𝑡 𝑑𝑡 = 0.5 + 𝐺 0.82 = 0.793
2𝜋
−∞ −∞ −∞ 0
Page 23
L’échantillonnage :
La théorie de l’estimation :
Lorsqu’on évalue dans un ensemble de sujet ou population la proportion P de ceux qui présente un caractère
donné on ne dispose le plus souvent dans la réalité que de group extrait de cette population
La population qu’ils nous fournissent P0 n’est pas la proportion exact, elle s’écart plus ou moins selon le
hasard de l’échantillonnage.
I- le parie :
L’intervalle de parie est définie par un écart e autour de P

Ex : l’intervalle [40,60]% autour de 50% est définit par l’écart e=10%
L’écart e exprimer en prenant pour unité l’écart type σ est appelle l’écart réduit ξα les deux borne de
l’intervalle de parie sont donné au risque α par :
𝑃𝑞 𝑃𝑞
- Pour P : 𝑃 − 𝜉𝛼 𝑛
≤ 𝑃0 ≤ 𝑃 + 𝜉𝛼 𝑛
- Pour q : 1 − 𝑃𝑖 ≥ 𝑞 ≥ 1 − 𝑃𝑠
𝑃𝑖 : La borne inferieur de l’intervalle
𝑃𝑠 : La borne supérieure de l’intervalle
Tableaux de l’écart réduit :
Elle donne pour écart réduit ξα le risque α correspondant

Ex : α = 0.05, ξα = 1.96
Condition d’utilisation :
1) 𝑛 ≥ 30 ; 𝑛 ∗ 𝑝 ≥ 5 ; 𝑛 ∗ 𝑞 ≥ 5
II- Estimation d’u pourcentage théorique :
Lorsqu’on observe un pourcentage P0 sur un échantillon le problème est d’estimer le véritable pourcentage
inconnu P de la population d’où est extrait l’échantillon
Page 24
La forme de l’intervalle confiance :
𝑃𝑞 𝑃𝑞
𝑃 − 𝜉𝛼 ≤ 𝑃0 ≤ 𝑃 + 𝜉𝛼
𝑛 𝑛
1 − 𝑃𝑖 ≥ 𝑞 ≥ 1 − 𝑃𝑠
Condition d’application :
1) 𝑛 ≥ 30 ; 𝑛 ∗ 𝑝 ≥ 5 ; 𝑛 ∗ 𝑞 ≥ 5
Table de l’intervalle de confiance :
Elle donne directement l’intervalle de confiance en fonction du pourcentage observé.
Page 25
Comparaison de pourcentage
I- Principe :
Dans le cas du caractère qualitatif on distingue deux types de comparaison de pourcentage :
Comparaison d’un pourcentage observé avec un pourcentage théorique :
Echanti 1 Popula
p1, q1 p, q
Test de conformité
Comparaison de deux pourcentages observés :
Echanti 1 Echanti 1
P1, Q1 P1, Q1
Test d’homogénéité
Le principe du test est l’analyse de l’écart entre les pourcentages comparés
II- Procédure :
II 1- Comparaison d’un pourcentage observé avec un pourcentage théorique :
1- Détermination du risque α
2- Construction des hypothèses H0 et H1
3- Vérification des conditions 𝑛 ≥ 30; 𝑛 − 𝑝 ≥ 5; 𝑛 − 𝑞 ≥ 5
𝑝 0 −𝑝
4- Calcule de la variable testé : 𝜀 = 𝑝 ∗𝑞
𝑛
5- Conclusion et prise de décision :
Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue
Page 26
II 2- Comparaison de deux pourcentages observés :
1- Détermination du risque α
2- Construction des hypothèses H0 et H1
3- Vérification des conditions 𝑛1 ≥ 30; 𝑛2 ≥ 30; 𝑛 − 𝑝 ≥ 5; 𝑛 − 𝑞 ≥ 5 𝑎𝑣𝑒𝑐 𝑛 = 𝑛1 + 𝑛2 et
𝑛1 ∗ 𝑝1 + 𝑛2 𝑝2
𝑝=
𝑛1 + 𝑛2
𝑝 1 −𝑝 2
4- Calcule de la variable testé : 𝜀 = 𝑝 ∗𝑞 𝑝 ∗𝑞
+
𝑛1 𝑛2
5- Conclusion et prise de décision :

Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue
Comparaison de deux moyennes

I- Introduction
Deux moyennes d’un caractère quantitatif sont-elles réellement différent ?

Une question qui préoccupe souvent l’expérimenteur.
L’examen plus fin montre que deux situations peuvent se présenter :
II- Principe:
Echantillon Population
𝑛 ; 𝑋 ; 𝑆2 T.C µ ; 𝜎2
Echantillon 1 Echantillon 2
𝑛1 ; 𝑋1 ; 𝑆1 2 T.H 𝑛2 ; 𝑋2 ; 𝑆2 2
III- Procédure :
III.1- Cas des grandes échantillons (𝒏 ≥ 𝟑𝟎)
A. Comparaison d’une moyenne observée avec une moyenne théorique :
1) Détermination du risque α.
2) Condition : 𝑛 ≥ 30.
3) Construction de H0.
Page 27
4) Calcule de la variable testée :

𝑋−µ
𝜉=
𝑆
𝑛−1
5) Conclusion :
 Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
 Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue
B. Comparaison de deux moyennes observées :
2) Condition : 𝑛1 ≥ 30 et 𝑛2 ≥ 30.
3) Construction de H0 et H1.
4) Calcule de la variable testée :
𝑋1 − 𝑋2
𝜉=
𝑆12 𝑆22
−
𝑛1 − 1 𝑛2 − 1
5) Conclusion :
 Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
 Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue
III.2- Cas des petits échantillons (𝒏 < 30)
A. Test de student : Comparaison d’une moyenne observée avec une moyenne théorique :
2) Condition : 𝑛 < 30.
4) degré de liberté 𝑑. 𝑑. 𝑙 = 𝜈 = 𝑛 − 1 et 𝑡𝛼𝜈 de la table.
5) variable testée :
𝑋−µ
𝑡=
𝑆
𝑛−1
6) Conclusion :
 Si 𝑡 ≥ 𝑡𝛼𝜈 la différence est significative au risque α, H0 est rejetée
 Si 𝑡 < 𝑡𝛼𝜈 la différence n’est pas significative au risque α, H0 est retenue
B. Test de student : Comparaison de deux moyennes observées :
2) Condition : 𝑛1 < 30 et/ou 𝑛2 < 30.
4) Calcule de la variance commune
𝑛1 𝑆12 + 𝑛2 𝑆22
𝑆𝑐2 =
𝑛1 + 𝑛2 − 2
5) Degré de liberté 𝑑. 𝑑. 𝑙 = 𝜈 = 𝑛1 + 𝑛2 − 2.
6) Détermination de 𝑡𝛼𝜈 de la table.
Page 28
7) Variable de student :
𝑋1 − 𝑋2
𝑡=
𝑆𝑐2 𝑆𝑐2
𝑛1 − 𝑛2
8) Conclusion :
 Si 𝑡 ≥ 𝑡𝛼𝜈 la différence est significative au risque α, H0 est rejetée
 Si 𝑡 < 𝑡𝛼𝜈 la différence n’est pas significative au risque α, H0 est retenue
Page 29

Bio Statistique 20 Final

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Bio Statistique 20 Final

Transféré par

Droits d'auteur :

Formats disponibles

Biostatistique

Département pharmacie Oran

Sens courant Sens scientifique

Les donné et les chiffre 1- collecté les donné

L’ensemble de tous les éléments a étudié.

Une partie de la population

II- Les caractère :

a- Variable statistique discontinue :

b- Variable statistique continue :

III- Tableau et graphe :

Catégorie Effective (fréquence absolu) ni Fréquence relative fi

Nombre d’enfant par Effective (fréquence

Poids (Kg) xi Effective (fréquence absolu) ni Fréquence relative fi

Paramètres de tendance centrale

Synthétisent et caractérisent l'ensemble des données par un nombre unique,

Cas de données non groupées

Le mode est la valeur de la variable statistique la plus fréquente

Cas de données groupées

Variable statistique discontinue

Nombre d'enfants Xi Nombre de familles ni

Variable statistique continue

Tableau n°2 les pesées de 50 nouveau-née

Poids (Kg) Xi Effective ni

La classe modale est 3,5 – 4,0 alors le mode est

b) Méthode d’interpolation linéaire

Cas des données non groupées

Cas des données groupées

Variable statistique discontinue

Nombre d’enfants Nombre de familles ni

Variable statistique continue

Poids (Kg) Xi Effective ni

3,0 – 3,5 alors Me = (3,0 + 3,5) / 2

b) Méthode d’interpolation linéaire

Cas des données groupées

(moyenne arithmétique simple)

Cas des données groupées (moyenne arithmétique pondérée)

Variable statistique discontinue

Nombre d’enfants Nombre de familles ni ni xi

𝑋 = 4 enfants, il ya en moyenne 4 enfants par famille

Variable statistique continue

c’est la différence entre la plus grande et la plus petite valeur de la série

2- L’écart-moyen (écart-absolu moyen) ×

C’est le rapport de l’écart type sur la moyenne arithmétique.

0−4 4 2 8 100 400

Calculer les paramètres de tendance centrale et de la dispersion

Introduction aux calculs des probabilités :

Eléments du calcul des probabilités

1- Dénombrement et analyse combinatoire :

1-1 arrangement sans répétition :

I.2-permutation, sans répétition :

II.1 Combinaison sans remise

III- Notions de base de calcul des probabilités

III.1- phénomène déterministes :

III.2- Phénomènes aléatoires :

III.3- Notion de probabilité :

Dans la statistique descriptive on a défini la fréquence relative

𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒

V- Evénement : contraire – impossibilité – certitude :

V.a- Evénement contraire :

Si A est un événement quelconque, alors 𝑃 𝐴 = 1 − 𝑃 𝐴

V.b- Evénement impossible :

Si le nombre de cas favorables de l’événement impossible A est nul

V.c- Evénement certain

Si le nombre de cas favorable de l’événement est non nul n=N