Vous êtes sur la page 1sur 29

Biostatistique

Département pharmacie Oran

Année 2008/2009
Faculté de médecine Oran

1
Faculté de médecine
Département de pharmacie

Statistique Descriptive

1-Tableaux et graphes

I- Définition :

Statistique

Sens courant Sens scientifique

Les donné et les chiffre 1- collecté les donné


2- organisé tableaux – graphe
3- analyser
4- décision (conclusion)

1- Au sens « courant »

On emploie le terme de statistique pour designer les données elle-même «Un ensemble de données
numériques » ainsi on parle des statistiques démographiques, économiques, sanitaires, les statistiques des
étudiants Répartition par âge, sexe, année, spécialité …
Généralement se sont les tableaux et les chiffres qui figurent dans les bilans administratifs.

2- Au sens « scientifique »

La statistique est l'ensemble des méthodes des techniques a partir desquelles on: collecte, organise, résume,
présente et analyse des données. Ces techniques nous aident à tirer des conclusions et à prendre des décisions
judicieuses.

La population :

L’ensemble de tous les éléments a étudié.

L’échantillon :

Une partie de la population


Pour généraliser il faut que l’échantillon soit représentatif à la population.

Page 2
Faculté de médecine
Département de pharmacie

II- Les caractère :

1- Caractère quantitatif :

Un caractère et dit quantitatif quand il est par un chiffre ex : poids, l’âge, taille, le taux de glycémie …

2- Caractère qualitatif :

Un Caractère est dit qualitatif quand il n’est pas mesurable ex : la couleur, la douleur, la nationalité …
Dans le caractère quantitatif en distingue deux variables

a- Variable statistique discontinue :

La variable ne peut prendre que des valeurs isolé entière ex : nombre d’enfant par famille

b- Variable statistique continue :

La variable peut prendre tout les valeurs comprise dans un intervalle donner ex : le poids, la taille, l’âge …

III- Tableau et graphe :

a- Caractère qualitatif :

Catégorie Effective (fréquence absolu) ni Fréquence relative fi


Professeur 5 10%
Maitre assistant 25 50%
Infermière 20 40%
Totale n = 50 100%
n = taille de l’échantillon

𝑛𝑖
fi = 𝑛
× 100

Graph :
Soit

Secteur circulaire

30
25
20 Pr
15 INf
10
5 MA
0
Professeur Maitre Infermière
assistant

Page 3
Faculté de médecine
Département de pharmacie

b- Caractère quantitatif :

1- Variable discontinue

Nombre d’enfant par Effective (fréquence


Fréquence relative fi
famille xi absolu) ni
0 5 10%
1 25 50%
2 20 40%
Totale n = 50 100%

Graph :
Diagramme :

30
25
20
15
10
5
0
0 1 2

2- Variable continue :

Poids (Kg) xi Effective (fréquence absolu) ni Fréquence relative fi


40 – 50 5 10%
50 – 60 25 50%
60 – 70 20 40%
Totale n = 50 100%

Graph :
Histogramme

30

25

20

15

10

5 Histogramme
Polygone de fréquence
0
Poids (Kg) xi Page 4
Faculté de médecine
Département de pharmacie

Paramètres de tendance centrale

INTRODUCTION

PARAMETRES DE
TENDANCE
CENTRALE
Paramètres de position

Synthétisent et caractérisent l'ensemble des données par un nombre unique,


une valeur type.

De telle sorte qu'en première approximation la comparaison de deux séries puisse se ramener à la comparaison
de deux nombres.

Le Mode (Mo)

Cas de données non groupées

Le mode est la valeur de la variable statistique la plus fréquente


Exemple
Soit la série statistique:
3, 5, 7, 15, 16, 16, 16, 17, 17, 30
Alors
Mo = 16

Cas de données groupées

Variable statistique discontinue


Le mode et la valeur de la variable statistique qui correspond à l'effectif le plus élevé.
Dans ce cas sa détermination est immédiate
Exemple
Tableau N°1: Nombre d'enfants par famille

Page 5
Faculté de médecine
Département de pharmacie

Nombre d'enfants Xi Nombre de familles ni


0 4
1 5
2 10
3 16
Mo = 4 4 18
5 14
6 7
7 6
TOTAL 80

Interprétation:
Le nombre d'enfants le plus fréquent dans cet échantillon est égal à 4.

Variable statistique continue


Il existe deux méthodes : méthode direct et méthode d’interpolation linéaire

a) Méthode direct

Exemple

Tableau n°2 les pesées de 50 nouveau-née

Poids (Kg) Xi Effective ni


2, 0 – 2,5 2
2,5 – 3,0 4
3,0 – 3,5 6
Class modale 3,5 – 4,0 30
4,0 – 4,5 8
total 50

La classe modale est 3,5 – 4,0 alors le mode est


Mo = (3,5 + 4,0) / 2 = 3,75 Donc Mo = 3,75 Kg

Interprétation :
Le poids le plus fréquent dans cet échantillon égal à 3,75 Kg

b) Méthode d’interpolation linéaire


𝑑1
Mo = bmin + ×k
𝑑 1 +𝑑 2
= 3,76 Kg
k = amplitude

Interprétation :
Le poids le plus fréquent dans cet échantillon égal à 3,76 Kg
Page 6
Faculté de médecine
Département de pharmacie

La médiane (Me)

Cas des données non groupées

La médiane est la valeur de la variable statistique qui divise la série statistique en deux parties égales
(50% de l’effectif lui soit inférieur et 50% supérieur)
- Nombre d’observation impair :
7, 9, 13, 45, 70, 101, 115
Me = 45
- Nombre d’observations pair :
2, 5, 9, 10, 12, 14, 20, 22
Me = (10 +12) / 2 = 11
La demi-somme de l’intervalle médian

Cas des données groupées

Variable statistique discontinue


la médiane est la valeur de la variable statistique qui occupe le (n / 2)éme rang (détermination direct)

Nombre d’enfants Nombre de familles ni


0 4
1 5
2 10
3 16
4 18
5 14
6 7
7 6
Totale 80
n / 2 = 80 / 2 = 40, la valeur de la variable qui occupe le 40éme rang est égale à 4 donc Me = 4 enfants

Interprétation :
Il ya 50% (soit 40 familles) qui ont moins de 4 enfants et 40 plus de 4 enfants

Variable statistique continue


Il y a deux méthodes : direct, méthode d’interpolation linéaire

a) Méthode direct
Les pesées de 50 nouveau-nées

Page 7
Faculté de médecine
Département de pharmacie

Poids (Kg) Xi Effective ni


2, 0 – 2,5 2
2,5 – 3,0 4
3,0 – 3,5 6
Class médiane 3,5 – 4,0 30
4,0 – 4,5 8
total 50

3,0 – 3,5 alors Me = (3,0 + 3,5) / 2


Donc Me = 3,75 Kg

Interprétation :
Il ya 50% (soit 25) nouveau-née qui ont un poids inferieur à 3,75 Kg et 50% (25) qui on un poids
supérieur à 3,75 Kg

b) Méthode d’interpolation linéaire


𝑛
2
−𝑆
Me = bmin + ×k
𝑛 𝑚𝑒
50
2
−12
Me = 3,5 + × 0,5
30
Me = 3,72

La moyenne arithmétique

Cas des données groupées

(moyenne arithmétique simple)


La moyenne arithmétique est la somme des observations divisée par leur nombre. Elle est notée
𝑥 +𝑥 +𝑥 +𝑥 +𝑥 + …..+𝑥 𝑛
𝑋= 1 2 3 4 5
𝑛

𝑥𝑖
Ce qui donne 𝑋 =
𝑛

Cas des données groupées (moyenne arithmétique pondérée)

Variable statistique discontinue


S’il y a répétition de certaines observation, c'est-à-dire le nombre x1 se produit n1 fois, x2 se produit
n2 fois, … …, en formule précédente devient

Page 8
Faculté de médecine
Département de pharmacie

𝑛𝑖 𝑥𝑖
𝑋=
𝑛

Exemple :

Nombre d’enfants Nombre de familles ni ni xi


0 4 0
1 5 5
2 10 20
3 16 48
4 18 72
5 14 70
6 7 42
7 6 42
Totale 𝑛𝑖 = 𝑛 = 80 𝑛𝑖 𝑥𝑖 =
299

𝑛𝑖 𝑥𝑖 299
𝑋= = = 3,74
𝑛 80

𝑋 = 4 enfants, il ya en moyenne 4 enfants par famille

Variable statistique continue


Xi = centre de classe

Paramètres de dispersion :
Elles ont pour but de permettre de mesurer la concentration de valeurs observées autour des valeurs
centrales
Elles vont nous données les unes par rapport au autres : sont elles prés de leur centre ? Proches les
une des autres ? sont-elles dispersées ?

1- L’étendue :

c’est la différence entre la plus grande et la plus petite valeur de la série


e = x max – x min

2- L’écart-moyen (écart-absolu moyen) ×

Il est défini comme étant égal à des différentes valeurs absolues, des différences entrent l’observation
et la valeur centrale

𝑛 𝑖 𝑥 𝑖 −𝑋
Em=
𝑛
Page 9
Faculté de médecine
Département de pharmacie

3- La variance :

Elle est définie comme la valeur moyenne des carrées des écarts des valeurs de la série statistique a
leur moyenne arithmétique
𝑛 𝑖𝑥𝑖 2
𝑛 𝑖 𝑥 𝑖 −𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑛
S2 = =
𝑛 𝑛

4- L’écart-type :

C’est la racine carré positive de la variance c’est un paramètre dont l’unité est celle de la variable

𝑛 𝑖𝑥𝑖 2
𝑛 𝑖 𝑥 𝑖 −𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑛
S= =
𝑛 𝑛

5- Le coefficient de variation:

C’est le rapport de l’écart type sur la moyenne arithmétique.


Il est indépendant du choix des limites

𝑆
C.V =
𝑋

Remarque :
C.V ≥ 0.33 la dispersion est importante
C.V < 0.33 la dispersion est moins importante

Application :
Soit le tableau suivant qui représente la répartition des notes dans un examen
Classe xi Effectif ni xi centre de class xi ni 𝑥𝑖 − 𝑋 2 𝑛𝑖 𝑥𝑖 − 𝑋 2

0−4 4 2 8 100 400


4−8 8 6 48 36 288
8 − 12 10 10 100 4 40
12 − 16 14 14 196 4 56
16 − 20 12 18 216 36 432
Totale 48 568 1216

Calculer les paramètres de tendance centrale et de la dispersion

𝑛𝑖 𝑥𝑖 568 𝑛 𝑖 𝑥 𝑖 −𝑋 2
𝑋= = = 11.83
2
S =
𝑛
𝑛 48
𝑑1 4 S2 = 25.33
Mod = bmin + × k = 12 +
× 4 = 14.66 S = 5.033
𝑑 1 +𝑑 2 4+2
𝑛 48 C.V = 0.419
−𝑆 −22
Me = bmin +
2
× k = 12 + 2 × 12,14 C.V > 0.33
𝑛 𝑚𝑒 14 La dispersion est importante
Page 10
Faculté de médecine
Département de pharmacie

Introduction aux calculs des probabilités :

Eléments du calcul des probabilités

1- Dénombrement et analyse combinatoire :

On dit qu’un ensemble est dénommable si on peut numéroter ses éléments pour les compter. L’analyse
combinatoire comprend un ensemble de méthodes qui permettent de déterminer le nombre de tous les résultats
possibles d’une expérience particulière

I. 1- Arrangements :

1-1 arrangement sans répétition :


On appelle arrangement sans répétition ou arrangement tout court, de n éléments p à p (n ≥ p) tout ensemble
ordonné de p de ces élément est donc caractérisé par la nature des «éléments ou par leur ordre
𝑝 𝑛!
D’où 𝐴𝑛 = 𝑛 − 𝑛 − 1 𝑛 − 2 … … 𝑛 − 𝑝 + 1 =
𝑛 −𝑝 !

Exemple1 :
Tiercé dans l’ordre dans une course de 14 chevaux
3 14!
𝐴14 = 14 ∗ 13 ∗ 12 = = 2184 𝑓𝑜𝑖𝑠
14−3 !

Exemple 2 :
Une séquence d’ADN est constituée d’un enchainement de 4 nucléotides [A (Adénine), C (cytosine), G
(guanine), et T (Thymine)]. Il existe différents arrangements possibles de 2 nucléotides ou di nucléotides p=2
et n=4
4!
𝐴24 = = 12 di nucléotides possible
4−2 !

I.2-permutation, sans répétition :

Une permutation de n objet, les permutations de ces n objets constituent un cas particulier des arrangements,
c’est le cas ou n=p
Deux permutations ne différent que par l’offre des objets
𝑛!
Calcule de 𝑃𝑛 = 𝐴𝑛𝑛 = = 𝑛 𝑛 − 1 𝑛 − 2 … . = 𝑛!
𝑛 −𝑛 !

Exemple :
Le nombre de manières de places 8 médecin autour d’une table
P8 = 8 ! = 8(8 – 1) (8 – 2) * …….*1=40320
Possibilités

Page 11
Faculté de médecine
Département de pharmacie

II.- Combinaison :

II.1 Combinaison sans remise

On appelle combinaison de p élément pris parmi n (n ≥ p) tout ensemble que l’on peut former en choisissant p
de ces éléments, sans considération d’ordre. Deux combinaison distinctes différent donc par la nature d’au
𝑝
𝑝 𝐴𝑛 𝑛!
moins un élément calcul de p ou 𝐶𝑛 = =
𝑃! 𝑝! 𝑛 −𝑝 !

Exemple 1 :
combien de manière peut-on avoir le nombre de possibilité de tiercé dans désordre dans une course de 14
chevaux
3 14∗13∗12
𝐶14 = = 364
3∗2∗1

Exemple 2 :
Dans le cadre de l’exemple de séquence d’ADN le nombre de di nucléotides attendus sans tenir compte de
l’ordre des bases dans la séquence est donc

4∗3
𝐶42 = = 6 di nucléotide
2∗1

III- Notions de base de calcul des probabilités

III.1- phénomène déterministes :

Sont prévisibles donnent un résultat qui ne dépend pas d’une loi de probabilité. Ils donnent le même résultat
lorsqu’on répète l’expérience.

III.2- Phénomènes aléatoires :

Sont dus en partie au hasard mais suivant des lois de probabilité. Le résultat est variable mais la répartition des
résultats est prévisible

III.3- Notion de probabilité :

Dans la statistique descriptive on a défini la fréquence relative


𝑛𝑖
𝐹𝑖 = ni : la fréquence absolue (ou le nombre de répétition xi)
𝑛
n : la taille de l’échantillon étudié

Page 12
Faculté de médecine
Département de pharmacie

Convergence en probabilité :
Si l’on répète N fois une expérience dans laquelle la probabilité d’apparition d’un événement A est p ; la
𝑛
fréquence de cet évènement au cours des N expériences, tend vers p lorsque N tend vers l’infini
𝑁
𝑛
N → ∞ => →p
𝑁

𝑓 𝑥𝑖 → 𝑝 𝑥𝑖 quand n → ∞

IV- La probabilité :

Quand une épreuve peut avoir résultat un ensemble de N cas et que n de ces cas sont favorables à un
événement A alors la probabilité que A se réalise

𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒


𝑃=
𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒

𝑛 𝑛
𝑃 𝐴 = 𝑁 comme 0 ≤ 𝑛 ≤ 𝑁 en divisant par N => 0 ≤ ≤ 1 => 0 ≤ 𝑃 𝐴 ≤1
𝑁

V- Evénement : contraire – impossibilité – certitude :

V.a- Evénement contraire :

Si A est un événement quelconque, alors 𝑃 𝐴 = 1 − 𝑃 𝐴


Ainsi parmi N cas possible, n sont favorables à l’évènement A ; (N-n) sont favorables à 𝐴

𝑁− 𝑛 𝑛
𝑃 𝐴 = =1− =1− 𝑃 𝐴
𝑁 𝑁

V.b- Evénement impossible :

Si le nombre de cas favorables de l’événement impossible A est nul


0
𝑃 𝐴 = =0
𝑁
A est un événement impossible
Ex : aucune chance que la maladie soit présente

V.c- Evénement certain

Si le nombre de cas favorable de l’événement est non nul n=N


𝑁
𝑃 𝐴 = =1
𝑁
A est un événement certain
Ex : maladie est présente

Page 13
Faculté de médecine
Département de pharmacie

VI- Théorème des probabilités totales

Soit A et B deux événement dont le nombre de cas favorable sont respectivement n1 et n2cherchons la
probabilité de l’événement « A ou B » noté A∪B
nombre de cas favorables à « A∪B »
𝑃 𝐴∪𝐵 = 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠
B A
𝑛1 + 𝑛2 𝑛1 𝑛2
𝑃 𝐴∪𝐵 =
𝑁
= +
𝑁 𝑁
=𝑃 𝐴 +𝑃 𝐵 n2 n1
𝑃 𝐴∪𝐵 = 𝑃 𝐴 +𝑃 𝐵

Evénement incompatibles :

Deux événement A et B sont dis incompatibles si la réalisation de l’un exclu la réalisation de l’autre autrement
dit les parties A et B sont disjointes
𝑃 𝐴1 ∪ 𝐴2 ∪ 𝐴3 … … … ∪ 𝐴𝑛 = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ + 𝑃 𝐴𝑛

Evénement compatibles

𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵

𝑃 𝐴∪𝐵∪𝐶 =𝑃 𝐴 +𝑃 𝐵 +𝑃 𝐶 − 𝑃 𝐴∩𝐵 −𝑃 𝐴∩𝐶 −𝑃 𝐵∩𝐶 +𝑃 𝐴∩𝐵∩𝐶

Loi de probabilité Variable aléatoire discrète:

I.1 Variable aléatoire discrète :

Soit une variable pouvant prendre l’ensemble des valeurs : 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 … … 𝑥𝑛 avec les
probabilités 𝑝1 , 𝑝2 , 𝑝3 , 𝑝4 … … 𝑝𝑛 telles que 𝑝1 + 𝑝2 + 𝑝3 + 𝑝4 + ⋯ + 𝑝𝑛 = 𝑃𝑖 = 1
On dit que x est variable discrète si elle ne peut prendre que des valeurs isolées et variable aléatoire si
sa valeur est fixée par le résultat d’une épreuve.
Donc tout les (valeurs) variables qui sont associées à une épreuve aléatoire et qui prennent les valeurs
numérique discontinues s’appellent variable aléatoires discontinues.
I.2 loi de probabilité :

On dit qu’on a définit une loi de probabilité par le tableau :


𝑥𝑖 …………………………………………………... Σ
𝑝𝑖 …………………………………………………... 1

Page 14
Faculté de médecine
Département de pharmacie

Exemple1 :
On jette un dé équilibré une seule foi. Soit x la variable aléatoire désignent le nombre de point
obtenus sur chaque face :
1- Déterminer graphiquement cette loi
Réponse :
1- loi de probabilité
𝑥𝑖 1 2 3 4 5 6 Σ
𝑝𝑖 1/6 1/6 1/6 1/6 1/6 1/6 1
Connaissant toutes les valeurs possibles de la variable 𝑥𝑖 et les valeurs correspondantes de
𝑝𝑖 , on a donc défini la loi de probabilité de cette variable

1/6

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6
En portent les valeurs de 𝑥𝑖 en abscisses et celles des 𝑝𝑖 en ordonnés sur l’axe des cordonné

I.3 Calcule des paramètres de tendance centrale et de dispersion :

I.3.a Espérance mathématique 𝑿 :

L’espérance mathématique d’une variable aléatoire discontinue notée 𝐸 𝑥 , vaut


𝐸 𝑥 = 𝑝1 𝑥1 + 𝑝2 𝑥2 + 𝑝3 𝑥3 + 𝑝4 𝑥4 + ⋯ + 𝑝𝑛 𝑥𝑛
𝐸 𝑥 = 𝑝𝑖 𝑥𝑖
Pour l’exemple 1 :
1 1 1 1 1 1 21
𝐸 𝑥 = ∗1+ ∗2+ ∗3+ ∗4+ ∗5+ ∗6=
6 6 6 6 6 6 6
21
→𝐸 𝑥 =
6
I.3.a Variance :

La variance d’une variable aléatoire discontinue, notée 𝜎 2 𝑥 ou 𝑉(𝑥) est définie par
𝑉 𝑥 = 𝑝𝑖 𝑥𝑖 − 𝐸 𝑥 2
C’est une moyenne de la somme des carrés 𝑥𝑖 par a port a leur espérance mathématique
La formule de définition peut encore s’écrire 𝑉 𝑥 = 𝑝𝑖 𝑥𝑖2 − 𝐸 𝑥 2 (formule pratique)

Page 15
Faculté de médecine
Département de pharmacie

I.4 Définition et représentation graphique de la fonction de répartition :

La fonction de répartition 𝐹(𝑥) est la fonction cumulative qui correspond à la courbe cumulative
(sigmoïde) de la variable statistique, c’est un moyen (outil) pour le calcule des probabilités des lois
C’est une fonction en escalier, toujours croissante.

Exemple :
Soit à déterminer en fonction de répartition de la loi de probabilité définie par
𝑥𝑖 2 5 6 8 Σ 1

𝑝𝑖 0.1 0.4 0.3 0.2 1 0.8


𝑓 𝑥 = 0 𝑝𝑜𝑢𝑟 𝑥 < 2
𝑓 𝑥 = 0.1 𝑝𝑜𝑢𝑟 2 ≤ 𝑥 < 5 0.5

𝑓 𝑥 = 0.1 + 0.4 𝑝𝑜𝑢𝑟 5 ≤ 𝑥 < 6


𝑓 𝑥 = 0.1 + 0.4 + 0.3 𝑝𝑜𝑢𝑟 6 ≤ 𝑥 < 8
0.1
𝑓 𝑥 = 0.1 + 0.4 + 0.3 + 0.2 = 1 𝑝𝑜𝑢𝑟 𝑥 ≥ 8
1 2 3 4 5 6 7 8 9 10 11

LES LOIS USUELLES DE PROBABILITE

1 -La Loi Binomiale (variable aléatoire discrète)

Lorsque les éventualités se réduisent à une alternative (succès ou échec – Malade ou non malade), la variable
aléatoire (nombre de succès, nombre de malades) suit une loi de probabilité appelée LOI BINOMIALE
Soit P la probabilité d'un événement A, donc q = 1-p, est la probabilité de l'événement contraire
La probabilité de réaliser x fois au cours de n épreuves identiques l'événement A est :
𝑝 𝑝 𝑛!
𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥 𝑜𝑢 𝐶𝑛 = 𝑝! 𝑛−𝑝 ! (Combinaison) n  x
n : nombre des épreuves, taille de l'échantillon
p : probabilité élémentaire ( p + q = 1)
n! = n(n-1) (n-2) (n-3) ...1
(5! =5 x 4 x 3 x 2 x 1) lire 5 factoriel.

Paramètres de la loi Binomiale :

L’espérance mathématique :
E (x) = n.p

La variance :
V(x) = n.p.q

L’écart type :
𝑆= 𝑛∗𝑝∗𝑞

Page 16
Faculté de médecine
Département de pharmacie

Conditions d'application de la loi binomiale :

La loi binomiale n’est applicable que si les conditions suivantes sont vérifiées:
1) La variable aléatoire étudiée est discontinue.
2) Les deux évènements indépendants.
3) La probabilité élémentaire est constante durant toute l’épreuve.

Exemple 1 :

Quelle est la probabilité d'avoir 3 garçons dans une famille de 10 enfants ?


Calculer l’espérance mathématique et la variance de cette variable.

Réponse :

Cette variable est discontinue


Il n'y a que 2 éventualités (garçon ou fille)
 elle suit une loi binomiale de paramètres : n = 10 et p = ½.
n = 10, p = ½, q = ½, x = 3
p
et P x = Cn ∗ Px ∗ qn−x
Alors la probabilité d’avoir 3 garçons :
3
13 17 10!
P x = 3 = C10 ∗ ∗ = ∗ ½ 10 = 0.117
2 2 3! 10 − 3 !
P(x=3) = 0,117
Ou bien directement de la table de la loi binomiale : P(x=3) = 0,117
L’espérance mathématique :
E (x) = n.p = 10 . ½ = 5
La variance :
V(x) = n.p.q = 10 . ½ . ½ = 2,5

Exemple 2

On s’intéresse au nombre de garçons dans une famille de 4 enfants.


Déterminer la probabilité :
1) de n’avoir aucun garçon.
2) d’avoir un garçon.
3) d’avoir quatre garçons.

Réponse :

Il s’agit d’une variable aléatoire discontinue (nombre de garçons) et deux éventualités (garçon ou fille).
𝑝
On a : n = 4, p = ½, q = ½, 𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
Alors :
1) La probabilité de n’avoir aucun garçon :
0
10 14 1
𝑃 𝑥 = 0 = 𝐶4 ∗ ∗ = = 0.062
2 2 16
2) La probabilité d’avoir un garçon :
1
11 13 4
𝑃 𝑥 = 0 = 𝐶4 ∗ ∗ = = 0.250
2 2 16
3) La probabilité d’avoir quatre garçons :

Page 17
Faculté de médecine
Département de pharmacie

14 10 1
𝑃 𝑥 = 0 = 𝐶44 ∗ ∗ = = 0.062
2 2 16
On peut déterminer ces probabilités directement de la table de la loi binomiale

Exemple 3 :

Une intoxication répartie au hasard affecte 10% de l’ensemble des habitants d’une ville. On considère
l’ensemble des familles de 5 personnes. Quelle est la probabilité :
- Que les cinq membres de la famille soient malades ?
- Que 4 des 5 membres de la famille soient malades ?
- Qu’il y ait au moins 3 malades dans la famille ?
- Quelles sont l’espérance mathématique et la variance de cette variable ?

Réponse :

 Variable aléatoire discontinue (nombre de malades)


 Deux éventualités malade ou non malade)
Donc cette variable est régie par une loi binomiale de paramètres
n = 5 et p=0,1 (10%); On a : n=5, p= 0,1 et q=0,9
𝑝
𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
1) 𝑃 𝑥 = 5 = 𝐶55 ∗ 0.15 ∗ 0.90 = 0.000
2) 𝑃 𝑥 = 4 = 𝐶54 ∗ 0.14 ∗ 0.91 = 0.000
3) 𝑃 𝑥 ≥ 3 = p 3 + p 4 + p 5 = 𝐶53 ∗ 0.13 ∗ 0.92 + 𝐶54 ∗ 0.14 ∗ 0.91 + 𝐶55 ∗ 0.15 ∗ 0.90
= 0.000 + 0.000 + 0.008 = 0.008
𝐷𝑜𝑛𝑐 𝑃 𝑥 ≥ 3 = 0.008
L’espérance mathématique :
E(x) = n.p = 5. 0,1 = 0,5
La variance :
V(x) = n.p.q = 5. 0,1. 0,9 = 0,45

Exercice :

Une maladie touche 6 % d’une population d’un pays donné.


On s’intéresse aux familles de 4 membres. Quelle est la probabilité :
1 - que les quatre membres de la famille soient malades ?
2 - que 2 membres de la famille soient malades ?
3 - qu’il y ait au moins 1 malade dans la famille ?
4 - qu’il y ait au plus 2 malades dans la famille ?
5 - qu’il y ait moins de 3 malades dans la famille ?
6 - qu’il y ait plus de 2 malades dans la famille ?
7 - Calculer l’espérance mathématique et la variance de cette variable.

Page 18
Faculté de médecine
Département de pharmacie

La loi de poisson : (Variable aléatoire discrète)

Définition de la loi de Poisson :

On dit qu’une variable aléatoire discrète suit une loi de Poisson si sa densité de probabilité est donnée sous la
forme:
𝛌𝐱 𝐞−𝛌
𝐏 𝐱 =
𝐱!
Où :
e = 2,71 (base du logarithme népérien) et
 : espérance mathématique E (x), appelée encore en pratique la moyenne.
λ = nP = E x = V x

Paramètres de la loi de Poisson :

L’espérance mathématique : E(x) = 


La variance : V(x) = 
L’espérance mathématique de la loi de Poisson est égale à sa variance.
La loi de Poisson est une loi de probabilité pour les événements rares (probabilité faible) et est utilisée
généralement dans le cas de la variable aléatoire discontinue distribuée dans le temps.

Exemple 1 :

On suppose qu'une variable biologique discontinue est distribuée dans le temps avec une moyenne de 9 unités
par heure. Quelle est la probabilité d'avoir 3 unités durant une heure ? (On suppose que cette variable suit une
loi de Poisson).

Réponse :

On a comme données
E(x) = = 9 unités ; x = 3
x suit la loi de Poisson, donc :
𝜆𝑥 𝑒 −𝜆
𝑃 𝑥 =
𝑥!
93 𝑒 −9
𝑃 𝑥=3 = = 0.015
3!
Ou bien directement de la table 𝑃 𝑥 = 3 = 0.015

Exemple 2 :

On suppose que le standard téléphonique du C.H.U. d'Oran reçoit en moyenne 5 appels par minute.
Sous l'hypothèse que le nombre d'appel pendant un intervalle de temps suit une loi de Poisson, calculer la
probabilité que durant une minute le standard téléphonique reçoit :
- trois appels
- Au plus deux appels.
Page 19
Faculté de médecine
Département de pharmacie

Réponse :

1) On a les données :
E(x) =  = 5 appels par minute ; x = 3
x suit la loi de Poisson, donc :
𝜆𝑥 𝑒 −𝜆
𝑃 𝑥 =
𝑥!
53 𝑒 −5
𝑃 𝑥=3 =
3!
La probabilité de recevoir 3 appels: P (x=3) = 0,140
Ou bien directement de la table : P(x=3) = 0,140.

2) Au plus deux appels :


P( x  2) = P(x=0) + P(x=1) + P(x=2)
50 𝑒 −5 51 𝑒 −5 23 𝑒 −5
𝑃 𝑥=0 = ;𝑃 𝑥 = 1 = ,𝑃 𝑥 = 2 =
0! 1! 2!
P (x=0) = 0,006 ; P (x=1) = 0,033 et P (x=2) = 0,084
Alors
P(x  2) = P(x=0) + P(x=1) + P(x=2)
= 0,006 + 0,033 + 0,084
La probabilité de recevoir au plus 2 appels :
P( x  2) = 0,123

Exercice :

Suite à une vaccination contre le paludisme, dans une population à risque, on estime à 2%, compte tenu du
délai d'immunisation, la proportion de personnes qui seront pourtant atteintes de la maladie. Quelle est la
probabilité de constater, lors d'un contrôle dans un petit village de 100 habitants tous récemment vaccinés, plus
d'une personne malade ? (on supposera l'indépendance des éventualités).

Solution :

P ( x > 1 ) = p(2) + p(3) + p(4) + p(5) + ………………………………


Ou bien P ( x > 1 ) = 1 –  p(0) + p(1) 
𝑝
On a n =100, p = 0,02 et q = 0,98 et 𝑃 𝑥 = 𝐶𝑛 ∗ 𝑃 𝑥 ∗ 𝑞 𝑛−𝑥
0 1
Alors : 𝑃 𝑥 = 0 = 𝐶100 ∗ 0.020 ∗ 0.98100 = 0.133 et 𝑃 𝑥 = 1 = 𝐶100 ∗ 0.021 ∗ 0.9899 = 0.27
Donc : 𝑃 𝑥 > 1 = 1 − 𝑝 0 + 𝑝 1 = 1 − 0.133 + 0.27 = 0.617

La probabilité de constater, lors d'un contrôle dans un petit village de 100 habitants tous récemment vaccinés,
plus d'une personne malade est égale à 0,617.

Approximation de la loi binominale sur la loi de poisson

Les conditions :

1) 𝑛 ≥ 30 la taille de l’echantillon est trés grande


2) 𝑝 → 0 𝑣𝑜𝑖𝑠𝑖𝑛𝑎𝑔𝑒 𝑑𝑒 0 𝑝 < 0.1
3) 𝜆 = 𝑛𝑝 < 5

Page 20
Faculté de médecine
Département de pharmacie

Exercice :
En jette une pièce de monnaie 7 foi quelle est la probabilité d’avoir 4 foi pille
Condition d’application de la loi binominale
Nombre d’épreuve ≥ 2
L’expérience avec remise
1
Le succès : pille 𝑝 = 2
1
L’échec : face 𝑞 = 2
B(7,1/2)
𝑃 𝑥 = 4 = 𝐶74 0.5 4 0.5 3

𝐸 𝑥 = 𝑛𝑝
𝑉 𝑥 = 𝑛𝑝𝑞

La variable aléatoire continue :


Une fonction qui a une densité de probabilité elle doit vérifier 2 conditions
a- ∀𝑥 ∈ ℝ 𝑓 𝑥 ≥ 0
+∞
b- ∫−∞ 𝑓 𝑥 𝑑𝑥 = 1

Les paramètres de la variable aléatoire continue :

L’espérance mathématique :

𝑏
𝐸 𝑥 = 𝑥𝑓 𝑥 𝑑𝑥
𝑎
𝑏 𝑏
𝑉 𝑥 = 𝑓 𝑥 𝑥 − 𝐸 𝑥 𝑑𝑥 = 𝑥 2 𝑓 𝑥 𝑑𝑥 − 𝐸 𝑥 2
𝑎 𝑎

Fonction de répartition F(x) :

La recherche du primitif de la fonction de densité de probabilité


𝑥
𝐹 𝑥 = 𝑓 𝑡 𝑑𝑡
0

Application des lois des probabilités (variable aléatoire continue ) :

La loi normale de Laplace – Gauss N (μ , σ) :

 Une variable aléatoire continue x pouvant prendre tout les valeurs réelles x dans l’intervalle de
−∞, +∞, pour 𝜇 ∈ ℝ, pour 𝜎 ∈ ℝ+dont la fonction de densité est :
1 −
1 𝑥−𝜇 2
𝑓 𝑥 =𝑔 𝑥 = 𝑒 2 𝜎
𝜎 2𝜋
 Soit X une variable aléatoire distribuer selon une loi normale et 𝑓(𝑥) la fonction de probabilité de X
alors :
Condition de densité de F
Page 21
Faculté de médecine
Département de pharmacie

∀𝑥 ∈ℝ𝑔 𝑥 >0
+∞

𝑔 𝑥 𝑑𝑥 = 1
−∞
La loi normale repose sur l’estimation de deux paramètres de la population statistique
La moyenne μ
L’écart type σ
La courbure (appelée « fonction de densité de probabilité »)
A la formule suivante
𝐹 𝑥 =𝜇
𝑉 𝑥 = 𝜎2 = 𝑆2
𝜎=𝑆
𝑒 = 2.72; 𝜋 = 3.14

La représentation graphique :

f(x)

Moyenne
Médiane
Mode

Forme de la distribution normale :

1- Symétrique
2- Médiane = Mode = Moyenne
3- En forme de cloche

La loi normale centrée réduite N (0,1) :

En pratique on procède à un changement de cette variable (on dit qu’on nome la variable). Pour cela, on
pratique le changement de X par T tel que :
𝑋−𝜇
𝑇=
𝜎
La nouvelle variable est dite variable est dite variable centrée réduite. De moyenne 𝑡 = 0 est sa variance 𝜎 =
1. Elle est notée N(0,1)

Page 22
Faculté de médecine
Département de pharmacie

Transformation d’une loi normale quelconque en N(0,1) :


La loi normale centré reduite
1 𝑥−𝜇 2
𝑥 𝑥 1 −
𝑃 𝑥1 < 𝑥 < 𝑥2 = ∫𝑥 2 𝑔 𝑥 𝑑𝑥 = ∫𝑥 2 𝜎 2𝜋 𝑒 2 𝜎 𝑑𝑥
1 1
𝑥−𝜇 𝑥 𝜇 𝑑𝑥 𝑥 1 −𝜇
𝑋 → 𝑡 = 𝜎 = 𝜎 − 𝜎 ; 𝑑𝑡 = 𝜎
= 0; 𝑥1 → 𝑡1 = 𝜎
𝑡2 5
1 𝑡2

𝑃 𝑡1 < 𝑇 < 𝑡2 = 𝑔 𝑡 𝑑𝑡 = 𝑒 2 𝑑𝑡
2𝜋
𝑡1 −∞
𝑡2
1
𝑔 𝑡 = 2𝜋
𝑒− 2

𝑡1 0 𝑡2

Distribution normale centrale réduite (Utilisation de la table) :

Dans cette table en voit l’aire entre 𝑡 = 0 et 𝑡 ; 𝑝 0 ≤ 𝑇 ≤ 𝑡 = 𝑝(−𝑡 ≤ 𝑇 ≤ 0)

Exemple 1 :

x−μ
Si x suit une loi normale N (μ , σ) de paramètre N (3.2, 2.2) alors 𝑡 = σ
suit une loi normale centré N (0, 1).
Calculer la probabilité 𝑃(𝑥 ≤ 5) ?
5 5
1 −
1 𝑥−𝜇 2
𝑃 𝑥≤5 = 𝑔 𝑥 𝑑𝑥 = 𝑒 2 𝜎 𝑑𝑥
𝜎 2𝜋
−∞ −∞
𝑥 − 𝜇 5 − 3.2
𝑡= = = 0.82
𝜎 3.2
0.82 0.82 0 0.82
1 𝑡2

𝑃 𝑡 ≤ 0.82 = 𝑔 𝑡 𝑑𝑡 = 𝑒 2 𝑑𝑡 = 𝑔 𝑡 𝑑𝑡 + 𝑔 𝑡 𝑑𝑡 = 0.5 + 𝐺 0.82 = 0.793
2𝜋
−∞ −∞ −∞ 0

Page 23
Faculté de médecine
Département de pharmacie

L’échantillonnage :

La théorie de l’estimation :

Lorsqu’on évalue dans un ensemble de sujet ou population la proportion P de ceux qui présente un caractère
donné on ne dispose le plus souvent dans la réalité que de group extrait de cette population
La population qu’ils nous fournissent P0 n’est pas la proportion exact, elle s’écart plus ou moins selon le
hasard de l’échantillonnage.

I- le parie :

L’intervalle de parie est définie par un écart e autour de P


Ex : l’intervalle [40,60]% autour de 50% est définit par l’écart e=10%
L’écart e exprimer en prenant pour unité l’écart type σ est appelle l’écart réduit ξα les deux borne de
l’intervalle de parie sont donné au risque α par :
𝑃𝑞 𝑃𝑞
- Pour P : 𝑃 − 𝜉𝛼 𝑛
≤ 𝑃0 ≤ 𝑃 + 𝜉𝛼 𝑛
- Pour q : 1 − 𝑃𝑖 ≥ 𝑞 ≥ 1 − 𝑃𝑠
𝑃𝑖 : La borne inferieur de l’intervalle
𝑃𝑠 : La borne supérieure de l’intervalle

Tableaux de l’écart réduit :

Elle donne pour écart réduit ξα le risque α correspondant


Ex : α = 0.05, ξα = 1.96

Condition d’utilisation :

1) 𝑛 ≥ 30 ; 𝑛 ∗ 𝑝 ≥ 5 ; 𝑛 ∗ 𝑞 ≥ 5

II- Estimation d’u pourcentage théorique :

Lorsqu’on observe un pourcentage P0 sur un échantillon le problème est d’estimer le véritable pourcentage
inconnu P de la population d’où est extrait l’échantillon

Page 24
Faculté de médecine
Département de pharmacie

La forme de l’intervalle confiance :

𝑃𝑞 𝑃𝑞
𝑃 − 𝜉𝛼 ≤ 𝑃0 ≤ 𝑃 + 𝜉𝛼
𝑛 𝑛
1 − 𝑃𝑖 ≥ 𝑞 ≥ 1 − 𝑃𝑠

Condition d’application :

1) 𝑛 ≥ 30 ; 𝑛 ∗ 𝑝 ≥ 5 ; 𝑛 ∗ 𝑞 ≥ 5

Table de l’intervalle de confiance :

Elle donne directement l’intervalle de confiance en fonction du pourcentage observé.

Page 25
Faculté de médecine
Département de pharmacie

Comparaison de pourcentage

I- Principe :

Dans le cas du caractère qualitatif on distingue deux types de comparaison de pourcentage :

Comparaison d’un pourcentage observé avec un pourcentage théorique :

Echanti 1 Popula

p1, q1 p, q

Test de conformité

Comparaison de deux pourcentages observés :

Echanti 1 Echanti 1

P1, Q1 P1, Q1

Test d’homogénéité

Le principe du test est l’analyse de l’écart entre les pourcentages comparés

II- Procédure :

II 1- Comparaison d’un pourcentage observé avec un pourcentage théorique :

1- Détermination du risque α
2- Construction des hypothèses H0 et H1
3- Vérification des conditions 𝑛 ≥ 30; 𝑛 − 𝑝 ≥ 5; 𝑛 − 𝑞 ≥ 5
𝑝 0 −𝑝
4- Calcule de la variable testé : 𝜀 = 𝑝 ∗𝑞
𝑛
5- Conclusion et prise de décision :
Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue

Page 26
Faculté de médecine
Département de pharmacie

II 2- Comparaison de deux pourcentages observés :

1- Détermination du risque α
2- Construction des hypothèses H0 et H1
3- Vérification des conditions 𝑛1 ≥ 30; 𝑛2 ≥ 30; 𝑛 − 𝑝 ≥ 5; 𝑛 − 𝑞 ≥ 5 𝑎𝑣𝑒𝑐 𝑛 = 𝑛1 + 𝑛2 et
𝑛1 ∗ 𝑝1 + 𝑛2 𝑝2
𝑝=
𝑛1 + 𝑛2
𝑝 1 −𝑝 2
4- Calcule de la variable testé : 𝜀 = 𝑝 ∗𝑞 𝑝 ∗𝑞
+
𝑛1 𝑛2

5- Conclusion et prise de décision :


Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue

Comparaison de deux moyennes


I- Introduction

Deux moyennes d’un caractère quantitatif sont-elles réellement différent ?


Une question qui préoccupe souvent l’expérimenteur.
L’examen plus fin montre que deux situations peuvent se présenter :

II- Principe:

Echantillon Population

𝑛 ; 𝑋 ; 𝑆2 T.C µ ; 𝜎2

Echantillon 1 Echantillon 2

𝑛1 ; 𝑋1 ; 𝑆1 2 T.H 𝑛2 ; 𝑋2 ; 𝑆2 2

III- Procédure :

III.1- Cas des grandes échantillons (𝒏 ≥ 𝟑𝟎)

A. Comparaison d’une moyenne observée avec une moyenne théorique :

1) Détermination du risque α.
2) Condition : 𝑛 ≥ 30.
3) Construction de H0.
Page 27
Faculté de médecine
Département de pharmacie

4) Calcule de la variable testée :


𝑋−µ
𝜉=
𝑆
𝑛−1
5) Conclusion :
 Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
 Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue

B. Comparaison de deux moyennes observées :

1) Détermination du risque α.
2) Condition : 𝑛1 ≥ 30 et 𝑛2 ≥ 30.
3) Construction de H0 et H1.
4) Calcule de la variable testée :
𝑋1 − 𝑋2
𝜉=
𝑆12 𝑆22

𝑛1 − 1 𝑛2 − 1
5) Conclusion :
 Si 𝜀 ≥ 𝜀𝛼 la différence est significative au risque α, H0 est rejetée
 Si 𝜀 < 𝜀𝛼 la différence n’est pas significative au risque α, H0 est retenue

III.2- Cas des petits échantillons (𝒏 < 30)

A. Test de student : Comparaison d’une moyenne observée avec une moyenne théorique :

1) Détermination du risque α.
2) Condition : 𝑛 < 30.
3) Construction de H0 et H1.
4) degré de liberté 𝑑. 𝑑. 𝑙 = 𝜈 = 𝑛 − 1 et 𝑡𝛼𝜈 de la table.
5) variable testée :
𝑋−µ
𝑡=
𝑆
𝑛−1
6) Conclusion :
 Si 𝑡 ≥ 𝑡𝛼𝜈 la différence est significative au risque α, H0 est rejetée
 Si 𝑡 < 𝑡𝛼𝜈 la différence n’est pas significative au risque α, H0 est retenue

B. Test de student : Comparaison de deux moyennes observées :

1) Détermination du risque α.
2) Condition : 𝑛1 < 30 et/ou 𝑛2 < 30.
3) Construction de H0 et H1.
4) Calcule de la variance commune
𝑛1 𝑆12 + 𝑛2 𝑆22
𝑆𝑐2 =
𝑛1 + 𝑛2 − 2
5) Degré de liberté 𝑑. 𝑑. 𝑙 = 𝜈 = 𝑛1 + 𝑛2 − 2.
6) Détermination de 𝑡𝛼𝜈 de la table.

Page 28
Faculté de médecine
Département de pharmacie

7) Variable de student :
𝑋1 − 𝑋2
𝑡=
𝑆𝑐2 𝑆𝑐2
𝑛1 − 𝑛2
8) Conclusion :
 Si 𝑡 ≥ 𝑡𝛼𝜈 la différence est significative au risque α, H0 est rejetée
 Si 𝑡 < 𝑡𝛼𝜈 la différence n’est pas significative au risque α, H0 est retenue

Page 29

Vous aimerez peut-être aussi