Génétique
U.E. : BIOSTATISTIQUE
ECUE : LOIS DE DISTRIBUTION
Niveau : L3_BIOSCIENCES
I- Variable aléatoire
I-1 Définition
Dans la plupart des phénomènes aléatoires, le résultat d’une épreuve peut se
traduire par une «grandeur» mathématique, très souvent représentée par un nombre
entier ou un nombre réel (il sera ici surtout question des variables aléatoires réelles,
les entiers faisant bien sûr partie des réels IR). La notion mathématique qui
représente efficacement ce genre de situation concrète est celle de variable
aléatoire.
Les valeurs qui sont effectivement prises par une variable aléatoire à l’issue de la
réalisation d’une épreuve donnée sont le seul fait du hasard.
- On désigne les variables aléatoires par des lettres majuscules. Ex : X = taille
des étudiants ; Y = poids du poisson péché.
- On désigne les valeurs que prend effectivement la variable aléatoire à l’issue
de la réalisation de l’épreuve (valeurs observées) par des lettres minuscules.
Ex : x1 = 165 cm ; x2 = 175cm, etc.
De manière pratique, la variable aléatoire est donc le fait élémentaire sur lequel se
porte l’attention du chercheur ou de l’investigateur. Le temps de désintégration d’un
atome radioactif, le pourcentage de réponses «oui» à une question posée dans un
sondage, le nombre d’enfants d’un couple, la taille des individus ou leur état de santé
(infecté ou non) dans une population d’étudiants, le gain au lancer de pièce de
monnaie sont autant d’autres exemples de variables aléatoires.
Remarque
Le terme de variable aléatoire peut parfois être trompeur, en effet, ce n'est pas la
valeur qu'elle prend une fois que l'on connait le résultat de l'expérience ou de
l’épreuve qui est aléatoire, mais la valeur qu'elle va prendre avant d'avoir
effectué l'expérience.
Par exemple, considérons une expérience de lancer de pièce de monnaie où suivant
que le résultat est pile on gagne 5000 FCFA, ou face on perd 500 FCFA. On
1
considère alors X, la variable aléatoire qui prend la valeur 5000 lorsqu’on obtient pile
et la valeur -500 lorsqu’on obtient face. X représente le gain à l'issue d'un lancer de
la pièce. Dans cette expérience, une fois que l'on connait le résultat du "pile"
ou "face" on connait la valeur de X, le gain, avec certitude et celle-ci ne dépend
pas du hasard. Par contre, avant de jeter la pièce on ne sait pas quelle valeur
va prendre X car on ne sait pas encore si l'on va obtenir pile ou face.
II- Probabilité
Un des concepts fondamentaux de la statistique est celui de Probabilité.
C’est une idée avec laquelle beaucoup d’entre nous sont familiers d’une manière
générale, mais il est nécessaire de définir ce mot avec précision avant de pouvoir
l’appliquer à l’analyse de données biologiques.
Quand on parle de probabilité d’un événement, cela implique que les circonstances
ne nous permettent pas de déterminer sa survenue régulière, en sorte que pour une
occasion donnée l’événement peut ou non se produire : mais dans une série étendue
2
d’occasions, il se présentera dans une proportion caractéristique de cas. On peut
exprimer cette proportion par un nombre.
Exemple :
(i)- Lors d’un lancer de pièce de monnaie, celle-ci peut tomber pile ou au contraire
face. Si la pièce est équilibrée, on ne sait pas laquelle des deux possibilités se
présentera à un jet quelconque. Mais la pièce étant équilibrée, l’on s’attend à une
probabilité de 1/2 pour pile et 1/2 pour face.
(ii)- Dans la descendance de mariages entre [normal] Aa et [albinos] aa dans une
population, l’on s’attend à 1/2 de [normal] et 1/2 de [albinos].
Remarque :
- La probabilité d’un événement impossible (Événement qui ne se produit jamais)
est nulle (égale à 0). La probabilité d’un événement certain (Evénement qui se
produit toujours) est égale à 1.
k
- La fréquence d’un événement (notée ¿ ) est le résultat observé à la fin d’une
n
expérience. Ce résultat varie de 0 à 1 ou de 0 % à 100 %.
Exemple : Au cours de l’année universitaire 2012-2013, 100 étudiants ont été
déclarés admis à l’UE de Biostatistique sur un total de 170 étudiants ayant composé
pour les 2 sessions ; soit une fréquence de 100/170 = 0,588.
- Lorsque le nombre d’épreuves augmente indéfiniment, les fréquences observées
pour le phénomène étudié tendent vers les probabilités et les distributions observées
vers les distributions de probabilité ou loi de probabilité ; c’est la loi des grands
nombres.
3
CHAPITRE II : LOIS DE DISTRIBUTION
I- Distributions de probabilité
I-1 Définition
Une distribution de probabilité également appelée loi de probabilité est une
mesure, souvent vue comme la loi décrivant le comportement d'une variable
aléatoire, discrète ou continue. L'étude d'une variable aléatoire suivant une loi de
probabilité discrète fait apparaître des calculs de sommes et de séries, alors que si
sa loi est absolument continue, l'étude de la variable aléatoire fait apparaître des
calculs d'intégrales.
La loi de probabilité de la variable X est l’ensemble des couples (x 1 ; p1), (x2 ; p2),
…, (xn ; pn).
Une loi de probabilité n’est établie que si ∑ Pi =1, la somme étant étendue à tous
i
les indices i.
4
Ensemble des Valeurs de la Probabilités associée
évènements possibles variable aléatoire X à la variable X P(X = xi) ou pi
G et G 0 1/4
F et G ou G et F 1 1/2
F et F 2 1/4
Cette fonction densité de probabilité est une loi de probabilité car l’aire sous la
courbe est égale à 1 pour toutes les valeurs de X définies.
5
IV- Fonction de répartition d’une variable aléatoire
6
V-1 Variables aléatoires discrètes
Si X est une variable aléatoire discrète de loi de probabilité (x i, pi) définie sur un
nombre fini (n) d’évènements élémentaires alors :
n
E ( X ) =∑ x i pi
i=1
Exemples :
Si l’on reprend l’exemple d’une fratrie de deux enfants, l’espérance de la variable
aléatoire « nombre de filles » est : E(X) = 0x1/4 + 1x1/2 + 2x1/4 = 1 d’où E(X) = 1.
Si l’on observe un nombre suffisant de fratries de 2 enfants, on attend en moyenne
une fille par fratrie.
Propriétés de la variance
Si X est une variable aléatoire admettant une variance alors :
(1) ∀ a ∈ R, V(aX) = a2.V(X)
(2) ∀ (a, b) ∈ IR, V(aX + b) = a2.V(X)
(3) V(X) = 0 ⇔ X = E(X)
7
VI-1 Variables aléatoires discrètes
Si X est une variable aléatoire discrète de loi de probabilité (xi, pi)i définie sur un
nombre fini (n) d’évènements élémentaires alors la variance est égale à :
n n
V ( X )=∑ (x−E ( X )) p i=∑ x i . p i−E( X )
2 2 2
i=1 i=1
Exemple :
Si l’on reprend l’exemple d’une fratrie de deux enfants, la variance de la variable
aléatoire « nombre de filles » est :
V(X) = 1/4x(O - 1)2 + 1/2x(1 - 1)2 + 1/4x(2 - 1)2 = 1/2 ; V(X) = 1/2 et σ(X) = 0,7
• Propriétés :
8
VII-1-2 Loi binomiale β (n , p)
On réalise n fois successivement et d’une manière indépendante une expérience
aléatoire qui a deux résultats possibles, le succès (associé au résultat pour lequel
nous voulons déterminer la probabilité) qui a une probabilité p de se réaliser et
l’échec qui a une probabilité q = 1 − p de se réaliser. La v.a. X = nombre de succès
obtenus au cours des n épreuves suit la loi binomiale notée β ( n , p ) .
La probabilité d’assister au cours des n épreuves à x réalisations du succès et n−x
réalisations de l’échec apparaissant dans un ordre quelconque est donnée par :
x x n−x
p ( X=x ) =Cn p q
• Représentation graphique
La représentation graphique préférentielle est le diagramme en bâtons.
• Les paramètres
Moyenne : mo=μ=np
Variance : σ 2=npq → σ= √npq
Notation : X β (n , p)
La variable X suit une loi binomiale de paramètres n et p.
• Propriétés
p(n−x)
p ( x+1 ) =p ( x ) .
q ( x+ 1)
p ( x ) =¿ C xn p x qn− x
p ( x+1 ) =¿ C x+1
n p
x +1 n−(x +1)
q
Exemples :
• Lancer d’une pièce de monnaie (pile ou face); qualité d’un produit (bon ou
défectueux); sondage électoral (pour ou contre).
9
• Dans une famille de fleurs, les fleurs rouges sont 3 fois plus nombreuses que les
fleurs bleues. On cueille au hasard 10 fleurs. Quelle est la probabilité d’avoir 0 fleur
bleue, 1, 2, 3, 4,……10 fleurs bleues.
• Représentation graphique
C’est le diagramme en bâtons dont l’allure varie en fonction de µ. La figure ci-
dessous représente la loi de Poisson pour µ = 4 (σ = 1,73).
• Paramètres
Moyenne μ=np
Variance σ 2=np
10
• Comparaison entre loi binomiale et loi de Poisson.
Lorsque n est grand, la loi de poisson est une bonne approximation de la loi
binomiale
Exemple :
1 1
p= np=100× =1
Pour n = 100 ; 100 ; 100
x 0 1 2 3 4 5
p(X =x)
0,3660 0,3700 0,1850 0,0610 0,0149 0,0029
loi binomiale
p(X =x)
0,3678 0,3678 0,1839 0,0613 0,0153 0,0030
loi de poisson
A 10−2 près, les valeurs calculées avec la loi binomiale sont identiques à celles
calculées avec la loi de Poisson.
On peut donc être amené à calculer p(X =x) avec la loi de Poisson pour simplifier
les calculs même si on est dans les conditions d’utilisation de la loi binomiale.
• Représentation graphique
Le polygone de fréquences est une courbe en cloche appelée courbe de
Gauss.
11
• Propriétés
L’aire comprise entre la courbe f ( x) et l’axe des abscisses vaut 1
Soient 2 points d’abscisse X 1=a et X 2=b avec a< b
L’aire délimitée par la courbe f (x) et les droites X =a et X =b représente la
probabilité pour que X soit comprise entre a et b.
p ( a ≤ X <b ) =p ( X <b ) −p ( X< a )=F ( b )−F (a)
• Paramètres
Moyenne : μ=np
Variance : σ 2=npq → σ= √npq
La loi normale est une approximation de la loi binomiale pour les variables
aléatoires continues dans les cas où n + ∞ et p est moyen.
12
• Représentation graphique
• Paramètres
Moyenne : μ=0
Variance : σ 2=1
→ σ=1
• Propriétés
L’aire comprise entre la courbe f ( U ) et l’axe des abscisses vaut 1
+∞ +∞
13
Exemple de calcul de la probabilité d’un intervalle dans le cas d’une variable
aléatoire normale quelconque.
Soit X variable aléatoire normale quelconque d’écart type σ =¿3 et de moyenne μ=¿
5. Calculez p(2 ≤ X <8).
X −μ
U=
On sait que σ
2−5 8−5
p ( 2≤ X < 8 )= p( ≤U < )
3 3
¿ p (−1≤ U <1 )
¿ p ( U <1 )− p(U <−1)
¿ 2 . p ( U <1 )−1=0,6826
Exercices d’application
Trouvez les probabilités des intervalles suivants :
p(−1 ≤ U <1) ; p(−1,28 ≤ U <+∞ ) ; p(−0,68 ≤ U <0) ; p(−1.96 ≤ U <1,96);
p(−0,46 ≤ U <2,21)
14
TABLE DE LA LOI NORMALE CENTREE ET REDUITE
15