Vous êtes sur la page 1sur 17

Laboratoire de

Génétique

U.E. : BIOSTATISTIQUE
ECUE : LOIS DE DISTRIBUTION

Niveau : L3_BIOSCIENCES

Enseignant : Dr TIAN BI T. Yves-Nathan


TABLE DES MATIÈRES Page

CHAPITRE I : NOTIONS DE VARIABLE ALEATOIRE ET DE PROBABILITE 1


I- Variable aléatoire 1
I-1 Variables aléatoires discrètes 1
I-2 Variables aléatoires continues 2
II- Probabilités 2
CHAPITRE II : LOIS DE DISTRIBUTION 4
I- Distributions de probabilités 4
I-1 Définition 4

I-2 Description de la loi de probabilité d’une variable aléatoire 4

II- Loi de probabilité d’une variable aléatoire discrète 4


III- Loi de probabilité d’une variable aléatoire continue ou fonction densité de probabilité 5
IV- Fonction de répartition d’une variable aléatoire 6
IV-1 Fonction de répartition d’une variable aléatoire discrète 6
IV-2 Fonction de répartition d’une variable aléatoire continue 6
V- Espérance mathématique d’une variable aléatoire 6
V-1 Variables aléatoires discrètes 7
V-2 Variables aléatoires continues 7
VI- Variance et écart-type d’une variable aléatoire 7
VI-1 Variables aléatoires discrètes 8
VI-2 Variables aléatoires continues 8
VII- Lois de probabilité discrètes usuelles 8
VII-1 Loi binomiale et Loi binomiale 8
VII-2 Loi de Poisson P(μ) 8
VIII- Lois de probabilité continues usuelles 11
VIII-1 Loi normale ou Loi de Laplace–Gauss N (µ, σ) 11
VIII-2 Loi normale centrée et réduite N (0 , 1) 12
TABLE DE LA LOI NORMALE CENTREE ET REDUITE 15
CHAPITRE I : NOTIONS DE VARIABLE ALEATOIRE ET DE PROBABILITE

I- Variable aléatoire
I-1 Définition
Dans la plupart des phénomènes aléatoires, le résultat d’une épreuve peut se
traduire par une «grandeur» mathématique, très souvent représentée par un nombre
entier ou un nombre réel (il sera ici surtout question des variables aléatoires réelles,
les entiers faisant bien sûr partie des réels IR). La notion mathématique qui
représente efficacement ce genre de situation concrète est celle de variable
aléatoire.

Les valeurs qui sont effectivement prises par une variable aléatoire à l’issue de la
réalisation d’une épreuve donnée sont le seul fait du hasard.

- On désigne les variables aléatoires par des lettres majuscules. Ex : X = taille
des étudiants ; Y = poids du poisson péché.
- On désigne les valeurs que prend effectivement la variable aléatoire à l’issue
de la réalisation de l’épreuve (valeurs observées) par des lettres minuscules.
Ex : x1 = 165 cm ; x2 = 175cm, etc.

Exemples de variables aléatoires


Si l’on considère la constitution d’une fratrie de deux enfants, l’espace fondamental
est constitué des évènements élémentaires suivants : {GG, GF, FG, FF}. Les valeurs
possibles prises par la variable aléatoire X : « nombres de filles dans la famille » sont
{0, 1, 2}.

De manière pratique, la variable aléatoire est donc le fait élémentaire sur lequel se
porte l’attention du chercheur ou de l’investigateur. Le temps de désintégration d’un
atome radioactif, le pourcentage de réponses «oui» à une question posée dans un
sondage, le nombre d’enfants d’un couple, la taille des individus ou leur état de santé
(infecté ou non) dans une population d’étudiants, le gain au lancer de pièce de
monnaie sont autant d’autres exemples de variables aléatoires.

Remarque
Le terme de variable aléatoire peut parfois être trompeur, en effet, ce n'est pas la
valeur qu'elle prend une fois que l'on connait le résultat de l'expérience ou de
l’épreuve qui est aléatoire, mais la valeur qu'elle va prendre avant d'avoir
effectué l'expérience.
Par exemple, considérons une expérience de lancer de pièce de monnaie où suivant
que le résultat est pile on gagne 5000 FCFA, ou face on perd 500 FCFA. On

1
considère alors X, la variable aléatoire qui prend la valeur 5000 lorsqu’on obtient pile
et la valeur -500 lorsqu’on obtient face. X représente le gain à l'issue d'un lancer de
la pièce. Dans cette expérience, une fois que l'on connait le résultat du "pile"
ou "face" on connait la valeur de X, le gain, avec certitude et celle-ci ne dépend
pas du hasard. Par contre, avant de jeter la pièce on ne sait pas quelle valeur
va prendre X car on ne sait pas encore si l'on va obtenir pile ou face.

I-2 Types de variables aléatoires


I-2-1 Variables aléatoires discrètes
Une variable aléatoire est dite discrète si elle ne prend que des valeurs discontinues
dans un intervalle donné (borné ou non borné). L’ensemble des nombres entiers est
discret ( X i ϵ [0 , I N ]). En règle générale, toutes les variables qui résultent d’un
dénombrement ou d’une numération (variables qualitatives, non métriques) sont de
type discret.
Exemples :
Les variables aléatoires,
- le nombre de petits par porté pour une espèce animale donnée (chat, chien, etc.),
- le nombre de bactéries dans 100 ml de préparation,
- le nombre de mutations dans une séquence d’ADN de 10 kb, etc., sont des
variables aléatoires discrètes.

I-2-2 Variables aléatoires continues


Une variable aléatoire est dite continue si elle peut prendre toutes les valeurs dans
un intervalle donné (borné ou non). En règle générale, toutes les variables qui
résultent d’une mesure (variables quantitatives, métriques) sont de type continu.
Exemples :
Les variables aléatoires,
- la taille des individus pour une espèce animale donnée,
- la masse corporelle des individus,
- taux de glucose dans le sang, etc., sont des variables aléatoires continues.

II- Probabilité
Un des concepts fondamentaux de la statistique est celui de Probabilité.
C’est une idée avec laquelle beaucoup d’entre nous sont familiers d’une manière
générale, mais il est nécessaire de définir ce mot avec précision avant de pouvoir
l’appliquer à l’analyse de données biologiques.
Quand on parle de probabilité d’un événement, cela implique que les circonstances
ne nous permettent pas de déterminer sa survenue régulière, en sorte que pour une
occasion donnée l’événement peut ou non se produire : mais dans une série étendue

2
d’occasions, il se présentera dans une proportion caractéristique de cas. On peut
exprimer cette proportion par un nombre.

Mesure de la probabilité d’un événement (aléatoire)


L’événement aléatoire est l’événement qui peut se produire ou non, dont la
production ou la non production est déterminée par le hasard.
L’opération qui conduit à l’apparition éventuelle de l’événement aléatoire est une
épreuve. Soit n le nombre d’épreuves et k le nombre de réalisations (apparition) de
l’événement aléatoire.
La probabilité p d’un événement aléatoire E est :

nombre de cas favorables


p ( E )=
nombre de cas possibles
La probabilité est une donnée de départ. Cette donnée varie de 0 à 1 ou de 0 % à
100 %.

Exemple :
(i)- Lors d’un lancer de pièce de monnaie, celle-ci peut tomber pile ou au contraire
face. Si la pièce est équilibrée, on ne sait pas laquelle des deux possibilités se
présentera à un jet quelconque. Mais la pièce étant équilibrée, l’on s’attend à une
probabilité de 1/2 pour pile et 1/2 pour face.
(ii)- Dans la descendance de mariages entre [normal] Aa et [albinos] aa dans une
population, l’on s’attend à 1/2 de [normal] et 1/2 de [albinos].

Remarque :
- La probabilité d’un événement impossible (Événement qui ne se produit jamais)
est nulle (égale à 0). La probabilité d’un événement certain (Evénement qui se
produit toujours) est égale à 1.
k
- La fréquence d’un événement (notée ¿ ) est le résultat observé à la fin d’une
n
expérience. Ce résultat varie de 0 à 1 ou de 0 % à 100 %.
Exemple : Au cours de l’année universitaire 2012-2013, 100 étudiants ont été
déclarés admis à l’UE de Biostatistique sur un total de 170 étudiants ayant composé
pour les 2 sessions ; soit une fréquence de 100/170 = 0,588.
- Lorsque le nombre d’épreuves augmente indéfiniment, les fréquences observées
pour le phénomène étudié tendent vers les probabilités et les distributions observées
vers les distributions de probabilité ou loi de probabilité ; c’est la loi des grands
nombres.

3
CHAPITRE II : LOIS DE DISTRIBUTION

I- Distributions de probabilité

I-1 Définition
Une distribution de probabilité également appelée loi de probabilité est une
mesure, souvent vue comme la loi décrivant le comportement d'une variable
aléatoire, discrète ou continue. L'étude d'une variable aléatoire suivant une loi de
probabilité discrète fait apparaître des calculs de sommes et de séries, alors que si
sa loi est absolument continue, l'étude de la variable aléatoire fait apparaître des
calculs d'intégrales.

I-2 Description de la loi de probabilité d’une variable aléatoire


Soit une expérience aléatoire dont l’ensemble des résultats possibles contient n
événement(s) élémentaire(s).
Soit X la variable aléatoire associée à cette expérience aléatoire prenant les valeurs
x1, x2, …, xn.
La probabilité que X = x1 est notée p1 (on note également p1 = p(X = x1))
La probabilité que X = x2 est notée p2 (on note également p2 = p(X = x2))

La probabilité que X = xn est notée pn (on note également pn = p(X = xn))

La loi de probabilité de la variable X est l’ensemble des couples (x 1 ; p1), (x2 ; p2),
…, (xn ; pn).

Une loi de probabilité n’est établie que si ∑ Pi =1, la somme étant étendue à tous
i

les indices i.

II- Loi de probabilité d’une variable aléatoire discrète


Dans le cas de la constitution d’une fratrie de deux enfants, si l’on fait l’hypothèse
que la probabilité d’avoir un garçon est égale à celle d’avoir une fille (1/2), alors la
distribution de probabilité ou loi de probabilité la variable aléatoire "nombre de
filles dans une fratrie de deux enfants" est :

4
Ensemble des Valeurs de la Probabilités associée
évènements possibles variable aléatoire X à la variable X P(X = xi) ou pi
G et G 0 1/4
F et G ou G et F 1 1/2
F et F 2 1/4

La loi de probabilité est constituée par les trois couples suivants :


1 1 1
(0 ; ), (1 ; ), (2 ; )
4 2 4

III- Loi de probabilité d’une variable aléatoire continue ou fonction densité de


probabilité
Dans le cas d’une variable aléatoire continue, la loi de probabilité associe une
probabilité à chaque ensemble de valeurs définies dans un intervalle donné. En
effet, pour une variable aléatoire continue, la probabilité associée à l’évènement {X =
a} est nulle, car il est impossible d’observer exactement cette valeur. On considère
alors la probabilité que la variable aléatoire X prenne des valeurs comprises dans un
intervalle [a, b] tel que P(a ≤ X ≤ b).
Lorsque cet intervalle tend vers 0, la valeur prise par X tend alors vers une fonction
que l’on appelle fonction densité de probabilité ou densité de probabilité.

Soit une fonction densité de probabilité f(x) :


(1) l’aire hachurée en vert correspond à la probabilité P(X < -10),
(2) l’aire hachurée en bleu correspond à la probabilité P(+10 < X < +15).

Cette fonction densité de probabilité est une loi de probabilité car l’aire sous la
courbe est égale à 1 pour toutes les valeurs de X définies.

5
IV- Fonction de répartition d’une variable aléatoire

IV-1 Fonction de répartition d’une variable aléatoire discrète


La fonction de répartition correspond à la distribution des probabilités cumulées. Le
plateau atteint par la fonction de répartition correspond à la valeur de probabilité 1
car .

Pour une variable aléatoire discrète, elle est définie comme :


F ( x i )=F ( X =xi ) = p( X ≤ xi )=∑ p( xi ) = fréquences cumulées (varie entre 0 et 1)

IV-2 Fonction de répartition d’une variable aléatoire continue


Pour une variable aléatoire continue, la fonction de répartition est définie par :
b
P ( a ≤ X ≤ b )=F X ( b )−F X ( a )=∫ f ( x ) dx=P ( X ≤ b )−P ( X ≤ a ) ,avec a< b.
a

V- Espérance mathématique d’une variable aléatoire


L’espérance mathématique E(X) d’une variable aléatoire X correspond à la
moyenne des valeurs possibles de X pondérées par les probabilités associées à ces
valeurs. C’est un paramètre de position qui correspond au moment d’ordre 1 de la
variable aléatoire X. C’est l’équivalent de la moyenne arithmétique . En effet
lorsque le nombre d’épreuves n est grand, tend vers E(X).

Propriétés de l’espérance mathématique


Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.

Si X et Y sont deux variables aléatoires définies sur un même univers Ω, admettant


une espérance, alors :
(1) E(X+Y) = E(X) + E(Y)
(2) E(aX) = aE(X) ∀a ∈ IR
(3) Si X ≥ 0 alors E(X) ≥ 0
n n
(4) Si X est un caractère constant E(X) = k, car E ( X ) =∑ k pi=k . ∑ pi
i=1 i=1
n
¿ ∑ pi=1
i=1

6
V-1 Variables aléatoires discrètes
Si X est une variable aléatoire discrète de loi de probabilité (x i, pi) définie sur un
nombre fini (n) d’évènements élémentaires alors :
n
E ( X ) =∑ x i pi
i=1

L’espérance mathématique se calcule ainsi :


E ( X ) =x1 . p ( X=x 1 ) + x 2 . p ( X=x 2 ) + ⋯+ x n . p ( X =x n) ;
n
s oit E ( X )=∑ x i . p ( X=x i )
i=1

Exemples :
Si l’on reprend l’exemple d’une fratrie de deux enfants, l’espérance de la variable
aléatoire « nombre de filles » est : E(X) = 0x1/4 + 1x1/2 + 2x1/4 = 1 d’où E(X) = 1.
Si l’on observe un nombre suffisant de fratries de 2 enfants, on attend en moyenne
une fille par fratrie.

V-2 Variables aléatoires continues


Si X est une variable aléatoire absolument continue de densité ƒ, on appelle
+∞

espérance de X, le réel E(X), défini par : E ( X ) =∫ x . f ( x ) dx .


−∞

VI- Variance et écart-type d’une variable aléatoire


La variance V(X) d’une variable aléatoire X est l’espérance mathématique du carré
de l’écart à l’espérance mathématique. C’est un paramètre de dispersion qui
correspond au moment centré d’ordre 2 de la variable aléatoire X. C’est l’équivalent
de la variance observée S2. En effet lorsque le nombre d’épreuves n est grand, S 2
tend vers V(X).
Si X est une variable aléatoire ayant une variance V(X), on appelle écart-type de X,
le réel : σ ( X )=√ V ( X )

Propriétés de la variance
Si X est une variable aléatoire admettant une variance alors :
(1) ∀ a ∈ R, V(aX) = a2.V(X)
(2) ∀ (a, b) ∈ IR, V(aX + b) = a2.V(X)
(3) V(X) = 0 ⇔ X = E(X)

7
VI-1 Variables aléatoires discrètes
Si X est une variable aléatoire discrète de loi de probabilité (xi, pi)i définie sur un
nombre fini (n) d’évènements élémentaires alors la variance est égale à :
n n
V ( X )=∑ (x−E ( X )) p i=∑ x i . p i−E( X )
2 2 2

i=1 i=1

Exemple :
Si l’on reprend l’exemple d’une fratrie de deux enfants, la variance de la variable
aléatoire « nombre de filles » est :
V(X) = 1/4x(O - 1)2 + 1/2x(1 - 1)2 + 1/4x(2 - 1)2 = 1/2 ; V(X) = 1/2 et σ(X) = 0,7

VI-2 Variables aléatoires continues


Si X est une variable aléatoire continue donnée par sa densité de probabilité alors la
variance de X est le nombre réel positif tel que :
+∞ +∞
V ( X )= ∫ (x−E ( X ) )2 . f ( x ) dx=∫ x 2 . f ( x ) dx−E (X )2
−∞ −∞

VII- Lois de probabilité discrètes usuelles

VII-1 Loi de Bernoulli et Loi binomiale

VII-1-1 Loi de Bernoulli β (1 , p)


On réalise une expérience aléatoire qui a deux résultats possibles : soit le succès qui
a une probabilité p de se réaliser, soit l’échec qui a une probabilité q = 1 - p. La
variable aléatoire X = nombre de succès obtenus suit la loi de Bernoulli notée β (1 , p)
et définie par :

• Propriétés :

8
VII-1-2 Loi binomiale β (n , p)
On réalise n fois successivement et d’une manière indépendante une expérience
aléatoire qui a deux résultats possibles, le succès (associé au résultat pour lequel
nous voulons déterminer la probabilité) qui a une probabilité p de se réaliser et
l’échec qui a une probabilité q = 1 − p de se réaliser. La v.a. X = nombre de succès
obtenus au cours des n épreuves suit la loi binomiale notée β ( n , p ) .
La probabilité d’assister au cours des n épreuves à x réalisations du succès et n−x
réalisations de l’échec apparaissant dans un ordre quelconque est donnée par :
x x n−x
p ( X=x ) =Cn p q

• Représentation graphique
La représentation graphique préférentielle est le diagramme en bâtons.

• Les paramètres
Moyenne : mo=μ=np
Variance : σ 2=npq → σ= √npq
Notation : X β (n , p)
La variable X suit une loi binomiale de paramètres n et p.

• Propriétés
p(n−x)
p ( x+1 ) =p ( x ) .
q ( x+ 1)
p ( x ) =¿ C xn p x qn− x
p ( x+1 ) =¿ C x+1
n p
x +1 n−(x +1)
q

Exemples :
• Lancer d’une pièce de monnaie (pile ou face); qualité d’un produit (bon ou
défectueux); sondage électoral (pour ou contre).

9
• Dans une famille de fleurs, les fleurs rouges sont 3 fois plus nombreuses que les
fleurs bleues. On cueille au hasard 10 fleurs. Quelle est la probabilité d’avoir 0 fleur
bleue, 1, 2, 3, 4,……10 fleurs bleues.

VII-2 Loi de Poisson P( μ)


La loi de Poisson encore appelée loi des petites probabilités est une approximation
de la loi binomiale dans les conditions de réalisation de 2 évènements alternatifs E et
non E ( E ) où :
n +∞
p 0
np ≤ 5
Cette approximation est conseillée généralement si n dépasse 50 et que p n’excède
pas 0,1.
x
μ −μ
Dans ce cas : P ( X=x )= e  ; où µ est la moyenne de la distribution.
x!
Cette loi convient donc à la description d’événements dont les chances de réalisation
sont faibles. Par exemple le nombre d’occurrences d’un événement dans un certain
laps de temps ou dans une région donnée (nb. d’accidents/semaine sur une
autoroute ; nb. d’appels téléphoniques dans un intervalle de temps ; nb. de
naissances/année dans une petite municipalité, etc.).

• Représentation graphique
C’est le diagramme en bâtons dont l’allure varie en fonction de µ. La figure ci-
dessous représente la loi de Poisson pour µ = 4 (σ = 1,73).

• Paramètres
Moyenne μ=np
Variance σ 2=np

10
• Comparaison entre loi binomiale et loi de Poisson.
Lorsque n est grand, la loi de poisson est une bonne approximation de la loi
binomiale

Exemple :
1 1
p= np=100× =1
Pour n = 100 ; 100  ; 100
x 0 1 2 3 4 5
p(X =x)
0,3660 0,3700 0,1850 0,0610 0,0149 0,0029
loi binomiale
p(X =x)
0,3678 0,3678 0,1839 0,0613 0,0153 0,0030
loi de poisson

A 10−2 près, les valeurs calculées avec la loi binomiale sont identiques à celles
calculées avec la loi de Poisson.
On peut donc être amené à calculer p(X =x) avec la loi de Poisson pour simplifier
les calculs même si on est dans les conditions d’utilisation de la loi binomiale.

VIII- Lois de probabilité continues usuelles

VIII-1 Loi normale ou Loi de Laplace–Gauss N (µ, σ)


C’est la loi la plus importante car la plus utilisée en biologie. Une variable aléatoire
continue X est distribuée suivant une loi normale si sa densité de probabilité est :
1 −¿ ¿¿
f ( x )= .e
σ √2 π
Où σ = écart type ; σ 2 = variance ; μ = moyenne
On note X N ( μ , σ ). X suit une loi normale de paramètres μ et σ

• Représentation graphique
Le polygone de fréquences est une courbe en cloche appelée courbe de
Gauss.

11
• Propriétés
L’aire comprise entre la courbe f ( x) et l’axe des abscisses vaut 1
Soient 2 points d’abscisse X 1=a et X 2=b avec a< b
L’aire délimitée par la courbe f (x) et les droites X =a et X =b représente la
probabilité pour que X soit comprise entre a et b.
p ( a ≤ X <b ) =p ( X <b ) −p ( X< a )=F ( b )−F (a)

• Paramètres
Moyenne : μ=np
Variance : σ 2=npq → σ= √npq
La loi normale est une approximation de la loi binomiale pour les variables
aléatoires continues dans les cas où n + ∞ et p est moyen.

VIII-2 Loi normale centrée et réduite N (0,1)


X −μ
U=
En faisant le changement de variable suivant : σ
C’est-à-dire en centrant la distribution sur la moyenne et en prenant l’écart type
comme unité, on obtient :
2
−μ
1
f ( U )= e 2
√2 π
f ( U ) est la fonction densité de probabilité de la loi normale centrée et réduite qu’on
note N (0 , 1).

12
• Représentation graphique

• Paramètres
Moyenne : μ=0
Variance : σ 2=1
→ σ=1

• Propriétés
L’aire comprise entre la courbe f ( U ) et l’axe des abscisses vaut 1
+∞ +∞

∫ f (U ) dU =∫ f ( U ) dU=0,5 (la moitié de l’aire vaut 0,5)


−∞ 0

La fonction f ( U ) est rapidement décroissante et s’annule pour U ≥ 4 à 10−4 près.


1
=0,4 f ( 0 )=0,4
√2 Π donc
f ( U )=1,4 . 10−4
L’aire délimitée par la courbe f ( U ) et les droites U =u1 et U =u2 avec u1 <u2 représente
la probabilité pour que U soit comprise entre u1 et u2.
p ( u1 <U <u2 ) =F ( u2 ) −F ( u1 ) =p ( U < u2 )− p(U < u1)

Utilisation de la table de loi normale centrée et réduite (table de la fonction de


répartition)
Cette table est établie pour des valeurs de U >0 et donne F ( U ) =p (U <u1 )
Ex : p(U < 0,5) = 0,6915
p ( U <−1 )= p ( U >+1 )=1− p (U < 1 )
¿ 1−0,8413=0,1587

13
Exemple de calcul de la probabilité d’un intervalle dans le cas d’une variable
aléatoire normale quelconque.

Soit X variable aléatoire normale quelconque d’écart type σ =¿3 et de moyenne μ=¿
5. Calculez p(2 ≤ X <8).
X −μ
U=
On sait que σ
2−5 8−5
p ( 2≤ X < 8 )= p( ≤U < )
3 3
¿ p (−1≤ U <1 )
¿ p ( U <1 )− p(U <−1)
¿ 2 . p ( U <1 )−1=0,6826

Exercices d’application
Trouvez les probabilités des intervalles suivants :
p(−1 ≤ U <1) ; p(−1,28 ≤ U <+∞ ) ; p(−0,68 ≤ U <0) ; p(−1.96 ≤ U <1,96);
p(−0,46 ≤ U <2,21)

14
TABLE DE LA LOI NORMALE CENTREE ET REDUITE

15

Vous aimerez peut-être aussi