Vous êtes sur la page 1sur 20

UNIVERSITE DE PORT-AU-PRINCE

Stat. II : Calculs de Probabilités

Professeur : Dario-Styve CELESTIN

MODULE 3.2: VARIABLES ALEATOIRES CONTINUES

SOMMAIRE
Variables Aléatoires Continues ........................................................................................................................................ 1
Loi de Probabilité : Fonction de Densité...................................................................................................................... 1
Les Lois de Probabilité Continues les plus Usuelles .................................................................................................... 4
a) Loi Uniforme ..................................................................................................................................................... 4
b) Loi Exponentielle ............................................................................................................................................... 7
c) Loi Normale ....................................................................................................................................................... 9
Fonction de Répartition d’une Variable Aléatoire Continue .................................................................................... 15
a) Fonction de Répartition de la Loi Uniforme.................................................................................................... 17
b) Fonction de Répartition de la Loi Exponentielle ............................................................................................. 18
c) Fonction de Répartition de la Loi Normale ..................................................................................................... 19
Variables Aléatoires Continues

Loi de Probabilité : Fonction de Densité

Contrairement à la variable aléatoire discrète, la v.a.c ne prend pas ses valeurs de manière isolée.
Les valeurs d’une telle variable sont tous les nombres réels possibles que l’on retrouve dans un
certain intervalle (sous-ensemble de ℝ ou ℝ lui-même) qui constituera alors son support. Ces
valeurs coïncident – comme on l’a déjà signalé – avec l’ensemble (non-dénombrable) des résultats
de l’expérience aléatoire qui induit la variable aléatoire en question. La nature continue de la
variable, fait donc qu’on ne peut pas, comme dans le cas discret, attribuer isolément à chacune de
ses valeurs une probabilité, simplement parce que le nombre de valeurs possibles étant non-
énumérable, le mot « isolément » ne s’y prête pas. Les événements seront plutôt des intervalles,
puisque la tribu des événements sera la tribu borélienne. On s’intéressera alors aux probabilités que
la variable se trouve dans des intervalles, sous-ensembles du support. Par exemple, pour une v.a.c
X qui aurait comme support Dx = ]−2, 53[, on pourrait s’intéresser à la probabilité que X soit plus
grand que 25, i.e, P(X > 25) ou que X soit compris largement entre 0 et 32, i.e, P(0 ≤ x ≤ 32), etc…
De façon générale, dans le cas continu, les événements de base seront de la forme :

(X > x) ou (X ≥ x) ou (X < x) ou (X ≤ x)

ou (x1 < X < x2 ) ou (x1 ≤ X < x2 ) ou (x1 < X ≤ x2 ) ou (x1 ≤ X ≤ x2 )

Ainsi, les probabilités que l’on aura à calculer seront de la forme :

P(X > x); P(X ≥ x); P(X < x); P(X ≤ x); P(x1 < X < x2 ); P(x1 ≤ X < x2 ); P(x1 < X ≤ x2 ); P(x1 ≤ X ≤ x2 )

Les représentations graphiques de telles distributions prenaient alors la forme d’histogrammes et


de polygones de fréquences ou de densités. En voici un exemple :

Distributions de fréquences et de densités Histogramme et polygone de densités

Comment calcule-t-on alors les probabilités dans le cas continu ? Imaginons qu’en statistique on
augmentait indéfiniment le nombre d’observations d’une variable continue X. On pourrait alors
illustrer la distribution empirique de X à l’aide d’un histogramme de densités ayant une quantité
infiniment grande de classes telle, que l’on pourrait réduire leur largeur jusqu’à ce qu’elles
deviennent aussi petites que l’on veut. A la limite, les classes deviendraient tellement étroites,
1
qu’elles se réduiraient à un nombre réel. L’ensemble (non-dénombrable) de cette infinité de
nombres réels constituerait alors le support de la variable aléatoire continue.

On dira donc qu’une variable aléatoire continue X est caractérisée par son support Dx et sa fonction
de densité f(x). C’est ainsi que dans le jargon des probabilités, on dit que l’on connait la population
(du point de vue de la variable et non des unités qui la constituent), ou la loi de probabilité ou encore
le modèle ou la distribution de probabilité d’une variable aléatoire continue lorsqu’on dispose de
son support et de sa fonction de densité. Le support est un intervalle (sous-ensemble de ℝ ou ℝ lui-
même), alors que la fonction de densité est définie comme suit :

Définition : On appelle fonction de densité d’une variable aléatoire continue X, une fonction non-
négative qui décrit la loi régissant le comportement de cette variable. La représentation
graphique d’une telle fonction, appelée courbe de densité, illustre ainsi la distribution
de la variable. Cette fonction permet de calculer les probabilités que la variable se
retrouve dans un intervalle quelconque de ℝ.

𝑓 ∶ ℝ ⟶ ℝ+
𝑥 ⟼ 𝑓(𝑥) > 0 𝑠𝑖 𝑥 ∈ 𝐷𝑥 𝑒𝑡 𝑓(𝑥) = 0 𝑠𝑖 𝑥 ∉ 𝐷𝑥

On note souvent : X~f(x) (sur Dx ) pour désigner la loi de X

Remarques 1.1 :

1) La fonction de densité possède ainsi les propriétés suivantes :


a) f(x) > 0 ∀ x ∈ Dx et f(x) = 0 ailleurs, i. e pour toutes les autres valeurs réelles
+∞
b) ∫−∞ f(x)dx = 1 (surface limitée par la courbe de f(x)et l′ axe des x)

2) Les probabilités d’un événement quelconque E = [x1 , x2 [ ⊆ ℝ se calculent comme suit :


x2

P(E) = P(x1 ≤ X < x2 ) = ∫ f(x)dx


x1

Exemple 1 :

La proportion de temps, au cours d’une semaine de 35 heures de travail, qu’un robot industriel est
en opération fut analysée durant un très grand nombre de semaines. On a pu trouver ainsi, à partir
de l’approche fréquentiste, que le modèle probabiliste ou la loi de probabilité qui régissait le
comportement de cette quantité X pouvait être exprimé comme suit :

f(x) = 2x si 0 < x < 1 et f(x) = 0 pour les autres valeurs réelles ( i. e X~f(x) = 2x sur ]0, 1[ )

a) Identifier la variable aléatoire qui nous intéresse d’après les données du problème
b) Quel est le support de cette variable ?
c) Vérifier que f(x) est bien une fonction de densité
d) Calculer la probabilité que la proportion de temps d’opération du robot en une semaine de
travail soit supérieur à 50%.

2
Solution :

a) La variable aléatoire qui nous intéresse est la quantité X définie comme suit :
X : « Proportion de temps durant lequel un robot industriel est en opération, au cours d’une
semaine de 35 heures de travail »

b) D’après la définition de f(x), on voit que l’intervalle ]0, 1[ représente le support de X. C’est en
effet sur ]0, 1[ que la fonction de densité est définie.

c) Vérifions que les deux propriétés d’une fonction de densité sont respectées :
i) Par définition, f(x) est toujours strictement positif sur ]0, 1[ et nul ailleurs
+∞ 1
ii) ∫−∞ f(x)dx = ∫0 2xdx = [x 2 ]10 = 1 − 0 = 1
f(x) est donc bien fonction de densité

d) On veut trouver P(X > 0.5)


+∞ 1

On a ∶ P(X > 0.5) = ∫ f(x)dx = ∫ 2xdx = [x 2 ]10.5 = (1 − 0.25) = 0.75 ou 75%


0.5 0.5

Remarques 1.2 :

1) Nous avons dit plus haut que les événements qui nous intéressaient dans le cas des variables
aléatoires continues, étaient des intervalles sous-ensembles de ℝ, dont les formes de base
étaient :
(X > x) ou (X ≥ x) ou (X < x) ou (X ≤ x)ou (x1 < X < x2 ) ou (x1 ≤ X < x2 )
ou (x1 < X ≤ x2 ) ou (x1 ≤ X ≤ x2 ) avec x, x1 et x2 ∈ ℝ

Qu’en est-il du cas où (X = x) ? La façon dont les probabilités sont calculées dans le cas
continu répond à cette question. En effet, si on veut calculer P(X = x) on devrait évaluer
𝑥
∫𝑥 𝑓(𝑡)𝑑𝑡. Or ceci n’est autre chose que zéro. Les singletons de ℝ ne présentent donc aucun
intérêt dans ce cas, car ils sont toujours de probabilité nulle. On dit en mathématiques qu’ils
sont non-mesurables. On aura donc dans le cas continu :
𝐏(𝐗 ≥ 𝐱) = 𝐏(𝐗 > 𝐱); 𝐏(𝐗 ≤ 𝐱) = 𝐏(𝐗 < 𝐱)
𝐞𝐭, 𝐏(𝐱 𝟏 ≤ 𝐗 ≤ 𝐱 𝟐 ) = 𝐏(𝐱𝟏 < 𝐗 ≤ 𝐱 𝟐 ) = 𝐏(𝐱 𝟏 ≤ 𝐗 < 𝐱 𝟐 ) = 𝐏(𝐱 𝟏 < 𝐗 < 𝐱 𝟐 )

2) Les fonctions de densité peuvent également être paramétriques, c’est-à-dire qu’elles


peuvent s’exprimer en fonction d’un ou de plusieurs paramètres. Ces paramètres
déterminent alors une infinité de membres différents dans la famille de lois qui caractérise
de telles fonctions. On les appelle des paramètres d’identification de la loi et de telles
distributions sont appelées des distributions paramétriques.

Tout comme dans le cas discret, il existe une infinité de couples (Dx , f(x)) qui définissent des
populations ou des lois de probabilité de variables aléatoires continues. Limitons-nous à l’étude de
trois des lois les plus usuelles.

3
Les Lois de Probabilité Continues les plus Usuelles

a) Loi Uniforme

La loi uniforme continue est analogue à son homologue discrète, sauf que cette fois ce ne sont pas
les valeurs isolées qui seront de probabilité égale (non nulle), mais plutôt les intervalles de même
largeur. On verra que si X est une variable aléatoire qui prend ses valeurs dans un intervalle, bien
déterminé, ]a, b[ selon une loi uniforme, alors la fonction de densité de X sera une constante de la
forme f(x) = 1⁄(b − a) sur Dx . On aura donc :

f(x) = 1⁄(b − a) si x ∈ Dx , i. e si a < x < b et f(x) = 0 pour toutes les autres valeurs réelles

On dit alors que X suit une loi uniforme de paramètres a et b et on note : 𝐗~𝐔𝐜 (𝐚, 𝐛)

Remarques 2.1 :

1) L’exemple qui suit est une illustration d’une loi uniforme continue. Elle servira de référence
à toutes les fois que l’on voudra identifier une loi comme telle.

Une corde est suspendue entre deux points orientés a et b (a < b). On décide, en se bandant
les yeux, de la couper au hasard à un endroit quelconque entre a et b. Si on désigne par X le
point où cette corde sera coupée, alors X sera une variable aléatoire dont le support est
l’intervalle ]a, b[ et la fonction de densité, celle d’une loi uniforme continue qui est de la forme
f(x) = 1⁄(b − a). Voyons de plus près.

Nous pouvons commencer par dire que, de manière certaine, la corde sera coupée entre a et
b (l’expérience ayant été conçue ainsi). Ce qui se traduit par l’équation P(a < X < b) = 1.

De plus, on peut comprendre que la corde a autant de chance d’être coupée entre a et (a+b)/2
qu’entre (a+b)/2 et b. Ce qui se traduit par P(a < X < (a + b)/2 ) = P((a + b)/2 < X < b ). De
même on a autant de chances de couper la corde entre a et (a+x) qu’entre (b-x) et b
(𝑥 > 0, ∈ ℝ), ce qui se traduit par P(a < X < a + x) = P(b − x < X < b ). De manière générale,
tous les sous-intervalles de même largeur auront la même chance (probabilité) de contenir
le point où la corde sera coupée. On comprend également que plus un intervalle est grand
(petit), plus (moins) il y a aura de chance de couper la corde là-dedans. La probabilité de
couper la corde dans un sous-intervalle quelconque de ]𝐚, 𝐛[ serait donc directement
proportionnelle à la longueur de ce sous-intervalle. Ce qui se traduit en mathématiques par
la relation suivante :

P(x1 < X < x2 ) = k(x2 − x1 ) ∀ x1 et x2 , tels que, a < x1 < x2 < b

k étant le facteur de proportionnalité

Puisque cette relation est en particulier vraie pour x1 = a et x2 = b, alors on aura :

P(x1 < X < x2 ) = k(b − a) = 1, (𝑖. 𝑒) k = 1⁄(b − a) , d′ où 𝐏(𝐱 𝟏 < 𝐗 < 𝐱 𝟐 ) = (𝐱 𝟐 − 𝐱 𝟏 ) ∕ (𝐛 − 𝐚)

4
Ainsi, si f(x) est la fonction de densité de X, alors :

x2
x2 − x1 1
P(x1 < X < x2 ) = ∫ f(x)dx = = (x − x1 )
b−a b−a 2
x1

Alors f(x) = 1⁄(b − a). X suit donc une loi uniforme sur ]a, b[ C.Q.F.D

2) La loi uniforme est entièrement caractérisée par les deux paramètres « a » et « b » qui
représentent les bornes de l’intervalle à l’intérieur duquel la variable aléatoire X peut prendre
ses valeurs. Ils permettent d’identifier un membre particulier de la famille des lois
uniformes. C’est pour cela qu’on les utilise dans la notation qui désigne cette loi. On les
retrouve évidemment dans l’expression de la fonction de densité.

3) On vérifie facilement que f(x) telle que définie pour la loi uniforme est bien une fonction de
densité. En effet, f(x) est toujours ≥ 0, car b > a. De plus,

+∞ b
1 x b b a
∫ f(x)dx = ∫ dx = [ ] = − =1 C. Q. F. D
b−a b−a a b−a b−a
−∞ a

4) Voici la représentation graphique de la fonction de densité de la loi uniforme continue :

5) Selon la première remarque 8.3.2, inclure ou non les bornes dans le calcul des probabilités ne
change rien. Ainsi,

x2 − x1
P(x1 < X < x2 ) = P(x1 ≤ X ≤ x2 ) =
b−a

5
Exemple 2.1

On suppose que le temps requis en minutes par les autobus pour faire le trajet Port-au-Prince /
Gonaïves est une variable aléatoire distribuée uniformément sur l’intervalle ]105, 150[, quand il n’y
a aucun événement particulier. De plus, on sait que les autobus attendent toujours exactement deux
heures avant de reprendre le chemin du retour (dans un sens ou dans l’autre), histoire de se reposer
et d’attendre le rechargement.
a) Identifier d’après les données du problème la variable aléatoire d’intérêt.
b) Exprimer la fonction de densité de cette variable
c) Quelle est la probabilité que l’un de ces autobus effectue le trajet Port-au-Prince / Gonaïves
en moins de deux heures ?
d) Supposons que l’autobus « Dieu est Grand » laisse Port-au-Prince à 6h a.m, quelle est la
probabilité qu’un passager qui se trouve aux Gonaives et qui se présente à 10h05 a.m à la
station d’autobus de cette ville, n’ait pas le temps de prendre cet autobus pour se rendre à
Port-au-Prince ?
e) Vrai ou faux ? Dire que 30% des trajets se font en moins de 118min1/2, peut s’écrire
P(X < 118.5min) = 0.30.

Solution :

a) La variable aléatoire qui nous intéresse d’après les données du problème est la suivante :
X : « Temps requis en minutes par un autobus pour faire le trajet Port-au-Prince / Gonaïves »

b) Puisqu’on nous dit que la variable suit une loi uniforme sur ]105, 150[, alors sa fonction de
densité est :
f(x) = 1⁄(150 − 105) = 1⁄45 si x ∈ ]105, 150[ et f(x) = 0 ailleurs
On peut interpréter cette loi comme le fait de couper au hasard une corde suspendue entre
les réels 105 et 150.

c) On demande P(X < 120) = ?


P(X < 120) = P(105 < X < 120 = (120 − 105)⁄(150 − 105) = 15⁄45 = 1⁄3 = 0.33 ou 33%

d) L’autobus qui laisse Port-au-Prince à 6h a.m arrivera aux Gonaïves entre 7h45 a.m et 8h30
a.m si tout va bien. Ainsi, ce même autobus repartira entre 9h45 a.m et 10h30 a.m. Le passager
en question ratera l’autobus, si ce dernier arrive aux Gonaïves juste deux heures avant lui,
soit à (10h05-2h) = 8h05 a. m. C’est-à-dire si le trajet a duré moins de (8h05-6h) = 2h5min =
125 min. On veut donc trouver P(X < 125).
P(X < 125) = P(105 < X < 125 = (125 − 105)⁄(150 − 105) = 20⁄45 = 0.44 ou 44%

e) Le rapprochement de la statistique et de la probabilité nous a déjà appris que la probabilité


d’un événement peut être comparée à la fréquence des fois ou encore la proportion des fois,
parmi une infinité de fois, que cet événement s’est réalisé (approche fréquentiste ou
historique du calcul des probabilités). Ainsi, 30% représentent effectivement la proportion
des fois (parmi toutes les fois – jusque-là) qu’un autobus a réalisé le trajet en moins de 118min
et 30sec, ou encore la proportion d’autobus qui ont réalisé ce trajet en moins de 118 min et
30sec. C’est-à-dire que P(X < 118min30sec) = 0.30 ou 30%. L’affirmation est donc vraie.

6
b) Loi Exponentielle

Bien qu’il n’y ait pas de situation type qui décrive une loi exponentielle (comme dans le cas de
Poisson), on a constaté qu’il existe une famille de variables aléatoires qui ont tendance à se
comporter comme telle. Ainsi, dans le contexte académique du cours, nous admettrons qu’une v.a
définie dans les conditions (suffisantes) décrites par cette remarque suit une loi exponentielle. Il
existe bien sûr d’autres v.a en dehors de cette famille qui suivent également une telle loi. De manière
théorique, c’est seulement en présence de son support et de sa fonction de densité que l’on
identifiera une loi exponentielle. Nous dirons qu’une variable aléatoire X suit une loi exponentielle,
si son support est Dx = [0, +∞[ et sa fonction de densité f(x) = βe−βx si x ∈ Dx et 0 ailleurs; β ∈ ℝ+ .
On parlera alors d’une loi exponentielle de paramètre 𝛃 et on notera : 𝐗~𝓔(𝛃).

Remarques 2.2 :

1) La loi exponentielle n’a que le paramètre β qui la caractérise. C’est pour cela qu’on l’utilise
dans la notation qui la désigne. On le retrouve dans l’expression de sa fonction de densité.
2) On peut vérifier facilement que f(x) est bien une fonction de densité. D’abord, puisque β est
strictement positif, alors f(x) le sera également, en particulier sur Dx . De plus, on a :
+∞ +∞
+∞ 1
∫ f(x)dx = ∫ βe−βx dx = [−e−βx ]0 = − lim e−βx + e0 = − lim +1
x→+∞ x→+∞ eβx
−∞ 0
+∞ +∞
1
Or, lim βx = 0, d′ où, ∫ f(x)dx = ∫ βe−βx dx = 1 C. Q. F. D
x→+∞ e
−∞ 0
3) La loi exponentielle a une certaine relation avec la loi Poisson. En effet, rappelez-vous que
dans le cadre du cours, nous admettons que les quantités qui représentent le nombre de fois
qu’un événement se réalise dans un intervalle de temps ou d’espace (longueur, distance,
surface ou volume), suivent des lois de Poisson. Si on s’intéresse plutôt, au temps, à la
longueur, la distance, la surface ou au volume mesuré entre deux réalisations de l’événement
en question, alors ce temps, cette longueur, cette distance, cette surface ou ce volume suivra
une loi exponentielle. On verra plus tard que 1⁄β est le temps, la longueur, la distance, la
surface ou le volume moyen entre deux réalisations de cet événement ; c’est l’inverse du taux
de réalisation ou d’apparition des événements de Poisson dans les mêmes unités de temps
ou d’espace (on aura donc 1⁄β = 1⁄λ ou β = λ).

Par exemple, si on admet que le nombre de pannes X que subit une machine ou une pièce
mécanique dans un intervalle de temps suit une loi de Poisson, alors dans le même contexte,
la variable Y qui représente le temps qui s’écoulera entre deux pannes consécutives de cette
machine ou de cette pièce mécanique suivra une loi exponentielle. Ce temps est généralement
désigné par la durée de vie de la machine ou de la pièce mécanique. 𝟏⁄𝛃 est alors la durée
de vie moyenne. De même, si la quantité X qui donne le nombre d’erreurs de toutes sortes
que l’on peut retrouver dans une page d’un livre suit une loi de Poisson, alors la surface Y
qui séparera deux erreurs suivra une loi exponentielle ; 1⁄β étant alors la surface moyenne
qui sépare deux erreurs. Finalement, si la quantité X qui compte le nombre de vers de terre
que l’on peut retrouver dans 10 cm3 de terre choisis au hasard suit une loi de Poisson, alors
le volume de terre Y qu’il faudra déplacer pour trouver deux vers successifs suivra une loi
exponentielle ; 1⁄β étant alors le volume moyen de terre trouvé entre deux vers.

7
4) Voici la représentation graphique de la fonction de densité de la loi exponentielle :

Exemple 2.2 :

Un fabricant de four à micro-onde veut déterminer la période de garantie qu’il devrait associer à
son tube magnétron, le composant le plus important du four. Des essais en laboratoire ont indiqué
que la durée de vie (en années) de ce composant est régie par une loi de probabilité exponentielle
qui s’exprime comme suit : f(x) = 0.2e−0.2x pour x ≥ 0.
a) Quelle est la probabilité qu’un tube opère sans défaillance durant une période de plus de 5
ans ?
b) D’après les chiffres d’affaires de la compagnie qui fabrique ces fours, les responsables
seraient prêts à remplacer avec la garantie, jusqu’à 5% des fours vendus. A combien de temps
devraient-ils fixer cette garantie ?

Solution :

La variable qui nous intéresse ici se définit comme suit :


X : « Durée de vie d’un certain tube magnétron ». On nous dit de plus, que X~ℰ(0.2)
a) On veut trouver P(X > 5)
∞ ∞

P(X > 5) = ∫ f(x)dx = ∫ 0.2e−0.2x dx = [−e−0.2x ]∞


5 =e
−1
= 0.3679 ou 36.79%
5 5
b) Avec la garantie, la compagnie devra remplacer un four, à toutes les fois qu’un tube en
défaillance avant la durée limite « t » de la garantie. Ainsi, lorsqu’on dit que la compagnie
accepterait de remplacer jusqu’à 5% des fours, cela se traduit bien évidemment par
l’inéquation P(X ≤ t) ≤ 0.05. Il s’agit alors de résoudre cette inéquation pour trouver « t ».
t t t

On sait que ∶ P(X ≤ t) = ∫ f(x)dx = ∫ 0.2e−0.2x dx = [−e−0.2x ] = −e−0.2t + 1


0 0 0
′ −0.2t −0.2t
D où, 1 − e ≤ 0.05, c’est-à-dire e ≥ 1 − 0.05 = 0.95 ou encore e0.2t ≤ 1⁄0.95 = 1.0526
On aura alors : ln (e0.2t ) ≤ ln(1.0526) , ou encore 0.2t ≤ 0.05126.
D′ où t ≤ 0.2563 an = 3mois, 2jours, 6hrs et 26 mn

La compagnie pourrait alors offrir une garantie allant jusqu’à 3 mois, 2 jours, 6 heures et 26 minutes

8
c) Loi Normale

La loi normale est une distribution qui se rencontre beaucoup dans la nature. Elle présente une
forme qui semble dire que cette nature est bien faite. On a en effet remarqué que bon nombre de
quantités numériques naturelles se produisant selon le hasard (donc de manière indépendante de
la volonté humaine et sans déterminisme), ont tendance à prendre la plupart de leurs valeurs dans
un intervalle limité, de manière assez équitable autour d’une quantité de référence, de sorte que très
peu de valeurs débordent les limites à droite et à gauche de cet intervalle (exemples : la taille, le
poids, le quotient intellectuel des adultes d’une certaine population, etc…). Les valeurs à l’intérieur
de l’intervalle sont alors considérées comme normales, d’où le nom de la loi, tandis que les autres
– très rares – sont plutôt considérées comme des cas exceptionnels. Par exemple si l’on considère le
taux de glucose dans le sang humain, on s’attend à ce que d’un individu à l’autre, ce taux soit
presque le même. La légère fluctuation qu’on retrouve, oscillant entre 70 mg/dl et 130 mg/dl, est
telle que, si on considère comme référence, le taux de sucre moyen dans le sang (100 mg/dl), certains
individus seront au-dessus de la moyenne, et d’autres en-dessous, d’une manière quasiment
équitable. Très peu d’humains auront un taux de glucose sanguin élevé ou bas (très éloigné de la
moyenne dans un sens ou dans l’autre) dépassant ainsi les valeurs limites déterminées par la nature
(70 mg/dl à 130 mg/dl à jeun). Ils seront alors ou bien considérés comme des accidents de la nature,
s’ils sont en bonne santé par ailleurs, ou bien ils seront des présumés malades (soufrant d’hypo ou
d’hyperglycémie). Les autres dont le taux de sucre fluctue entre ces valeurs limites seront considérés
comme normaux.

La plupart des variables naturelles se comportent de cette manière. C’est d’ailleurs en observant des
quantités physiques de la nature que cette loi a été découverte. L’expression mathématique qui
décrit de tels comportements a d’abord été publiée par Abraham de Moivre en 1733 (mathématicien
franco-britannique, 1667-1754). D’autres théoriciens se sont également associés plus tard à cette loi,
tels que, le Marquis de Laplace (1749-1827) et le mathématicien, physicien allemand, Karl Friedrich
Gauss (1777-1855). C’est pour cette raison que la loi normale est désignée par certains auteurs
(notamment les Français) comme loi de Laplace-Gauss, tout comme on parle de distribution
Gaussienne. La littérature anglo-saxonne parle de loi Normale (Normal distribution).

On dira par exemple qu’un procédé de fabrication fonctionne bien (ou normalement), s’il produit
des pièces dont les spécifications ne s’éloignent pas trop des normes fixées, ni dans un sens, ni dans
l’autre, mais restent plutôt dans les limites d’une certaine tolérance, équitablement réparties autour
des spécifications types du procédé.

La fonction qui décrit un tel comportement s’exprime généralement comme suit :

1 1 x−μ 2
e 2 σ )
− (
f(x) = ∀ x ∈ ℝ, où, σ > 0 et μ ∈ ℝ
σ√2π

C’est ainsi que l’on dira qu’une variable aléatoire X est distribuée selon une loi normale de
paramètres μ et σ (élevé au carré), si le support de cette variable Dx est la droite réelle ℝ et sa fonction
de densité exprimée comme plus haut. On notera alors : 𝐗 ~ 𝓝(𝛍, 𝛔𝟐 ).

9
Remarques 2.3

1) Dans l’expression de la fonction de densité d’une normale, on retrouve deux paramètres qui
caractérisent cette loi : 𝜇 et 𝜎 (élevé au carré) permettant ainsi d’identifier un membre
particulier de cette famille de lois. Regardons un peu à la lumière du graphique de cette
fonction, comment elle exprime effectivement le comportement décrit plus haut :

D’abord, on peut voir que la courbe est symétrique par rapport à l’axe X = μ. C’est donc la
valeur référentielle autour de laquelle se répartissent, de manière équitable, les autres valeurs
de X, i.e P(X ≤ μ) = P(X ≥ μ) = 0.5 ou 50%. On remarque également que l’axe des X est une
asymptote horizontale, ce qui traduit le fait que les valeurs éloignées de μ sont de plus en
plus rares, exprimant ainsi l’idée que très peu de valeurs de X débordent certaines limites.
De plus, il y a également deux points d’inflexion à X = μ − σ et X = μ + σ où la courbe change
de concavité. Ces points indiquent, selon la valeur de σ, combien les valeurs de X s’éloignent
de μ, ce qui fait de ce paramètre un indicateur de la dispersion des valeurs de X autour de μ.

On admettra donc que 𝛍 et 𝛔𝟐 sont respectivement la moyenne et la variance des valeurs


de X qu’on aurait obtenues, si on répétait indéfiniment l’expérience qui engendre X.

2) Vérifions que f(x) est bien une fonction de densité :


i) tous les termes de f(x) sont positifs, alors f(x) l’est aussi
ii) montrons que :
+∞ +∞
1 1 x−μ 2
e−2( )
∫ f(x)dx = ∫ σ dx =1
σ√2π
−∞ −∞

x−μ 1
Faisons le changement de variable suivant : z = , alors dz = dx, i. e dx = σdz
σ σ
De plus, lorsque x → −∞, z → −∞ et lorsque x → +∞, z → +∞. On obtient alors :
+∞ +∞ +∞
1 1 x−μ 2 1 1 2 1 1 2
∫ e−2( σ ) 𝑑𝑥 = ∫ e−2z 𝑑𝑧 = ∫ e−2z 𝑑𝑧
σ√2π √2π √2π
−∞ −∞ −∞
+∞ +∞
1 1 2 2 1 2
La propriété de la symétrie de l′ intégrant donne: ∫ e−2z dz = ∫ e−2z dz
√2π √2π
−∞ 0

10
+∞ +∞ +∞ ∞ ∞
2 1 2 2 1 2 1 2 2 1 2 2
Posons a = ∫ e−2z dz , alors a = (∫ e−2x dx) (∫ e−2y dy) = ∫ ∫ e−2(x +y ) dxdy
2
√2π π π
0 0 0 0 0

Faisons le changement en coordonnées polaires suivant, en posant, x = rcosθ et y = rsinθ

dx dx
dr dθ cosθ −rsinθ
On obtient alors la matrice jacobienne ∶ J = =[ ] , d′ où,
dy dy sinθ rcosθ
[ dr dθ]
Det(J) = rcos2 θ + rsin2 θ = r(cos2 θ + sin2 θ) = r et x 2 + y 2 = r 2 (cos2 θ + sin2 θ) = r 2 . Ainsi:

π⁄2 ∞ π⁄2 ∞ π⁄2


2 1 2 2 1 2
a2 = ∫ ∫ e−2 r rdrdθ , car x > 0 et y > 0, i. e a2 = ∫ [−e−2 r2 ] dθ = ∫ 1dθ
π π π
0 0 0 0 0
2 π
Finalement : a2 = × = 1 et puisque a > 0, alors a = 1 C. Q. F. D
π 2

3) Il n’est pas nécessaire de faire du calcul intégral pour calculer les probabilités associées à une
variable normale. Il suffira d’utiliser la démarche suivante : Nous venons de voir que si X est
une variable aléatoire normale de paramètres μ et σ2 quelconques, en faisant un changement
de variable :
+∞ +∞
x−μ 1 1 x−μ 2 1 1 2
z= , on aura ∶ ∫ e−2( σ ) dx = ∫ e−2z dz = 1.
σ σ√2π √2π
−∞ −∞
1 1 2
Ainsi, f(z) = e−2z est
la densité de la variable aléatoire Z qui n’est nulle autre qu’une
√2π
normale avec μ = 0 et σ = 1.

Donc, n’importe quelle variable aléatoire normale X de moyenne 𝝁 et de variance 𝝈𝟐


quelconques, peut se transformer en une normale Z de moyenne 0 et de variance 1. Une
telle normale est appelée normale centrée réduite ou normale standard.

Alors, pour calculer par exemple 𝐏(𝐱 𝟏 < 𝐗 < 𝐱 𝟐 ) on transformera X en Z comme suit :

𝐱 −𝛍
𝐱𝟐 𝐳𝟐 = 𝟐
𝛔
𝟐
𝟏 𝟏 𝐱−𝛍 𝟏 𝟏 𝟐
𝐞−𝟐( )
𝐏(𝐱 𝟏 < 𝐗 < 𝐱 𝟐 ) = ∫ 𝛔 𝐝𝐱 = ∫ 𝐞−𝟐𝐳 𝐝𝐳
𝛔√𝟐𝛑 𝐱 −𝛍 √𝟐𝛑
𝐱𝟏 𝐳𝟏 = 𝟏
𝛔

𝐳𝟐
𝐱𝟏 − 𝛍 𝐱𝟐 − 𝛍 𝟏 −𝟏𝐳𝟐
𝐢. 𝐞 𝐏(𝐱𝟏 < 𝐗 < 𝐱 𝟐 ) = 𝐏 ( <𝐙< ) = 𝐏(𝐳𝟏 < 𝐙 < 𝐳) = ∫ 𝐞 𝟐 𝐝𝐳
𝛔 𝛔 √𝟐𝛑
𝐳𝟏

Or, il existe deux principales tables appelées Table Normale Centrée Réduite où on retrouve, déjà
effectués, les calculs pour toutes les intégrales possibles relatives à une normale centrée réduite.

L’exemple qui suit montre comment utiliser celle dont on fera usage.
11
12
Exemple 2.3

Une machine remplit automatiquement des boites de céréales dont le poids nominal devrait être
300 gr (on suppose que le poids de la boite est négligeable). La machine est ajustée de sorte que le
poids des boites remplies fluctue autour de cette valeur nominale selon une distribution normale.
Des données observées sur une longue période ont permis d’exprimer cette fluctuation comme suit :

1 1 x−300 2
e 2 10 ) ,
− (
f(x) = i. e X~𝒩(μ = 300 gr ; σ2 = 100 gr 2 )
10√2π

a) Identifier la variable d’intérêt dans ce problème


b) Quelle est la proportion de boites dont le poids sera d’au moins 300 gr ?
c) Calculer la probabilité :
i) qu’une boite contienne plus de 311.3 gr de céréales
ii) qu’une boite contienne au moins 285.7 gr de céréales
iii) qu’une boite remplie pèse entre 290 gr et 310.4 gr
iv) qu’une boite remplie pèse entre 312 gr et 315 gr
v) qu’une boite remplie pèse entre 288 gr et 292 gr
d) Quel est le poids minimum des 10% de boites qui pèsent le plus ?
e) Quel est le poids maximum des 5% de boites les plus légères ?

Solution :

a) La variable qui nous intéresse dans ce problème, c’est la quantité :


X : « Poids d’une boite de céréales »
b) Puisque X est distribuée normalement, sa courbe de densité est symétrique par rapport à un
axe de symétrie qui ici est x = 300 gr. On aura donc P(X ≥ 300) = 0.5 ou 50%.
c) i) On demande 𝑷(𝑿 ≥ 𝟑𝟏𝟏. 𝟑) =?
Nous allons transformer la variable X en une variable normale centrée réduite Z.
311.3 − 300
La probabilité voulue s’écrit alors P (Z > ) = P(Z > 1.13)
10
Or, avec la table que nous utilisons, les surfaces tabulées pour la normale Z sont toujours
celles comprises entre 0 et une valeur positive quelconque de Z. On doit donc réécrire,
𝑃(𝑍 > 1.13) = 𝑃(𝑍 > 0) − 𝑃(0 < 𝑍 < 1.13) = 0.5 − 0.3708 = 0.1292 𝑜𝑢 12.92%.
ii) On demande 𝑷(𝑿 ≥ 𝟐𝟖𝟓. 𝟕) =?
Faisons la transformation en une normale centrée réduite Z. On obtient :
285.7 − 300
P(X ≥ 285.7 = P (Z ≥ ) = P(Z ≥ −1.43)
10
Pour pouvoir utiliser notre table, nous devons réécrire la probabilité comme suit :
P(Z ≥ −1.43) = P(−1.43 ≤ Z ≤ 0) + P(Z > 0)
Puis, utilisant la propriété de la symétrie, on aura :
P(Z ≥ −1.43) = P(0 ≤ Z ≤ 1.43) + P(Z > 0)
On peut maintenant lire dans la table ; on obtient :
P(Z ≥ −1.43) = 0.4236 + 0.5 = 0.9236 ou 92.36%
iii) On demande 𝑷(𝟐𝟗𝟎 < 𝑿 < 𝟑𝟏𝟎. 𝟒) =?
290 − 300 310.4 − 300
Transformons X en Z, on obtient : P(290 < X < 310.4) = P ( <Z< )
10 10
= P(−1 < Z < 1.04) = P(−1 < Z < 0) + P(0 ≤ Z < 1.04)

13
Et d’après la symétrie, on aura :
P(−1 < Z < 1.04) = P(0 < Z < 1) + P(0 ≤ Z < 1.04)
On peut alors lire directement dans la table :
P(−1 < Z < 1.04) = 0.3413 + 0.3508 = 0.6921 ou 69.21%
iv) On demande 𝑷(𝟑𝟏𝟐 < 𝑿 < 𝟑𝟏𝟓) =?
312 − 300 315 − 300
Transformons X en Z, on obtient : P(312 < X < 315) = P ( <Z< )
10 10
= P(1.2 < Z < 1.5) = P(0 < Z < 1.5) − P(0 ≤ Z < 1.2) = 0.4332 − 0.3849 = 0.0483 ou 4.83%
v) On demande 𝑷(𝟐𝟖𝟖 < 𝑿 < 𝟐𝟗𝟐) =?
288 − 300 292 − 300
Transformons X en Z, on obtient : P(288 < X < 292) = P ( <Z< )
10 10
= P(−1.2 < Z < −0.08) = P(0.08 < Z < 1.2) = P(0 ≤ Z < 1.2) − P(0 ≤ Z < 0.08)
= 0.3849 − 0.2881 = 0.0968 ou 9.68%
d) Soit x1 , le poids minimum des 10% de boites qui pèsent le plus, alors, 𝑃(𝑋 ≥ x1 ) = 0.10
x1 − 300
Transformons X en Z, on obtient : P(X ≥ x1 ) = 0.10 = P (Z ≥ ) = 0.10
10
x1 − 300
est forcément positif, d′ où,
10
x1 − 300 x1 − 300
P (Z ≥ ) = P(Z > 0) − P (0 < Z < ) = 0.10
10 10

x1 − 300
et on obtient, P (0 < Z < ) = 0.50 − 0.10 = 0.40
10

Cette fois-ci, on fera dans la table le chemin inverse. On partira de la surface, pour arriver à
la valeur de Z. En effet, ici on connait la probabilité que Z se trouve entre 0 et la quantité
positive (x1 − 300)/10 et on veut trouver l’inconnue x1 de cette quantité. On cherche donc
dans la table normale centrée et réduite la surface de 40% (0.50 – 0.10), ou à défaut celle qui
est la plus proche. On trouve ainsi une surface de 0.3997, et la valeur de Z qui correspond est
z=1.28. On a donc :
x1 − 300
= 1.28, d′ où x1 = 312.8 gr
10

e) Soit x2 , le poids maximum des 5% de boites qui pèsent le moins.


Alors, on veut trouver x2 tel que : P(X ≤ x2 ) = 0.05
x2 − 300
Transformons X en Z, on obtient : P(X ≤ x2 ) = P (Z ≤ ) = 0.05
10

x2 − 300 300 − x2 𝑥2 − 300 300 − 𝑥2


ici, < 0, d′ où, > 0 et on a ∶ 𝑃 (𝑍 ≤ ) = 𝑃 (𝑍 ≥ ) = 0.05
10 10 10 10

300 − x2 300 − x2 300 − x2


P (Z ≥ ) = P(Z > 0) − P (0 < Z < ) , d′où P (0 < Z < ) = 0.5 − 0.05 = 0.45
10 10 10

On cherchera alors dans la table normale centrée réduite la surface 0.45 ou à défaut celle qui est la
plus proche. Non seulement, on ne trouve pas 45% dans la table, mais en plus, deux surfaces lui
sont proches l’une que l’autre : 0.4495 et 0.4505. Les deux valeurs de Z qui correspondent à ces
surfaces sont : 1.64 et 1.65, soit z=1.645. On a donc :
300 − x2
= 1.645, d′ où x2 = 283.55 gr.
10

14
Fonction de Répartition d’une Variable Aléatoire Continue

Conceptuellement, la fonction de répartition d’une variable aléatoire continue X est la même que
dans le cas discret. Elle représente la probabilité que cette variable prenne des valeurs plus petites
ou égales à une certaine valeur réelle x, c’est-à-dire, P(X ≤ x). Sauf qu’ici, puisque X prend ses
valeurs de manière continue, le cumul des probabilités ne saurait être représenté par une somme. Il
x
s’obtient plutôt comme suit :P(X ≤ x) = ∫−∞ f(t)dt

Définition : On appelle fonction de répartition d’une variable aléatoire continue X, une


fonction qui associe à toute valeur réelle x, un nombre réel positif compris entre
0 et 1 qui représente le cumul des probabilités de toutes les valeurs réelles qui
sont plus petites ou égales à x.
𝑭 ∶ ℝ ⟶ [𝟎, 𝟏]
𝒙

𝒙 ⟼ 𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) = ∫ 𝒇(𝒕)𝒅𝒕


−∞

Remarques 3 :

1) On montre que la fonction de répartition d’une variable aléatoire continue possède les
propriétés suivantes :

i) F(x) est monotone croissante, i.e F(x1 ) ≤ F(x2 ) si x1 < x2


ii) F(−∞) = 0 et F(+∞) = 1
iii) F(x) est continue à droite

2) La fonction de répartition d’une variable aléatoire continue est également telle que :
P(x1 ≤ X ≤ x2 ) = F(x2 ) − F(x1 ), parce que P(X = x) = 0 ∀x ∈ ℝ. Or, puisque par définition,

x2 x2

P(x1 ≤ X ≤ x2 ) = ∫ f(x)dx , donc, ∫ f(x)dx = F(x2 ) − F(x1 ).


x1 x1

De plus, d’après le théorème fondamental du calcul, s’il existe une fonction F(x) telle que :
b

∫ f(x)dx = F(b) − F(a)


a

Alors F(x) sera la primitive de f(x), c’est-à-dire que :


dF(x)
= F ′ (x) = f(x)
dx

D’où le résultat suivant : La dérivée de la fonction de répartition d’une variable aléatoire


continue correspond à la fonction de densité de cette variable.

3) Si pour une variable aléatoire continue X, ∃ x ∗ tel que F(x ∗ ) = δ (0 < δ < 1), on dit que x ∗
est le quantile d’ordre δ de la distribution de X.

15
Exemple 3 :

a) Déterminer la fonction de répartition de la v.a.c X dont la fonction de densité est :


1
(9 − x 2 ) si 0 < x < 3
f(x) = { 18

0 ailleurs

b) Calculer alors P(1.43 < X < 2.57) et P(X > 2) en utilisant F(x)

Solution :
x

a) Par définition, on que : F(x) = ∫ f(t)dt


−∞
x

si x ≤ 0 alors, F(x) = ∫ f(t)dt = 0


−∞
si 0 < x < 3, alors,
x
x 0 x x
1 2 )dt
1 t3 1 x3
F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt = 0 + ∫(9 − t = [9t − ] = (9x − )
18 18 3 18 3
−∞ −∞ 0 0
0
x 0 3 x

si x ≥ 3, alors, F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt + ∫ f(t)dt = 0 + 1 + 0 = 1


−∞ −∞ 0 3
D’où on obtient :
0 si x<0

1 x3
F(x) = (9x − ) si 0 ≤ x < 3
18 3

{1 si x≥3

b) P(1.43 < X < 2.57) = F(2.57) − F(1.43)

1 2.573 1 1.433
Or, F(2.57) = (9 × 2.57 − ) = 0.97065 et F(1.43) = (9 × 1.43 − ) = 0.66085
18 3 18 3

D’où, P(1.43 < X < 2.57) = 0.97065 − 0.66085 = 0.3098 ou 30.98%. De même, on aura, P(X > 2) =

1 23
1 − P(X ≤ 2) = 1 − F(2) = 1 − 18 (9 × 2 − ) i. e P(X > 2) = 1 − 85185 = 0.14815 ou 14.82%
3

16
a) Fonction de Répartition de la Loi Uniforme

Rappelons que l’on dit qu’une variable aléatoire X suit une loi uniforme (continue) sur un intervalle
]a, b[, si Dx = ]a, b[ et :

1
si a < x < b
f(x) = {b − a
0 ailleurs

On obtient alors la fonction de répartition comme suit :

si x ≤ a, alors, F(x) = ∫ f(t)dt = 0 (Pourquoi? )


−∞
x
x a x x
1 t x−a
si a < x < b, alors, F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt = 0 + ∫ dt = [ ] =
b−a b−a b−a
−∞ −∞ a a
a
x a b x

si x ≥ b, alors, F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt + ∫ f(t)dt = 0 + 1 + 0 = 1


−∞ −∞ a b

0 si x≤a
x−a
F(x) = si a < x < b
b−a

{1 si x≥b

Voici la représentation graphique de la fonction de répartition d’une loi uniforme où, a < 0 < b :

17
b) Fonction de Répartition de la Loi Exponentielle

Une variable aléatoire X suit une loi exponentielle, si son support est Dx = [0, +∞[ et sa fonction de
densité donnée par :

βe−βx si x ≥ 0
f(x) = { où β > 0
0 ailleurs
x
On trouve facilement la fonction de répartition de X comme suit : 𝑠𝑖 x < 0, F(x) = ∫−∞ f(t)dt = 0

x 0 x x 𝑥

si x ≥ 0, alors, F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt = 0 + ∫ βe−βt dt = [−e−βt ] = 1 − e−βx


−∞ −∞ 0 0 0

D’où F(x) est définie comme suit :

0 si x < 0
F(x) = {
1 − e−βx si x ≥ 0

Ce qui donne la représentation graphique suivante :

18
c) Fonction de Répartition de la Loi Normale

Rappelons qu’une variable aléatoire X est dite normale, de moyenne 𝜇 et de variance 𝜎 2 , si son
support est la droite réelle ℝ, et si sa fonction de densité est donnée par :

1 1 x−μ 2
e 2 σ )
− (
f(x) =
σ√2π

Ainsi la fonction de répartition de X s’exprime comme suit :

x
1 1 t−μ 2
e 2 σ ) dt ,
− (
F(x) = ∫ ∀x∈ℝ
σ√2π
−∞

Aucune autre expression particulière n’est retenue dans la littérature pour décrire la fonction de
répartition d’une loi normale, sinon que cette définition pure et simple. En effet, il n’y a aucun
intérêt, du point de vue du calcul des probabilités, à développer cette intégrale, car de telles
probabilités peuvent se calculer en passant de X ∶ 𝒩(μ, σ2 ) à Z ∶ 𝒩(0, 1) et en faisant des
transformations appropriées permettant de pouvoir utiliser la table normale centrée réduite que
nous connaissons jusque-là. Mieux encore, l’autre table normale centrée réduite dont nous avons
fait mention antérieurement, nous donne directement ces probabilités après la transformation de X
en Z. C’est précisément la table où on trouve toutes les images de la fonction de répartition de la
normale centrée réduite. On y lit en effet les valeurs de P(Z ≤ z) plutôt que celles de P(0 ≤ Z ≤ z)
que nous utilisons. Cette autre table donne alors l’ordre δ (0 < δ < 1) des différents quantiles z qui
partagent la droite réelle.

On peut donc, en trouvant plusieurs points de F(x) à l’aide de l’une ou l’autre de ces deux tables
𝒩(0, 1), esquisser la courbe de la fonction de répartition d’une loi normale par exemple
(𝜇 = 300, 𝜎 2 = 100) dont l’allure est la suivante :

N.B. Nous venons de voir que dans la table qui donne les quantiles de la variable aléatoire
Z~𝒩(0, 1), on lit δ = F(z) = P(Z < z). Il s’ensuit alors que P(Z ≥ z) = 1 − δ. En posant 𝛂 = 𝟏 − 𝛅,
on aura P(Z ≥ z) = α. Conventionnellement, la valeur particulière z de Z telle que 𝑷(𝒁 ≥ 𝒛) = 𝜶
est notée 𝒛𝜶 . On écrit alors : 𝑷(𝒁 ≥ 𝒛𝜶 ) = 𝜶 et 𝒛𝜶 sera le quantile d’ordre 𝟏 − 𝜶 de la distribution
normale centrée réduite.

19

Vous aimerez peut-être aussi