Académique Documents
Professionnel Documents
Culture Documents
Mehdi naimi
Table des gures
variance σ 2 = 100 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
de la normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
i
Liste des tableaux
ii
Table des matières
Introduction 1
1.1.2 Probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
toire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
iii
A.3 Table de Chi-2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Bibliographie 36
iv
Introduction
Même la science est incertaine. Les scientiques ont parfois tort. Ils arrivent à des
conclusions diérentes dans de nombreux domaines diérents : les eets d'un certain
ingrédient alimentaire ou d'une faible radioactivité, le rôle des graisses dans les ré-
Par exemple, pendant des décennies, les chirurgiens ont cru qu'une mastectomie ra-
dicale était le seul traitement du cancer du sein. Plus récemment, des essais cliniques
soigneusement conçus ont montré que des traitements moins drastiques semblaient
Mais le plus important, c'est qu'il faut toujours faire face à des informations incom-
plètes : il est soit impossible, soit trop coûteux, soit trop long, d'étudier l'ensemble
quête. Donc, une certaine incertitude prévaut presque toujours. La science et les
culant les probabilités, ils sont en mesure de décrire ce qui s'est passé et de prévoir
1
Chapitre 1
La théorie des probabilités à pour but l'étude des phénomènes ou les expériences
aléatoires .Une expérience est appelée aléatoire s'il est impossible de prévoir son
résultat et si, répétée dans des conditions identiques, elle peut donner, ou aurait pu
Ω.
évènement.
évènement peut être élémentaire (un seul élément) ou composée (plusieurs éléments).
2
contient pas d'éléments. Dans le cas du lancement d'un dé, l'événement impossible
Dans l'exemple 1.1.1, l'évènement B = {2; 4; 6} "avoir un chire pair " or L'évé-
nement contraire de B , B = {1; 3; 5} "avoir un chire pair ".
3
La gure 1.2 illustre graphiquement A∪B pour le cas où A et B sont et ne sont
Exemple 1.1.3. Supposons que A soit l'événement pour lequel une personne a une
tension artérielle diastolique normotensive (DBP) (DBP < 90), et que B entre
4
Figure 1.3 Représentation schématique de A ∩ B
1.1.2 Probabilité
1. P (Ω) = 1
2. Si A et B deux événement qui s'excluent mutuellement, P (A ∪ B) = P (A) +
P (B)
Propriétés
P (A) = 1 − P (A).
3. Si un événement implique un autre : A ⊂ B ⇒ P (A) ≤ p(B).
4. P (A ∪ B) = P (A) + P (B) − P (A ∩ B), pour tout événement A et B.
Cas particulier :
Il s'agit d'un cas assez courant où tous les événements élémentaires ont la même
5
Si L'ensemble fondamental est ni Ω = {a1 , a2 , ..., an } donc dans le cas d'équipro-
1
babilité, on a P (ai ) = pour tout i ∈ {1, ..., n}.
n
Cette particularité est souvent sous-entendue ou précisée par l'armation que les
ment A.
P
P (A) = P (ai ) = Card(A)/Card(Ω) (où le ”Card” représente le nombre d'élé-
ai ∈A
ment diérentes).
ments suivant :
B obtenir un multiple de 3
Alors
événements indépendants
Dénition 1.1.7. Deux événements A et B sont dit indépendants si la réalisation
Exemple 1.1.5. Supposons que deux médecins, A et B, testent tous les patients ar-
rivant dans une clinique pour la syphilis. L'événement A+ = {le médecin A pose un
que le médecin A diagnostique 10% de tous les patients comme positifs, le médecin
B diagnostique 17% de tous les patients comme positifs, et les deux médecins diag-
indépendants ?
serait attendu parce qu'il devrait y avoir une similitude entre la façon dont deux
6
1.2 Variable aléatoire discrète
Après avoir réalisé une expérience, on s'intéresse souvent à une certaine fonction
masculin touchés par la rétinite pigmentaire dans une famille, le nombre de décès par
cancer chez les jeunes enfants dans une ville. Ces grandeurs (ou fonctions) auxquelles
on s'intéresse sont en fait des fonctions réelles dénies sur l'ensemble fondamental
Cette section présente le concept général d'une variable aléatoire discrète et décrit
discussion des tests hypothèses basés sur les distributions binomiales et de Poisson.
X :Ω −→ R
ai 7−→ X(ai ) = xi
Deux types de variables aléatoires sont abordés dans ce texte : discrète et conti-
nue. Une variable aléatoire est dite discrète si elle peut prendre un nombre de valeurs
ponctuelles. et continue si prendre tout les valeurs d'un intervalle ou une union d'in-
tervalles.
Exemple 1.2.1. L'otite moyenne, une maladie de l'oreille moyenne, est l'une des
raisons les plus courantes de consulter un médecin au cours des deux premières
années de vie, autre qu'une visite de routine chez le bébé. soit X la variable aléatoire
qui représente le nombre d'épisodes d'otite moyenne au cours des deux premières
années de vie. Alors X est une variable aléatoire discrète, qui prend les valeurs 0, 1,
2, et ainsi de suite.
Exemple 1.2.2 (Santé environnementale). Les eets possibles sur la santé des tra-
sont d'intérêt pour la santé publique. L'un des problèmes dans l'évaluation de cette
question est de savoir comment mesurer l'exposition cumulative d'un travailleur. Une
en rem [2]. L'exposition cumulative au cours de la vie d'un travailleur pourrait alors
7
être obtenue en additionnant les expositions annuelles. L'exposition cumulative aux
rayonnements est un bon exemple d'une variable aléatoire continue, car elle variait
dans cette étude de 0,000 à 91,414 rem, ce qui serait considéré comme prenant un
crète
Les valeurs prises par une variable aléatoire discrète et ses probabilités associées
peuvent être exprimées par une règle ou une relation appelée fonction probabilité-
masse (pmf ).
Dénition 1.2.2. Soit X une variable aléatoire discret, Une fonction probabilité-
masse est une relation mathématique, ou règle, qui associer à toute valeur possible xi
de la variable aléatoire X la probabilité P (X = xi ) = P (xi ). La fonction probabilité
valeurs et leurs probabilités associées, ou elle peut être exprimée comme une formule
Exemple 1.2.3. Dans un article paru dans le "Journal of the American Dietetic
Association, Holben et al". ont examiné le statut de sécurité alimentaire des familles
dans la région des Appalaches, dans le sud de l'Ohio. L'objectif de l'étude était
d'examiner les taux de faim des familles avec enfants dans le cadre d'un programme
d'aide alimentaire utilisés au cours des 12 derniers mois. Le tableau 1.1 montre les
la forme d'un graphique, comme dans Figure 1.4 Dans la Figure 1.4, la longueur de
Exemple 1.2.4. quelle la probabilité qu'une famille sélectionnée au hasard ait utilisé
un ou deux programme alimentaire.
Solution Pour répondre à cette question, nous utilisons la règle d'addition pour les
table 1.1
8
Table 1.1 Distribution de probabilité des programmes utilisés par les familles
Fonction de répartition
variable aléatoire, L'idée de base est d'assigner à chaque valeur individuelle la somme
9
des probabilités de toutes les valeurs qui ne sont pas plus grandes que la valeur
par F (X) et, pour une valeur spécique x de X, est dénie par P r(X ≤ x) et
nées de vie. Supposons que cette variable aléatoire a une fonction probabilité-masse
F (x) = 0 if x < 0
F (x) = 1.0 if x ≥ 6
x 0 1 2 3 4 5 6
Exemple 1.2.6. Quelle est la probabilité qu'un bébé sélectionnée au hasard ait eu :
10
Figure 1.5 fonction de répartition pour le nombre d'épisodes d'otite moyenne au
cours des deux premières années de vie.
3. entre 3 et 5 ?
aléatoire discrète
une variable aléatoire de la même façon que pour les échantillons. L'analogue de
11
la variance de la variable aléatoire, ou la variance de population, et est dénoté par
i=n
X
E(X) = µ = xi P (X = xi )
i=1
i=n
X
V (X) = σ 2 = (xi − µ)2 P (X = xi )
i=1
L'écart type d'une variable aléatoire X, dénoté par σ, est la racine carrée de sa
variance.
Solution
L'espérance mathématique de X :
i=6
X
µ= xi P (X = xi )
i=1
= 2.038.
La variance de X :
i=n
X
x2i P (X = xi ) = 02 (0.129) + 12 (0.246) + 22 (0.271) + 32 (0.185) + 42 (0.095) + 52 (0.039)
i=1
+ 62 (0.017)
= 6.12
√
d'où la variance σ 2 = 6.12 − (2.038)2 = et l'écart-type σ= 1.967.
12
Propriétés
Soient X, Y deux variable aléatoires, a et b deux constantes réelles.
1. E(aX + b) = aE(X) + b
2. E(X + Y ) = E(X) + E(Y )
3. V (X + a) = V (X)
4. V (aX) = a2 V (X)
5. V (X + Y ) = V (X) + V (Y ) si X et Y sont indépendants.
processus ou une expérience aléatoire, ne peut aboutir qu'à l'un des deux résultats
mutuellement exclusifs, tels que mort ou vivant, malade ou en bonne santé, à terme
complet ou prématuré, l'expérience est appelé expérience Bernoulli. L'un des résul-
Espérance mathématique
L'espérance mathématique d'une variable de Bernoulli est obtenue en appliquant
trouve
E(X) = p
V (X) = p(1 − p)
13
Car
X
V (X) = (xi − µ)P (X = xi )
= (1 − p)2 p + (0 − p)2 (1 − p)
= p(1 − p)
Tous les exemples faisant intervenir la distribution binomiale ont une structure
1. dont chacune ne peut avoir que deux résultats possibles (expérience de Ber-
noulli).
l'autre.
3. Les épreuves sont indépendants, c'est-à-dire que le résultat d'un épreuve par-
n épreuve de Bernoulli. Par exemple, si nous examinons tous les dossiers de nais-
sance du North Carolina State Center for Health Statistics (...) pour l'année 2001,
nous constatons que 85, 8% des grossesses ont eu lieu au cours de la semaine 37 ou
plus tard. Nous appellerons cela une naissance à terme. Avec ce pourcentage, nous
naissance de cette population, quelle est la probabilité que trois d'entre eux corres-
prématuré par (E) (échec), et supposons que les cinq enregistrements de naissance
SSSEE
Comme la probabilité d'un succès est donnée par p et que la probabilité d'un échec
est donnée par (1 − p), la probabilité de la séquence de résultats ci-dessus est déter-
14
La probabilité qui en résulte est celle d'obtenir la séquence spécique des résultats
dans l'ordre indiqué. Cependant, nous ne nous intéressons pas à l'ordre d'occurrence
lieu de se produire dans l'ordre indiqué ci-dessus (appelez-le l'ordre numéro 1), trois
succès et deux échecs pourraient se produire dans l'une des séquences supplémen-
Numéro 2 3 4 5 6 7 8 9 10
Ordre 10110 10011 11010 11001 10101 01110 00111 01011 01101
Utilisation de combinaisons
On peut facilement prévoir que, à mesure que la taille de l'échantillon augmente,
n!
Cnk =
k!(n − k)!
5! 5×4×3×2
C53 = = = 10
3!(5 − 3)! 3×2×2
15
Dénition 1.3.2. La distribution du nombre de succès dans n essais statistiquement
indépendants, où la probabilité de succès de chaque essai est p, est connue sous le
P (X = k) = Cnk pk (1 − p)n−k
probabilité d'obtenir un garçon est de 0,51 à chaque naissance et que les sexes des
Solution
n utilise une distribution binomiale avec n = 6, p = 0.51, k = 2. et X= nombre
distribution binomiale et de notre travail ultérieur sur l'estimation et les tests d'hy-
Xi=n
E(X) = E( Xi ) les Xi sont des variables de Bernoulli indépendants
i=1
i=n
X
= E(Xi )
i=1
= n.p
V (X) = np(1 − p)
16
1.4 Loi de Poisson
à événements rares.
lité d'un nouveau décès attribuable à la èvre typhoïde dans un jour donné est très
faible et que le nombre de cas signalés dans deux périodes distinctes est une va-
riable aléatoire indépendante, le nombre de décès sur une période d'un an suivra une
distribution de Poisson.
l du temps. Des événements rares peuvent également être considérés non seulement
au l du temps, mais aussi sur une surface, comme la distribution du nombre de co-
lonies bactériennes poussant sur une plaque d'agar. Supposons que nous ayons une
plaque d'agar de 100 cm2 . Nous supposons que la probabilité de trouver des colo-
nies bactériennes à n'importe quel point a (ou plus précisément dans une petite zone
trouver des colonies bactériennes à n'importe quels deux points a1 , a2 sont indépen-
dants. Selon ces hypothèses, le nombre de colonies bactériennes sur toute la plaque
Exemple 1.4.3. Dans une étude sur l'anaphylaxie induite par les médicaments
chez les patients prenant du bromure de rocuronium dans le cadre de leur anesthé-
sie, Laake et Røttingen [1] ont constaté que la fréquence de l'anaphylaxie suivait un
17
Solution (i)
e−12 123
P (X = 3) = = 0.00177
3!
(ii)
P (X ≥ 3) = 1 − P (X ≤ 2) = 1 − [P (X = 0) + P (X = 1) + P (X = 2)]
= 1 − [P (X = 0) + P (X = 1) + P (X = 2)]
−12 0
e−12 121 e−12 122
e 12
=1− + +
0! 1! 2!
= 1 − [0.00000614 + 0.00007373 + 0.00044238]
= 0.99947775
Exercice 1.4.1. Si le nombre moyen d'accidents graves par an dans une grande
usine (où le nombre d'employés reste constant) est de cinq, trouver la probabilité
c) Aucun accident
son)
tique, on considère que P (m) constitue une très bonne approximation de B(n, p)
lorsque n est assez grand (n ≥ 100), p assez petit (p ≤ 0, 1). Elle est encore valable
soient malades ?
18
Solution Soit X Le nombre d'invendues malade parmi 100.
X B(100, 0.001)
100!
donc P (X = 2) = (0.001)2 (0.999)98 = 0.00449
2! 98!
les cas.
une variable aléatoire est dite continue si elle peut prendre tout les valeurs d'un
Variable A correspondant à la masse corporelle des individus pour une espèce ani-
male donnée.
19
Fonction de densité de probabilité
Si X a une distribution continue, la probabilité que X prenne une valeur bien
donc à la probabilité que X soit dans un intervalle donne [a; b], ou qu'il soit inférieur
à une valeur donnée a.
Dénition 1.5.1. Une variable aléatoire X est dite à densité lorsqu'il existe une
20
Exemple 1.5.3. Voici quelques exemples de densités de probabilités ainsi que leurs
Espérance et variance X
Dénition 1.5.2. Soit X une variable aléatoire continue de densité f.
On appelle espérance de X le réel, noté E(X), déni par la relation
Z +∞
E(X) = xf (x) dx
−∞
On appelle variance de X le réel, noté V (X), s'il existe, est déni par la relation
Z +∞
V (X) = (x − E(X))2 f (x) dx
−∞
On appelle écart-type de X le réel, noté σX , déni par la relation
2
σX = V (X)
Exemple 1.5.4. On peut calculer l'espérance, la variance et l'écart-type pour la
21
Fonction de repartition
Dénition 1.5.3. La fonction de distribution cumulative pour la variable aléatoire
X évaluée au point x est dénie comme la probabilité que X prenne les valeurs ≤ x.
F :R −→ [0, 1]
Z x
a 7−→ F (a) = f (t) dt
−∞
− e−2x + 1
0, si x ≤ 0
Donc on trouve F (x) =
−e−2x + 1,
si t ≥ 0.
La loi de probabilité qu'on rencontre le plus souvent tant dans les traites de
statistique théorique que pour ses applications, est la loi de Gauss, encore appelée
loi normale ou loi de Laplace-Gauss. Cette loi semble avoir été formulée pour la
première fois en 1733 par De Moivre dans ses recherches sur la forme limite de la loi
la loi binomiale. Plus tard, les travaux de Gauss en 1809 et 1816 établirent L'aspect
22
De façon générale, toute variable aléatoire qui peut être exprimée comme une
somme de beaucoup d'autres variables aléatoires peuvent être bien approchées à une
distribution normale.
Les cellules ont tendance à être distribuées normalement parce que cette variable
aléatoire est une somme de 100 variables aléatoires, chacune représente si une cel-
normale
toutes les valeurs réelles possibles, entre moins L'inni et plus l'inni. La loi normale
Dénition 1.6.1. La fonction de densité qui dénit la loi normale notée N (µ, σ 2 )
a pour expression :
1 x − µ !2
1 −
f (x) = √ e 2 σ , x∈R
σ 2π
Cette fonction f est appelée densité de X.
23
Fonction de répartition
aléatoire X ait une valeur inférieure ou égale à x. Cette fonction est exprimée par :
1 t−µ 2
Z x −
1
p(X ≤ x) = √ e 2 σ dt, x∈R
−∞ σ 2π
La fonction de répartition ne peut être exprimée sous forme explicite, d'une façon
simple, son calcul demande L'utilisation des méthodes d'évaluation numériques. Les
résultats de ces calculs sont pressentes sous forme de tables, appelées tables de la
loi normale.
(1) Il est symétrique par rapport à sa moyenne, µ, la courbe sur une côté de la
(3) la surface totale sous la courbe au-dessus de l'axe des x est une unité car-
rée. Cette caractéristique découle du fait que la distribution normale est une
distribution probabiliste.
24
Figure 1.8 la fonction de densité pour une loi normale de moyen µ = 50 et une
variance σ 2 = 100
25
Figure 1.10 Comparaison de deux distributions normales avec les mêmes
Loi normale centrée réduite Si une variable aléatoire X suit une loi N (µ, σ 2 ),
avec µ=0 et σ = 1, on dit que X suit une loi normal standard ou une loi normale
symétrique autour de 0 et la surface totale délimitée par cette courbe est égale a 1.
26
la valeur maximale de f (z) est atteinte à z = 0, la valeur maximale étant f (0) =
1
√ = 0, 399. On peut vérier aussi que les deux points correspondants à, z = −1
2π
et z = 1 sont les points d'inexion de la courbe de densité.
duite
t2
Z Z −
1
φ(z) = p(Z ≤ z) = √ e 2 dt, z∈R
−∞ 2π
La symétrie de la courbe de densité par rapport a L'origine implique que la fonction
pour tout a ∈ R+
Figure 1.12 Fonction de répartition φ(z) pour la loi normale centrée et réduite
a ∈ R+
(a) p(Z < a) = p(Z ≤ a) = φ(a)
(b) p(Z > a) = p(Z ≥ a) = 1 − φ(a)
(c) p(Z ≤ −a) = p(Z ≥ a) = 1 − φ(a)
(d) p(−a ≤ Z ≤ a) = 2p(Z ≤ a) − 1 = 2φ(a) − 1
27
Le résultat (3) est très utile, car il permet d'obtenir la valeur de la fonction de
P (Z ≤ 0.64) = 0.7389
Exemple 1.6.4. Quelle proportion des valeurs Z se situe entre 2.0 et 1,53 ?, si
Z N (0, 1).
p(1.53 ≤ Z ≤ 2.0) = φ(2.00) − φ(1.53) = 0.9772 − 0.9370.
Exemple 1.6.5. Étant donné une distribution normal standard, trouver p(Z ≥
1.22).
p(Z ≥ 1.22) = 1 − φ(1.22) = 1 − 0.8888
Exemple 1.6.6. Étant donné une distribution normal standard, trouver p(Z ≤
−1.22).
p(Z ≤ −1.22) = 1 − φ(−1.22) = 1 − 0.8888
28
1.6.4 standardisation d'une loi normale quelconque N (µ, σ)
Exemple 1.6.7 (hypertension) . Supposons qu'une légère hypertension est dénie
comme une personne dont le DBP est entre 90 et 100mm Hg , et les sujets sont des
avec une moyenne de 80 et une variance de 144. Quelle est la probabilité qu'une
N (0, 1).
X −µ
Théorème 1.6.1. Si X N (µ, σ 2 ) alors Z= suit une loi normal centrée
σ
et réduite N (0, 1).
l'aide de la table de Gauss. Cette procédure est illustrée dans la gure 1.6.4.
29
Figure 1.14 Évaluation des probabilités pour toute distribution normale à l'aide
de la normalisation
90 − 80 100 − 80
p(90 ≤ X ≤ 100) = p( ≤Z≤ )
12 12
= p(0.883 ≤ Z ≤ 1.667) = φ(1.667) − φ(0.883)
Exemple 1.6.8. On suppose qu'une certaine variable X N (11; 4). Pour quelle
30
Solution
14 − 11
p(X ≤ 14) = p(Z ≤ )
2
= p(Z ≤ 1.5) = φ(1.5)
= 0.9332
31
Annexe A
32
A.1 Table de Gauss
33
34
A.2 Table de Student
35
A.3 Table de Chi-2
36
Bibliographie
P. J., Landrigan, P. J., Terpilak, M.,and Cox, C. (1981, January 31). Cancer
tion.
[5] J.A.Rice, Mathematicals Statistics And Data analysis,Duxbury Press, 2nd Edi-
[6] Arora, N. S., and Rochester, D. R (1984). Eect of chronic airow limitation
37