Académique Documents
Professionnel Documents
Culture Documents
UCAO
Licence 1 Sciences Economiques
2
TABLE DES MATIÈRES 3
2.3 Variations saisonnières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1 Estimation des coefficients saisonniers du modèle additif . . . . . . . . 24
2.3.2 Estimation des coefficients saisonniers du modèle multiplicatif . . . . . 25
2.4 Désaisonnalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Prévisions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6 Exemple : Modèle additif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3 Analyse combinatoire 31
3.1 Principes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Arrangements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Arrangements sans répétitions . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Arrangements avec répétitions . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Combinaisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.1 Combinaisons sans répétitions . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.2 Combinaisons avec répétitions . . . . . . . . . . . . . . . . . . . . . . . . 33
4 Espace probabilisé 34
4.1 Rappels de Théorie des ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2 Univers des possibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.3 Evénements, Tribu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.4 Probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.5 Conditionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.6 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.6.1 Indépendance de deux évènements . . . . . . . . . . . . . . . . . . . . . . 38
4.6.2 Indépendance de n évènements . . . . . . . . . . . . . . . . . . . . . . . . 38
Chapitre
1.1 Introduction
La question centrale de ce chapitre est relative aux statistiques bivariées (deux variables).
Comment juger de l’intensité de la dépendance statistique esntre deux variables ?
Répondre statistiquement à cette question dépend de la nature des deux variables étu-
diées. Trois combinaisons sont possibles :
— Deux variables qualitatives :
— Une variable qualitative et une variable quantitative :
— Deux variables quantitatives
L’analyse dans ce cas n’est plus univariée mais bien bivariée. On analyse de manière simul-
tanée les caractéristiques des individus suivant deux variables.
1.2 Généralités
ni j
fi j = .
n
4
1.2. GÉNÉRALITÉS 5
HH Y Y
H
Y2 ··· Yj ··· Yl
X HH 1
X1 n 11 n 12 ··· n1 j ··· n 1l
X2 n 21 n 22 ··· n2 j ··· n 2l
.. .. .. .. .. .. ..
. . . . . . .
Xi n i1 n i2 ··· ni j ··· n il
.. .. .. .. .. .. ..
. . . . . . .
Xk n k1 n k2 ··· nk j ··· n kl
Exemple 1.2.3. Une variable quantitative continue et une variable qualitative : Répartition
d’un groupe de 50 personnes réparties par âge et par genre, tous âgés de moins de 45 ans.
PPGenre Homme
PP
Femme
Age PP
P
P
[0, 18[ 10 20
[18, 45[ 5 15
k
X
n• j = ni j.
i =1
6 CHAPITRE 1. STATISTIQUES À DEUX VARIABLES
La fréquence de la modalité Y j est donnée par
n• j
f• j = .
n
Nous avons
X l
k X k
X l
X
n= ni j = n i• = n• j
i =1 j =1 i =1 j =1
X l
k X k
X l
X
fi j = f i• = f • j = 1.
i =1 j =1 i =1 j =1
HH Y
HH Y1 Y2 ··· Yj ··· Yl Total
X H
X1 n 11 n 12 ··· n1 j ··· n 1l n 1•
X2 n 21 n 22 ··· n2 j ··· n 2l n 2•
.. .. .. .. .. .. .. ..
. . . . . . . .
Xi n i1 n i2 ··· ni j ··· n il n i•
.. .. .. .. .. .. .. ..
. . . . . . . .
Xk n k1 n k2 ··· nk j ··· n kl n k•
Total n •1 n •2 ··· n• j ··· n •l n
HH Y
HH Y1 Y2 ··· Yj ··· Yl Total
X H
X1 f 11 f 12 ··· f1 j ··· f 1l f 1•
X2 f 21 f 22 ··· f2 j ··· f 2l f 2•
.. .. .. .. .. .. .. ..
. . . . . . . .
Xi f i1 f i2 ··· fi j ··· f il f i•
.. .. .. .. .. .. .. ..
. . . . . . . .
Xk f k1 f k2 ··· fk j ··· f kl f k•
Total f •1 f •2 ··· f• j ··· f •l 1
1.2.4 Indépendance
On dit que les caractères X et Y sont satistiquement indépendants dans l’ensemble des
n individus considérés si toutes les distributions conditionnelles de X sont identiques à la
distribution marginale en X .
Puisque
ni j
ni j n fi j
f i j = = n• j = ,
n• j f• j
n
alors
f i j = f • j × f i j = f i• × f j i .
8 CHAPITRE 1. STATISTIQUES À DEUX VARIABLES
Ainsi, nous obtenons
n i• n• j 2
³ ´
3 ni j −
2 X n
χ2 =
X
n i• n• j
i =1 j =1 n
µ¡ n i• n •1 ¢2 ¡ n n ¢2 ¡ n n ¢2 ¶
2
X n i1 − n n i2 − i•n •2 n i3 − i•n •3
= n i• n •1 + n i• n •2 + n i• n •3
i =1 n n n
n 1• n •1 ¢2 n 1• n •2 ¢2 n 1• n •3 ¢2 ¢2 ¢2 ¢2
n 21 − n2•nn•1 n 22 − n2•nn•2 n 23 − n2•nn•3
¡ ¡ ¡ ¡ ¡ ¡
n 11 − n n 12 − n n 13 − n
= n 1• n •1 + n 1• n •2 + n 1• n •3 + n 2• n • 1 + n 2• n •2 + n 2• n • 3
n n n n n n
On sait que :
X et Y sont indépendants ⇐⇒ f i j = f i• × f • j i = 1, . . . , k, j = 1, . . . , l.
1.3.3 Exercices
1.3.3.1 Exercice 1
Nous voulons étudier la liaison entre le type de musique X et l’âge Y . X a trois modalités
(chansons, jazz, classique) et Y a quatre modalités (jeunes, adulte femme, adulte homme,
vieux). Voici le tableau de contingence :
HH Y Jeunes
H
Adulte femme Adulte homme Vieux Total
X HH
Chansons 69 172 133 27 401
Jazz 41 84 118 11 254
Classique 18 127 157 43 345
Total 128 383 408 81 1000
n i• n• j 2
³ ´
4 ni j −
3 X n
χ2 =
X
n i• n• j = 52.9138.
i =1 j =1 n
1.3.3.2 Exercice 2
Un site internet reçoit 113 457 visiteurs durant un mois. On désigne par X le navigateur
internet utilisé et Y le système d’exploitation utilisé.
10 CHAPITRE 1. STATISTIQUES À DEUX VARIABLES
hhh
hhhh
hhh Système d’exploitation (Y)
hhhh
hhhh Windows Mac Linux
hhh
Navigateur internet (X) hhhh
Chrome 14103 1186 427
Firefox 30853 4392 3234
Internet explorer 47389 23 0
Safari 668 6416 0
Autres 2974 40 1752
1. Identifier la population, sa taille ainsi que les variables étudiées en précisant leur type.
2. Quelle est la proportion de visiteurs sous Windows ?
3. Quelle proportion de visiteurs utilisent le navigateur Safari ?
4. Parmi les utilisateurs de Mac, quelle proportion utilise Chrome ?
5. Parmi les utilisateurs de Safari, quelle proportion est sous Windows ?
6. Représenter graphiquement la distribution des proportions par Navigateur pour chaque
système d’exploitation. Les variables X et Y sont-elles indépendantes ?
Nous avons :
1. −1 ≤ r X Y ≤ 1.
2. Si r X Y > 0 alors les deux variables évoluent dans le même sens.
3. Si r X Y < 0 alors les deux variables n’évoluent pas dans le même sens.
4. | r X Y | = 1 ⇐⇒ les n points ( X i , Yi ) sont alignés.
5. r X Y = 0 ⇐⇒ Pas de liaison linéaire, mais possibilité d’une liaison d’un autre type.
6. X et Y indépendantes=⇒ r X Y = 0.
Figure 1.1 –
12 CHAPITRE 1. STATISTIQUES À DEUX VARIABLES
Figure 1.2 –
Remarque 1.4.1. • La covariance dépend des unités de mesure dans lesquelles sont
exprimées X et Y . Le coefficient de corrélation est un indice de liaison sans unité.
• La covariance et le coefficient de corrélation ne permettent de mettre en évidence
qu’une relation linéaire entre X et Y .
• Si deux variables sont statistiquement indépendantes (aucun lien), la corrélation est
nulle, mais l’inverse est faux : il peut exister un lien autre que linéaire entre elles.
La droite d’équation y = ax + b est appelée droite de régression de Y sur X . Elle passe par
le point ( X n , Y n ).
2.0
1.8
1.6
1.4
20 30 40 50 60 70
Age
14 CHAPITRE 1. STATISTIQUES À DEUX VARIABLES
Les points sont rangés le long d’une droite. On peut donc supposer l’existence d’une
relation linéaire entre l’age et le taux de cholesterol.
10
X
x i yi − 12 x12 y12
i =1
rXY = v v ≈ 0.95
u 10 u 10
uX uX
t x2 − 12( x )2 t yi2 − 12( y12 )2
i 12
i =1 i =1
Le coefficient de corrélation est positif. Ce qui signifie que l’age et le taux de choles-
terol évolue dans le même sens. De plus ils sont fortement corrélés ; ce qui confirme
la relation linéaire entre l’age et le taux de cholesterol.
P10
i =1 x i yi − 12 x12 y12
a= P 10 2
= 0.03
2
i =1 x i − 12( x12 )
Taille ( X i ) 140 161 155 148 155 123 160 140 165 172 155
Poids (Yi ) 38.2 44.3 46.1 38.2 50.5 22.4 40.4 34.7 50.5 50.5 38.1
60
50
poids
40
30
taille
[1] 0.5312239
Call:
lm(formula = poids ~ taille)
Coefficients:
(Intercept) taille
17.9617 0.1817
1X n
Yn = n i• Y i .
n i=1
On définit :
- la variance intra-groupe
1X k
Vintra = n i• σ2i
n i=1
avec
n i•
1 X
σ2i = (Yi j − Y i )2
n i• j=1
- la variance inter-groupe
1X k
Vinter = n i• (Y i − Y n )2
n i=1
σ2 = Vintra + Vinter .
- η2X |Y = 0 ⇒ Vinter = 0 ⇒ Y i = Y n . Ce qui signifie que les moyennes de Y sont les mêmes
dans toutes les modalités de X . En moyenne, les données ne diffèrent pas selon qu’elles
se trouvent dans telle ou telle modalité de X .
- η2X |Y = 1 ⇒ Vintra = 0 ⇒ Yi j = Y i . Les données diffèrent d’un groupe à l’autre mais à
l’interieur même de chaque groupe, il n’y a aucune variabilité.
Remarque 1.5.1. Si η2X |Y est proche de 1, c’est que le caractère X explique une grande
partie de la variabilité des données alors que si sa valeur est proche de 0, elle n’en explique
que très peu.
1.5.2 Exemple
Liaison entre le sexe (caractère X ) et le salaire (caractère Y ).
Le caractère X admet deux modalités : femme et homme.
30Y F + 20Y H
Y= = 1818.36
30 + 20
La variance inter-groupe est :
1
½ ³ ´2 ³ ´2 ¾
Vinter = nF Y F − Y + nH Y H − Y = 27809.32
50
On peut considérer que le caractère sexe explique environ 58% de la variabilité des salaires
observés.
Chapitre
2.1 Présentation
2.1.1 Définitions
On appelle série chronologique (chronique, série temporelle) la distribution statistique
d’une variable au cours du temps. Les séries chronologiques sont des cas particuliers de séries
statistiques à deux variables, l’une des variables étant le temps.
Soit Nous ( X t , t ∈ T) une série chronologique ; l’ensemble T est appelé espace des temps :
T = {1, . . . , T }.
- le mois, unité de référence correspondant aux dates d’observation ; le mois peut être
le mois véritable mais également le trimestre, le semestre, etc.
- l’année composée d’un nombre p de mois ; le nombre p est appelé période ; par
exemple, p = 4 pour les observations trimestrielles, p = 12 pour les observations men-
suelles.
Soit X t l’observation d’une grandeur X à la date t. Si les observations sont faites sur n
années, et chaque année contenant p mois, on notera X i j l’observation du mois j de l’année
i . Nous avons
Xi j = Xt avec t = ( i − 1) p + j.
Le mois t est le j -ème mois de la i -ème année. Le nombre total d’observations est T = np.
t 1 2 ... T
Xt X1 X2 ... XT
18
2.1. PRÉSENTATION 19
XXX
XXX Mois mois 1 mois 2 ... mois j ... mois p
Années XXX
X
année 1 X 11 X 12 ... X1 j ... X1p
année 2 X 21 X 22 ... Xij ... X2p
..
.
année i X i1 X i2 ... Xij ... Xip
..
.
année n X n1 X n2 ... Xnj ... X np
Exemple 2.1.1. Chiffre d’affaires trimestriel d’une entreprise (en millions de francs)
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Xt 2 8 6 12,5 5 10.5 9 15 7 12 10,5 17 8.5 14.5 12 19
XXX
XXX Mois Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
Années XXX
X
1976 2 8 6 12.5
1977 5 10.5 9 15
1978 7 12 10.5 17
1979 8.5 14.5 12 19
Exemple 2.1.2. Chiffre d’affaires trimestriel d’une entreprise (en millions de francs)
XXX
XXX Mois Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
Années XXX
X
2000 5,5 6,3 16,9 32,4
2001 23,1 17,5 37,8 62,7
2002 40,6 28,7 58,7 93,3
2003 58,5 39,9 79,5 123,1
S t = S t+ p = S t+2 p = . . . ;
- Principe de conservation des aires : sur une année, l’influence des variations
saisonnières est nulle.
Le traitement des séries chronologiques peut avoir pour objectifs d’isoler et estimer une
tendance, isoler et estimer une composante saisonnière, et désaisonnaliser la série, de réaliser
une prévision, de construire un modèle explicatif en terme de causalité.
− On représente les points ( j, Yi j ) que l’on relie par des segments de droites, ceci pour
chacune des années i ; ce graphique permet une analyse année par année et une
comparaison entre les différentes années
Un modèle est une image simplifiée de la réalité qui vise à traduire les mécanismes
de fonctionnement du phénomène étudié et permet de mieux les comprendre.On distingue
deux types de modèles : les modèles déterministes et les modèles stochastiques. Dans ce
cours, nous nous limitons aux modèles déterministes. Les deux modèles déterministes les
plus utilisés sont :
X t = T t + S t + εt .
2.1. PRÉSENTATION 21
p
X
Principe de conservation des aires : S j = 0.
j =1
p
X
Principe de conservation des aires : S j = 0.
j =1
Nous observons dans la litterature d’autre forme du modèle multiplicatif :
— X t = T t × S t × εt
— X t = T t × S t + ε t (souvent qualifié de modèle mixte). Le principde de conservation
des aires dans ce cas est
p
X
S j = p.
j =1
22 CHAPITRE 2. ANALYSE DESCRIPTIVE D’UNE SÉRIE CHRONOLOGIQUE
Dans la suite, lorsque nous parlerons de modèle multiplicatif nous considérons la forme :
X t = T t × (1 + S t ) × (1 + ε t ).
Remarque 2.2.1. La tendance à la date t peut être estimée par la moyenne mobile centrée
à la date t de longueur la période p si
- la tendance présente une faible courbure
- les variations saisonnières sont périodiques de période p et ont une influence nulle
sur l’année
- les variations résiduelles sont de faible amplitude.
Remarque 2.2.2. Les moyennes mobiles peuvent être influencées par les valeurs extrêmes.
Dans ce cas, on pourrait calculer les médianes mobiles de même ordre. Les moyennes mobiles
donnent une meilleure estimation que les moindres carrés.
24 CHAPITRE 2. ANALYSE DESCRIPTIVE D’UNE SÉRIE CHRONOLOGIQUE
2.2.2 Méthode de Mayer
On ajuste le nuage de points ( t, X t ) à une droite passant par les deux points ( t̄1 , X̄ 1 ) et
( t̄ 2 , X̄ 2 ) calculés de la manière suivante :
- on découpe la série en deux parties de même effectif
- pour chacune des deux parties, on calcule la moyenne des t et celle des X t : ( t̄1 , X̄ 1 )
et ( t̄2 , X̄ 2 ) ; on peut calculer les points médians au lieu des moyennes ; cela permet de
limiter l’influence des valeurs extrêmes.
- il reste à tracer la droite passant par les deux points.
Nous obtenons
cov( t, X )
a= b = X̄ − a t̄
var ( t)
où
1 XT 1 XT
cov( t, X ) = tX t − t̄ X̄ var ( t) = t2 − t̄2
T t=1 T t=1
1 XT 1 XT
X̄ = Xt t̄ = t.
T t=1 T t=1
Remarque 2.2.3. La droite des moindres carrés ajuste au mieux au sens des moindres
carrés (c’est celle qui passe le plus près de l’ensemble des points), mais elle ne modélise pas
toujours bien la tendance.
0
Sj
5. Estimer S j par Se j = 0 − 1.
M
2.4 Désaisonnalisation
Désaisonnaliser une série chronologique, c’est éliminer la composante saisonnière sans
modifier les autres composantes. On appelle observation corrigée des variations saisonnières
ou observation désaisonnalisés, la valeur X i∗j cdobtenue en éliminant l’effet saisonnier sur
la valeur X i j . On la notera X t∗ . La désaisonnalisation permet de comparer des observations
dont les variations saisonnières sont différentes.
• Modèle additif : X i∗j = X i j − Se j
Xij
• Modèle multiplicatif : X i∗j =
1 + Se j
2.5 Prévisions
• Modèle additif : la prévision est :
h i
p
X i j = a ( i − 1) p + j + b + Se j .
Nous avions montré par les méthodes précédentes que le modèle est additif.
X i j − Mi j
2.6. EXEMPLE : MODÈLE ADDITIF 27
0 1³ ´
S1 = − 3.875 − 3.9375 − 4.3125 = −4.042
3
0 1³ ´
S 2 = 0.9375 + 0.625 + 1.25 = 0.935
3
0 1³ ´
S3 = − 1.5 − 1.125 − 1.3125 = −1.3125
3
0 1³ ´
S 4 = 4.3125 + 4.4375 + 4.6875 = 4.479
3
Comme
0 0 0 0
S 1 + S 2 + S 3 + S 4 = 0.0595 6= 0,
le principe de conservation des aires n’est pas respectée. Nous passons à l’étape sui-
vante.
0 0 0 0
Les coefficients Se1 , Se2 , Se3 et Se4 respectent leprincipe de conservation des aires.
4. Séries désaisonnalisée :
0
X i∗j = X i j − Se j .
2.6. EXEMPLE : MODÈLE ADDITIF 29
3 Analyse combinatoire
L’analyse combinatoire est un important outil dans de nombreuses branches des mathé-
matiques, notamment dans la théorie des probabilités et en statistique.
3.1 Principes
Il existe deux principes fondamentaux en analyse combinatoire :
— Principe additif : Si une tâche peut être accomplie de m manières, et si une autre
tâche peut être accomplie de n manières. Et si les deux tâches ne peuvent pas être
réalisées simultanément, alors la réalisation d’une ou de l’autre des deux tâches peut
être accomplie de m + n manières.
— Principe multiplicatif : Si une procédure peut être découpée en deux étapes, et
qu’il y a m facons possibles de réaliser la première étape, et qu’il y a n facons possibles
de réaliser la seconde étape, alors la procédure peut être accomplie de nm facons.
3.2 Arrangements
Définition 3.2.1. Un arrangement de p éléments choisis parmi n éléments est une dispo-
sition ordonnée de p de ces n éléments.
On distingue les arrangements avec répétitions et les arrangements sans répétitions.
31
32 CHAPITRE 3. ANALYSE COMBINATOIRE
Remarque 3.2.1. Un arrangement sans répétitions est une permutation si p = n. Le
nombre de permutations de n éléments est :
A nn = n!
Exemple 3.2.3. Tirage sans remise : Une urne U contient n boules numérotés de 1 à n. On
tire successivement p boules de U sans les remettre dans l’urne. Il y a A np tirages différents
possibles.
Exemple 3.2.4. Le nombre d’arrangements avec répétitions que l’on peut faire avec deux
éléments choisis parmi trois éléments a, b, c est 32 = 9. Ces 9 arrangements sont : (a, a),
(a, b), ( b, a), (a, c), ( c, a), ( b, b), ( b, c), ( c, b) et ( c, c).
Exemple 3.2.5. Tirage avec remise : Une urne U contient n boules numérotés de 1 à n.
On tire successivement p boules de U en remettant chaque fois dans l’urne la boule qu’on
vient de tirer. Le nombre de tirages possibles est donc n p .
3.3 Combinaisons
Définition 3.3.1. Une combinaison de p éléments choisis parmi n éléments est une dispo-
sition non ordonnée de p de ces n éléments.
Exemple 3.3.1. Le nombre de combinaisons sans répétitions que l’on peut faire avec deux
éléments choisis parmi trois éléments a, b, c est C32 = 3. Ces 3 combinaisons sans répétitions
sont : (a, b), (a, c), et ( b, c).
Exemple 3.3.3. Le nombre de combinaisons avec répétitions que l’on peut faire avec deux
éléments choisis parmi trois éléments a, b, c est K 32 = C42 = 6. Ces 6 combinaisons sont :
(a, a), (a, b), (a, c), ( b, b), ( b, c) et ( c, c)
Exemple 3.3.4. Soit E = {R, V , B}. Alors (B, B, R, V , V ) est une combinaison avec répétition
de 5 éléments de E.
Exemple 3.3.5. On souhaite répartir p chiffons dans n tiroirs. On note les tiroirs t1 , . . . , t n .
A une répartition, on associe le mot t1 , . . . , t1 , t2 , . . . , t2 , . . . , t n , . . . , t n , où chaque t i est répété
autant de fois que le nombre de chiffons rangés dans le tiroir. On obtient une combinaison
avec répétitions.
4 Espace probabilisé
L’objet des probabilités est de modéliser des phénomènes aléatoires et de prédire avec
certitude leur évolution ou les conséquences qu’ils peuvent engendrer.
On a
Card ( A ∪ B) = Card ( A ) + Card (B) − Card ( A ∩ B).
Définition 4.2.2. L’univers des possibles (ou univers), noté Ω est défini par l’ensemble de
tous les résultats possibles qui peuvent être obtenus au cours d’une expérience aléatoire.
34
4.3. EVÉNEMENTS, TRIBU 35
La description explicite de l’ensemble Ω est la première étape dans la modélisation d’un
phénomène aléatoire. On distingue les univers comprenant un nombre fini de résultats de
ceux comprenant un nombre infini de résultats. Parmi les univers infinis, on distingue les
univers infinis non dénombrables des univers infinis dénombrables. Par exemple, l’univers
Ω = {ω1 , . . . , ω i , . . .} est un univers infini dénombrable puisque l’on peut identifier chacun des
éléments de Ω, même s’il en existe une infinité. En revanche, Ω = R est un exemple d’univers
infinis non dénombrables. Dans le cas d’un univers fini ou infini dénombrable, la taille de
l’univers est appelée cardinal de Ω et est noté card (Ω).
Exemple 4.2.1. Voici quelques expériences aléatoires et les univers des possibles corres-
pondants :
1. On lance une pièce. On a Ω = {pile, face}.
2. On jette un dé. On a Ω = {1, 2, 3, 4, 5, 6}.
3. On jette deux dés. On a
4. Un bus est censé passer toutes les 30 minutes à l’école de police pour se rendre à Faya.
Un passager arrive à l’arrêt de bus. On cherche à modéliser son temps d’attente. A
priori, on peut supposer que ce temps d’attente est dans l’intervalle Ω = [0, 30].
Le couple (Ω, A ) est appelé espace probabilisable. Pour compléter la description d’un
phénomène aléatoire, il nous reste à introduire la notion de mesure de probabilité.
4.4 Probabilité
Pour une expérience aléatoire donnée, une fois déterminé le couple (Ω, A ) qui représente
l’univers Ω associé à cette expérience et la tribu des évènements A , on définit une application
de A à valeurs dans [0, 1] qui à chaque évènement associe sa probabilité, c’est à dire la chance
de réalisation de cet évènement.
Définition 4.4.1. On appelle probabilité sur (Ω, A ) une application P : A → [0, 1] telle
que :
(i) P(Ω) = 1
(ii) si ( A i ) i∈ I est une famille dénombrable d’éléments de A deux à deux disjoints ou
incompatibles (i.e. ∀ i 6= j, A i ∩ A j = ;) alors
à !
P P( A i ).
[ X
Ai =
i∈ I i∈ I
4.5 Conditionnement
Soit (Ω, A , P) un espace probabilisé. Dans ce chapitre, nous allons étudier deux notions
importantes : le conditionnement et l’indépendance. Le conditionnement permet de prendre
en compte une information supplémentaire dans le calcul d’une probabilité. L’indépendance
rend compte du fait que deux évènements n’ont aucune incidence l’un sur l’autre.
Définition 4.5.1. Soient A et B deux évènements tels que P(B) > 0. On appelle probabilité
conditionnelle de A sachant que B, le réel défini par
P( A ∩ B)
P( A /B) = .
P(B)
L’application A 7−→ P( A /B) définit une probabilité sur (Ω, A ).
Proposition 4.5.1. Formule des probabilités composées.
n
\
Soit A 0 , . . . , A n une suite d’évènements telle que A i 6= ;. Alors, on a
i =0
n
P( A i ) = P( A 0 ) × P( A 1 / A 0 ) × P( A 2 / A 0 ∩ A 1 ) × . . . × P( A n / A 0 ∩ A 1 ∩ . . . ∩ A n−1 ).
\
i =0
Exemple 4.5.2. Une urne contient des boules blanches et nores, marquées ou non. On sup-
pose que parmi les boules marquées, il y a 30% de boules blanches et parmi les non marquées
60%. Par ailleurs, on sait que 80% des boules sont marquées. Quelle est la probabilité de
tirer une boule blanche ?
Solution. On note
B =”la boule est blanche”
M =”la boule est marquée”
On a
P(B) = P(B ∩ M ) + P(B ∩ M c )
= P( M ) × P(B/ M ) + P( M c ) × P(B/ M c )
80 30 20 60 36
= × + × = .
100 100 100 100 100
Théorème 4.5.2. (Formule de Bayes)
Soit {B1 , . . . , B n } un système complet d’évènements et A un évènement tel que P( A ) > 0.
Alors, nous avons
P(B i )P( A /B i )
P( B i / A ) = n
.
P (B k )P( A /B k )
X
k=1
38 CHAPITRE 4. ESPACE PROBABILISÉ
4.6 Indépendance
4.6.1 Indépendance de deux évènements
Définition 4.6.1. Soient A et B deux évènements. On dit que A et B sont indépendants si
P( A ∩ B) = P( A )P(B).