Vous êtes sur la page 1sur 112

COURS DE

PROBABILITÉS

Dr EL BADAOUI Rabie
Ecole Nationale de Commerce et de Gestion de
Marrakech
Théorème de Bayes

 Les probabilités sont confrontées à un certains nombre de facteurs qui


influencent leur réalisation

 D’où l’importance de l’analyse des probabilités à posteriori

 En effet, on commence l’analyse avec des probabilités a priori


concernant les différents événements

 Ensuite, on obtient des informations supplémentaires sur ces événements


ce qui nous permet de réviser les valeurs des probabilités a priori

 Le théorème de Bayes permet d’effectuer ces calculs


Théorème de Bayes

 Considérons une entreprise qui possède 2 fournisseurs différents

 Soient A1 l’événement ‘’la pièce est fournie par le fournisseur 1’’ et


A2 l’événement ‘’la pièce est fournie par le fournisseur 2’’

 65% des pièces achetées par l’entreprise proviennent du fournisseur


1 et 35% du fournisseur 2

 On aura: P(A1) = 0.65 et P(A2) = 0.35

 La qualité des pièces achetées varie en fonction du fournisseur


Théorème de Bayes

 Les données révèlent les nivaux de qualité présentés dans le tableau


suivant
 Soient B l’événement ‘’la pièce est de bonne qualité’’ et M l’événement
‘’la pièce est défectueuse’’
 P = 0.98; P = 0.02 ; P = 0.95 et P = 0.05

% de pièces de % de pièces
bonne qualité défectueuses
Fournisseur 1 98 2

Fournisseur 2 95 5
Théorème de Bayes

 On peut considérer ces événements comme une expérience en 2


étapes

 4 résultats sont possibles

 Chacun des résultats possibles est l’intersection de 2 événements:


 P (A1, B) = P (A1 B) = P(A1)P

 Le processus de calcul des probabilités jointes est décrit par ce qui


est appelé un arbre des probabilités.
Théorème de Bayes

 À l’étape 1, les probabilités de chaque branche correspondent aux


probabilités a priori

 A l’étape 2, les probabilités de chaque branche correspondent aux


probabilités conditionnelles

 On multiplie les probabilités de chaque branche pour obtenir les


probabilités de chaque résultat possible de l’expérience
Théorème de Bayes

 Supposons que les pièces des 2 fournisseurs soient utilisées dans le


système de production de l’entreprise et que l’une des machines tombe en
panne à cause d’une pièce défectueuse

 Sachant que la pièce est défectueuse, quelle est la probabilité qu’elle


provienne du fournisseur 1? Du fournisseur 2 ? Avec les informations
contenues dans l’arbre des probabilités

 Le théorème de Bayes permet de répondre à ces questions

 Nous cherchons à déterminer les probabilités a posteriori Pet Poù M est


l’événement ‘’la pièce est défectueuse’’
Théorème de Bayes

 Par la loi des probabilités conditionnelles nous avons:

 Pour trouver P(M), l’événement M ne se produit que dans 2 cas à


savoir et

 On substituant les deux dernières équations la première on aura:


Théorème de Bayes
Théorème de Bayes

 Nous avons commencé avec une probabilité de 0.65 qu’une pièce


sélectionnée aléatoirement proviennent du fournisseur 1

 Sachant que la pièce est défectueuse, cette probabilité chute à 0.42

 Si la pièce est défectueuse, il y a plus de chance qu’elle proviennent


du fournisseur 2 avec P ( = 0.57

 Le théorème de Bayes est applicable lorsque les deux événements


sont mutuellement exclusifs (leur union correspond à l’espace
d’échantillon entier)
L’approche tabulaire

Événements Probabilités Probabilités Probabilités Probabilités a posteriori


a priori conditionnelle jointes
P(Ai) s

A1 0.65 0.02 0.0130 0.0130/0.0305=0.4262

A2 0.35 0.05 0.0175 0.0175/0.0305=0.5738

Totaux 1 P(B) = 0.0305 1


Application

 Un fiduciaire tient la comptabilité d’une grande entreprise. Pour


cela, elle consacre comptable SAMIR uniquement pour les dossiers
de ce client. Pendant la période du dépôt du bilan, elle fait appel à
un collaborateur KARIM d’un autre service pour renforcer l’équipe
pendant 3 mois.

 Soit A1 l’événement ‘’le dossier est traité par SAMIR’’


 Soit A2 l’événement ‘’le dossier est traité par KARIM’’
 Soit C l’événement ‘’ Le dossier est très bien traité’’
 Soit D l’événement ‘’Le dossier contient des erreurs’’
Application

Sachant que:

 SAMIR traite 80% des dossiers


 KARIM traite 20% des dossiers
 Le travail de SAMIR engendre 95% de dossiers traités correctement et 5%
d’erreurs
 Le travail de KARIM produit 90% de dossiers traités correctement et 10%
d’erreurs

 Déterminer la probabilité que le dossier provient de SAMIR sachant qu’il


contient des erreurs P?
 Déterminer la probabilité que le dossier provient de KARIM sachant qu’il
contient des erreurs P?
L’approche tabulaire

Événements Probabilités Probabilités Probabilités Probabilités a posteriori


a priori conditionnelle jointes
P(Ai) s

A1 0.8 0.05 0.04 0.04/0.06=0.66

A2 0.2 0.1 0.02 0.02/0.06=0.33

Totaux 1 P(D) = 0.06 1


Chapitre 3: Distribution des probabilités

 Nous avons définis le concept d’expérience et de résultat de l’expérience

 Une variable aléatoire fournit un moyen de décrire de façon numérique les


résultats d’une expérience

 Une variable aléatoire est une description numérique du résultat d’une


expérience

 En d’autres termes, une variable aléatoire associe une valeur numérique à


chaque résultat possible de l’expérience

 La valeur numérique dépend du résultat de l’expérience

 Nous distinguons entre une variable aléatoire discrète et variable aléatoire


continue selon les valeurs numériques qu’elles prennent
Chapitre 3: Distribution des probabilités

 Variable aléatoire discrète:

 Est une variable aléatoire qui peut prendre soit un nombre fini de valeurs, soit
un ensemble infini de valeurs dénombrables telles que 0,1,2…est dite variable
aléatoire discrète

 Un étudiant passe 2 examens/ an. Nous définissons la variable aléatoire


discrète X comme le nombre d’examens par an. Cette variable aléatoire
discrète peut prendre les valeurs finies 0, 1 ou 2.

 Pour le nombre de voitures arrivant au péage, la variable aléatoire X


correspond au nombre de voiture arrivant au péage au cours d’une journée. Les
valeurs possibles de X appartiennent à l’ensemble des nombres entiers positifs
0,1, 2, etc.
X est donc une variable aléatoire discrète dont les valeurs appartiennent à cet
Chapitre 3: Distribution des probabilités

 Bien que de nombreuses expériences aient des résultats naturellement


décrits par des valeurs numériques, ce n’est pas toujours le cas

 Exemple:

 Lors d’une enquête, on demande à un individu de se souvenir d’une


publicité télévisée. Cette expérience à deux résultats possibles: ‘’on
se souvient’’ ou ‘’on se souvient pas’’.

 Il est possible de décrire les résultats de cette expérience


numériquement en définissant la variable aléatoire discrète X de la
façon suivante: x=0 (ne se souvient pas) et x=1 (se souvient)
Chapitre 3: Distribution des probabilités

 Le tableau suivant fournit des exemples de variables aléatoires


discrètes. Dans chaque exemple, la variable peut prendre un nombre
fini de valeurs ou un ensemble infini mais dénombrables de valeurs
telles que 0, 1, 2 etc

Expérience Variable aléatoire Valeurs prises par la


variable aléatoire
Contacter 5 clients Nombre de clients qui 0,1,2,3,4,5
passent une commande
Inspecter 50 chemises Nombre de chemises 0,1,2,3,…50
défectueuses
Gérer un restaurant Nombre de clients 0,1,2,……

Vendre une automobile Sexe des clients 0= homme et 1=femme


Chapitre 3: Distribution des probabilités

 Variable aléatoire continue:


 Est une variable qui prend ses valeurs numériques dans un intervalle
ou une suite d’intervalles
 Les résultats d’expériences basés sur des échelles de mesure telles
que le poids, la température, la distance sont des variables aléatoires
continues
 Pour un service de dépannage sur une autoroute de 100 km, on
pourrai définir la variable X comme le lieu du prochaine panne. X
est une variable aléatoire continue prenant des valeurs dans
l’intervalle [0; 100 km]
 Un appel téléphonique peut prendre par exemple: 1:36 min; 2:58
min; 3:56 min…..une infinité de valeur entre [0; ∞[
Chapitre 3: Distribution des probabilités

 Une variable aléatoire continue peut prendre n’importe quelle


valeur dans un intervalle donné

Expérience Variable aléatoire Valeurs prises par la


variable aléatoire
Gérer l’affluence des Temps du service entre X ≥0
clients l’arrivée des clients
Remplir une canette de Nombre de centilitres 0 ≤ X ≤33
soda de 33 cl
Construire un hôpital Pourcentage de réalisation 0% ≤ X ≤100%
du travail après 6 mois
Application:

 Identifier les valeurs que peut prendre la variable aléatoire et déterminer si


elle est discrète ou continue

Expériences Variable aléatoire X


Passer un examen de 20 questions Nombre de bonnes réponses

Observer le travail d’un employé Nombre d’heures non productives


pendant 8 heures
Conduire un audit fiscal de 20 Nombre de cas de fraudes
entreprises
Peser la récolte du safran Nombre de grammes
Chapitre 3: Distribution des probabilités

 La distribution de probabilités discrètes

 La distribution de probabilité d’une variable aléatoire décrit


comment sont distribuées les probabilités en fonction des
valeurs de la variable aléatoire

 La distribution de probabilité est définie par une fonction de


probabilité notée f(x).

 Cette fonction donne la probabilité que la variable aléatoire


prenne une valeur spécifique pour l’ensemble des valeurs
possibles
Chapitre 3: Distribution des probabilités

 L’utilisation des méthodes subjectives et de fréquence relative seront utiles


pour développer des distributions de probabilités sous forme de tableau
 La méthode classique d’attribution de probabilité aux valeurs que peut
prendre une variable aléatoire est applicable lorsque l’expérience génère
des valeurs équiprobables

Nombre obtenu Probabilité que X prenne la valeur


x
x f(x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Chapitre 3: Distribution des probabilités

 La méthode subjective d’attribution des probabilités peut conduire à


un tableau dans lequel figurent les valeurs que prendre la variable
aléatoire et les probabilités associées

 La personne qui développe la distribution des probabilités utilise


son meilleur jugement pour attribuer chaque probabilité

 Les probabilités dans ce cas seront différentes selon le jugement


subjectif de chaque personne
Chapitre 3: Distribution des probabilités

 La méthode des probabilités basée sur la fréquence relative est


appliquée lorsqu’on dispose de données suffisantes

 L’utilisation de la méthode de la fréquence relative pour développer


des distributions de probabilités discrète conduit à ce qui est appelé
une distribution discrète empirique

 Avec les quantités de données disponibles aujourd’hui issues des


scanners, les cartes de crédit, l’intelligence artificielle… ce type de
distribution est de plus en plus utilisé
Chapitre 3: Distribution des probabilités

 Une concession de voiture a fournit les données suivantes sur la


distribution des ventes de voitures par jour
 Considérons l’expérience consistant à observer une journée parmi
les 300 jours de l’opération de vente

Nombre de jours Nombre de voitures vendues


54 jours 0
117 jours 1
72 jours 2
42 jours 3
12 jours 4
3 jours 5
Chapitre 3: Distribution des probabilités

 La variable aléatoire est définie comme le nombre de voitures


vendues au cours de cette journée

 Utilisant la méthode des fréquence relatives pour attribuer les


probabilités aux valeurs de la variable aléatoire X

 On aura:

 f(0) donne la probabilité qu’aucune voiture n’a été vendue, f(1)


donne la probabilité qu’une voiture ait été vendue….
 f(0) = 54/300 = 0.18 la probabilité de ne vendre aucune voiture
Chapitre 3: Distribution des probabilités

 L’avantage de décrire une variable aléatoire et sa distribution de


probabilité, est de rendre facile la détermination de la probabilité
d’occurrence des différents événements qui peuvent présenter un
intérêt pour le responsable
x F(x)
0 0.18
1 0.39
2 0.24
3 0.14
4 0.04
5 0.01

 On s’aperçoit que f(1) = 0.39 le nombre le plus probable de ventes


de voitures au cours d’une journée est 1
 Une fonction de probabilité d’une variable aléatoire discrète doit satisfaire
les deux conditions suivantes :
f(x) ≥ 0 (i)
∑f(x) = 1 (ii)

 Ces relations sont analogues aux deux conditions de base, déterminant


l’attribution des probabilités aux résultats d’une expérience. (Chap 1)
 Dans le tableau précédent , nous voyons que les probabilités de la variable
aléatoire X satisfont la condition (i); f(x) est supérieure ou égale à 0 pour
toutes les valeurs x de X. De plus, la somme des probabilités est égale à 1
(ii).
 Ainsi, la fonction utilisée est une véritable fonction de probabilité discrète.
Il existe une formule qui associe la fonction de probabilité f(x) à chaque
valeur x de X et qui est souvent utilisée pour décrire les distributions de
probabilité.
L’exemple le plus simple d’une distribution de probabilité discrète donnée par
une formule est la distribution uniforme discrète, sa fonction de
probabilité est :

Par exemple, considérons l’expérience d’un lancer de dé et définissons la


variable aléatoire X comme étant le nombre qui apparaît sur la face
supérieure. Elle peut prendre 6 valeurs différentes : x = 1,2,3,4,5,6. Ainsi,
la fonction de probabilité de cette variable aléatoire est

f(x) = 1/6 pour x= 1,2,3,4,5,6


Les distributions de probabilité les plus répandues sont
généralement spécifiées par une formule.

Trois cas importants sont les lois de probabilité binomiale, de


Poisson et hypergéométrique. ( à voir plus tard)
Espérance mathématique et variance

1. Espérance mathématique
L’espérance mathématique ou la moyenne d’une variable aléatoire est une
mesure de tendance centrale. L’expression mathématique de l’espérance
d’une variable aléatoire discrète X est :
E(X)= µ = ∑x f(x)
Il s’agit d’une moyenne pondérée des valeurs que peut prendre la variable
aléatoire. Les poids correspondent aux probabilités.
Les notation E(x) et µ décrivent toutes les deux l’espérance mathématique
d’une variable aléatoire
Cette équation montre que pour calculer l’espérance mathématique d’une
variable aléatoire discrète, on multiplie chaque valeur de la variable
aléatoire par la probabilité f(x) correspondante et on additionne les
différents produits.
Application

 Calcul de l’espérance mathématique du nombre d’automobiles vendues au


cours d’une journée chez la concession de voitures
x f(x) xf(x)
0 0.18 0*0.18=0
1 0.39 1*0.39=0.39
2 0.24 2*0.24=0.48
3 0.14 3*0.14=0.42
4 0.04 4*0.04=0.16
5 0.01 5*0.01=0.05

Total = 1 1.50

E(X)= µ = ∑x f(x)
2. La variance

Alors que l’espérance mathématique fournit la valeur moyenne de la


variable aléatoire, on a souvent besoin d’une mesure de dispersion
ou de variabilité.

Nous utilisons la variance pour résumer la dispersion des valeurs d’une


variable aléatoire.

L’expression mathématique de la variance d’une variable aléatoire est :

Var(X) = σ2 = ∑ (x- µ) 2 f(x) (iii)


La variance est une somme pondérée des écarts au carré d’une variable
aléatoire par rapport à sa moyenne. Les pondérations correspondent
aux probabilités.

Comme le montre la formule (iii) une part essentielle de la formule de


la variance est l’écart entre une valeur particulière de la variable
aléatoire et sa moyenne, x- µ. Dans le calcul de la variance d’une
variable aléatoire, les écarts par rapport à la moyenne sont élevés au
carré pondérés par la valeur de la fonction de probabilité associée.

La somme de ces écarts au carré pondérés forme la variance


Calcul de la variance du nombre d’automobiles vendues au cours
d’une journée chez la concession de voitures

x x- µ (x- µ) 2 f(x) (x- µ) 2 f(x)

0 0-1.5=-1.5 2.25 0.18 2.25*0.18=0.4050


1 1-1.5=-0.5 0.25 0.39 0.25*0.39=0.0975
2 2-1.5=0.5 0.25 0.24 0.25*0.24=0.0600
3 3-1.5=1.5 2.25 0.14 2.25*0.14=0.3150
4 4-1.5=2.5 6.25 0.04 6.25*0.04=0.2500
5 5-1.5=3.5 12.25 0.01 12.25*0.01=0.1225
Total = 1 1.2500

Var(X) = σ2 = ∑ (x- µ) 2 f(x)


La loi binomiale
 La Distribution de probabilité discrète a de nombreuses applications qui
sont associées à une expérience à plusieurs étapes, appelée expérience
binomiale.
 Une expérience binomiale possède 4 caractéristiques :
1. c‘est une série de n tirage identiques.
2. deux évènements sont possibles à chaque tirage ( un est dit succès l’autre échec)
3. La probabilité de succès (p) ne se modifie pas d’un tirage à l’autre et donc la
probabilité d’échec (1-p) ne se modifie pas non plus.
4. Les tirages sont indépendants.

Si les propriétés 2,3 et 4 sont satisfaites, on dit que les tirages sont générés
par un processus de Bernoulli.
Si la propriété 1 est également satisfaite : Expérience Binomiale
 L’intérêt d’une expérience binomiale est de connaître le nombre de succès
au cours de n tirages.

 Soit X le nombre de succès obtenus en n tirage. X = 0,1,2,3…,n. Puisque le


nombre de valeurs est fini, X est une variable aléatoire discrète.
 La distribution de probabilité associée à cette variable aléatoire est appelée
loi binomiale.

 On prend l’expérience qui consiste à passer 5 examens. À chaque examen


observe si l’étudiant réussit ou non.
 Nous nous intéressons au nombre de réussite au cours de ces 5 examens.
Cette expérience a-t-elle les propriétés d’une expérience binomiale?
Quelle est la variable aléatoire qui nous intéresse?
1. l’expérience consiste en 5 tirages identiques, chaque tirage correspond au
passage d’un examen.
2. Deux issues sont possibles à chaque tirage : validé : succès , NV : échec.
3. Les probabilités de succès et d’échec ne se modifient pas d’un tirage à
l’autre : p = 0.5 et 1-p = 0.5
4. Les tirages (lancers) sont indépendants. Le résultat d’un examen n’est pas
affecté par ce qui se passe lors des autres examens.

- Les propriétés d’une expérience binomiale sont satisfaites


- La variable aléatoire correspond ici au nombre de fois où l’étudiant valide
- X peut prendre les valeurs 0,1,2,3,4 ou 5.
 Considérons un représentant d’une société informatique qui se rend
chez 10 clients, sélectionnés de manière aléatoire. L’issue de chaque
entrevue est associée à un succès si le client achète le matériel et à un
échec dans le cas contraire.
 De par son expérience passée, p=0.10.
 En vérifiant les propriétés d’une expérience binomiale on observe que:
 Il s’agit de 10 tirage identiques ( 1 tirage = 1 personne contactée)
 Deux issues sont possibles : souscription (succès) sinon (échec)
 Les probabilités de succès et échec sont supposées être invariantes p=0.10 et
1-p=0.90
 Les tirages sont indépendants puisque les clients sont sélectionnés
aléatoirement
 Nous utilisons une formule mathématique spécifique pour calculer la
probabilité de x succès en n tirages : fonction de probabilité binomiale.

 Problème du magasin de parfum


 Considérons les comportements d’achat des 3 prochains clients qui entreront
dans le magasin.
 La probabilité qu’un client fasse un achat = 0.30, quelle est la probabilité que 2
des 3 clients suivants fassent un achat.
 L’expérience génère huit issues possibles avec : achat (S) non achat (E)
 Nous nous intéressons aux résultats de l’expérience avec deux succès parmi les
3 tirages .

La propriété 3 de l’expérience binomiale est appelée hypothèse de


stationnarité
Diagramme arborescent
1. trois tirages identiques, 1 tirage pour chaque client
2. Deux issues possibles : Achat (S) , Non achat (E)
3. P=0.30 et 1-p = 0.70
4. La décision d’achat de chaque client est indépendante des décisions des autres
clients

Les propriétés d’une expérience binomiale sont satisfaites

Le nombre de résultats de l’expérience qui donnent exactement x succès en n tirages


peut se calculer à partir de la formule suivante :

(1)


n! = n(n-1)(n-2)….(2)(1)

et par définition 0!=1


 Pour le magasin de parfum: pour obtenir 2 succès (x=2) de 3 tirages (n=3):

Donc 3 des résultats possibles fournissent 2 succès (SSE), (SES), (ESS)

 Pour obtenir 3 succès en 3 tirage :

Le seul résultat constitué de 3 succès est identifié par (SSS)


Pour déterminer la probabilité de x succès en n tirages, il faut connaître
également la probabilité associée à chacun des résultats de l’expérience.
 Multiplication des probabilités correspondantes à chaque résultat d’un
tirage pour trouver la probabilité d’une série particulière de succès ou
d’échec.
 p= 0.30 à chaque tirage
Premier Deuxième Troisième Résultat de Probabilité
client client client l’expérience
Achat Achat Pas SSE pp(1-p)=p2(1-p)= 0.063
d’achat

Achat Pas Achat SES p(1-p)p=p2(1-p)= 0.063


d’achat
Pas Achat Achat ESS (1-p)pp=p2(1-p)= 0.063
d’achat
 Les probabilités des trois résultats impliquant deux succès sont identiques.

 Dans une expérience binomiale, toutes les séries de résultats de tirage


impliquant x succès en n tirages ont la même probabilité d’occurrence qui
est égale à : px(1-p)(n-x) (2)

 Pour notre cas, tout résultat comprenant 2 succès parmi 3 tirages a une
probabilité égale à :
p2(1-p)(3-2)=(0.30)2*(0.70)1= 0.063
 La combinaison des deux équations (1) et (2) nous donne la fonction de
probabilité binomiale suivante:

 x nombre de succès
 p est la probabilité du succès lors d’un tirage
 n est le nombre de tirages
 f(x) est la probabilité de x succès en n tirage

 Pour une distribution de probabilité binomiale, X est une variable aléatoire


discrète ayant une fonction de probabilité f(x) applicable pour les valeurs
de x= 0,1,2,…,n.
Application

 Prenons l’exemple du magasin de parfum, calculons la probabilité :

 Qu’aucun client ne fasse pas d’achat


 Qu’un client fasse un achat
 Que deux clients fassent un achat
 Que les trois clients fassent un achat

La distribution de probabilité du nombre de client faisant un achat


(tableau) :
x f(x)
0
1
2

3
Total 1.000
 La fonction de probabilité binomiale peut être appliquée à toute expérience
binomiale.

 Si les 4 propriétés sont satisfaites avec n et p sont connues, nous pouvons


utiliser la fonction :

 Supposons maintenant que dans la cas du magasin, nous avons 10 clients au


lieu de 3 avec une expérience binomiale : n=10, x=4 et p=0.3.

 La probabilité que quatre clients sur dix fassent un achat est égale à :
Utilisation des tables de probabilité binomiales

 L'utilisation de ces tables est souvent plus facile que la formule de la fonction
précédente.

 Pour utiliser cette table, il faut spécifier les valeur n, p et x en fonction de


l’expérience binomiale qui nous intéresse.

 On prend l’exemple où : n=10, x=3 et p= 0.4; selon le tableau f(x)= 0.2150 (à


vérifier en utilisant la formule de la fonction)
Extrait de la table de probabilités binomiales
 D’après la même table, et pour le magasin, les valeurs de n, x et p
correspondant à f(4) = 0.2001 sont: n= 10, x= 4 et p= 0.30

 Alors que les tables de probabilités binomiales sont faciles à utiliser, il est
impossible d’avoir des tables avec toutes les valeurs possibles de n et p
Espérance mathématique et variance d’une loi binomiale

 Nous avons déjà présenté les calculs de l’espérance mathématique ainsi de


la variance d’une variable aléatoire discrète.

 Dans le cas particulier où la distribution de la probabilité de la variable


aléatoire est binomiale, avec un nombre de tirages n connu et une
probabilité de succès p connue, les formules générales de l’espérance et de
la variance sont simplifiées :

E(X)= µ = np
Var(X)= σ2 = np(1-p)
 Calculons le nombre moyen de clients qui effectuent un achat pour
l’exemple du magasin de parfum avec 3 clients :

 E(X) = np = 3(0.3) = 0.9

 Avec 1000 clients prévus qui entreront dans le magasin le mois prochain,
le nombre moyen d’acheteurs serait : µ = np = 1000(0.3) = 300

 Afin d’augmenter la moyenne des ventes, le Directeur doit inciter plus de


clients à entrer dans le magasin et/ou accroître la probabilité qu’un client
effectue un achat après être entré.
 Pour le magasin de parfum avec trois clients, la variance et l’écart type du
nombre de client effectuant un achat sont respectivement :
 σ2 = np(1-p) = 3(0.3)(0.7) = 0.63
 σ= = 0.79

 Pour les 1000 clients suivants :


 σ2 = np(1-p) = 1000(0.3)(0.7) = 210
 σ= = 14.49
La loi de Poisson
 On suppose une variable aléatoire discrète qui est souvent utile pour
décrire le nombre d’occurrences d’un évènement au cours d’un intervalle
de temps ou d’espace bien défini.

 Par exemple, la variable aléatoire en question peut être le nombre


d’arrivées de voitures à une station de service, le nombre de pannes sur
100 000 km pour une voiture, ou le nombre de fuites sur 100 km de
pipeline.

 Si les deux propriétés suivantes sont satisfaites, le nombre d’occurrences


est une variable aléatoire décrite par une loi (une distribution de
probabilité) de Poisson.

 La Loi de Poisson est souvent utilisée pour modéliser les taux d’arrivées
dans des situations de file d’attente.
Propriétés d’une expérience de Poisson

1. la probabilité d’une occurrence est la même dans deux intervalles de même longueur.
2. l’occurrence ou la non-occurrence d’un évènement dans un intervalle est
indépendante de l’occurrence ou la non-occurrence de cet évènement dans un autre
intervalle.

La fonction de probabilité de Poisson est donnée par l’expression suivante:

f(x) est la probabilité de x occurrences dans un intervalle


µ est l’espérance mathématique ou le nombre moyen d’occurrence dans un intervalle
e est le nombre d’Euler, vaut environ 2.71828
 Dans le cadre d’une Loi de Poisson, X est une variable aléatoire discrète
indiquant le nombre d’occurrences dans un intervalle. Puisqu’il n’ y a pas
de limite supérieure au nombre d’occurrences, la fonction de probabilité
f(x) est applicable pour les valeurs x= 0,1,2,… sans limite.

 Dans des applications pratiques, la valeur de X peut éventuellement être


tellement grande que f(x) est proche de zéro; la probabilité que X prenne
des valeurs supérieures devient négligeable.
Un exemple avec des intervalles temporels

 Supposons que nous nous intéressons au nombre d’arrivées au guichet


d’une banque, au cours d’un intervalle de 15 minutes, le matin, en
semaine.

 Si l’on suppose que la probabilité d’une arrivée est la même pour deux
intervalles de longueur égale et que l’arrivée ou la non-arrivée pendant
une période de temps est indépendante de l’arrivée ou la non-arrivée
pendant une autre période de temps.

 La fonction de probabilité de la loi de Poisson peut être appliquée.


 Supposons que ces hypothèses sont satisfaites et qu’une analyse des
données historiques révèle que le nombre moyen d’arrivées au cours d’un
intervalle de 15 minutes est de 10, dans ce cas la fonction de probabilité
suivante s’applique:

 La variable aléatoire est ici le nombre d’arrivées en 15 minutes.

 Si l’on veut connaître la probabilité de 5 arrivées en 15 minutes, on pose


x=5, ainsi :
 Bien que la probabilité ci-dessus soit déterminée par la fonction de
probabilité en posant µ=10 et x=5, il est plus facile de recourir à la table de
distribution de probabilités de Poisson.

 Cette table fournit les probabilités pour des valeurs particulières de x et µ.

 Pour utiliser la table des probabilités de Poisson, il suffit de connaître les


valeurs de x et µ.

 Par exemple, la probabilité de cinq arrivées en 15 minutes se lit à


l’intersection de la ligne correspondant à x=5 et de la colonne
correspondant à µ= 10.

 On obtient : f(x)= 0.0378


Extrait de table de probabilité de Poisson
Un exemple avec des intervalles de longueur ou de
distance


Considérons une application n’impliquant pas d’intervalle de temps, pour
laquelle la distribution de Poisson est utile.

 Supposons que nous nous intéressions à l’occurrence des défauts majeurs


sur une autoroute, un mois après sa réfection.

 On suppose que la probabilité d’un défaut majeur est la même sur deux
portions d’autoroute de longueur égale et que l’apparition d’un défaut sur
un intervalle est indépendante sur un autre intervalle.

 Ainsi, la distribution de probabilité de Poisson peut être appliquée.


 Supposons que les défauts majeurs apparaissent un mois après la réfection de
l’autoroute à un taux moyen de 2 défauts/km.

 Quelle est la probabilité qu’il n’ait pas de défaut majeur sur une distance de
l’autoroute d’une longueur de 3 km ?

 Puisque nous nous intéressons à un intervalle long de 3km, µ=(2défauts/km)


(3)=6 représente le nombre moyen de défauts majeurs sur une portion
d’autoroute de 3km.

 D’après la formule de la fonction de probabilité de Poisson, la probabilité qu’il


n’y ait aucun défaut majeur est égale à 0.0025 (à vérifier)
 Il est donc improbable qu’il n’y ait aucun défaut majeur sur cette portion
d’autoroute longue de 3 km.

 En réalité il y a une probabilité de 0.9975 (1-0.0025=0.9975) qu’il y ait au


moins un défaut majeur sur cette portion d’autoroute.
La loi Hypergéométrique

 La loi hypergéométrique est étroitement liée à la loi binomiale.

 La différence majeure entre ces deux lois est que : lorsqu’il s’agit d’une loi
hypergéométrique, les tirages ne sont pas indépendants, et la probabilité de
succès change d’un tirage à l’autre.

 La notation habituelle dans des applications de la loi hypergéométrique est


la suivante : r correspond au nombre d’éléments dans la population de
taille N qui sont considérés comme des succès.

 N-r correspond donc au nombre d’éléments dans la population de taille N


qui sont considérés comme des échecs.
 La fonction de probabilité hypergéométrique est utilisée pour calculer
la probabilité que, dans un échantillon de n éléments sélectionnés
aléatoirement sans remise, nous obtenions x éléments considérés comme
des succès et (n-x) éléments considérés comme des échecs.

 Pour que cela se réalise, il faut obtenir x succès parmi les r succès de la
population et n-x échecs parmi les N-r échecs de la population.

 La fonction de la probabilité hypergéométrique décrite ci-dessous fournit


la probabilité d’obtenir x succès dans un échantillon de taille n.
 Pour
 Où : x est le nombre de succès
n est le nombre de tirages
f (x) est la probabilité de x succès en n tirages
N est le nombre d’éléments dans la population
r est le nombre d’éléments dans la population appelés succès
 Notez que représente le nombre de façon de sélectionner un
échantillon de taille n parmi une population de taille N.

 Et représente de nombre de façon d’obtenir x succès parmi un nombre


total de succès r dans la population.

 Et représente le nombre de façons d’obtenir n-x échecs parmi un


nombre total d’échecs N-r dans la population.
 Dans le cadre d’une loi hypergéométrique, X est une variable aléatoire
discrète et la fonction de probabilité f(x) donnée est généralement
applicable pour des valeurs x = 0,1,2,….

 Cependant, seules les valeurs de X pour lesquelles le nombre de succès


observés est inférieur ou égal au nombre de succès dans la population ( )
et pour lesquelles le nombre d’échecs observés est inférieur ou égal au
nombre de succès dans la population ( n-x N-r ) sont valides.

 Si ces deux conditions ne sont pas satisfaites pour certaines valeurs de X,


alors f(x)=0 pour ces valeurs, indiquant que la probabilité que la variable
aléatoire X prenne cette valeur est nulle.
 Pour illustrer les calculs nécessaires lors de l’utilisation de la formule de la
fonction de probabilité hypergéométrique, considérons le problème de
contrôle de la qualité suivant :

 Les fusibles électriques produits par Ontario Electric sont conditionnés par
une boîte de douze.

 Supposons qu’un inspecteur sélectionne aléatoirement trois des 12 fusibles


contenus dans une boîte pour les tester.

 Si la boîte contient exactement cinq fusibles défectueux, quelle est la


probabilité que l’inspecteur trouve exactement un fusible défectueux
parmi les trois sélectionnés au hasard ?
 Dans cet exemple, n=3 et N=12. Avec r= 5 fusibles défectueux dans la
boîte. La probabilité de trouver x=1 fusible défectueux est :

 Supposons maintenant que nous voulions connaître la probabilité de


trouver au moins un fusible défectueux.
 La façon la plus simple de répondre à cette question consiste tout d’abord
à calculer la probabilité que l’inspecteur ne trouve aucun fusible
défectueux.
 La probabilité de x=0 est
 La probabilité de ne trouver aucun fusible défectueux étant égale à 0.1591,
on en conclut que la probabilité de trouver au moins un fusible défectueux
est de 1- 0.1591 = 0.8409.

 Ainsi il y a une probabilité relativement élevée que l’inspecteur trouve au


moins un fusible défectueux.

 La moyenne et la variance d’une distribution hypergéométrique sont


données par les formules suivantes :
 Dans l’exemple précédent, n=3, r=5 et N=12.

 Ainsi la moyenne et la variance du nombre de fusibles défectueux sont


égales à :

 L’écart type est égal à :


Remarques
 Considérons une distribution hypergéométrique avec n tirages.

 Soit la probabilité de succès au premier tirage.

 Si la taille de la population est importante, le terme de la formule de la


variance tend vers 1.

 Par conséquent, la moyenne et la variance se résument à E(X) = np et Var


(X)= np(1-p).
 Ces expressions sont celles de la moyenne et de la variance d’une distribution
binomiale.

 Lorsque la taille de la population est importante, une distribution


hypergéométrique peut être approchée par une distribution binomiale
avec n tirages et une probabilité de succès
La loi uniforme
 Considérons la variable aléatoire X qui représente la durée du vol en avion
entre Casablanca et Paris.

 Supposons que la durée du vol soit comprise entre 120 et 140 minutes.

 Puisque la variable aléatoire X peut prendre n’importe quelle valeur dans


cet intervalle de temps, X est une variable aléatoire continue et non pas
discrète.

 Supposons que les données actuelles sur la durée du vol nous permettent
de conclure que la probabilité que la durée du vol appartienne à un autre
intervalle d’une minute compris entre 120 et 140 minutes.
 Puisque tous les intervalles d’une minute, compris entre 120 et 140 minutes,
sont équiprobables, on dit que la variable aléatoire X suit une loi uniforme.

 La fonction de densité de probabilité, qui définit la loi uniforme de cette


variable aléatoire X, correspond à :

 Lorsque la probabilité est proportionnelle à la longueur de l’intervalle, la


variable aléatoire est distribuée de façon uniforme.
 La figure X est une représentation graphique de cette fonction de densité.

 De façon plus générale, la fonction de densité uniforme pour une variable


aléatoire X est obtenue en utilisant la formule suivante :

 Dans l’exemple de la durée du vol entre Chicago et New York : a= 120 et


b=140

 Comme nous l’avons dit en introduction, pour une variable aléatoire


continue, la probabilité correspond à la vraisemblance que cette variable
aléatoire prenne une valeur appartenant à un intervalle particulier.
 Dans l’exemple relatif à la durée du vol, on peut se demander quelle
est la probabilité que celle-ci soit comprise entre 120 et 130
minutes,

 C’est-à-dire quelle est la valeur de P(120 x 130).

 Puisque la durée du vol doit être comprise entre 120 et 140 minutes
et que les probabilités sont uniformément distribuées sur cet
intervalle, on pressent que P(120 x 130)= 0.50.
 Nous montrerons par la suite que cette probabilité est égale à l’aire
situé entre 120 et 130 dans la figure X
L’aire comme mesure des probabilités

 Considérons l’aire sous le graphique de f(x), entre 120 et 130,


représenté à la figure X.

 La partie considérée du graphique est rectangulaire. Par conséquent,


son aire est simplement égale à l largeur multipliée par la hauteur.

 Avec la largeur de l’intervalle égale à 10 (130-120=10) et la hauteur


égale à la valeur de la fonction de densité, f(x)= 1/20,

 Nous avons une aire de 0.50, (10*(1/20)= 10/20 = 0.50


 Quelle remarque pouvez-vous faire l’aire soue le graphique de f(x) et la
probabilité? Elles sont identiques, et c’est généralisable à toutes les
variables aléatoires continues.

 Une fois la fonction de densité f(x) identifiée, la probabilité que X


prenne une valeur comprise entre et est égale à l’aire sous le
graphique de f(x) comprise entre et

 Étant donné la distribution uniforme de la durée de vol, en utilisant


l’interprétation de l’aire en terme de probabilité, on peut répondre à un
certain nombre de question en matière de probabilité concernant la durée
de vol

 Par exemple, quelle est la probabilité que la durée de vol soit
comprise entre 128 et 136 minutes ?
 La largeur de l’intervalle est égale à 8 (136-128=8). Avec une
hauteur uniforme de 1/20,
La loi normale

 La loi la plus importante pour décrire une variable aléatoire


continue
 Très utilisée dans l’inférence statistique
 Elle fournit une description des résultats possibles obtenus grâce à
un échantillon
La loi normale

La courbe normale:
 La loi normale est représentée par une courbe en forme de

cloche. La fonction de densité de probabilité qui définit la


courbe en forme de cloche de la loi normale est la suivante:

 µ: la moyenne
 σ : écart type
 Π = 3.14159
 E = 2.71828
La loi normale

La loi normale est caractérisée par les éléments suivants:


 Il existe une famille entière de lois normales. Elles se différencient
par leur moyenne et leur écart type
 Le point le plus élevé de la courbe correspond à la moyenne qui
est également la médiane et le mode de la distribution
La loi normale

 La moyenne de la distribution peut être négative, nulle ou positive

 La distribution normale est symétrique: la courbe à gauche de la


moyenne correspond à l’image inversée de la courbe à droite de la
moyenne. Les queues de la courbe s’étendent à l’infini de chaque
côté et théoriquement, ne touchent jamais l’axe horizontal. La
distribution étant symétrique, son coefficient d’asymétrie est nulle
La loi normale

 L’écart type détermine la largeur et le degré d’aplatissement de la


courbe. Plus l’écart type est grand, plus la courbe sera large, aplatie,
traduisant ainsi une plus grande dispersion des données

 Les probabilités d’une variable aléatoire normale sont données par


l’aire sous la courbe. L’aire totale située sous la courbe d’une
distribution de probabilité normale est égale à 1. puisque la
distribution est symétrique, l’aire sous la courbe à gauche de la
moyenne est égale à 0.5 et l’aire sous la courbe à droite de la
moyenne à 0.5 également
La loi normale centrée réduite

 Une variable aléatoire qui a une distribution de probabilité normale


de moyenne nulle et d’écart type égale à 1, suit ce que l’on
appelle une loi normale centrée réduite.
 La lettre Z est habituellement utilisée pour désigner cette variable
aléatoire normale particulière
 Puisque µ = 0 et σ = 1, l’expression de densité normale centrée
réduite est plus simple:
La loi normale centrée réduite

 Comme pour les autres variables aléatoires continues, les


probabilités d’une loi normale sont obtenues en calculant l’aire sous
la courbe de la fonction de densité.
 Ainsi, pour trouver la probabilité qu’une variable aléatoire normale
prenne une valeur appartenant à un intervalle donné, nous devons
calculer l’aire sous la courbe normale dans cet intervalle
 Les 3 types de probabilités à calculer sont:
 La probabilité que la variable aléatoire centrée réduite Z soit

inférieure ou égale à 1
 La probabilité que la variable Z soit comprise entre deux valeurs

 La probabilité que la variable Z soit supérieure ou égale à une

certaine valeur
La loi normale centrée réduite

 Cas 1: calcul de la probabilité que la valeur z d’une variable


aléatoire normale centrée réduite Z soit inférieure à 1: P (z ≤ 1)
 La probabilité cumulée correspond à l’aire sous la courbe normale à
gauche de z = 1
La loi normale centrée réduite

 On se référant à la table, la probabilité cumulée correspondant à z =


1 située dans la table à l’intersection de la ligne intitulée 1,0 et de la
colonne intitulée 0,00.
 A cette intersection se trouve la valeur 0,8413, ainsi :
P ( z ≤ 1) = 0.8413

Z 0,00 0,01 0,02


.
.
0.9 0.8159 0.8186 0.8212
1.0 0.8413 0.8438 0.8461
1.1 0.8643 0.8665 0.8686
1.2 0.8849 0.8869 0.8888
.
P ( z ≤ 1)
La loi normale centrée réduite

 Cas 2: Calcul de probabilité pour une valeur de la variable aléatoire


normale centré réduite comprise entre -0.50 et 1.25 ; c’est à dire P(-
0.50 ≤ z ≤ 1.25)
La loi normale centrée réduite

 Trois étapes sont nécessaires au calcul de cette probabilité.


 On doit trouver l’aire sous la courbe normale à gauche de z = 1.25
 Ensuite nous trouvons l’aire sous la courbe normale à gauche de z
= -0.50.
 Enfin nous soustrayons l’aire à gauche de z = -0.50 à l’aire à gauche
de z = 1.25 pour trouver P(-0.50 ≤z ≤1.25)
 Dans la table, nous nous intéressons à l’intersection de la ligne 1.2
et la colonne 0.05. elle donne la valeur P(z ≤1.25)=0.8944
 Pour trouver l’aire sous la courbe à gauche de z = -0.50 nous
cherchons l’intersection de -0.5 et 0.00 ce qui donne P(z ≤-0.50) =
0.3085
 P(-0.50 ≤z ≤1.25) = P(z ≤1.25) – P(z ≤-0.50)
= 0.8944 - 0.3085 = 0.5859
La loi normale centrée réduite

 Cas 3: pour calculer la probabilité pour qu’une valeur de la variable


aléatoire normale centrée réduite soit supérieur
 Supposons qu’on calcule la probabilité pour obtenir une valeur z
supérieure ou égale à 1.58 P(z≥1.58)
 La valeur située à l’intersection 1.5 et 0.08 est égal à 0.9429
 P(z<1.58) = 0.9429
 Cependant, puisque l’aire totale sous la courbe normale est égale à 1 on a
P(z≥1.58) = 1 – 0.9429 = 0.0571
La loi normale centrée réduite

 Dans les opérations précédentes, nous avons calculé les probabilités


à partir des valeurs z spécifiques
 Dans certaines situations, on connait la probabilité mais pas la
valeur z correspondante
 Exemple:
 Supposons que nous voulions trouver une valeur z telle que la
probabilité correspondante soit égale à 0.10
 Cet exemple est l’inverse des exemples précédents
 Pour cela, on utilise la table des probabilités de la loi normale
centrée réduite
La loi normale centrée réduite

 Rappelons que la table fournit l’aire sous la courbe à gauche d’une


valeur particulière de la variable aléatoire normale Z
 Nous savons que l’aire dans la queue droite de la courbe est égale à
0.10
 Donc, l’aire sous la courbe à gauche est égale à 0.9
 En recherchant dans la table, nous trouvons que 0.8997 est la valeur
z la probabilité cumulée la plus proche de 0.9
Z 0.06 0.07 0.08 0.09
1,0 0.8554 0.8577 0.8599 0.8621
1,1 0.8770 0.8790 0.8810 0.8830
1,2 0.8962 0.8980 0.8997 0.9015
1,3 0.9279 0.9147 0.9162 0.9177

Valeur de la probabilité cumulée la plus proche de 0.9


La loi normale centrée réduite

 La valeur associée à cette probabilité est 1.28 (intersection de 1.2 et


0.08)
 Une aire d’environ 0.9 se situe à gauche de 1.28
 Donc, il y a une probabilité de 0.10 que z soit supérieure à 1.28

 Synthèse: 2 cas de figures


 On spécifie la valeur Z et on utilise la table pour déterminer la probabilité
correspondante
 On spécifie une aire ou une probabilité et on utilise la table pour déterminer
la valeur Z correspondante
La loi normale centrée réduite

Calcul des probabilités d’une loi normale quelconque


 Nous avons traité la loi normale centrée réduite parce que les
probabilités de toute loi normale sont calculées à partir de cette loi
centrée réduite
 Lorsqu’on a une distribution normale de moyenne µ et d’écart type
σ, on la convertie en distribution normale centrée réduite
 Ensuite on utilise la table des probabilités normales centrées
réduites et les valeurs appropriées de Z pour trouver les probabilités
 La formule utilisée pour convertir toute variable aléatoire normale
X, de moyenne µ et d’écart type σ, en une variable aléatoire centrée
réduite est
La loi normale centrée réduite

 Si la variable aléatoire X est égale à sa moyenne, alors la valeur de


la variable aléatoire Z est z = (µ - µ / σ) = 0

 Si la variable aléatoire est égale à sa moyenne µ, Z est égale à sa


moyenne 0

 Supposons que la variable aléatoire X soit égale à sa moyenne plus


un écart type (x= µ + σ), on appliquant la formule:
Z = [(µ + σ) - µ] /σ = σ/ σ = 1

 C’est-à-dire si x = µ + σ, z = 1 (z est le nombre d’écarts type qui


séparent la variable aléatoire X de sa moyenne µ)
La loi normale centrée réduite

 Pour illustrer le fait que cette conversion nous permet de calculer


des probabilités associées à toute distribution normale, supposons
que la distribution normale soit de moyenne µ = 10 et d’écart type σ
= 2, quelle est la probabilité que la variable aléatoire que la variable
aléatoire X soit comprise entre 10 et 14?

 En utilisant la formule, on a:
 Pour que x = µ=10 et z = (x- µ)/σ = (10-10)/2 = 0
 Pour x = 14, z = (14-10)/2=2

 Ainsi, la probabilité que la variable aléatoire X soit comprise entre


10 et 14 est équivalente à la probabilité que la variable aléatoire Z
soit comprise entre 0 et 2
La loi normale centrée réduite

 La probabilité que nous recherchons est la probabilité que la


variable aléatoire X soit comprise entre sa moyenne et deux écarts
type au dessus de sa moyenne

 En utilisant z = 2 et la table des probabilités normales centrées


réduites, on trouve que P( z ≤ 2) = 0.9772 et P( z ≤ 0)=0.5

 P( 0 ≤ z ≤ 2)= P( z ≤ 2) – P( z ≤ 0) = 0.9772 – 0.5 = 0.4772

 Par conséquent la probabilité que la variable aléatoire X soit


comprise entre 10 et 14 est égale à 0.4772
La loi normale centrée réduite

 Supposons que la société GENERAL ait conçu un nouveau modèle


de pneu
 Les responsables pensent que la garantie du kilométrage effectué
par un pneu est un facteur déterminant dans la vente du produit
 Ils veulent obtenir des informations en termes de probabilités sur le
nombre de kilomètres que peut effectuer le nouveau pneu

 À partir des tests, les ingénieurs estiment que µ = 36 500 km et


σ=5000 km et que l’on peut supposer que la distribution est normale

 Quelle est la probabilité que le kilométrage effectué par un pneu


excède 40 000 km?
La loi normale centrée réduite

 Pour x = 40 000, z = x- µ/ σ = 40 000 – 36 500 /5000 = 0.70


 On constate qu’une valeur de la variable aléatoire X égale à 40000
correspond à une valeur de la variable normale centrée réduite z
égale à 0.70
 En utilisant la table de probabilité centrée réduite, nous constatons
que l’aire sous la courbe normale à gauche de z=0.70 est égale à
0.7580
 Ainsi, 1-0.7580 = 0.2420 est la probabilité que z soit supérieure à
0.70 et donc x soit supérieure à 40 000
 On a 24,2% des pneus qui aurons un kilométrage supérieure à
40000 km
La loi normale centrée réduite

 Supposons que GENERAL décide la mise en place d’une garantie qui


offre le remplacement des pneus à tarif réduit si les pneus originaux
ne dépassent pas le km garanti

 Quelle devrait être le kilométrage garanti pour qu’au plus 10% des
pneus n’effectuent pas le nombre de kilomètres garantis?

 Nous cherchons la valeur z qui correspond à la probabilité de 10%


 En utilisant la table, nous constatons que z= -1.28 est la valeur de la
variable aléatoire normale centrée réduite correspondant au
kilométrage garanti souhaité

 Z = z - µ/ σ = -1.28 ; x- µ = -1.28 σ ; x = µ -1.28 σ


La loi normale centrée réduite

 X = 36 500 – (1.28*5000) = 30 100

 Ainsi, une garantie de 30 100 km satisfait la condition selon


laquelle 10% des pneus n’effectuent pas le nombre de kilomètres
garantis

 Nous constatons le rôle majeur des distributions de probabilités


dans le processus d’aide à la décision

 Une fois la distribution de probabilité établie pour une application


particulière, elle peut être utilisée pour obtenir des informations
probabilistes sur le problème
Merci de votre attention

Vous aimerez peut-être aussi