Vous êtes sur la page 1sur 18

Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

STATISTIQUES 2 (chap 4-6 )

Chapitre 4 : Variables aléatoires discrètes


Mots-clés : variable aléatoire, loi, espérance, variance, fonction de répartition, couple de
variables aléatoires, covariance.

4.1. Définition
Jusqu'ici, nous nous sommes intéressés aux résultats de l'expérience aléatoire, alors qu'on peut être
intéressé plutôt par des valeurs associées à ces résultats. Exemple : les paris : on lance un dé, et on
associe à chaque résultat un gain. C'est ce gain qui sera étudié.
Une variable aléatoire X est une fonction qui associe à chaque résultat (face du dé, nom de la
personne, ...) d'une expérience aléatoire un nombre (gain, n° sécu, ...).
- On note X la v.a.
- On note X = x l’évènement : « le gain vaut x »
(c'est à dire qu'un des résultats associés au gain x s'est réalisé : x est une réalisation de X ).

- On note P(X=x) la probabilité d'avoir le gain x.


Exemple :
En associant au résultat du dé un gain égal à 10 fois le nombre de points apparus, on définit une v.a X,
qui peut prendre les valeurs x1=10, x2=20, x3=30, x4=40, x5=50, x6=60.
Si on change de règle, en définissant par exemple le gain : « +10 si résultat vaut 6, -2 sinon », on
définit une autre v.a Y, dont les valeurs possibles sont 10 et -2.
La question est, bien sûr :
Quelles sont les valeurs possibles de X, et avec quelles probabilités ?
Cette information est la loi de la v.a.
Dans un premier temps, nous considérons que X prend des valeurs discrètes, en nombre finies : on
parle de « variable aléatoire discrète (v.a.d) finie » .
Les valeurs possibles forment donc une liste : (x1, x2, … , xn). Les probabilités associées aussi. On note
cela dans un tableau, semblable donc en tout point à un tableau de fréquences en statistiques.

4.2 Loi d’une v.a.d finie


La loi, ou distribution d'une v.a X est la fonction x ¾® P(X=x) , définie sur l’ensemble des valeurs
possibles de X.
C'est connaître la valeur de la probabilité P(X=xi) pour toutes les valeurs xi que peut
prendre X.
Dans les cas simples (X à valeurs discrètes finies), on la donne par un tableau contenant x1, ..., xn , les
différentes valeurs que peut prendre X et les probabilités associées, notées P(X=x) :
L’exemple du dé donne :
y
x 10 20 30 40 50 60 Pour Y : -2 10
P(Y=y)
P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 5/6 1/6

Exemple fondamental :
On lance deux dés, et on définit trois variables aléatoires :

19
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

S : somme des points obtenus


M : maximum des deux résultats
D : différence (en valeur absolue) des deux résultats

Donner leur loi respective (par un tableau à chaque fois).

Voir CM

Réponse : quelle est la loi de S ?


c'est deux choses :
liste des valeurs possibles ( de 2 à 12)
liste des probas associées
Conseil : il est nécessaire d'écrire la liste des 36 résultats possibles : L'univers :
(notation abrégée)
11 12 13 14 15 16
21 22 23 24 25 26
31 32 33 34 35 36
41 42 43 44 45 46
51 52 53 54 55 56
61 62 63 64 65 66

Loi de S :

par exemple : Proba (S=2) = nbre cas fav / nbre cas possible = 1/36

Valeurs possibles si 2 3 4 5 6 7 8 9 10 11 12
proba associée : 0,03 0,06 0,08 0,11 0,14 0,17 0,14 0,11 0,08 0,06 0,03

On peut en faire un représentation par un diagramme en bâtons :

exemple 1 : v.a.d S
0,18
0,16
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
2 3 4 5 6 7 8 9 10 11 12

on parle aussi de DISTRIBUTION de probabilité

20
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

On va maintenant chercher à résumer ces informations par quelques paramètres :

4.3. Paramètres d’une v.a :


En notant pi pour P(X=xi), probabilité d’avoir la i-ème valeur possible de X :

Espérance d'une v.a X : E ( X ) = å xi P( X = xi ) = å xi pi , aussi noté X .


i i
C’est la valeur « attendue ».
valeur moyenne attendue : E(S) = 0,03*2 + 0,06*3 +... + 0,06*11 + 0,03*12 = 7
C'était évident , par symétrie !!

Variance d'une v.a X :


V(X) = å (x
i
i - E ( X ))² ´ P( X = xi ) = å (x
i
i
"
- E ( X ))² pi = ∑ 𝑝! 𝑥! − (𝐸(𝑋))"

ou encore : 𝑉(𝑋) = 𝐸(𝑋 " ) − (𝐸(𝑋))"


Comme en statistique, la variance mesure la dispersion, tout comme l’écart-type :

Ecart-type d’une v.a X : c’est la racine carrée de la variance : V(X) = ( s (X) )²

Exercice :
Calculer espérance et variance pour les trois variables aléatoires, S, M , et D précédentes.

Propriétés :
Pour tout réel a, on a :
E(X+a) = E(X) + a E(aX) = aE(X) V(X+a) = V(X) V(aX) = a²V(X)

Concrètement :
une variable aléatoire : c'est une donnée qui varie dans le
problème, et qui nous intéresse ...

21
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Exemple traité :
(D'après "les grands sujets du DCG", ed Gualino, K. Meghraoui, 2014)
Lucie est une entreprise qui fabrique des biscuits secs. La vente d'un paquet de biscuits
permet un gain de 0,60 €. Par contre, en cas d'invendu, le paquet doit être stocké, ce qui
coûte 0,06 € (par paquet).
Voici un modèle des demandes possibles, avec leur probabilité de réalisation :
tableau décrivant la variable aléatoire "Demande" :
Listes des valeurs possibles (ligne 1) et les probas associées (ligne 2) donc TOUT CE QUI NOUS INTERESSE
(LOI de la variable aléatoire "Demande" , on dit aussi "distribution" de la v.a )
niveau de la
Demande 0 10 000 20 000 30 000 40 000
probabilité de
réalisation 12,5% 20% 35% 20% 12,5%
ce tableau peut être : lourd / fastidieux / ...
è on peut le REPRESENTER (figure) et/ou le RESUMER (par des paramètres : moyenne (Espérance), variance,
écart-type
a) Calculer l'espérance de la variable aléatoire "niveau de la demande", et
l'interpréter.
E(D) = somme des "pixi" = somme des produits : valeurs*proba :
E(D) = 0,125*0 + 0,20*10 000 +0,35* 20 000 + 0,20*30 000 +0,125* 40 000 = 20 000
évidemment .... (par symétrie du tableau)

b) Si l'entreprise dispose, en début de période, d'un stock de 20 000 paquets, quels sont les
différents gains possibles, selon les valeurs de la demande ?

Répondre en complétant le tableau :


niveau de la
demande 0 10 000 20 000 30 000 40 000
gain (*) -1200 (**) 5400 12 000€ 12 000€ 12 000€

(*) : on ne vend rien , donc une perte de 20 000*0,06 = 1200€


(**) : on vend 10 000 (gain : 10 000*0,6 = 6000€ , mais perte de 10 000*0,06=600€ :
Total : 5400€

niveau de la
Demande 0 10 000 20 000 30 000 40 000
gain -1200€ 5400€ 12 000€ 12 000€ 12 000€
probabilité de
réalisation 12,5% 20% 35% 20% 12,5%

Quelle est l'espérance de la variable aléatoire gain (ou "gain espéré") ?


on calcule la moyenne du gain espéré : notons G le gain
E(G) = 0,125*(-1200)+ 0,20*5400 +0,35* 12 000 + 0,20*12 000 +0,125* 12 000
=0,125*(-1200)+ 0,20*5400 +0,675* 12 000 = 9030 €
on aura un gain moyen de 9030€
BIEN COMPRENDRE : c'est une valeur "espérée" qui n'est pas atteinte, mais correspond à un gain moyen sur une
longue période ...

c) Faire de même pour les autres niveaux de stocks :


Espérance
niveau de la demande : de gain :
GAIN 0 10 000 20 000 30 000 40 000
Stock 0 0€ 0€ 0€ 0€ 0€ 0€
22
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

disponible 10 000 -600€ 6000€ 6000€ 6000€ 6000€ 5175 €


20 000 -1200€ 5400€ 12 000€ 12 000€ 12 000€ 9030 €
30 000 -1800€ 4800€ 11400€ 18 000€ 18 000€ 10 575
(*) : 10 800
40 000 -2400€ 10 800€ 17 400€ 24 000€
4200€
note sur ligne 3 :
6000 – 20000*0,06 = 6000 – 1200 = 4800
12 000 – 10000*0,06 = 12000 – 600 = 11 400€
(*) = 6000 – 1800 = 4200
puis : 12000 – 1200 = 10 800. et 18000 – 600 = 17 400
ligne 2 : gain espéré : E(G)
= 0,125*(-600)+ 0,875*6000 =
ligne 4 : etc ....
d) Conclure : quel niveau de stock (entre 0, 10 000, 20 000, 30 000 et 40 000) permet de
maximiser le gain espéré ?
on a intérêt à avoir un stock de 40 000 pièces, car cela maximise le gain espéré , avec
une valeur de 10 800€

4.4. Fonction de répartition


On appelle fonction de répartition la fonction qui associe à une valeur x la probabilité P( X£x ) que X
soit inférieur à x :
F(x) = P( X £ x ).
Pour une v.a discrète, c'est donc la somme des probas P(X=xi) pour tous les xi inférieurs (ou égal) à x.
Elle correspond à la notion de fréquences cumulées croissantes en statistique.
C'est une fonction en escalier, croissante, positive, dont la limite en +¥ vaut 1.
On a : (a<b) : F(b) = P(X£b) = P(X£a ou a<X£b) = P(X£a) + P(a<X£b), donc :
P( a<X£b ) = F(b) - F(a). De plus : P(X>a) = 1 – P( X£a ) = 1 - F(a)

Exemple :
Représenter la fonction de répartition des v.a S, M et D de l’exemple

4.5. Cas de deux variables aléatoires


Si X et Y sont deux variables aléatoires définies sur le même univers, on peut les étudier
simultanément :
Exemple
Un magasin vend deux type d’articles : A et B. La vente d’un article A rapporte 100 €, celle d’un
article B 200 €. On vend de 0 à 3 articles A et de 0 à 2 articles B par jour.
On note X et Y les variables aléatoires « gain réalisé par les ventes de A », « gain réalisé par les
ventes de B » en une journée, et on les décrit par le tableau :
Y\X 0 100 200 300 loi de Y
0 0.02 0.04 0.1 0.04
200 0.05 0.15 0.15 0.05
400 0.02 0.20 0.10 0.08
Loi de X
1) En calculant les distributions marginales, donner la loi de X et celle de Y
2) Calculer l’espérance, la variance, l’écart-type de X et Y.
23
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

3) Dresser la loi de Z=X+Y « gains réalisé sur toutes les ventes ». Calculer son espérance, sa
variance, son écart-type et comparer aux résultats précédents.

Généralisation :
Soient X et Y deux v.a.d finies définies sur le même univers W.
X pouvant prendre les valeurs (x1, x2, … , xp) , Y pouvant prendre les valeurs (y1, y2, … , yq) :
X(W) = {x1, x2, … , xp } et Y(W) = { y1, y2, … , yq }
La probabilité que le couple (X,Y) prenne la valeur (xi, yj) s’écrit P( X= xi, Y=yj ) , notée pij
Bien sûr la somme des pij (somme sur les deux indices : i=1..p, j=1..q ) vaut 1.
La loi du couple (X,Y) est donc donnée par un tableau (matrice) à q lignes et p colonnes.
On retrouve alors les lois de X et Y seules en faisant les totaux aux marges du tableau, d’où le terme
de distributions marginales :
P(X= xi) = P(X= xi, Y=y1) + P(X= xi, Y=y2) + … + P(X= xi, Y=yq) (somme de la colonne i) noté
pi .
P(Y=yj) = P(X=x1, Y=yj) + P(X=x2, Y=yj) + … + P(X=xp, Y=yj) (somme de la ligne j) noté p . j

Covariance :
Pour le couple, on définit un nouveau paramètre, la covariance, par
Cov(X,Y) = E(XY) – E(X)E(Y) = åp xy
i, j
ij i j - ( å pi. xi )(å p. j yi ) = å pij xi y j - x y
i j i, j

Exercice :
Calculer la covariance des variables X et Y de l’exemple (directement, et avec Excel) :
-
Fonction de répartition :
C’est maintenant une fonction de deux variables : H( x, y) = P( X ≤ x, Y ≤ y )
Ainsi, dans l’exemple : H (300,100) = , H(100,200) = , H(200,100) =

4.6. Indépendance entre deux variables aléatoires

Définition : X et Y seront dites indépendantes si :


Pour toute valeur xi de X et toute valeur yj de Y, P(X=xi Ç Y=yj) = P(X=xi) ´ P(Y=yj)

C'est le cas lorsque les réalisations de X et de Y n'influent pas l'une sur l'autre.
Le contexte permet souvent de faire cette hypothèse.

Exercice :
Etablir le tableau décrivant la loi de probabilité du couple (X,Y) précédent, à partir des lois
marginales, si les variables X et Y avaient été indépendantes.

Y\X 0 100 200 300 loi de Y


0 0,20
200 0,40
400 0,40
Loi de X 0,09 0,39 0,35 0,17 1
Propriété : si X et Y indépendantes :
V(X+Y) = V(X) + V(Y) et E(X´Y) = E(X) ´ E(Y)

4.7. Opérations sur les variables aléatoires

24
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Si X et Y sont deux v.a définies sur le même univers W , et a,b deux nombres quelconques.
Si X est d’espérance E(X) et de variance V(X), et Y d’espérance E(Y) et de variance V(Y),
Alors une combinaison Z = aX+b , Z = X+Y , ou plus généralement Z = aX+bY est aussi une
variable aléatoire, qui a comme propriétés :

E(aX+b) = aE(X) + b V(aX+b) = a2V(X)


E(X+Y) = E(X) + E(Y) V(X+Y) = V(X) + V(Y)+ 2Cov(X,Y)
si indépendantes : V(X+Y) = V(X) + V(Y)
E(aX+bY) = aE(X) + bE(Y)
V(aX+bY) = a2V(X) + b2V(Y) + 2a.b.cov(X,Y)

4.8. Application à la Gestion


Voici quelques exemples de situations de gestion qui ont la particularité de faire intervenir plusieurs
variables aléatoires et donc d’utiliser ces propriétés :

Situation 1 :
Une entreprise fabrique deux produits, A et B. La demande du marché pour le produit A est 70 unité
par mois en moyenne, avec un écart-type de 6. Pour le produit B, elle est de 120 unités par mois, avec
un écart-type de 20.
Que peut-on dire de la demande globale des deux produits sur le marché ?

Situation 2 :
DEC est une entreprise qui fabrique des armoires et des bureaux.
Le chiffre d'affaires sur les ventes d'armoires est une variable aléatoire de paramètres :
m = 84960 et s = 22000 (en K€)
Le chiffre d'affaires sur les ventes de bureaux est une variable aléatoire de paramètres :
m' = 115500 et s' = 26000 (en K€)
Comment varie le chiffre d'affaires total ?

Situation 3 :
Une entreprise industrielle utilise pour sa production une pièce technique A, pour laquelle elle son
besoin hebdomadaire est une variable aléatoire de moyenne 125 et d’écart-type 10.
Que peut-on dire de ses besoins mensuels ?

Situation 4 :
Une entreprise fabrique un produit : le MAMO
L’entreprise vend en moyenne 300 unités du produit MAMO par an, avec un écart-type de 20.
Les coûts de production de MAMO se répartissent en :
50 000 € de frais fixes, 2 000 € par unité produite.
Le prix de vente unitaire d’un produit MAMO est 7 000 €.
Quels sont les paramètres (moyenne, écart-type) de chacune des variables aléatoires suivantes ?
CX : « coût de production des produits MAMO »
BX : « bénéfice réalisé par les ventes de produits MAMO »

Pour traiter ce genre de situation, il est donc essentiel de connaître les propriétés de ce paragraphe, qui
permettent de combiner plusieurs variables aléatoires.

EXERCICES :
Exercice 1 : traiter la situation 1 ci-dessus ...
Exercice 2 : traiter la situation 2 ci-dessus ...
Exercice 3 : traiter la situation 3 ci-dessus ...
Exercice 4 : traiter la situation 4 ci-dessus ...
25
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Chapitre 5 : Principales lois discrètes


Mots-clés : Epreuve de Bernoulli, tirage loi Binomiale, loi de Poisson, loi hypergéomètrique,
table d’une loi

5.1. Loi binomiale


Une épreuve de Bernoulli est une expérience aléatoire qui n'a que deux issues : le succès, avec une
probabilité p, ou l'échec, avec une probabilité q (q=1-p).
La variable aléatoire X associée est le nombre de succès :
X=1 si on a une réussite, avec une probabilité p, X=0 sinon, avec une probabilité q.
On calcule immédiatement :
E(X)=p V(X) = pq
On répète maintenant n épreuves de Bernoulli identiques et indépendantes, et on s'intéresse à la v.a
"nombre de succès apparus".
On dit alors que : X suit la loi binomiale de paramètres n et p, notée B(n,p).

une v.a X suit la loi binomiale de paramètres n et p, si elle vaut le nombre de succès
apparus dans une répétition de n épreuves de Bernoulli identiques et indépendantes .
La probabilité d'avoir k succès ( k entre 0 et n), notée P( X=k ), vaut alors :
𝑷(𝑿 = 𝒌) = 𝑪𝒌𝒏 . 𝒑𝒌 . 𝒒𝒏#𝒌
Les paramètres sont : 𝑬(𝑿) = 𝒏𝒑 , 𝑽(𝑿) = 𝒏𝒑𝒒 , 𝝈(𝑿) = 1𝒏𝒑𝒒
Exemples :
1. Un représentant de commerce visite 20 clients par jours. On suppose qu’à chaque visite, la
probabilité de conclure une vente est de 0,1.
Soit X la v.a « nombre de ventes conclues dans la journée » :
1) Quelle est la loi de probabilité de X ?
2) Quelle est la probabilité de conclure au moins 5 ventes ?
3) Que devient cette probabilité s’il visite non pas 20, mais 30 clients par jour ?
4) A partir de quel nombre de clients quotidiens la probabilité précédente dépasse-t-elle 0,25 ?
Réponses : (CM)

2. Un commerçant vend 6 ordinateurs analogues le même jour. La probabilité pour qu’un appareil soit
en bon état 5 ans plus tard est de 0.8. Calculer les probabilités pour que, 5 ans après :
¨ 4 ordinateurs (exactement) soient en bon état.
¨ Un au moins soit en bon état.
Réponses : (CM)

26
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Allure d’une distribution binomiale :


X suivant B(n,p) donné, on peut visualiser sur une même figure toutes les valeurs P(X=k) par un
diagramme en bâtons, si n n’est pas trop grand :
Par exemple la distribution des probabilités suivant la loi B(10 ; 0,4) à la forme :
0,3
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11

Attention aux valeurs en abscisses : Excel numérote à partir de 1 au lieu de 0 !


Alors que, pour p=0,3 , on a :
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11

On voit qu’à partir de k=7, les probabilités de l'événement « X=k » sont quasi-nulles.
Calcul de la loi binomiale B(n ; p) à l'aide du tableur EXCEL. :
Pour avoir dans une cellule donnée la valeur de P( X = k ) pour X suivant B(n ;p) on y écrit :
= LOI.BINOMIALE.N (k; n ; p ; FAUX).
FAUX : en l’absence de cette instruction, Excel, calcule les probabilités cumulées (fonction
de répartition), c’est à dire P( X £ k )
Source : http://www.assistancescolaire.com/eleve/1S/maths/reviser-le-cours/loi-binomiale-1s_mat_03

27
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

5.2. Loi de Poisson

Simon POISSON, Ecole Polytechnique de Paris, publie « Recherche sur la probabilité des jugements
en matière criminelle et civile » en 1837.

On va approximer la loi binomiale car elle présente certains inconvénients :


• les coefficients binomiaux sont lourds à calculer
• Avoir deux paramètres (n et p) ne permet pas de consulter facilement des tables.

Situation de Poisson :
Une v.a.d X à valeurs dans N, suit une loi de Poisson de paramètre m, si on a , pour toute valeur

entière k ;

𝑬(𝑿) = 𝒎 , 𝑽(𝑿) = 𝒎 , 𝝈(𝑿) = √𝒎

C'est lorsque un phénomène aléatoire se produit assez rarement sur une période : anomalies de
production, erreurs d'impression, réception d'appels téléphoniques par un standard, occupation d'un
guichet de vente, ... et sur lequel on dispose d’une seule information : le nombre moyen de
réalisation par période : m.
Les valeurs de P(X=k) sont rarement calculées : on les lit sur une table.
Réciproquement, un phénomène aléatoire discret pour lequel espérance et variance sont identiques
sera souvent considéré comme suivant une loi de Poisson.
Exemples :
1. Si l’on sait que le nombre moyen de clients à une caisse est de 8 par intervalles de 15 mn, on peut
calculer :
- la probabilité d’en avoir 10 dans cet intervalle : ______________
- d’en avoir moins de 6 dans cet intervalle : ___________________

2. Si l'on sait qu'une production de tee-shirts a 3% de défauts, et que l'on étudie des lots de 100, il y a
en moyenne 3 défauts par lots. La variable aléatoire X : "nombre de tee-shirts défectueux dans un lot"
peut être considérée comme suivant la loi de Poisson de paramètre 3.
(La situation s'apparente en fait à la loi binomiale avec n élevé, c'est donc une approximation)
Immédiatement : E(X) = V(X) = 3.
Et, par lecture de table on a, par exemple : P(X=4) = 0.168 P(X=9) = 0.003

Calcul de la loi de Poisson à l'aide du tableur EXCEL. :


Pour avoir dans une cellule la valeur de P( X = k ) pour X suivant P(m) on y écrit :
= LOI.POISSON.N (k; m ; FAUX).

Poisson, m=2 Poisson, m=3


0,300 0,250
0,200
0,200 0,150
0,100
0,100
0,050
0,000 0,000
1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11

28
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Attention aux valeurs en abscisses : Excel numérote à partir de 1 au lieu de 0 !

Poisson, m=10
0,150

0,100

0,050

0,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

TABLE DE LA LOI de POISSON (paramètre : lambda)

29
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

5.3. Somme de variables aléatoires de Poisson


Théorème :
Si X et Y sont deux v.a indépendantes, qui suivent une loi de Poisson
de paramètre m et m’ respectivement, alors X+Y suit également
une loi de Poisson, de paramètre m+m’ .

5.4 Loi de Poisson comme approximation de la Loi binomiale :

La loi binomiale, pour n grand, s’approche par la loi de Poisson :


on remplace alors B(n,p) par P(m), où m = np.
Dans la pratique, on le fait généralement dès que n>50 et np de l'ordre de quelques unités.
(la marge d'erreur est inférieure à 20% pour n>100, à 10% pour n>180, à 5% pour n>350).

5.5. Variante 1 : Loi géométrique

Dans la même situation que pour la loi binomiale, on peut s'intéresser au : RANG DU
PREMIER SUCCES (c'est à dire la probabilité d'avoir eu k-1 échecs, puis un succès).

Paramètres :
Notons T cette v.a. La probabilité d'avoir k-1 échecs, puis un succès au rang k ( k entre 1 et l'infini !),
notée P( T=k ), vaut alors (puisque les tirages sont indépendants) :
𝑷(𝑻 = 𝒌) = (𝟏 − 𝒑)𝒌#𝟏 . 𝒑
𝟏#𝒑 𝟏#𝒑
Les paramètres sont : 𝑬(𝑻) = 𝟏/𝒑 , 𝑽(𝑻) = 𝒑𝟐
, 𝝈(𝑻) = 8 𝒑𝟐

Propriété de Markov
Une propriété remarquable est que : P(( T > n+k ) sachant que (T>n) ) = P( T > k )
Autrement dit :
Savoir qu'il y a eu n échecs précédemment ne change au rien à la probabilité d'en avoir k
devant soi .
Ou encore : le hasard n'a pas de mémoire.
Cette propriété "d'absence de mémoire" est utilisée dans les modèles décrivant les processus aléatoires
complexes de la finance, par exemple.

5.6. Variante 2 : Loi hypergéométrique


Nous avons vu que, dans le cas de tirages (modèle des urnes) avec remise, les tirages étant bien
identiques et indépendants, on utilise la loi binomiale :
Une urne contient 45 boules rouges et 5 boules blanches : on en tire avec remise, successivement, 3
boules, et on s'intéresse au nombre de boules blanches tirées.
Si note X ce nombre, on voit que X suit une loi binomiale de paramètres n=3 et p = 5/50 = 0,1.

Mais, dans la pratique, les éléments interrogés dans un sondage, par exemple, ne sont pas
réinterrogés ensuite : il s'agit alors de tirages SANS remises.

La loi hypergéométrique traite ce cas :

30
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Imaginons une urne contenant N objets, dont un certain nombre K possèdent une certaine
propriété ("être blanche" dans l'exemple précédent). On fait un tirage sans remise de n
objets, appelé « échantillon »: combien parmi eux possèdent la propriété étudiée ?
Ce nombre est une variable aléatoire X, qui prend au minimum la valeur 0, et au maximum :

- la valeur n (tous les objets de l’échantillon ont la propriété), si n £ K


- la valeur K ( l’échantillon contient tous les objets ayant la propriété), si K £ n
Donc la valeur maximale est : m=min(K,n)
on a alors, en posant p = K/N (proportion d'individus ayant la propriété) :

X suit la loi hypergéométrique de paramètres (N,K,n), définie par :


𝑪𝒌𝑲 × 𝑪𝒏$𝒌
𝑵$𝑲 𝑵−𝒏
𝑷(𝑿 = 𝒌) = , 𝑬 (𝑿 ) = 𝒏𝒑 , 𝑽 (𝑿 ) = 𝒏𝒑𝒒 ,
𝑪𝒏𝑵 𝑵−𝟏

On reconnait la formule utilisée à de nombreuses reprises dans les exercices de probabilités


élémentaires, où elle apparait naturellement (voir exemple 2).
Cette loi est particulièrement utile en théorie des sondages :

Exemple 1 : si une population de 200 individus comporte 8% de chômeurs, et que j’en prélève
aléatoirement un échantillon de 30 personnes, combien celui-ci peut-il contenir de chômeurs ?
Réponse : Ici : N=200 , K=0,08*200=16 , n=30
𝑪𝟎𝟏𝟔 ×𝑪𝟑𝟎
L’échantillon peut contenir 0 chômeurs avec une probabilité : 𝑃(𝑿 = 𝟎) = 𝑪𝟑𝟎
𝟏𝟖𝟒
𝟐𝟎𝟎

𝑪𝟏𝟏𝟔 ×𝑪𝟐𝟗
L’échantillon peut contenir 1 chômeurs avec une probabilité : 𝑃(𝑿 = 𝟏) = 𝑪𝟑𝟎
𝟏𝟖𝟒
𝟐𝟎𝟎
Etc. …
La différence avec la situation binomiale est qu’il s’agit ici de tirage sans remise (tirage exhaustif) :
après chaque tirage, la population a diminué d’une unité.
Cette loi est peu utilisée car dans la pratique, dès que le rapport n/N est petit (à partir de 0,1), on
fait une approximation par la loi binomiale : on considére que la population n’a pas
significativement variée à chaque tirage, et qu’elle est donc constante.

Exemple 2 :
Une classe de 20 élèves comprend 12 garçons et 8 filles. On en choisit 7 aléatoirement parmi les 20,
qu'on appelle "échantillon".
a) Combien d'échantillons peut-on former ?
b) Quelle est la probabilité d'avoir un échantillon :
- ayant quatre garçons ?
- n'ayant aucun garçon ?
- n'ayant aucune fille ?

Mais, dans la pratique, lorsque l'effectif (N) est grand, on peut considérer qu'il ne varie pas au
cours du tirage : tous se passe alors comme si on avait un tirage non-exhaustif.
les éléments interrogés dans un sondage, par exemple, ne sont pas réinterrogés ensuite : il s'agit
alors de tirages SANS remises.

31
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

Chapitre 6 : Variables aléatoires continues


Mots-clés : densité de probabilité, intégrale généralisée, loi uniforme, loi exponentielle, loi normale,
variable centrée réduite, courbe de Gauss (Laplace-Gauss, gaussienne), intervalles de confiance.

6.1 Généralités sur les variables aléatoires continues (v.a.c.) :


Nous nous intéressons maintenant à un phénomène aléatoire X décrivant une quantité continue
(longueur, temps, …), prenant ses valeurs dans tout un intervalle : il y a une infinité de valeurs
différentes.
Donc, la probabilité d’une valeur donnée est nécessairement nulle (1 cas favorable sur une
infinité possibles).
Première conséquence :
Pour toute valeur x, P(X=x) = 0, (1 valeur favorable sur une infinité possibles)
On ne s’intéressera donc qu’à des probabilités d’intervalles :
P(X>a) : probabilité que X prenne une valeur dans ] a, +¥[
P(X<a) : probabilité que X prenne une valeur dans ] –¥,a [
P( a<X<b) : probabilité que X prenne une valeur dans ] a, b [

Deuxième conséquence :
A chaque fois, prendre une inégalité stricte ou large ne change pas la valeur.
(Puisque cela revient à ajouter ou enlever une seule valeur, de probabilité nulle)
Fonction de répartition d’une v.a.c :
On appelle fonction de répartition d’une v.a continue X la fonction F qui associe à un
nombre x la probabilité P( X£x ) que X prenne une valeur inférieure :
F(x) = P( X £ x ).
Connaître F nous permet de connaître la loi de X, puisque alors :
P( a £ X £ b ) = F(b) - F(a).
P( X > a ) = 1 – P( X £ a ) = 1 - F(a)
c’est à dire que la loi de la v.a.c X est alors totalement déterminée par F.
F sera une fonction croissante, à valeur dans [ 0 , 1], continue et dérivable (sauf éventuellement en
quelques points) et qui vérifie :
𝐥𝐢𝐦 𝑭(𝒙) = 𝟏 , 𝐥𝐢𝐦 𝑭(𝒙) = 𝟎
𝒙→%& 𝒙→'&

Densité de probabilité :
Soit X une v.a.c. et donnons-nous une fonction f vérifiant :

f³0, f est continue (sauf peut-être en quelques points) , ò-¥ f(t)dt =1
f est appelée « densité de probabilité » associée à X.
x
La donnée de f détermine totalement la loi de X car, si on pose : F(x) = ∫ −∞
f (t)dt
On peut alors définir :

32
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

𝒕)𝒃
𝑷(𝒂 ≤ 𝑿 ≤ 𝒃) = 9 𝒇(𝒕)𝒅𝒕 = 𝑭(𝒃) − 𝑭(𝒂)
𝒕)𝒂
𝒕)𝒂
𝑷(𝑿 ≤ 𝒂) = 9 𝒇(𝒕)𝒅𝒕 = 𝑭(𝒂)
𝒕)'¥

F est une fonction de répartition pour X.


C'est aussi une primitive de f puisque F ’(t) = f(t)
Toute fonction f vérifiant ces propriétés permet de définir une fonction de répartition F
(primitive de f) et donc une probabilité pour X sur les intervalles de R

IL EST IMPORTANT D’AVOIR EN TETE UNE ILLUSTRATION GEOMETRIQUE DE CES


FORMULES :

LA PROBABILITE EST UNE AIRE SOUS UNE COURBE f


(figure CM )

Paramètres d’une v.a.c.


On définit l’espérance et la variance de X par les formules usuelles :
+¥ +¥
E(X)= ò t f(t)dt V(X) = E(X²)- (E(X))² = ò-¥ t² f(t)dt - (E(X))²

q Nous n'aurons pas à les calculer explicitement dans ce cours ...


Propriétés :
Les propriétés précédentes (chapitre v.a discrètes) de l’espérance et la variance restent vraies :
Pour toutes constantes a, b et pour toute paire de v.a.c. X et Y on a toujours :

E(X+a) = E(X) + a E(aX) = aE(X)


V(X+a) = V(X) V(aX) = a²V(X)
E(X+Y) = E(X) + E(Y) ,
V(X+Y) = V(X) + V(Y) + 2cov(X,Y)
E(aX+bY) = aE(X) + bE(Y) ,
V(aX+bY) = a2V(X) + b2V(Y) + 2ab*cov(X,Y)

33
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.


6.2. La loi uniforme

On l’utilise pour modéliser un phénomène aléatoire X dont on ne sait rien, sinon qu’il se
situe dans un intervalle [a,b] : la probabilité est donc uniformément répartie sur cet
intervalle.
(Figure)

Une v.a. continue X suit la loi uniforme sur un intervalle [a, b] si sa densité de probabilité f
est :
𝟏
f(x) = 0 si x Ï [a, b] et f(x) = 𝒃#𝒂 si x Î [a, b]

(Figure)

Probabilités et paramètres :
𝒙'𝒂
𝑷( 𝑿 ≤ 𝒙) = 𝒃'𝒂 𝑠𝑖 𝑎 ≤ 𝑥 ≤ 𝑏 , 𝟎 𝑠𝑖 𝑥 < 𝑎, 1 𝑠𝑖 𝑥 > 𝑏
(b-a)²
E(X) = b+a , V(X) =
2 12
(preuve : CM )

Caractéristique :
La probabilité de prendre une valeur dans n’importe quel sous-intervalle [c, d] de [a, b] est
proportionnelle à la longueur du sous-intervalle :
𝒅−𝒄
𝑷( 𝒄 ≤ 𝑿 ≤ 𝒅) =
𝒃 − 𝒂

Exemple 1 : (sujet Baccalauréat ES 2014, Exercice 3, partie A) :


Chaque jour, Antoine s’entraine au billard américain pendant une durée comprise entre 20
minutes et une heure. On modélise la durée de son entrainement, en minutes, par une variable
aléatoire X qui suit la loi uniforme sur l’intervalle [ 20 ; 60 ].
1. Calculer la probabilité p pour que l’entrainement dure plus de 30 minutes.
2. Calculer l’espérance de X. Interpréter ce résultat.

Exemple 2 : (http://xmaths.free.fr/TES/cours/ ) :
une variable aléatoire X suit la loi uniforme sur l’intervalle [ -1 ; 1 ].
Calculer et représenter par une aire les probabilités suivantes :
P( X£ 0,3) ; P(-0,5 £ X £ 0,5 ) ; P(X >0,3)

Exemple 3 :
Dans une vente aux enchères, un concurrent fait une offre inconnue, mais dont on sait qu'elle
se situe entre 10 000€ et 20 000€. Utiliser la loi uniforme pour estimer les chances que son
offre soit :
a) Inférieure à 13 000 €
b) supérieure à 18 000 €
c) comprise entre 14 000 et 16 000 €

34
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

6.3. La loi exponentielle :

Une v.a. continue suit la loi exponentielle de paramètre λ (λ>0) si sa densité de probabilité
f est définie par :
f(x)= 0 si x<0
f(x)= λ.exp(-λx) si x³0
Probabilités : 𝑷( 𝑿 ≤ 𝒂) = 𝟏 − 𝒆𝒙𝒑(−𝝀𝒂)
𝟏 𝟏
Paramètres : 𝑬(𝑿) = , 𝑽(𝑿) = 𝟐
𝝀 𝝀
Le paramètre s’interprète donc comme l’inverse de la valeur moyenne prise par la grandeur
aléatoire X.

Exemple : La durée de vie d’un ordinateur portable exprimée en années est une variable aléatoire 𝑋
suivant la loi exponentielle de paramètre 𝜆=0,125
La probabilité que la durée de vie de cet ordinateur portable dépasse 3 ans est égale à
𝑃(𝑋≥3 ), soit : .....

Allure de la loi exponentielle :

Caractéristique :
Cette loi est utilisée pour modéliser des phénomènes « sans vieillissement », car elle a la propriété de
suivante (propriété de Markov, comme la loi géométrique) :
P( (X > x + a) sachant que ( X>x) ) = P(X>a)
35
Université de Montpellier, MOMA. L2 Sciences de Gestion, S4 2021-2022. Statistiques 2. Cours. D. Echikr.

En gros, si X est un temps, par exemple une durée de vie d’un produit :
savoir qu’un produit a déjà duré x heures (par exemple) ne change rien à la probabilité qu’il
dure encore a heures (il n’a pas vieilli !).

En une phrase : « la durée de vie restante ne dépend pas de l’âge »


Ou "la probabilité d'avoir encore un certain temps d'attente restant ne dépend pas du temps
d'attente déjà passé"

Elle peut par exemple représenter la durée de vie d'un composant électronique, ou celle d'une
ampoule électrique avant qu'elle ne brûle : la probabilité qu'elle dure au moins s+t heures
sachant qu'elle a déjà duré t heures sera la même que la probabilité de durer s heures à partir
de sa mise en fonction initiale ; en d'autres mots, le fait qu'elle n'ait pas brûlé pendant t heures
ne change rien à son espérance de vie à partir du temps t.
Concrètement, cela veut dire que la probabilité d’attendre t minutes ne dépend pas de l’attente
déjà effectuée…
http://dictionnaire.sensagent.leparisien.fr/Loi%20exponentielle/fr-fr/
http://www.mathonline.fr/?p=344

Exercice :
%& /
On rappelle que ∫. 𝑒 '- 𝑑𝑡 = lim ∫. 𝑒 '- 𝑑𝑡 = lim (−𝑒 / + 1) = 1
/→%& /→%&
Soit λ un réel strictement positif.
1- Démontrer que la fonction définie sur [0;+∞[ par f(x)=λe−λx est une densité de
probabilité. Si une variable aléatoire X a une telle densité, on dira qu’elle suit loi
exponentielle de paramètre λ.
2- Une variable aléatoire est dite sans mémoire si P(X ≥ t + h | X ≥ t) = P(X ≥ h).
Montrez que la loi exponentielle est sans mémoire
3- Calculez la dérivée de la fonction 𝑔(𝑡) = −(𝑡 + 1)𝑒 '- , en déduire l’espérance d’une
loi exponentielle de paramètre λ.
4- La durée de vie X en année, d'un appareil avant la première panne suit une loi
exponentielle de paramètre λ. D'après une étude, la probabilité que cet appareil tombe
en panne pour la première fois avant la fin de la première année est 0,2.
Déterminer la valeur de λ à 10−2 près.
NB : La loi exponetielle est utilisée dans l’étude de la fiabilité des systèmes et plus
généralement dans l’étude des phénomènes sans mémoire (datation au carbone 14 par
exemple).

36

Vous aimerez peut-être aussi