Vous êtes sur la page 1sur 13

Sommaire

XIV
Inégalité de concentration - Loi des grands nombres XIV-1
1. Exploiter une moyenne d’échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIV-1
a) Moyenne d’un échantillon de taille n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIV-1
b) Estimation de la proportion des valeurs dans un intervalle . . . . . . . . . . . . . . . . . . . . . XIV-4
2. Exploiter des inégalités probabilistes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIV-6
a) Inégalités de Markhov et de Bienaymé-Tchebychev . . . . . . . . . . . . . . . . . . . . . . . . . XIV-6
b) Inégalité de concentration et loi des Grands Nombres . . . . . . . . . . . . . . . . . . . . . . . . XIV-8
3. En résumé : inégalités probabilistes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIV-11
4. Approfondissement possible : marche aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIV-11
Chapitre XIV

Inégalité de concentration - Loi des


grands nombres

1. Exploiter une moyenne d’échantillon


a) Moyenne d’un échantillon de taille n
Définition 1

• On rappelle qu’un échantillon de taille n (n ∈ N∗ ) d’une loi de probabilité est une liste de n variables
aléatoires indépendantes suivant cette loi.
• Soit (X1 , X2 , . . . , Xn ) un échantillon de taille n d’une loi de probabilité donnée.
On appelle variable aléatoire moyenne de l’échantillon la variable définie par :
1
Mn = (X1 + X2 + . . . + Xn )
n

Propriété 1

Pour tout échantillon (X1 , X2 , . . . , Xn ) de la loi d’une variable aléatoire X dont la moyenne est Mn , on a :
1 1
E(Mn ) = E(X) V (Mn ) = V (X) σ(Mn ) = √ σ(X)
n n

Démonstration

Pour l’espérance :
!
1X 1X
n n
E(Mn ) = E Xk = E(Xk ) d’après la linéarité de l’espérance.
n n
k=1 k=1
1X
n
= E(X) car E(X) = E(Xk ).
n
k=1
1 X n
= E(X) 1 car E(X) est indépendant de k
n
k=1
| {z }
n
1
= × n × E(X)
n

= E(X)
p XIV-2 Chap. XIV

Pour la variance : !
1X 1 X
n n
V (Mn ) = V Xk = 2 V (Xk ) car les Xk sont des variables indépendantes.
n n
k=1 k=1
1X
n
= V (X) car V (X) = V (Xk ).
n
k=1
1 X n
= 2 V (X) 1 car V (X) est indépendant de k
n
k=1
| {z }
n
1
= 2 × n × V (X)
n
1
= V (X)
n

Pour l’écart-type :
r
p 1 1 p 1
σ(Mn ) = V (Mn ) = V (X) = √ V (X) = √ σ(X)
n n n

A titre d’exemple 1

Soit X une une variable aléatoire qui suit une loi binomiale de paramètres n = 200 et p = 0, 3. Soit
(X1 , X2 , . . . , Xk ) un échantillon de taille k = 50 de la loi de X.
On note M50 la variable aléatoire moyenne de cet échantillon.

1. Partie probabilité
a) Calcul de l’espérance, de la variance et de l’écart-type de X.

• µ = E(X) = np = 200 × 0, 3 = 60

• V (X) = np(1 − p) = 200 × 0, 3 × 0, 7 = 42


p √
• σ(X) = np(1 − p) = 42 ≈ 6, 4807 à 10−4 près.

b) Calcul de l’espérance, de la variance et de l’écart-type de M50 .

• E(M50 ) = E(X) = 60

1 1
• V (M50 ) = V (X) = × 42 = 0, 84
50 50
p √
• σ(M50 ) = V (M50 ) = 0, 84 ≈ 0, 9165 à 10−2 près.
ou r
1 1 √ 0, 42 √
σ(M50 ) = √ σ(X) = √ × 0, 42 = = 0, 84 ≈ 0, 9165 à 10−4 près.
50 50 50

2. Partie modélisation
Modélisation de la variable aléatoire X et de la variable aléatoire Mk .
La fonction simu_X en Python comptabilise le nombre de succès lors de n répétitions indépendantes
d’une même loi de Bernoulli de paramètre p. Autrement dit, la fonction simu_X simule une variable
aléatoire suivant la loi binomiale B(n, p).
1.. EXPLOITER UNE MOYENNE D’ÉCHANTILLON p XIV-3

La fonction simu_M(n,p,k) simule la variable aléatoire M_k c’est-à-dire qu’elle simule la variable aléatoire
moyenne de l’échantillon (X1 , X2 , . . . , Xk ) de taille k.
Codage en Python

1 import random as rd
2 def simu_X(n,p) :
3 for experience in range(1,n) :
4 if rd.randint(1,10)<=10∗p : # car p possède une valeur exacte au dixième
5 cpt = cpt+1
6 return cpt
7

8 def simu_M(n,p,k) :
9 s=[simu_X(n,p) for i in range(k)] :
10 Mk=sum(s)/k
11 return Mk

A titre d’exemple 2 ▶ Des vidéos d’Yvan Monka pour t’aider

Exercice 1 : Calculer l’espérance, la variance et l’écart-type d’une variable aléatoire moyenne


On considère la variable aléatoire X qui prend, de façon équiprobable, les valeurs -4, 0, 1, 3 et 6.
M50 est la variable aléatoire moyenne d’un échantillon de taille 50 de la loi de X.
Calculer l’espérance, la variance et l’écart-type de M50 .

Recherche 1 ▶ Application directe

X est une variable aléatoire suivant une loi binomiale de paramètres n = 15 et p = 0, 654.
On considère un échantillon (X1 , X2 , . . . , X8 0) de la loi suivie par X.
1
On note S80 = X1 + X2 + . . . + X8 0 et M80 = (X1 + X2 + . . . + X8 0).
80

1. Déterminer les espérances et les variances de S80 et M80 au centième près.


2. Réaliser des fonctions en Python qui modélisent les variables aléatoires X, S80 et M80 .

3. Réaliser des fonctions en Python qui simulent les espérances et les variances de S80 et M80 . Les comparer
avec les résultats déterminer au 1).
p XIV-4 Chap. XIV

b) Estimation de la proportion des valeurs dans un intervalle


A titre d’exemple 3

On reprend l’énoncé de l’exemple 1.

1. À propos de X.
On cherche à calculer la probabilité que la variable aléatoire X s’éloigne de la valeur d’un écart-type de
son espérance, ce qui revient à calculer P (|X − µ| ⩽ σ) autrement dit, on cherche à calculer la probabilité
P (µ − σ ⩽ X √⩽ µ + σ) à l’aide d’un outil numérique.
µ − σ = 60 − √42 ≈ 54 arrondi à l’unité près.
µ − σ = 60 + 42 ≈ 66 arrondi à l’unité près.

Remarque :

En théorie, 0, 683% des valeurs prises par X se situe


dans l’intervalle [µ − σ; µ + σ].

2. À propos de Mk .
On cherche à estimer la proportion des valeurs de Mk qui s’éloignent de la valeur σMk de son espérance
E(Mk ), ce qui revient à calculer P (|M k − E(Mk )| ⩽ σ(Mk )).
Pour y parvenir, on prend un échantillon de taille k. On exécute la fonction simu_X(n,p,k) qui retourne
Mk.
Si l’écart entre Mk et E(Mk ) = 60 est inférieur à σ(Mk ) ≈ 0, 92, on attribue la valeur 1, sinon la valeur
0. On va prendre plusieurs échantillons de taille k ; On va prendre N échantillons. Et on va compter la
fréquence des succès. A la suite des programmes précédents, on réalise donc la fonction estim_proportion :

Codage en Python

1 import random as rd
2 def simu_X(n,p) :
3 cpt=0
4 for experience in range(1,n) :
5 if rd.randint(1,10)<=10∗p :
6 cpt = cpt+1
7 return cpt
8

9 def simu_M(n,p,k) :
10 s=[simu_X(n,p) for i in range(k)]
11 Mk=sum(s)/k
12 return Mk
13

14 def estim_proportion(n,p,k,N) :
15 ech=[simu_M(n,p,k) for i in range(N)]
16 compteur=0
17 for m in ech :
18 if abs(m−60)<=0.9165 :
19 compteur=compteur+1
20 return compteur/N
1.. EXPLOITER UNE MOYENNE D’ÉCHANTILLON p XIV-5

>>> simu_X(200,0.3) >>> simu_M(200,0.3,50) >>> estim_proportion(200,0.3,50,1000)


51 59,88 0.657

>>> simu_X(200,0.3) >>> simu_M(200,0.3,50) >>> estim_proportion(200,0.3,50,1000)


69 58,3 0.683

>>> simu_X(200,0.3) >>> simu_M(200,0.3,50) >>> estim_proportion(200,0.3,50,1000)


57 60,5 0.676

Recherche 2 ▶ Apprendre à utiliser les valeurs absolues

Exercice 2 : Soit Y une variable aléatoire. Recopier et compléter les pointillés :


a. Y ∈]0; 10[⇐⇒ |Y − . . .| < . . .
.......................................................................................................
.......................................................................................................
.......................................................................................................

b. Y ∈ [45; 51] ⇐⇒ |Y − . . .| ⩽ . . .
.......................................................................................................
.......................................................................................................
.......................................................................................................

c. Y ∈] − ∞; 12[∪]14; +∞[⇐⇒ |Y − . . .| > . . .


.......................................................................................................
.......................................................................................................
.......................................................................................................

d. Y ∈] − ∞; 2] ∪ [16; +∞ ⇐⇒ |Y − . . .| ⩾ . . .
.......................................................................................................
.......................................................................................................
.......................................................................................................

Extrait du manuel Sésamath Terminale Générale Spécialité


p XIV-6 Chap. XIV

2. Exploiter des inégalités probabilistes


a) Inégalités de Markhov et de Bienaymé-Tchebychev
Propriété 2

Pour toute variable aléatoire X et pour tout nombre réel δ :

• Inégalité de Markov :
E(X)
P (X ⩾ δ) ⩽
δ

• Inégalité de Bienaymé-Tchebychev :

V (X)
P (|X − E(X)| ⩾ δ) ⩽
δ2

Démonstration de l’inégalité de Bienaymé-Tchebychev.

(pré-requis : définition de la variance d’une variable aléatoire, notion de valeur absolue pour exprimer la
distance entre deux nombres réels).

Soit δ un réel strictement positif.


On note µ l’espérance E(X).

Soient x1 ,x2 , …, xn les valeurs prises par la variable aléatoire X et on désigne par H l’ensemble des valeurs xk
telles que |xk − µ| ⩾ δ.

X
n
2
X 2
X 2
On a : V(X) = P (X = xk ) (xk − µ) = P (X = xk ) (xk − µ) + P (X = xk ) (xk − µ) .
| {z }
k=1 xk ∈H xk ∈H
/ ⩾0
X
D’où, on obtient : V ⩾ δ 2
P (X = xk ).
xk ∈H
X
Or, P (X = xk ) = P (|X − µ| ⩾ δ).
xk ∈H
V (X)
On en conclut que : P (|X − µ| ⩾ δ) ⩽ .
δ2

A titre d’exemple 4 ▶ Une vidéo d’Yvan Monka pour t’aider

Exercice 3 : Appliquer l’inégalité de Bienaymé-Tchebychev


Soit une variable aléatoire X qui suit la loi binomiale de paramètres n = 20 et p = 0, 1.
1. Appliquer l’inégalité de Bienaymé Tchebichev avec δ = 2σ(X). Interpréter.

2. Recommencer avec δ = 3σ(X), puis δ = 4σ(X). Que constate-t-on ?


2.. EXPLOITER DES INÉGALITÉS PROBABILISTES p XIV-7

Recherche ▶ Utiliser l’inégalité de Markov

Exercice 4 : Appliquer l’inégalité de Markov avec les valeurs de l’énoncé.


On suppose que X est une variable aléatoire positive dans chacun des cas.
1. P (X ⩾ a), avec a = 5 et E(X) = 3.
2. P (X < a), avec a = 2 et E(X) = 1.

Exercice 5 : On considère la variable aléatoire X donnant le nombre de points marqués par une équipe de
basket au cours d’un match. Un analyste affirme : « Grâce à l’inégalité de Markov, je peux dire que la probabilité
que l’équipe marque au moins 48 points est inférieure à 75% ».
Calculer le nombre moyen de buts marqués par match par l’équipe.

Inspiré du manuel Le Livrescolaire.fr Tle Spécialité maths

Recherche ▶ Utiliser l’inégalité de Bienaymé-Tchebychev

Exercice 6 : Dans une population, la taille en cm d’une personne adulte prise au hasard est donnée par une
variable aléatoire :

• F , d’espérance 165 et de variance 25 pour une femme ;


• H, d’espérance 180 et de variance 36 pour un homme.

1. a) Majorer la probabilité P (|F − 165| ⩾ 8).


b) Majorer la probabilité que la taille d’une femme de cette population soit inférieure ou égale à 155
cm, ou supérieure ou égale à 175 cm.
2. Appliquer l’inégalité de Bienaymé-Tchebychev à l’événement |H − 180| ⩾ 10 et l’interpréter dans les
termes de l’énoncé.

Exercice 7 : Le nombre de messages envoyés quotidiennement par Yvan via son portable est donné par une
variable aléatoire M d’espérance E(M ) = 50 et d’écart-type σ(M ) = 10.
1. Minorer la probabilité que l’écart entre M et E(M ) soit inférieur à deux écarts-types.

2. a) Minorer la probabilité qu’Yvan envoie au plus 10 messages OU au moins 90 messages, par jour.
b) Sachant que P (M ⩽ 10) = 0, 01, majorer la probabilité qu’il envoie 90 messages ou plus par jour.

Extrait du manuel Sésamath Terminale Générale Spécialité


p XIV-8 Chap. XIV

b) Inégalité de concentration et loi des Grands Nombres


Propriété 3

Pour toute variable aléatoire X associée à un échantillon (X1 , X2 , . . . Xn ) de taille n, et pour tout nombre réel
δ>0 :

• Inégalité de concentration :
V (X)
P (|Mn − E(X)| ⩾ δ) ⩽
nδ 2

• Loi des grands nombres :


lim P (|Mn − E(X)| ⩾ δ) = 0
n→+∞

Démonstration de l’inégalité de concentration

(pré-requis : propriétés sur les sommes de variables aléatoires, inégalité de Bienaymé-Tchebychev)

Notons X1 , X2 , . . . Xn n variables aléatoires indépendantes toutes de même loi, d’espérance µ et de variance


V.
!
1X 1X
n n
1
Par linéarité de l’espérance, on a : E(Mn ) = E Xk = E (Xk ) = × nµ = µ.
n n n
k=1 k=1
Par indépendance des variables aléatoires X1 , X2 , . . . Xn on a :
!
Xn Xn Xn
V Xk = V (Xk ) = V = nV .
k=1 k=1 k=1

On en déduit que :
!
1X 1 X
n n
1 V
V (Mn ) = V Xk = 2
V (Xk ) = 2 × nV = .
n n n n
k=1 k=1

On applique alors l’inégalité de Bienaymé-Tchebychev à la variable aléatoire Mn et on conclut que :


V
P (|Mn − µ| ⩾ δ) ⩽
nδ 2

Démonstration de la loi des grands nombres

Démonstration (pré-requis : théorème des gendarmes, inégalité de concentration)

Pour tout réel δ > 0 , l’inégalité de concentration donne :


V
0 ⩽ P (|Mn − µ| ⩾ δ) ⩽ 2

V
Or, lim = 0.
n→+∞ n2
Appliquant le théorème des gendarmes, on conclut que :

lim P (|Mn − µ| ⩾ δ) = 0.
n→+∞

Interprétation :
L’écart entre la moyenne d’un échantillon d’une variable aléatoire et l’espérance de cette variable ne dépasse une valeur
donnée à l’avance qu’avec une probabilité qui tend vers zéro quand la taille de l’échantillon tend vers l’infini.
Autrement dit, la loi des grands nombres signifie que plus la taille de l’échantillon d’une variable aléatoire X est
grande, plus l’écart entre la moyenne de cet échantillon et l’espérance de la variable aléatoire X est faible.
2.. EXPLOITER DES INÉGALITÉS PROBABILISTES p XIV-9

A titre d’exemple 5 ▶ Une vidéo d’Yvan Monka pour t’aider

Exercice 8 : Déterminer la taille d’un échantillon avec l’inégalité de concentration


Soit une variable aléatoire X qui suit une loi de Bernoulli de paramètre 0,2.
On considère un échantillon de n variables aléatoires suivant la loi de X.
On appelle Mn la variable aléatoire moyenne associée à cet échantillon.
Déterminer la taille n de l’échantillon de façon à ce que la probabilité moyenne Mn appartiennent à l’intervalle
]0, 03; 0, 37[ soit supérieure à 0, 95.

A titre d’exemple 6 ▶ Application de la loi des grands nombres

Énoncé :
Justifier qu’en lançant une punaise un nombre de fois suffisamment grand, on peut estimer la probabilité
qu’elle retombe en reposant sur sa pointe.

Résolution :
On considère l’expérience aléatoire qui consiste à lancer une punaise et à regarder si elle retombe sur la
« pointe » (succès de probabilité p inconnue), ou sur la « tête ».

C’est une épreuve de Bernoulli de paramètre p.

On répète cette expérience n fois de manière indépendante, où n ∈ N.

On a alors un schéma de Bernoulli de paramètres n et p.

On note alors X1 , X2 , . . . Xn n variables aléatoires indépendantes toutes de même loi de Bernoulli de paramètre
p et associées à ces répétitions. Ces variables ont donc pour espérance p.

1X
n
Notant Mn = Xk et appliquant la loi des grands nombres, on obtient que :
n
k=1
pour tout δ > 0 , lim P (|Mn − p| ⩾ δ) = 0.
n→+∞

En lançant un grand nombre de fois la punaise, on peut donc estimer la valeur de p en observant la réalisation
de la variable aléatoire Mn .

Entraînement Labomep et/ou wim’s

Exercice 9 : Inégalité de Bienyamé-Tchebichev


p XIV-10 Chap. XIV

Recherche

Exercice 10 : On considère un dé équilibré à six faces numérotées de 1 à 6 et une succession de n lancers de


ce dé, où n est un entier naturel strictement positif.
On note X la variable aléatoire donnant le nombre de 1 obtenu à l’issue de ces n lancers.

1. Que valent l’espérance et la variance de X ?


n n
2. Minorer la probabilité de l’évéenement |X − | < en fonction de n à l’aide de l’inégalité de Bienaymé-
6 100
Tchebychev.
3. En déduire le nombre de lancers nécessaires pour que la fréquence d’apparition du 1 au cours de ces n
n n n n
lancers soit dans l’intervalle ] − ; − [ avec une certitude d’au moins 95%.
6 100 6 100

Inspiré du manuel Le Livrescolaire.fr Tle Spécialité maths

Recherche

Exercice 11 : On considère une variable aléatoire X, un échantillon (X1 , X2 , . . . , Xn ) de cette variable


X1 + X2 + . . . + Xn
aléatoire, ainsi que la variable aléatoire Mn = .
n
Une simulation de Mn pour les premières valeurs de n a été réalisée en Python :

1. La loi de X est l’une des deux lois ci-dessous ; laquelle ?

ai 8 12 24 bi 5 7,5 15
P (A = ai ) 0,5 0,25 0,25 P (B = bi ) 0,1 0,7 0,2

2. Déterminer une valeur de n à partir de laquelle on est sûr à 95 % que Mn est compris entre 12 et 14.
3. Ecrire une fonction « X » en Python qui simule la va-
riable aléatoire X.
En exécutant « graphique(n) », on obtiendra une re-
présentation graphique des moyennes obtenues au cours
d’une simulation de n répétitions successives de la va-
riable X.
3.. EN RÉSUMÉ : INÉGALITÉS PROBABILISTES p XIV-11

3. En résumé : inégalités probabilistes


Pour toute variable aléatoire X (positive dans le cas de l’inégalité de markov) de moyenne Mn sur un échantillon de
taille n et pour tout nombre réel δ > 0 :

L’inégalité de concentration implique que plus la taille des échantillons est importante, plus les moyennes sont regrou-
pées autour de l’espérance :

Extrait du livre Variations Tle (Edition Hatier)

4. Approfondissement possible : marche aléatoire


Une marche aléatoire est un modèle mathématique d’un système possédant une dynamique discrète composée d’une
succession de pas aléatoires.

La notion mathématique sous-jacente est celle de « chaîne de Markov ».


Une chaîne de Markov est une suite de variables aléatoires (Xn )n∈N∗ qui permet de modéliser l’évolution dynamique
d’un système aléatoire : Xn représente l’état du système à l’instant n.
Le modèle de marche aléatoire le plus simple est celui de la marche aléatoire discrète à une dimension sur Z.

Énoncé :

Sur un axe horizontal, un pion placé à l’origine du repère (O; I) se déplace de la manière suivante :
• Si le lancer d’une pièce équilibrée donne « pile », on déplace le pion d’une unité vers la droite.
• Si le lancer d’une pièce équilibrée donne « face », on déplace le pion d’une unité vers la gauche.

Après n déplacements, on note Dn le nombre de fois où le pion a effectué un déplacement vers la droite et Xn l’abscisse
du pion dans le repère.
1. Simuler la variable aléatoire Xn .
2. Utiliser cette simulation pour estimer l’espérance et l’écart type de Xn .

3. Démontrer que la variable aléatoire Xn a pour espérance 0 et pour écart type n.
p XIV-12 Chap. XIV

Éléments de correction :

Codage en Python

1 from math import∗


2 from random import∗
3 def X(n) :
4 x=0
5 for i in range(n) :
6 a=random()
7 if a>0.5 : >>> Estim_Moyenne_Ecart_type(16,100000)
8 x=x−1 (-0.00098,4.0033234992434945)
9 else :
10 x=x+1 >>> Estim_Moyenne_Ecart_type(16,100000)
11 return x (-0.0112,3.994881044537662)
12

13 def Estim_Moyenne_Ecart_type(n,N) :
14 echXn=[X(n) for i in range(N)]
15 moy=sum(echXn)/N
16 var = 0
17 for j in range (N) :
18 var = var+(echXn[j]−moy)∗∗2
19 return(moy,sqrt(var/N))

Vous aimerez peut-être aussi