I. Convergences
Dans cette partie on va traiter des éléments de calcul des probabilités très utiles pour
leur application à la statistique. Il existe deux théorèmes fondamentaux: le premier s’appelle
la loi des grands nombres LGN ,le second s’appelle le théorème de la limite centrale TCL.
1. L’inégalité de Markov
Une variable aléatoire est dite positive ou nulle dans un univers 𝛺 lorsque toutes les valeurs
prises par celle -ci sont des réelles positives ou nulles.
Par exemple la variable aléatoire donnant un nombre de faces numérotées 1 obtenues sur dix
lancers d'un dé est positive ou nulle.
Théorème 1 (Admis)
Soit 𝑋 une variable aléatoire réelle positive ou nulle d'espérance 𝐸(𝑋), alors:
𝐸(𝑋)
∀𝑎 > 0 𝑃(𝑋 ≥ a) ≤
a
Exemple 1
Soit 𝑋 une variable aléatoire discrète et positive admettant une espérance égale à 3 et une
variance égale à 1
1.Donner un minorant de 𝑃(𝑋 < 10).
2.Calculer 𝑉(10 − 𝑋) si elle existe.
Solution
D'après l'inégalité de Markov
𝐸(𝑋)
𝑃(𝑋 ≥ a) ≤ a , 𝐸(𝑋) = 3, on choisit 𝑎 = 10, alors:
3
𝑃 (𝑋 ≥ 10) ≤
10
Or 𝑃 (𝑋 ≥ 10) = 1 − 𝑃(𝑋 < 10),donc 𝑃 (𝑋 < 10) ≥ 0,7.
2.𝑉(10 − 𝑋) = 𝑉 (𝑋) = 1
EXERCICE 1
Dans une entreprise ,le salaire brut mensuel moyen des employés est de 2 442 DH. On choisit
un salarié au hasard et on note 𝑋 la variable aléatoires donnant son salaire.
Quelle est la probabilité que le salaire de cet employé soit supérieur à 7 326 ?
2. L’inégalité de Bienaymé-Tchebychev
Théorème 2 (Admis)
Soit 𝑋 une variable aléatoire réelle, admettant une espérance 𝐸𝑋 et une variance 𝑉(𝑋) alors:
𝑉(𝑋)
∀𝑎 > 0 𝑃(|𝑋 − 𝐸𝑋| ≥ 𝑎) ≤ 2
𝑎
Cela veut dire que moins la variable aléatoire 𝑋 varie, plus qu’elle aura des chances d’être
proche de son espérance 𝐸(𝑋).
1
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
Exemple 2
Soit X une variable gaussienne centrée et réduite. D’après l’inégalité de B.T on a :
Pour tout 𝑎 > 0
1
𝑃 (|𝑋| ≥ 𝑎) = 𝑃(𝑋 ≥ 𝑎) + 𝑃(𝑋 ≤ −𝑎) ≤ 2
𝑎
En particulier pour 𝑎 = 3:
1
𝑃 (𝑋 ≥ 3) + 𝑃(𝑋 ≤ −3) ≤ 2 = 0,11
3
En regardant dans la table gaussienne, on obtient :
𝑃(𝑋 ≥ 3) + 𝑃(𝑋 ≤ −3) = 0,0027
EXERCICE 2
Soit 𝑋 une variable aléatoire suivant une loi binomiale de paramètre 𝑛 et 𝑝 :ℬ(20; 0,3)
1. Déterminer l’espérance et la variance de 𝑋.
2. En se servant de l’inégalité de Bienaymé-Tchebychev montrer que
𝑃 (|𝑋 − 6| ≥ 5) ≤ 0,168
©EXERCICE 3
On jette 3 600 fois un dé équilibré . Minorer la probabilité que le nombre d'apparition du
numéro 1 soit compris entre 480 et 780.
3. Convergence en probabilité
Définition 1
On dit qu’une suite de variables aléatoires réelles 𝑋1 , … 𝑋𝑛 converge en probabilité vers une
valeur certaine 𝜆 si et seulement:
𝑛→+∞
∀𝜀 > 0 𝑃(|𝑋𝑛 − 𝜆| < 𝜀 ) → 1
On écrit
𝑃
𝑋𝑛 → 𝜆
On peut alors donner intuitivement une condition suffisante de convergence en probabilité:
𝑛→+∞
𝐸(𝑋𝑛 ) → 𝜆 𝑃
{ 𝑛→+∞ ⇒ 𝑋𝑛 → 𝜆
𝑉(𝑋𝑛 ) → 0
EXERCICE 4
Soit 𝑋1 , … 𝑋𝑛 une suite de variables indépendantes uniformes sur l’intervalle [0, 𝜆] où 𝜆 est un
nombre réel positif. On considère la variable aléatoire 𝑆𝑛 construite à partir de la suite
𝑋1 , … 𝑋𝑛 :
1 𝑃 𝑛→+∞
Pour tout 𝑛, 𝑆𝑛 = 𝑛 (𝑋1 + ⋯ 𝑋𝑛 ). Montrer que 𝐸(2𝑆𝑛 ) → 𝜆, et que 𝑉(2𝑆𝑛 ) → 0.
Soit 𝑋1 , … 𝑋𝑛 : une suite de v.a.r deux à deux indépendantes admettant une même espérance
𝐸(𝑋) et une même variance 𝑉(𝑋).On pose:
2
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
𝑋1 + ⋯ 𝑋𝑛 ∑𝑖=𝑛
𝑖=1 𝑋𝑖
𝑋̅ = =
𝑛 𝑛
Alors
∀𝜀 > 0 𝑙𝑖𝑚 𝑃(|𝑋̅ − 𝐸𝑋| ≥ 𝜀 ) = 0
𝑛→+∞
et
𝑙𝑖𝑚 𝑃(|𝑋̅ − 𝐸𝑋| < 𝜀 ) = 1
𝑛→+∞
Exemple 3
Dans une entreprise de 500 salariés on cherche à déterminer le nombre de personnes mariées.
(On a fait un sondage dans un département de 𝑛 = 50 salariés qui donne 15 mariés contre 35
non mariés (célibataires, veufs, ou divorcés). Modélisons de la même façon que dans
l’exemple précédent: soit 𝑋𝑖 la variable de Bernoulli qui prend la valeur 1 avec la probabilité
𝑝 si l’individu numéro i est marié et 0 (avec la probabilité 1 − 𝑝) si l’individu numéro 𝑖 n’est
pas marié. Il est très simple de calculer 𝐸𝑋𝑖 = 𝑝 .La v.a.r
𝑖=𝑛
𝑋 = 𝑋𝑖 + ⋯ 𝑋𝑛 = ∑ 𝑋𝑖
𝑖=1
est la v.a.r ‘‘nombre de mariés. La loi faible des grands nombre dit que:
𝑖=𝑛
𝑋𝑖 𝑃
𝑋̅ = ∑ → 𝐸𝑋 = 𝑝
𝑛
𝑖=1
𝑋𝑖 15
Les résultats du sondage disent que la réalisation de la v.a.r 𝑋̅ = ∑𝑖=𝑛
𝑖=1 𝑛 est = 0,3 .Une
50
1
estimation de 𝑝 est donc 0,3. La variable 𝑛 ∑𝑖=𝑛
𝑖=1 𝑋𝑖 est appelé estimateur de 𝑝.Attention, il faut
1
bien comprendre que 0,3 est seulement une réalisation de la v.a.r. 𝑛 ∑𝑖=𝑛 𝑖=1 𝑋𝑖 . Un autre
statisticien ayant fait un sondage dans un autre département peut trouver autre chose;
cependant on devait trouver des résultats analogues lorsque les sondés sont nombreux (il ne
faut pas oublier que 𝑛 → +∞!).Revenons à notre problème: on donne 0,3 comme estimation
de 𝑝.Nous avons donc une estimation de 500 × 0,3 = 150 mariés dans l’entreprise.
La convergence en loi est très importante car c’est le second théorème fondamental de la
statistique, c’est un résultat de convergence en loi.
Définition 2
3
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
EXERCICE 5
Soit 𝑋1 , … 𝑋𝑛 une suite de variables indépendantes et uniformes sur [0; 12]. On considère la
variable 𝑆𝑛 = 𝑋̅ . Cherche la probabilité que 𝑆𝑛 soit supérieure à 𝑡 = 5.
4
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
Définition 3
Une statistique 𝑡 est une fonction des observations de (𝑥1 , … . 𝑥𝑛 ):
𝑡: ℝ𝑛 → ℝ𝑚
(𝑥1 , … . 𝑥𝑛 ) → 𝑡(𝑥1 , … . 𝑥𝑛 )
1 𝑛 2
Par exemple 𝑥̅ 𝑛 = 𝑛 (𝑥1 , … . 𝑥𝑛 ),∑𝑖=1 𝑥𝑖 , sont des statistiques. Pour simplifier les écritures, on
note souvent 𝑡𝑛 = 𝑡(𝑥1 , … . 𝑥𝑛 ), et 𝑇𝑛 = 𝑡(𝑋1 , … . 𝑋𝑛 )
Les valeurs 𝑥1 , 𝑥2 , … 𝑥𝑛 obtenues, de l’échantillon (𝑋1 , … 𝑋𝑛 ) sont des valeurs estimées de cet
échantillon.
Exemple 5
Supposons qu’on interroge 20 personnes ‘‘êtes vous favorables à l’action du gouvernement’’?
On possède un 20-échantillon (𝑋1 , … . 𝑋𝑛 ) dont la réalisation est :
𝑇1 = 𝑋1 𝑡1 = 0
𝑋1 +𝑋2 +𝑋3 2
𝑇2 = 𝑡2 = 3
3
𝑋1 +⋯+𝑋20 1
𝑇3 = 𝑡3 = 2
20
Dans cet exemple on dispose d’un 𝑛-échantillon de réponses (1 pour un individu favorable à
l’action du gouvernement ,0 sinon), et on considère comme estimateur de 𝑝 la proportion des
1
personnes interrogées, c’est à dire 𝑇𝑛 = 𝑛 (𝑋1 + ⋯ 𝑋𝑛 ).
5
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
Définition 7
On dit que l’estimateur est consistant ou convergeant. Cela signifie que l’on trouve la valeur
du paramètre quand l’échantillon devient grand (car l’estimation est alors égale à 𝜃) si :
6
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
Proposition 2
n→+∞ 𝑃
Si ∀𝑛 ∈ ℕ∗ , 𝐸 ( 𝑇𝑛 ) → 𝜃 et lim 𝑉𝑎𝑟(𝑇𝑛 ) = 0, alors 𝑇𝑛 → 𝜃,c'est-à-dire l’estimateur 𝑇𝑛 est
𝑛→+∞
consistent (ou convergent).
n→+∞
𝐸 ( 𝑇𝑛 ) → 𝜃
Exemple 7
On peut appliquer la proposition 1 pour le cinquième estimateur 𝑇5 , cet estimateur est donc
consistant du paramètre inconnu 𝑝.
En effet,
𝑝(1−𝑝)
𝑉𝑎𝑟(𝑇5 ) = 𝑛 et 𝐸(𝑇5 ) = 𝑝
𝑝(1 − 𝑝)
lim 𝑉𝑎𝑟(𝑇5 ) = lim =0
𝑛→+∞ 𝑛→+∞ 𝑛
et
𝑛→+∞
𝐸(𝑇5 ) → 𝑝
Exemple 8
Vérifions cette propriété pour les estimateurs de paramètres de la loi normale:
𝑋 +⋯𝑋𝑛
𝑋̅ = 1 avec 𝑋𝑖 v.a.r normales indépendantes suivant chacune une 𝒩(𝜇, 𝜎 2 )
𝑛
𝜎 2
On en déduit que 𝑋̅ suit une 𝒩(𝜇, 𝑛 ):
En effet
𝑋1 + ⋯ 𝑋𝑛 1 1
𝑋̅ = 𝐸 ( ) = (𝐸𝑋1 + ⋯ 𝐸𝑋𝑛 ) = × 𝑛 𝐸𝑋𝑖 = 𝐸𝑋𝑖 = 𝜇
𝑛 𝑛 𝑛
𝑋1 + ⋯ 𝑋𝑛 1
𝑉𝑎𝑟(𝑋̅ ) = 𝑉𝑎𝑟 ( ) = 2 [𝑉𝑎𝑟(𝑋1 ) + ⋯ 𝑉𝑎𝑟(𝑋𝑛 )]
𝑛 𝑛
1 𝑉𝑎𝑟(𝑋𝑖 )
= 2 × 𝑛 𝑉𝑎𝑟(𝑋𝑖 ) =
𝑛 𝑛
Donc
𝜎2
𝑉𝑎𝑟(𝑋̅) =
𝑛
4.1. Méthode des moments
Nous présentons dans ce paragraphe une première méthode pour trouver un estimateur du
paramètre 𝜃. On se place dans le cas continu. Soit 𝑋 une variable aléatoire de densité 𝑓𝜃 (𝑥) ;
on appelle moment (théorique) d’ordre 𝑟 les quantités:
+∞
𝜇𝑟 (𝜃) = ∫ 𝑥 𝑟 𝑓𝜃 (𝑥 )𝑑𝑥 = 𝐸(𝑋 𝑟 )
−∞
D’autre part, si 𝑋1 + ⋯ 𝑋𝑛 est un 𝑛-échantillon de variables aléatoires discrètes, on appelle
moment empirique d’ordre 𝑟 les quantités:
1
𝑚𝑟 = (𝑋1𝑟 + 𝑋2𝑟 … 𝑋𝑛𝑟 )
𝑛
7
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
𝑝 𝑠𝑖 𝑥𝑖 = 1
𝑃(𝑋𝑖 = 𝑥𝑖 ) = {
1−𝑝 𝑠𝑖 𝑥𝑖 = 0
On peut écrire, de manière concentrée, que
𝑓𝑝 (𝑥𝑖 ) = 𝑝 𝑥𝑖 (1 − 𝑝)1−𝑥𝑖
1
Montrer que l’estimateur 𝑇𝑛 = (𝑋1 + ⋯ 𝑋𝑛 ) = 𝑋̅
𝑛
Indication: Calculer log 𝐿, puis calculer les dérivées première et seconde du maximum de
vraisemblance par rapport à 𝑝.
Remarque
∑(𝑋𝑖 − 𝑋̅ )2 ↝ 𝜎 2 𝜒𝑛−1
2
𝑖=1
C’est-à-dire
∑𝑖=𝑛 ̅ 2
𝑖=1 (𝑋𝑖 − 𝑋) 2
↝ 𝜒𝑛−1
𝜎2
De plus, 𝑋̅ et∑𝑖=𝑛 ̅ 2
𝑖=1 (𝑋𝑖 − 𝑋) sont indépendantes.
5. Information de Fisher
Définition 9
On appelle Information de Fisher apportée par la réalisation (𝑥1 , 𝑥2 … 𝑥𝑛 ) sur le paramètre 𝜃
la quantité (lorsqu’elle existe):
8
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
𝜕 2 Log 𝐿
Ou encore 𝐼𝑛 (𝜃) = 𝐸 (− )
𝜕𝜃2
Où 𝐿 est la vraisemblance.
Exemple 10
EXERCICE 7
Une équipe de chercheurs en biologie veut tester l’efficacité d’un nouveau vaccin contre un
certain virus. C’est pour cela elle choisit une population de chimpanzés, catégorie des singes
qui forment une tribu des Panines à qui on injecte le virus et ce nouveau vaccin.
On note 𝑋𝑖 le singe 𝑛𝑖 qui a manifesté la présence dans le sang du virus.
Soit 𝑝 la proportion de chimpanzés non guéris.
1) Déterminer l’estimateur du maximum de vraisemblance de p et étudier ses propriétés.
2) Calculer la borne de Cramer-Rao. Cet estimateur est il efficace ?
EXERCICE 8
Soit (𝑋1 , 𝑋2 … 𝑋𝑛 ) un 𝑛-échantillon d’une v.a.r. 𝑋 de loi de densité:
𝑎
𝑓𝑝 (𝑥) = 1+1 𝑥 ≥ 1; 𝑝 > 0.
𝑥 𝑝
1. Déterminer 𝑎 en fonction de 𝑝.
2. Déterminer l’estimateur du maximum de vraisemblance 𝑇𝑛 de 𝑝. Est il biaisé ?
3. Calculer la borne de Cramer-Rao.
EXERCICE 9
Soit 𝑋 une variable aléatoire discrète dont la loi de probabilité, donnée ci-dessous, dépend
d’un paramètre 𝑝 tel que 0 < 𝑝 < 1.
𝑃(𝑋 = 0) = 𝑝2 ; 𝑃(𝑋 = 1) = 2𝑝(1 − 𝑝) ; 𝑃(𝑋 = 2) = (1 − 𝑝)2
On extrait un échantillon de taille 𝑛 = 3 de la proportion et on obtient :
𝑥1 = 0 ; 𝑥2 = 1 ; 𝑥3 = 0
Calculer une estimation de 𝑝 en utilisant le principe du maximum de vraisemblance.
9
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
EXERCICE 10
On extrait un 10-échantillon de différents calibres d’oranges de haute qualité. On note 𝑋 leur
poids. On suppose que 𝑋 suit une loi normale de paramètre 𝜇 et 𝜎.
Et on note:
𝑥1 = 200 𝑥2 = 240 𝑥3 = 190 𝑥4 = 150 𝑥5 = 220
𝑥6 = 180 𝑥7 = 170 𝑥8 = 230 𝑥9 = 210 𝑥10 = 210
Donner une estimation ponctuelle de 𝜇 et 𝜎.
EXERCICE 11
Soit 𝑋 une v.a de loi qui dépend d’un paramètre réel 𝑝. 𝑇1 et 𝑇2 sont deux estimateurs de 𝑝 et
ils sont indépendants et non biaisés ayant des variances respectives 𝑉1 et 𝑉2 .On considère
l’estimateur 𝑇3 = (1 − 𝜆)𝑇1 + 𝜆 𝑇2 , 𝜆 ∈ ℝ.
1) Montrer que 𝑇3 est aussi sans biais.
2) Pour quelle valeur de 𝜆,𝑇3 est de variance minimale?(soit 𝑉3 cette variance).
©3) Les hypothèses de Cramer-Rao étaient vérifiées, les estimateurs 𝑇1 et 𝑇2 peuvent-ils être
efficaces tous les deux?
©EXERCICE 12
Soit (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) une suite de v.a.r indépendantes de paramètre 𝑝 et de densité :
1
−(1+ )
𝑓 (𝑥, 𝑝) = 𝑎𝑥 𝑝 𝑥≥1 ; 𝑝>0
1. Quelle condition doit remplir le paramètre 𝑎 pour que 𝑓 soit une densité ?
2. Déterminer l’estimateur du maximum de vraisemblance 𝑇𝑛 de 𝑝. Est il biaisé ou non ?
3. Déterminer la borne de Cramer-Rao. Conclure.
©EXERCICE 13
Soit (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) un échantillon d’une loi normale 𝒩(𝜇, 𝜎 2 ).
1. Déterminer l’estimateur du maximum de vraisemblance Tn du paramètre μ
2. Montrer que Tn est non biaisé.
3. Est-il consistant ?
Rappelons que la formulation mathématique de la loi normale est:
1 (𝑥 − 𝜇)2
( )
𝑓 𝑥 = 𝑒𝑥𝑝 −
𝜎√2𝜋 2𝜎²
©EXERCICE 14
1. Calculer l’intégrale suivante en fonction de 𝑝:
𝑎
1+𝑝
𝐼𝑎 = ∫ 4
𝑑𝑥
1 (𝑥 + 𝑝 )
où 𝑝 est un paramètre de ]−1, +∞[ .
En déduire:
𝑙𝑖𝑚 𝐼𝑎
𝑎→+∞
Soit 𝑋 une suite de v.a.r définie sur [1, +∞[ et de densité:
1+𝑝
𝑓 (𝑥, 𝑝) =
(𝑥 + 𝑝)2
où 𝑝 est un paramètre de ]−1, +∞[. On extrait un échantillon (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) de la loi de X.
2. Déterminer la borne de Cramer-Rao pour l’estimateur 𝑝.
EXERCICE 15
Soit 𝑋 une variable aléatoire qui suit une loi de Poisson de paramètre 𝜆.déterminer un
estimateur de 𝜆 par la méthode du maximum de vraisemblance L.
10
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
11