Vous êtes sur la page 1sur 11

Statistique Échantillonnage Estimation 2021-

Prof Idelhakkar Brahim 2022

S3 Sciences économiques et gestion


Prof: Idelhakkar B

I. Convergences
Dans cette partie on va traiter des éléments de calcul des probabilités très utiles pour
leur application à la statistique. Il existe deux théorèmes fondamentaux: le premier s’appelle
la loi des grands nombres LGN ,le second s’appelle le théorème de la limite centrale TCL.

1. L’inégalité de Markov
Une variable aléatoire est dite positive ou nulle dans un univers 𝛺 lorsque toutes les valeurs
prises par celle -ci sont des réelles positives ou nulles.
Par exemple la variable aléatoire donnant un nombre de faces numérotées 1 obtenues sur dix
lancers d'un dé est positive ou nulle.

Théorème 1 (Admis)
Soit 𝑋 une variable aléatoire réelle positive ou nulle d'espérance 𝐸(𝑋), alors:
𝐸(𝑋)
∀𝑎 > 0 𝑃(𝑋 ≥ a) ≤
a
Exemple 1
Soit 𝑋 une variable aléatoire discrète et positive admettant une espérance égale à 3 et une
variance égale à 1
1.Donner un minorant de 𝑃(𝑋 < 10).
2.Calculer 𝑉(10 − 𝑋) si elle existe.
Solution
D'après l'inégalité de Markov
𝐸(𝑋)
𝑃(𝑋 ≥ a) ≤ a , 𝐸(𝑋) = 3, on choisit 𝑎 = 10, alors:
3
𝑃 (𝑋 ≥ 10) ≤
10
Or 𝑃 (𝑋 ≥ 10) = 1 − 𝑃(𝑋 < 10),donc 𝑃 (𝑋 < 10) ≥ 0,7.
2.𝑉(10 − 𝑋) = 𝑉 (𝑋) = 1

EXERCICE 1
Dans une entreprise ,le salaire brut mensuel moyen des employés est de 2 442 DH. On choisit
un salarié au hasard et on note 𝑋 la variable aléatoires donnant son salaire.
Quelle est la probabilité que le salaire de cet employé soit supérieur à 7 326 ?

2. L’inégalité de Bienaymé-Tchebychev
Théorème 2 (Admis)

Soit 𝑋 une variable aléatoire réelle, admettant une espérance 𝐸𝑋 et une variance 𝑉(𝑋) alors:
𝑉(𝑋)
∀𝑎 > 0 𝑃(|𝑋 − 𝐸𝑋| ≥ 𝑎) ≤ 2
𝑎
Cela veut dire que moins la variable aléatoire 𝑋 varie, plus qu’elle aura des chances d’être
proche de son espérance 𝐸(𝑋).

1
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

Exemple 2
Soit X une variable gaussienne centrée et réduite. D’après l’inégalité de B.T on a :
Pour tout 𝑎 > 0
1
𝑃 (|𝑋| ≥ 𝑎) = 𝑃(𝑋 ≥ 𝑎) + 𝑃(𝑋 ≤ −𝑎) ≤ 2
𝑎
En particulier pour 𝑎 = 3:
1
𝑃 (𝑋 ≥ 3) + 𝑃(𝑋 ≤ −3) ≤ 2 = 0,11
3
En regardant dans la table gaussienne, on obtient :
𝑃(𝑋 ≥ 3) + 𝑃(𝑋 ≤ −3) = 0,0027
EXERCICE 2
Soit 𝑋 une variable aléatoire suivant une loi binomiale de paramètre 𝑛 et 𝑝 :ℬ(20; 0,3)
1. Déterminer l’espérance et la variance de 𝑋.
2. En se servant de l’inégalité de Bienaymé-Tchebychev montrer que
𝑃 (|𝑋 − 6| ≥ 5) ≤ 0,168

©EXERCICE 3
On jette 3 600 fois un dé équilibré . Minorer la probabilité que le nombre d'apparition du
numéro 1 soit compris entre 480 et 780.

3. Convergence en probabilité
Définition 1

On dit qu’une suite de variables aléatoires réelles 𝑋1 , … 𝑋𝑛 converge en probabilité vers une
valeur certaine 𝜆 si et seulement:
𝑛→+∞
∀𝜀 > 0 𝑃(|𝑋𝑛 − 𝜆| < 𝜀 ) → 1
On écrit
𝑃
𝑋𝑛 → 𝜆
On peut alors donner intuitivement une condition suffisante de convergence en probabilité:
𝑛→+∞
𝐸(𝑋𝑛 ) → 𝜆 𝑃
{ 𝑛→+∞ ⇒ 𝑋𝑛 → 𝜆
𝑉(𝑋𝑛 ) → 0
EXERCICE 4

Soit 𝑋1 , … 𝑋𝑛 une suite de variables indépendantes uniformes sur l’intervalle [0, 𝜆] où 𝜆 est un
nombre réel positif. On considère la variable aléatoire 𝑆𝑛 construite à partir de la suite
𝑋1 , … 𝑋𝑛 :
1 𝑃 𝑛→+∞
Pour tout 𝑛, 𝑆𝑛 = 𝑛 (𝑋1 + ⋯ 𝑋𝑛 ). Montrer que 𝐸(2𝑆𝑛 ) → 𝜆, et que 𝑉(2𝑆𝑛 ) → 0.

4. La loi faible des grands nombres

Théorème 3 LGN (admis)

Soit 𝑋1 , … 𝑋𝑛 : une suite de v.a.r deux à deux indépendantes admettant une même espérance
𝐸(𝑋) et une même variance 𝑉(𝑋).On pose:

2
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

𝑋1 + ⋯ 𝑋𝑛 ∑𝑖=𝑛
𝑖=1 𝑋𝑖
𝑋̅ = =
𝑛 𝑛
Alors
∀𝜀 > 0 𝑙𝑖𝑚 𝑃(|𝑋̅ − 𝐸𝑋| ≥ 𝜀 ) = 0
𝑛→+∞
et
𝑙𝑖𝑚 𝑃(|𝑋̅ − 𝐸𝑋| < 𝜀 ) = 1
𝑛→+∞
Exemple 3

Dans une entreprise de 500 salariés on cherche à déterminer le nombre de personnes mariées.
(On a fait un sondage dans un département de 𝑛 = 50 salariés qui donne 15 mariés contre 35
non mariés (célibataires, veufs, ou divorcés). Modélisons de la même façon que dans
l’exemple précédent: soit 𝑋𝑖 la variable de Bernoulli qui prend la valeur 1 avec la probabilité
𝑝 si l’individu numéro i est marié et 0 (avec la probabilité 1 − 𝑝) si l’individu numéro 𝑖 n’est
pas marié. Il est très simple de calculer 𝐸𝑋𝑖 = 𝑝 .La v.a.r
𝑖=𝑛

𝑋 = 𝑋𝑖 + ⋯ 𝑋𝑛 = ∑ 𝑋𝑖
𝑖=1
est la v.a.r ‘‘nombre de mariés. La loi faible des grands nombre dit que:

𝑖=𝑛
𝑋𝑖 𝑃
𝑋̅ = ∑ → 𝐸𝑋 = 𝑝
𝑛
𝑖=1
𝑋𝑖 15
Les résultats du sondage disent que la réalisation de la v.a.r 𝑋̅ = ∑𝑖=𝑛
𝑖=1 𝑛 est = 0,3 .Une
50
1
estimation de 𝑝 est donc 0,3. La variable 𝑛 ∑𝑖=𝑛
𝑖=1 𝑋𝑖 est appelé estimateur de 𝑝.Attention, il faut
1
bien comprendre que 0,3 est seulement une réalisation de la v.a.r. 𝑛 ∑𝑖=𝑛 𝑖=1 𝑋𝑖 . Un autre
statisticien ayant fait un sondage dans un autre département peut trouver autre chose;
cependant on devait trouver des résultats analogues lorsque les sondés sont nombreux (il ne
faut pas oublier que 𝑛 → +∞!).Revenons à notre problème: on donne 0,3 comme estimation
de 𝑝.Nous avons donc une estimation de 500 × 0,3 = 150 mariés dans l’entreprise.

5. Convergence en loi. Théorème de la limite centrale (TCL)

La convergence en loi est très importante car c’est le second théorème fondamental de la
statistique, c’est un résultat de convergence en loi.

Définition 2

Soit 𝑋1 , … 𝑋𝑛 une suite de v.a.r.c. et notons 𝐹1 , … 𝐹𝑛 la suite des fonctions de répartition


associées. La suite 𝑋1 , … 𝑋𝑛 converge en loi vers une variable aléatoire 𝑋 si et seulement si:
𝑛+→∞
∀𝑥 ∈ ℝ 𝐹𝑛 (𝑥 ) → 𝐹(𝑥) où 𝐹 est la fonction de répartition de 𝑋.On écrit:
ℒ ℒ
𝑋𝑛 → 𝑋 ou bien 𝑋𝑛 → 𝐹.
Cela signifie, que ‘‘lorsque 𝑛 est très grand, la loi de 𝑋𝑛 est presque celle de 𝑋.En général, la
variable 𝑋 ne nous intéresse pas: c’est la loi limite 𝐹 que l’on veut connaître.

3
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

Théorème 4:théorème centrale limite TCL (admis).


Soit 𝑋1 , … 𝑋𝑛 une suite de v.a.r continues ou discrètes indépendantes et de même loi
d’espérance 𝐸(𝑋) et de variance 𝑉(𝑋) finie non nulle. On a :
𝑖=𝑛
1 1
𝑋̅ = (𝑋1 +. . 𝑋𝑛 ) = ∑ 𝑋𝑖
𝑛 𝑛
𝑖=1
On pose :
𝑋̅ − 𝐸(𝑋)
𝑠𝑛∗ = √𝑛 ( )
√𝑉(𝑋)
Alors:
𝑋̅ − 𝐸𝑋 ℒ
𝑠𝑛∗ = √𝑛 ( ) → 𝒩(0,1)
√𝑉 (𝑋)
Exemple 4
Soit 𝑋 une variable aléatoire comptant le nombre de succès lors de la réalisation de 5000
épreuves aléatoires indépendantes, dont la probabilité de réalisation de chacune est 0,2.
𝑋 suivant donc une loi binomiale ℬ(5 000 ; 0,2). Son espérance est 1 000, et sa variance est
𝑉 (𝑋) = 800.
Cherchant 𝑇 tel que 𝑃(𝑋 ≥ 𝑇) ≥ 0,975.
En effet
𝑋 − 1 000 𝑇 − 1 000
𝑋≥𝑇⟺ ≥
√800 √800
𝑋−1 000
Si on pose 𝑌 = 800 ,𝑌 n'est rien d'autre que la fonction de répartition de la loi normale

𝑇 − 1 000
𝑃 (𝑋 ≥ 𝑇) ≤ 0,025 ⟺ 𝑃 (𝑌 ≥ ) ≤ 0,025
√800
𝑇 − 1 000
⟺ 1−𝐹( ) ≤ 0,025
√800
𝑇 − 1 000
⟺ 𝐹( ) ≥ 0,975 ≥ 𝐹(2)
√800
𝑇−1 000
Cette condition sera réalisée dès que ≥ 2, soit 𝑇 ≥ 1057.
800

EXERCICE 5
Soit 𝑋1 , … 𝑋𝑛 une suite de variables indépendantes et uniformes sur [0; 12]. On considère la
variable 𝑆𝑛 = 𝑋̅ . Cherche la probabilité que 𝑆𝑛 soit supérieure à 𝑡 = 5.

4
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

II. Estimation ponctuelle


Estimer le paramètre 𝜃 consiste à donner une valeur approchée à ce paramètre à partir d’un
sondage de la population.
Le 𝑛-uplet 𝑋1 , … 𝑋𝑛 de variables aléatoires est un 𝑛-échantillon de la variable 𝑋 si les
variables 𝑋𝑖 sont indépendantes entre elles et suivent la même loi que 𝑋.

Définition 3
Une statistique 𝑡 est une fonction des observations de (𝑥1 , … . 𝑥𝑛 ):
𝑡: ℝ𝑛 → ℝ𝑚
(𝑥1 , … . 𝑥𝑛 ) → 𝑡(𝑥1 , … . 𝑥𝑛 )
1 𝑛 2
Par exemple 𝑥̅ 𝑛 = 𝑛 (𝑥1 , … . 𝑥𝑛 ),∑𝑖=1 𝑥𝑖 , sont des statistiques. Pour simplifier les écritures, on
note souvent 𝑡𝑛 = 𝑡(𝑥1 , … . 𝑥𝑛 ), et 𝑇𝑛 = 𝑡(𝑋1 , … . 𝑋𝑛 )

Les valeurs 𝑥1 , 𝑥2 , … 𝑥𝑛 obtenues, de l’échantillon (𝑋1 , … 𝑋𝑛 ) sont des valeurs estimées de cet
échantillon.

1. Définition et premières qualités d’un estimateur


Définition 4
Soit 𝑋1 , … 𝑋𝑛 un 𝑛-échantillon de la variable 𝑋 et 𝑡 une fonction de 𝑛 variables réelles, et soit
𝑇𝑛 la v.a.r telle que 𝑇𝑛 = 𝑡(𝑋1 , … 𝑋𝑛 )
Un estimateur d'une grandeur 𝜃 est une statistique 𝑇𝑛 à valeurs dans l’ensemble des valeurs
possibles de 𝜃. Une estimation de 𝜃 est une réalisation 𝑡𝑛 de l’estimateur 𝑇𝑛 . Un estimateur
est donc une variable aléatoire, alors qu’une estimation est une valeur déterministe.

Exemple 5
Supposons qu’on interroge 20 personnes ‘‘êtes vous favorables à l’action du gouvernement’’?
On possède un 20-échantillon (𝑋1 , … . 𝑋𝑛 ) dont la réalisation est :

(𝑥1 , … . 𝑥20 ) = (0,1,1,1,0,0,0,0,0,1,1,1,1,0,0,0,1,0,1,1)

Voici quelques estimateurs du paramètre 𝑝 (proportion choisie) et les estimations


correspondantes.

𝑇1 = 𝑋1 𝑡1 = 0
𝑋1 +𝑋2 +𝑋3 2
𝑇2 = 𝑡2 = 3
3

𝑋1 +⋯+𝑋20 1
𝑇3 = 𝑡3 = 2
20

𝑋1 𝑋2 +𝑋3 𝑋4 …+𝑋19 𝑋20 3


𝑇4 = 𝑡4 = 20
20
𝑋1 +𝑋2 +⋯.+𝑋𝑛
𝑇5 = 𝑡5 = 𝑥̅ 𝑛
𝑛

Dans cet exemple on dispose d’un 𝑛-échantillon de réponses (1 pour un individu favorable à
l’action du gouvernement ,0 sinon), et on considère comme estimateur de 𝑝 la proportion des
1
personnes interrogées, c’est à dire 𝑇𝑛 = 𝑛 (𝑋1 + ⋯ 𝑋𝑛 ).

5
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

2. Estimateur non biaisé


Dans la réalité, la taille des échantillons est limitée pour des raisons de temps ou du coût élevé
de l’opération .Il est donc naturel de se demander quelle qualité est attendue d’un estimateur
limité à des échantillons de taille donnée 𝑛.

On dit que l’estimateur du paramètre 𝜃 est sans biais lorsque,


Pour tout 𝑛 ∈ ℕ∗ 𝐸 (𝑇𝑛 ) = 𝜃
Définition 6
On définit donc le biais comme suit:

Biais 𝑇𝑛 =Eespérance de l’estimateur− parametre à estimer

Ici 𝑏𝑖𝑎𝑖𝑠(𝑇𝑛 ) = 𝐸(𝑇𝑛 ) − 𝜃.


Par exemple le premier estimateur 𝑇1 = 𝑋1 et rappelons que si:
𝑋𝑖 ↝ ℬ(𝑝),alors 𝐸𝑋𝑖 = 𝑝, et 𝑉 (𝑋𝑖 ) = 𝑝(1 − 𝑝).
Donc 𝐸𝑋1 = 𝑝, et 𝑉 (𝑋1 ) = 𝑝(1 − 𝑝) ,soit 𝐸(𝑇1 ) = 𝐸𝑋1 = 𝑝.
𝑏𝑖𝑎𝑖𝑠(𝑇1 ) = 𝐸(𝑇1 ) − 𝑝 = 0.
Donc l’estimateur 𝑇1 n’est pas biaisé.

3. Risque quadratique minimum


On peut également espérer que la dispersion de l’estimateur autour de la valeur que l’on
cherche à estimer est plus faible possible. Pour cela, on définit le risque quadratique par:

𝑅(𝑇𝑛 , 𝜃) = 𝐸 [(𝑇𝑛 − 𝜃)]2


Proposition 1
𝑅(𝑇𝑛 , 𝜃) = 𝑉𝑎𝑟(𝑇𝑛 ) + biais 2 (𝑇𝑛 )
Démonstration (voir TD).
Exemple 6
Calculons le risque quadratique de l’estimateur 𝑇1 . Il s’agit de calculer sa variance.

𝑉𝑎𝑟(𝑇1 ) = 𝑉𝑎𝑟(𝑋1 ) = 𝑝(1 − 𝑝)


Or l’estimateur 𝑇1 n'est pas biaisé ,donc
𝑅 (𝑇1 , 𝑝) = 𝑉𝑎𝑟(𝑇1 ) = 𝑝(1 − 𝑝).
4. Estimateur consistant

Rappelons que la notion de convergence en probabilité est la généralisation de la convergence


habituelle en mathématique.

Définition 7
On dit que l’estimateur est consistant ou convergeant. Cela signifie que l’on trouve la valeur
du paramètre quand l’échantillon devient grand (car l’estimation est alors égale à 𝜃) si :

∀𝜀 > 0 𝑙𝑖𝑚 𝑃(|𝑇𝑛 − 𝜃| < 𝜀) = 1


𝑛→+∞
On écrit:
𝑃
𝑇𝑛 → 𝜃

6
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

Proposition 2
n→+∞ 𝑃
Si ∀𝑛 ∈ ℕ∗ , 𝐸 ( 𝑇𝑛 ) → 𝜃 et lim 𝑉𝑎𝑟(𝑇𝑛 ) = 0, alors 𝑇𝑛 → 𝜃,c'est-à-dire l’estimateur 𝑇𝑛 est
𝑛→+∞
consistent (ou convergent).
n→+∞
𝐸 ( 𝑇𝑛 ) → 𝜃

Exemple 7
On peut appliquer la proposition 1 pour le cinquième estimateur 𝑇5 , cet estimateur est donc
consistant du paramètre inconnu 𝑝.
En effet,
𝑝(1−𝑝)
𝑉𝑎𝑟(𝑇5 ) = 𝑛 et 𝐸(𝑇5 ) = 𝑝
𝑝(1 − 𝑝)
lim 𝑉𝑎𝑟(𝑇5 ) = lim =0
𝑛→+∞ 𝑛→+∞ 𝑛
et
𝑛→+∞
𝐸(𝑇5 ) → 𝑝
Exemple 8
Vérifions cette propriété pour les estimateurs de paramètres de la loi normale:
𝑋 +⋯𝑋𝑛
𝑋̅ = 1 avec 𝑋𝑖 v.a.r normales indépendantes suivant chacune une 𝒩(𝜇, 𝜎 2 )
𝑛
𝜎 2
On en déduit que 𝑋̅ suit une 𝒩(𝜇, 𝑛 ):
En effet
𝑋1 + ⋯ 𝑋𝑛 1 1
𝑋̅ = 𝐸 ( ) = (𝐸𝑋1 + ⋯ 𝐸𝑋𝑛 ) = × 𝑛 𝐸𝑋𝑖 = 𝐸𝑋𝑖 = 𝜇
𝑛 𝑛 𝑛

𝑋1 + ⋯ 𝑋𝑛 1
𝑉𝑎𝑟(𝑋̅ ) = 𝑉𝑎𝑟 ( ) = 2 [𝑉𝑎𝑟(𝑋1 ) + ⋯ 𝑉𝑎𝑟(𝑋𝑛 )]
𝑛 𝑛
1 𝑉𝑎𝑟(𝑋𝑖 )
= 2 × 𝑛 𝑉𝑎𝑟(𝑋𝑖 ) =
𝑛 𝑛
Donc
𝜎2
𝑉𝑎𝑟(𝑋̅) =
𝑛
4.1. Méthode des moments
Nous présentons dans ce paragraphe une première méthode pour trouver un estimateur du
paramètre 𝜃. On se place dans le cas continu. Soit 𝑋 une variable aléatoire de densité 𝑓𝜃 (𝑥) ;
on appelle moment (théorique) d’ordre 𝑟 les quantités:
+∞
𝜇𝑟 (𝜃) = ∫ 𝑥 𝑟 𝑓𝜃 (𝑥 )𝑑𝑥 = 𝐸(𝑋 𝑟 )
−∞
D’autre part, si 𝑋1 + ⋯ 𝑋𝑛 est un 𝑛-échantillon de variables aléatoires discrètes, on appelle
moment empirique d’ordre 𝑟 les quantités:
1
𝑚𝑟 = (𝑋1𝑟 + 𝑋2𝑟 … 𝑋𝑛𝑟 )
𝑛

Exemple 9: Loi exponentielle 𝓔𝒙𝒑(𝝀)


1 1
On sait que 𝜇1 (𝝀) = 𝝀 et 𝑚1 = 𝑋̅.On prend donc 𝑇𝑛 = 𝑋̅ .

7
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

4.2. Méthode du maximum de vraisemblance


Définition 8
Soit (𝑋1 , 𝑋2 … 𝑋𝑛 ) un 𝑛-échantillon d’une v.a.r. 𝑋 de loi de densité 𝑓𝜃 (𝑥).La vraisemblance
de 𝜃 associée à la réalisation (𝑥1 , 𝑥2 … 𝑥𝑛 ) de l’échantillon est l’application 𝐿 (comme
Likelihood ‘‘vraisemblance’’ en anglais) de l’espace des paramètres Θ dans ℝ+ définie par:
𝐿(𝑥1 , 𝑥2 … 𝑥𝑛 , 𝜃) = 𝑓(𝑥1 , 𝜃) × 𝑓 (𝑥2 , 𝜃) … .× 𝑓(𝑥𝑛 , 𝜃)
On écrit aussi
𝐿 = 𝑓𝜃 (𝑥1 ) × 𝑓𝜃 (𝑥2 ) … .× 𝑓𝜃 (𝑥𝑛 )
EXERCICE 6
Reprenons l’exemple des personnes interrogées sur l’action du gouvernement pour montrer
comment se calcule en pratique l’estimateur du maximum de vraisemblance. La loi de 𝑋 étant
une loi de Bernoulli ℬ(𝑝), on a donc:

𝑝 𝑠𝑖 𝑥𝑖 = 1
𝑃(𝑋𝑖 = 𝑥𝑖 ) = {
1−𝑝 𝑠𝑖 𝑥𝑖 = 0
On peut écrire, de manière concentrée, que
𝑓𝑝 (𝑥𝑖 ) = 𝑝 𝑥𝑖 (1 − 𝑝)1−𝑥𝑖
1
Montrer que l’estimateur 𝑇𝑛 = (𝑋1 + ⋯ 𝑋𝑛 ) = 𝑋̅
𝑛
Indication: Calculer log 𝐿, puis calculer les dérivées première et seconde du maximum de
vraisemblance par rapport à 𝑝.

Remarque

Sous certaines conditions de régularité, l’estimateur du maximum de vraisemblance est


asymptotiquement sans biais et consistant.

Théorème 5 (Cochran simple) (Admis)

Soit (𝑋1 , … , 𝑋𝑛 un 𝑛-échantillon d’une loi 𝒩(𝜇, 𝜎 2 )


Alors:
𝑖=𝑛

∑(𝑋𝑖 − 𝑋̅ )2 ↝ 𝜎 2 𝜒𝑛−1
2

𝑖=1

C’est-à-dire
∑𝑖=𝑛 ̅ 2
𝑖=1 (𝑋𝑖 − 𝑋) 2
↝ 𝜒𝑛−1
𝜎2
De plus, 𝑋̅ et∑𝑖=𝑛 ̅ 2
𝑖=1 (𝑋𝑖 − 𝑋) sont indépendantes.

5. Information de Fisher

Définition 9
On appelle Information de Fisher apportée par la réalisation (𝑥1 , 𝑥2 … 𝑥𝑛 ) sur le paramètre 𝜃
la quantité (lorsqu’elle existe):

𝜕Log 𝑓𝜃 (𝑋) 2 𝜕Log 𝐿 2


𝐼𝑛 (𝜃) = 𝐸 [ ] =𝐸( )
𝜕𝜃 𝜕𝜃

8
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022
𝜕 2 Log 𝐿
Ou encore 𝐼𝑛 (𝜃) = 𝐸 (− )
𝜕𝜃2

Où 𝐿 est la vraisemblance.
Exemple 10

Calculons l’information de Fisher dans le modèle de Bernoulli, on a


𝑓𝑝 (𝑥 ) = 𝑝 𝑥 (1 − 𝑝)1−𝑥
Donc
Log 𝑓𝑝 (𝑥 ) = 𝑥Log𝑝 + (1 − 𝑥 )Log(1 − 𝑝)
Dérivons en la variable 𝑝
𝜕Log 𝑓𝑝 (𝑥 ) 𝑥 1 − 𝑥 𝑥−𝑝
= − =
𝜕𝑝 𝑝 1 − 𝑝 𝑝(1 − 𝑝)
Alors en trouve
𝑋−𝑝 2 1 2
𝐼 (𝑝 ) = 𝐸 ( ) =( ) 𝐸(𝑋 2 + 𝑝2 − 2𝑝𝑋)
𝑝(1 − 𝑝 𝑝(1 − 𝑝)
2
1 1
( ) (𝑝 + 𝑝2 − 2𝑝2 ) =
𝑝(1 − 𝑝 𝑝(1 − 𝑝)
Définition 10
1
Soit 𝑉𝑎𝑟(𝑇𝑛 ) ≥ 𝑛𝐼(𝜃)
Le terme de droite est appelé Inégalité de Fréchet-Darmois-Cramer-Rao (FDCR) ou tout
simplement la borne de Cramer-Rao, un estimateur sans biais dont la variance est égale à cette
borne (donc est la plus petite) est dit efficace.

EXERCICE 7
Une équipe de chercheurs en biologie veut tester l’efficacité d’un nouveau vaccin contre un
certain virus. C’est pour cela elle choisit une population de chimpanzés, catégorie des singes
qui forment une tribu des Panines à qui on injecte le virus et ce nouveau vaccin.
On note 𝑋𝑖 le singe 𝑛𝑖 qui a manifesté la présence dans le sang du virus.
Soit 𝑝 la proportion de chimpanzés non guéris.
1) Déterminer l’estimateur du maximum de vraisemblance de p et étudier ses propriétés.
2) Calculer la borne de Cramer-Rao. Cet estimateur est il efficace ?

EXERCICE 8
Soit (𝑋1 , 𝑋2 … 𝑋𝑛 ) un 𝑛-échantillon d’une v.a.r. 𝑋 de loi de densité:
𝑎
𝑓𝑝 (𝑥) = 1+1 𝑥 ≥ 1; 𝑝 > 0.
𝑥 𝑝

1. Déterminer 𝑎 en fonction de 𝑝.
2. Déterminer l’estimateur du maximum de vraisemblance 𝑇𝑛 de 𝑝. Est il biaisé ?
3. Calculer la borne de Cramer-Rao.
EXERCICE 9
Soit 𝑋 une variable aléatoire discrète dont la loi de probabilité, donnée ci-dessous, dépend
d’un paramètre 𝑝 tel que 0 < 𝑝 < 1.
𝑃(𝑋 = 0) = 𝑝2 ; 𝑃(𝑋 = 1) = 2𝑝(1 − 𝑝) ; 𝑃(𝑋 = 2) = (1 − 𝑝)2
On extrait un échantillon de taille 𝑛 = 3 de la proportion et on obtient :
𝑥1 = 0 ; 𝑥2 = 1 ; 𝑥3 = 0
Calculer une estimation de 𝑝 en utilisant le principe du maximum de vraisemblance.

9
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

EXERCICE 10
On extrait un 10-échantillon de différents calibres d’oranges de haute qualité. On note 𝑋 leur
poids. On suppose que 𝑋 suit une loi normale de paramètre 𝜇 et 𝜎.
Et on note:
𝑥1 = 200 𝑥2 = 240 𝑥3 = 190 𝑥4 = 150 𝑥5 = 220
𝑥6 = 180 𝑥7 = 170 𝑥8 = 230 𝑥9 = 210 𝑥10 = 210
Donner une estimation ponctuelle de 𝜇 et 𝜎.
EXERCICE 11
Soit 𝑋 une v.a de loi qui dépend d’un paramètre réel 𝑝. 𝑇1 et 𝑇2 sont deux estimateurs de 𝑝 et
ils sont indépendants et non biaisés ayant des variances respectives 𝑉1 et 𝑉2 .On considère
l’estimateur 𝑇3 = (1 − 𝜆)𝑇1 + 𝜆 𝑇2 , 𝜆 ∈ ℝ.
1) Montrer que 𝑇3 est aussi sans biais.
2) Pour quelle valeur de 𝜆,𝑇3 est de variance minimale?(soit 𝑉3 cette variance).
©3) Les hypothèses de Cramer-Rao étaient vérifiées, les estimateurs 𝑇1 et 𝑇2 peuvent-ils être
efficaces tous les deux?
©EXERCICE 12
Soit (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) une suite de v.a.r indépendantes de paramètre 𝑝 et de densité :
1
−(1+ )
𝑓 (𝑥, 𝑝) = 𝑎𝑥 𝑝 𝑥≥1 ; 𝑝>0
1. Quelle condition doit remplir le paramètre 𝑎 pour que 𝑓 soit une densité ?
2. Déterminer l’estimateur du maximum de vraisemblance 𝑇𝑛 de 𝑝. Est il biaisé ou non ?
3. Déterminer la borne de Cramer-Rao. Conclure.
©EXERCICE 13
Soit (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) un échantillon d’une loi normale 𝒩(𝜇, 𝜎 2 ).
1. Déterminer l’estimateur du maximum de vraisemblance Tn du paramètre μ
2. Montrer que Tn est non biaisé.
3. Est-il consistant ?
Rappelons que la formulation mathématique de la loi normale est:
1 (𝑥 − 𝜇)2
( )
𝑓 𝑥 = 𝑒𝑥𝑝 −
𝜎√2𝜋 2𝜎²
©EXERCICE 14
1. Calculer l’intégrale suivante en fonction de 𝑝:
𝑎
1+𝑝
𝐼𝑎 = ∫ 4
𝑑𝑥
1 (𝑥 + 𝑝 )
où 𝑝 est un paramètre de ]−1, +∞[ .
En déduire:
𝑙𝑖𝑚 𝐼𝑎
𝑎→+∞
Soit 𝑋 une suite de v.a.r définie sur [1, +∞[ et de densité:
1+𝑝
𝑓 (𝑥, 𝑝) =
(𝑥 + 𝑝)2
où 𝑝 est un paramètre de ]−1, +∞[. On extrait un échantillon (𝑋1 , 𝑋2 , . . 𝑋𝑛 ) de la loi de X.
2. Déterminer la borne de Cramer-Rao pour l’estimateur 𝑝.
EXERCICE 15
Soit 𝑋 une variable aléatoire qui suit une loi de Poisson de paramètre 𝜆.déterminer un
estimateur de 𝜆 par la méthode du maximum de vraisemblance L.

10
Statistique Échantillonnage Estimation 2021-
Prof Idelhakkar Brahim 2022

11

Vous aimerez peut-être aussi