Académique Documents
Professionnel Documents
Culture Documents
Ouazza Ahmed
2022-2023
1 / 47
Plan
2 Ch II : Estimation ponctuelle
2 / 47
Chapitre IV:
Tests Statistiques
3 / 47
Tests Statistiques
I: Tests paramétriques
4 / 47
Tests Statistiques
I: Tests paramétriques
5 / 47
Tests Statistiques
6 / 47
Tests Statistiques
7 / 47
Tests Statistiques
8 / 47
Tests Statistiques
9 / 47
Tests Statistiques
10 / 47
Un test statistique est basé sur un modèle probabiliste et comporte un certain
risque.
Définition 0.2
• On appelle risque de première espèce, notée α, la probabilité de rejeter
l’hypothèse H0 alors qu’elle est vraie, c-à-d α = P (W/H0 ).
α : Θ0 → [0, 1]
θ0 → α(θ0 ) = Eθ0 (ϕ(X)) = Pθ0 (ϕ(X) = 1)
• La probabilité de retenir l’hypothèse H0 alors qu’elle est fausse s’appelle
risque de deuxième espèce, notée 1 − β, c-à-d 1 − β = P (W c /H1 ).
1 − β = Eθ (1 − ϕ(X)) = Pθ (ϕ(X) = 0) ∀θ ∈ Θ1
• La probabilité β s’appelle puissance du test (c-à-d la puissance du test est
la probabilité d’accepter H1 alors qu’elle est vraie).
11 / 47
Tests Statistiques
Les différentes situations que l’on peut rencontrer dans le cadre des tests
d’hypothèse sont résumées dans le tableau suivant :
Décision \ Réalité H0 est vraie H0 est fausse
Accepter H0 conclusion correcte erreur de deuxième espèce
(1 − α) (1 − β)
Rejeter H0 erreur de première espèce conclusion correcte
(α) (β)
12 / 47
Définition 0.3
• Soit H0 : θ ∈ Θ0 une hypothèse nulle multiple et α(θ) le risque de première
espèce pour la valeur θ ∈ Θ0 . On appelle niveau du test (ou seuil du test) la
valeur α telle que :
Dans la pratique, on fixe un seuil α et on cherche la région critique W telle que, pour θ ∈ Θ0 ,
Pθ ((X1 , · · · , Xn ) ∈ W ) = α, en utilisant la méthode de Neymann-Pearson et test les plus
puissants, la méthode du maximum de vraisemblance...
13 / 47
Tests Statistiques
Définition 0.4
Étant donnés deux tests ϕ1 et ϕ2 de niveau ≤ α pour tester l’hypothèse
H0 : θ ∈ Θ0 contre H1 : θ ∈ Θ1 .
Le test ϕ1 est uniformément plus puissant (UPP) que ϕ2 si et seulement si
∀θ ∈ Θ1 β1 (θ) ≥ β2 (θ).
14 / 47
Tests Statistiques
15 / 47
Tests Statistiques
On pose:
L0 (X1 , · · · , Xn ) = vraisemblance quand θ = θ0
L1 (X1 , · · · , Xn ) = vraisemblance quand θ = θ1
Définition 0.5
L1 (X1 , · · · , Xn )
Soit R(X) = le rapport de vraisemblance.
L0 (X1 , · · · , Xn )
On considère la famille de tests ϕk dont la région critique Wk est de la forme
:
L1 (X1 , · · · , Xn )
R(X) = >k
L0 (X1 , · · · , Xn )
On appelle test de Neyman-Pearson tout test de cette forme.
17 / 47
Tests Statistiques
Remarque
Le deuxième point nous dit que tout test UPP de niveau α coïncide avec ϕk ,
ν-presque partout sur l’ensemble {x/R(x) 6= k}. C-à-d ∀θ ∈ {θ0 , θ1 }
18 / 47
Tests Statistiques
Existence d’un test UPP avec randomisation:
Si on utilise des tests randomisés ( c-à-d le test ϕk prend des valeurs dans
[0, 1]), on a un résultat plus fort, qui garantit l’existence d’un test UPP de
niveau α, quel que soit α ∈]0, 1[.
Théorème 0.2 (Neyman-Pearson II: existence avec randomisation)
Soit α ∈]0, 1[, il existe des constantes k > 0 et γ ∈ [0, 1] tels que le test:
1 si R(x) > k
ϕk (x) = γ si R(x) = k
0 si R(x) < k
20 / 47
Tests Statistiques
On a:
n
!
1 −1 X
L1 (x1 , · · · , xn ) = √ exp (xi − m1 )2
( 2πσ02 )n 2σ02 i=1
n
!
1 −1 X
et L0 (x1 , · · · , xn ) = √ exp 2 (xi − m0 )2
( 2πσ02 )n 2σ0 i=1
Donc
L1 (x1 , · · · , xn )
R(x) =
L0 (x1 , · · · , xn )
n n
!
−1 X 2 1 X 2
= exp (xi − m1 ) + 2 (xi − m0 )
2σ02 i=1 2σ0 i=1
n(m1 − m0 ) n 2 2
= exp x − 2 (m1 − m0 )
σ02 σ0
21 / 47
Tests Statistiques
22 / 47
Tests Statistiques
23 / 47
Tests Statistiques
24 / 47
Tests Statistiques
25 / 47
Tests Statistiques
Donc
σ0
β = Pθ1 X > z1−α √ + m0
n
√ √
n(X − m1 ) z1−α σ0 − δ n
= P θ1 >
σ0 σ0
√ √
n(X − m1 ) n
= P θ1 > z1−α − δ
σ0 σ0
√
n
= 1 − φ(z1−α − δ)
σ0
= g(δ)
Si δ → 0 alors β → α
Si δ → +∞ alors β → 1
26 / 47
Tests Statistiques
ou
H0 : θ ≥ θ0 H0 : θ = θ0
⇔
H1 : θ < θ0 H1 : θ < θ0
27 / 47
Tests Statistiques
28 / 47
Tests Statistiques
Exemple 1:
La famille (N (θ, 1), θ ∈ R) est à RVM, en effet:
0
Pour θ < θ , on a:
0
0
√1 exp − 12 ni=1 (xi − θ )2
P
L(x1 , · · · , xn , θ ) = ( 2π)n
1 1 Pn 2
et L(x1 , · · · , xn , θ) = (√2π)n exp − 2 i=1 (xi − θ)
donc
0
L(x1 , · · · , xn , θ ) 0 n 02
= exp (θ − θ)nx − (θ − θ2 )
L(x1 , · · · , xn , θ) 2
1 Pn
on pose S(x) = x = n i=1 xi
donc
0
L(x1 , · · · , xn , θ ) 0 n 02
= exp (θ − θ)nS(x) − (θ − θ2 ) = G(S(x))
L(x1 , · · · , xn , θ) 2
on remarque que G est monotone, donc la famille (N (θ, 1), θ ∈ R) est à
29 / 47
Tests Statistiques
Exemple 2:
La famille (N (0, θ2 ), θ ∈ R?+ ) est à RVM, puisque:
n
0 n !
L(x1 , · · · , xn , θ ) θ 1 0 −2 X
= exp − (θ − θ−2 ) x2i
L(x1 , · · · , xn , θ) θ0 2
i=1
Pn 2
on pose S(x) = i=1 xi
donc
0
L(x1 , ·, xn , θ )
= G(S(x)) et G est monotone.
L(x1 , ·, xn , θ)
30 / 47
Tests Statistiques
Exemple 3:
La famille (B(θ), θ ∈]0, 1[) est à RVM, en effet:
0 0
!n 0
!Pni=1 xi
L(x1 , · · · , xn , θ ) 1−θ θ (1 − θ)
=
L(x1 , · · · , xn , θ) 1−θ θ(1 − θ0
on pose S(x) = ni=1 xi
P
donc
0
L(x1 , ·, xn , θ )
= G(S(x)) et G est monotone.
L(x1 , ·, xn , θ)
d’où la famille (B(θ), θ ∈]0, 1[) est à RVM.
31 / 47
Tests Statistiques
Remarque:
De façon générale, si (X1 , · · · , Xn ) est un échantillon iid d’une famille
exponentielle de densité:
32 / 47
Tests Statistiques
H1 : σ 2 > σ02
avec σ02 donné (connu).
Exercice 2:
Soit X1 , · · · , Xn iid avec Xi ∼ U]0,θ[ , θ > 0.
Déterminer la région de rejet associée au problème de test suivant:
H0 : θ = θ0
H1 : θ > θ0
avec θ0 donné (connu).
36 / 47
Tests Statistiques
37 / 47
Tests Statistiques
38 / 47
Tests Statistiques
Exemple:
Soit X1 , · · · , Xn iid, avec Xi ∼ N (m, σ02 )
Le paramètre m ∈ R est inconnu et σ02 > 0 est connu (spécifié).
On considère le problème de test suivant:
H0 : m = m0
H1 : m 6= m0
avec m0 connu.
∀α ∈]0, 1[ le test ϕα (X1 , · · · , Xn ) défini par
1 si X < c1 ou X > c2
ϕα (X1 , · · · , Xn ) =
0 si c1 ≤ X ≤ c2
est UPP sans biais au niveau α.
39 / 47
Tests Statistiques
40 / 47
Tests Statistiques
α
on remarque que z α2 = −z1− α2 où z1− α2 est le quantile d’ordre 1 − 2 d’une
loi N (0, 1)
d’où
c1 = −z1− α2 √σ0n + m0
de la même façon on trouve :
c2 = z1− α2 √σ0n + m0
Par conséquent, on rejette H0 si
σ0
X < c1 = −z1− α2 √ n
+ m0 ou X > c2 = z1− α2 √σ0n + m0
Remarque: La région d’acceptation de H0 est
σ0 σ0
{−z1− α2 √ + m0 ≤ X ≤ z1− α2 √ + m0 }
n n
42 / 47
Tests Statistiques
Définition 0.8
• On appelle rapport de vraisemblance généralisé (RVG), la fonction
λ(x1 , · · · , xn ) telle que:
sup L(θ, x1 , · · · , xn )
θ∈Θ0
λ(x1 , · · · , xn ) =
supL(θ, x1 , · · · , xn )
θ∈Θ
• On appelle test du RVG, le test défini par une région de rejet de la forme :
λ(x1 , · · · , xn ) < k ≤ 1
43 / 47
Tests Statistiques
Exemple:
Soit X1 , · · · , Xn iid avec Xi ∼ N (m, σ 2 ), avec (m, σ 2 ) inconnu.
Déterminer la région critique pour le problème du test suivant:
H0 : σ 2 = σ02
H1 : σ 2 6= σ02
44 / 47
Tests Statistiques
p-value (p-valeur):
45 / 47
Tests Statistiques
•
•
•
•
46 / 47
Tests Statistiques
47 / 47