Académique Documents
Professionnel Documents
Culture Documents
1/43
Cours 5/10
Tests d’hypothèses
Objectifs du cours 5
◮ prendre une décision en posant un test d’hypothèse
◮ choisir et construire un test d’hypothèse
◮ définir et calculer les risques de première et deuxième espèce
2/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
3/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Exemple « Fiabilité composant »
iid
Rappel : X1 , . . . , Xn ∼ E(θ), θ > 0.
Problème posé
Le producteur souhaite proposer à ses clients une garantie d’un an.
➠ Est-ce pertinent ?
Reformuler la question
Il estime qu’une garantie est envisageable si :
4/43
Exemple « Fiabilité composant »
iid
Rappel : X1 , . . . , Xn ∼ E(θ), θ > 0.
Problème posé
Le producteur souhaite proposer à ses clients une garantie d’un an.
➠ Est-ce pertinent ?
Reformuler la question
Il estime qu’une garantie est envisageable si :
4/43
Exemple « Fiabilité composant »
0.6
0.5 σ02
N θ0 , n
0.4
Application num.
0.3 σ0
√
θ0 = 0
n t = 1.30
0.2
7/43
σ02
Si H1 est vraie (θ = θ1 ) : X̄ ∼ N , et ainsi :
θ1 , n
Pθ1 (δ = 0) = Pθ1 (X̄ ≤ t) = Φ σt−θ √1
/ n 0
0.6
0.5 σ02 σ02
N θ0 , n N θ1 , n
0.4
Application num.
0.3 σ0
√
t = 1.30
n θ1 = 2
0.2
18.8%
0.1 5%
0
θ0 t θ1
8/43
Un premier aperçu du vocabulaire
9/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Poser un test d’hypothèse
Hypothèse statistique
Une hypothèse statistique est représentée par un sous-ensemble de
P X , et donc par un sous-ensemble de Θ.
Hypothèse nulle
On appelle hypothèse nulle l’hypothèse H0 : θ ∈ Θ0
◮ que l’on « veut tester »,
◮ celle qui sera conservée par défaut si elle n’est pas incohérente
avec les données.
Hypothèse alternative
On appelle hypothèse alternative l’hypothèse H1 : θ ∈ Θ1
◮ qui sera choisie si H0 est rejetée.
◮ On suppose que Θ1 ∩ Θ0 = ∅.
Hypothèse nulle
On appelle hypothèse nulle l’hypothèse H0 : θ ∈ Θ0
◮ que l’on « veut tester »,
◮ celle qui sera conservée par défaut si elle n’est pas incohérente
avec les données.
Hypothèse alternative
On appelle hypothèse alternative l’hypothèse H1 : θ ∈ Θ1
◮ qui sera choisie si H0 est rejetée.
◮ On suppose que Θ1 ∩ Θ0 = ∅.
Exemple 1.
iid
◮ X1 , X2 , . . . , Xn ∼ E(θ), avec θ ∈ Θ = [0, +∞[,
◮ Θ0 = {θ ≥ θ0 } ; Θ1 = {θ < θ0 } avec θ0 > 0 un seuil fixé.
Exemple 1.
iid
◮ X1 , X2 , . . . , Xn ∼ E(θ), avec θ ∈ Θ = [0, +∞[,
◮ Θ0 = {θ ≥ θ0 } ; Θ1 = {θ < θ0 } avec θ0 > 0 un seuil fixé.
Exemple 1.
iid
◮ X1 , X2 , . . . , Xn ∼ E(θ), avec θ ∈ Θ = [0, +∞[,
◮ Θ0 = {θ ≥ θ0 } ; Θ1 = {θ < θ0 } avec θ0 > 0 un seuil fixé.
13/43
Procédure de test
δ: X 7→ {0, 1},
(
0 si H0 est acceptée,
x →
1 si elle est rejetée (en faveur de H1 ).
14/43
Procédure de test
δ: X 7→ {0, 1},
(
0 si H0 est acceptée,
x →
1 si elle est rejetée (en faveur de H1 ).
14/43
Quantifier les risques d’erreur
(△
! Ce risque dépend de la valeur de θ, pour θ ∈ Θ0 .)
(△
! Ce risque dépend de la valeur de θ, pour θ ∈ Θ0 .)
Pθ (δ = 1) = Eθ (δ), θ ∈ Θ1 .
Pθ (δ = 1) = Eθ (δ), θ ∈ Θ1 .
Remarques :
◮ il s’agit d’un ordre partiel sur les fonctions puissance,
◮ lorsque c’est possible, on cherchera le test uniformément le plus puissant
au niveau α (c’est-à-dire un test de niveau α, uniformément plus puissant
que tout autre test de niveau α).
17/43
Définition : taille d’un test
On dit que δ est de niveau exactement α, ou de taille α, si
sup Pθ (δ = 1) = α.
θ∈Θ0
Remarques :
◮ il s’agit d’un ordre partiel sur les fonctions puissance,
◮ lorsque c’est possible, on cherchera le test uniformément le plus puissant
au niveau α (c’est-à-dire un test de niveau α, uniformément plus puissant
que tout autre test de niveau α).
17/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Test du rapport de vraisemblance
Supposons deux hypothèses simples : Θ0 = {θ0 } et Θ1 = {θ1 }.
L(θ1 , X )
T = .
L(θ0 , X )
† X X
On peut montrer que la famille finie {Pθ , Pθ } est tjrs dominée (ex. facultatif / Radon-Nikodym).
0 1
18/43
Test du rapport de vraisemblance
Supposons deux hypothèses simples : Θ0 = {θ0 } et Θ1 = {θ1 }.
L(θ1 , X )
T = .
L(θ0 , X )
† X X
On peut montrer que la famille finie {Pθ , Pθ } est tjrs dominée (ex. facultatif / Radon-Nikodym).
0 1
18/43
Résultat fondamental
Soit α ∈ ]0, 1[.
n(θ12 −θ02 ) Pn
= exp − 2σ2 exp (θ1σ−θ
2
0)
i=1 Xi .
0 0
Pn
θ1 > θ0 donc δ = 1 ⇐⇒ T > t ⇐⇒ i=1 Xi >c
20/43
Retour sur l’exemple gaussien
n(θ12 −θ02 ) Pn
= exp − 2σ2 exp (θ1σ−θ
2
0)
i=1 Xi .
0 0
Pn
θ1 > θ0 donc δ = 1 ⇐⇒ T > t ⇐⇒ i=1 Xi >c
20/43
Statistique de test et p-valeur
Le résultat d’un test peut être exprimé à l’aide de sa p-valeur.
Définition : p-valeur
Soit T la statistique de test d’un test de la forme δ = 1T >tα .
pval(x) = 1 − F0 (T (x)).
21/43
Statistique de test et p-valeur
Le résultat d’un test peut être exprimé à l’aide de sa p-valeur.
Définition : p-valeur
Soit T la statistique de test d’un test de la forme δ = 1T >tα .
pval(x) = 1 − F0 (T (x)).
21/43
Statistique de test et p-valeur
Le résultat d’un test peut être exprimé à l’aide de sa p-valeur.
Définition : p-valeur
Soit T la statistique de test d’un test de la forme δ = 1T >tα .
pval(x) = 1 − F0 (T (x)).
21/43
Interprétation de la p-valeur
Supposons F0 continue et strictement croissante :
∀α ∈ ]0, 1[, ∃!tα ∈ R, δ = 1T >tα est de niveau exactement α.
Proposition
Proposition
0.4 H0 acceptée
0.2
α = 0.233
0
θ0 tα = T (x)
0.4 H0 acceptée
0.2
α = 0.05
0
θ0 T (x) tα
pval est le plus grand niveau α auquel on accepte H0 .
23/43
0.4 H0 rejetée
0.2
α = 0.4
0
θ0 tα T (x)
0.4 H0 acceptée
0.2
α = 0.05
0
θ0 T (x) tα
pval est le plus grand niveau α auquel on accepte H0 .
23/43
Démonstration
F0 (tα ) = 1 − α.
On a donc
δ=1 ⇔ T > tα
⇔ F0 (T ) > F0 (tα ) = 1 − α
⇔ pval < α
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Exemples de tests avec des hypothèses composites
24/43
Exemples de tests avec des hypothèses composites
24/43
Différences avec le cas d’hypothèses simples
∀θ ∈ Θ0 , Pθ (δ = 1) ≤ α ⇔ sup Pθ (δ = 1) ≤ α.
θ∈Θ0
| {z }
taille du test
Θ1 → [0, 1]
θ 7 → Pθ (δ = 1) .
25/43
Différences avec le cas d’hypothèses simples
∀θ ∈ Θ0 , Pθ (δ = 1) ≤ α ⇔ sup Pθ (δ = 1) ≤ α.
θ∈Θ0
| {z }
taille du test
Θ1 → [0, 1]
θ 7 → Pθ (δ = 1) .
25/43
Différences avec le cas d’hypothèses simples (suite)
supθ∈Θ1 L(θ; X )
T (X ) = .
supθ∈Θ0 L(θ; X )
pval = sup (1 − Fθ (T )) .
θ∈Θ0
26/43
Différences avec le cas d’hypothèses simples (suite)
supθ∈Θ1 L(θ; X )
T (X ) = .
supθ∈Θ0 L(θ; X )
pval = sup (1 − Fθ (T )) .
θ∈Θ0
26/43
Retour sur l’exemple gaussien / test sur la moyenne
Cas 1. H0 : θ = θ0 / H1 : θ = θ1 , avec θ0 < θ1
◮ Rappel du test optimal :
σ0
δ(X ) = 1 ⇐⇒ X̄ > tα avec tα = θ0 + q1−α √ n
Analyse du test δ
◮ δ est identique ∀θ1 > θ0 (il ne dépend que de α et θ0 ) ;
◮ θ 7→ Pθ (δ = 1) = 1 − Φ tα −θ √ est croissante
σ / n
0
Cas 2. H0 : θ = θ0 / H1 : θ > θ0
Cas 3. H0 : θ ≤ θ0 / H1 : θ > θ0
Conclusion sur les cas 2 et 3
◮ δ est un test de niveau (exactement) α,
◮ δ est UPP parmi les tests de niveau au moins α.
27/43
Retour sur l’exemple gaussien / test sur la moyenne
Cas 1. H0 : θ = θ0 / H1 : θ = θ1 , avec θ0 < θ1
◮ Rappel du test optimal :
σ0
δ(X ) = 1 ⇐⇒ X̄ > tα avec tα = θ0 + q1−α √ n
Analyse du test δ
◮ δ est identique ∀θ1 > θ0 (il ne dépend que de α et θ0 ) ;
◮ θ 7→ Pθ (δ = 1) = 1 − Φ tα −θ √ est croissante
σ / n
0
Cas 2. H0 : θ = θ0 / H1 : θ > θ0
Cas 3. H0 : θ ≤ θ0 / H1 : θ > θ0
Conclusion sur les cas 2 et 3
◮ δ est un test de niveau (exactement) α,
◮ δ est UPP parmi les tests de niveau au moins α.
27/43
Retour sur l’exemple gaussien / test sur la moyenne
Cas 1. H0 : θ = θ0 / H1 : θ = θ1 , avec θ0 < θ1
◮ Rappel du test optimal :
σ0
δ(X ) = 1 ⇐⇒ X̄ > tα avec tα = θ0 + q1−α √ n
Analyse du test δ
◮ δ est identique ∀θ1 > θ0 (il ne dépend que de α et θ0 ) ;
◮ θ 7→ Pθ (δ = 1) = 1 − Φ tα −θ √ est croissante
σ / n
0
Cas 2. H0 : θ = θ0 / H1 : θ > θ0
Cas 3. H0 : θ ≤ θ0 / H1 : θ > θ0
Conclusion sur les cas 2 et 3
◮ δ est un test de niveau (exactement) α,
◮ δ est UPP parmi les tests de niveau au moins α.
27/43
Cas 4 (test bilatéral) : H0 : Θ0 = {θ0 } / H1 : Θ1 = {θ 6= θ0 }
Idée† : utiliser T (X ) = X̄ − θ0
σ0
➠ H0 rejetée si T (X ) > tα avec tα = √
n
q1− α2 .
0.6
0.5 σ02
N θ0 , n
0.4 Application numérique :
θ0 = 0
0.3 σ0 tα = 1.55
√
n x̄ = 0.577
0.2 pval = 0.47
0.1
α α
2 tα tα 2 = 2.5%
0
θ0 x̄
† Exercice : montrer qu’il s’agit du test du RV généralisé quand σ 2 = σ02 est connu.
28/43
Cas 4 (test bilatéral) : H0 : Θ0 = {θ0 } / H1 : Θ1 = {θ 6= θ0 }
Idée† : utiliser T (X ) = X̄ − θ0
σ0
➠ H0 rejetée si T (X ) > tα avec tα = √
n
q1− α2 .
0.6
0.5 σ02
N θ0 , n
0.4 Application numérique :
θ0 = 0
0.3 σ0 tα = 1.55
√
n x̄ = 0.577
0.2 pval = 0.47
0.1
α α
2 tα tα 2 = 2.5%
0
θ0 x̄
† Exercice : montrer qu’il s’agit du test du RV généralisé quand σ 2 = σ02 est connu.
28/43
Cas 4 (test bilatéral) : H0 : Θ0 = {θ0 } / H1 : Θ1 = {θ 6= θ0 }
Idée† : utiliser T (X ) = X̄ − θ0
σ0
➠ H0 rejetée si T (X ) > tα avec tα = √
n
q1− α2 .
0.6
0.5 σ02
N θ0 , n
0.4 Application numérique :
θ0 = 0
0.3 σ0 tα = 1.55
√
n x̄ = 0.577
0.2 pval = 0.47
0.1
α α
2 tα tα 2 = 2.5%
0
θ0 x̄
† Exercice : montrer qu’il s’agit du test du RV généralisé quand σ 2 = σ02 est connu.
28/43
Application « Fiabilité composant »
iid
Rappel : X1 , . . . , Xn ∼ E(θ)
H0 : Θ0 = {θ ≥ θ0 } (composant insuffisamment fiable)
H1 : Θ1 = {θ < θ0 } (composant suffisamment fiable)
iid
Rappel : X1 , . . . , Xn ∼ E(θ)
H0 : Θ0 = {θ ≥ θ0 } (composant insuffisamment fiable)
H1 : Θ1 = {θ < θ0 } (composant suffisamment fiable)
Remarque : même principe pour n’importe quel test unilatéral sur ce modèle.
Application « Fiabilité composant » (suite)
Zone de rejet du test du RV au niveau α :
n o
Rα = x tel que T RV (x) > tαRV = x tel que T (x) = x̄ > tα .
Remarque : même principe pour n’importe quel test unilatéral sur ce modèle.
Application « Fiabilité composant » (suite)
Zone de rejet du test du RV au niveau α :
n o
Rα = x tel que T RV (x) > tαRV = x tel que T (x) = x̄ > tα .
Remarque : même principe pour n’importe quel test unilatéral sur ce modèle.
Application « Fiabilité composant » (suite)
0.15
Γ (p = n, λ = nθ0 )
Application numérique :
0.1 n = 10
θ0 = − log(0.9)
tα = 14.91
0.05
x̄ = 10.15
pval = 0.47
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
iid
Contexte : X1 , X2 , . . . ∼ Pθ
√ 1
loi
Par le TCL on a sous H0 : n X̄n − θ0 −−−→ N 0, θ12 , donc
n→∞ 0
∞ 1 1
tα,n = + √ q1−α
θ0 θ0 n
√ 1
loi
Par le TCL on a sous H0 : n X̄n − θ0 −−−→ N 0, θ12 , donc
n→∞ 0
∞ 1 1
tα,n = + √ q1−α
θ0 θ0 n
√ 1
loi
Par le TCL on a sous H0 : n X̄n − θ0 −−−→ N 0, θ12 , donc
n→∞ 0
∞ 1 1
tα,n = + √ q1−α
θ0 θ0 n
√ 1
loi
Par le TCL on a sous H0 : n X̄n − θ0 −−−→ N 0, θ12 , donc
n→∞ 0
∞ 1 1
tα,n = + √ q1−α
θ0 θ0 n
tα,n (exact)
18
∞ (asympt.)
tα,n
16
14 ∞ calculés
tα,n et tα,n
pour α = 0.05
12
1 1
=−
θ0 log(0.9)
102 104
taille échantillon n
30/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Test d’adéquation à une loi donnée
iid
Contexte : X1 , X2 , . . . ∼ P avec P inconnue, quelconque ;
➠ θ = P, Θ = { lois de probabilité sur (R, B(R)) }.
31/43
Test d’adéquation à une loi donnée
iid
Contexte : X1 , X2 , . . . ∼ P avec P inconnue, quelconque ;
➠ θ = P, Θ = { lois de probabilité sur (R, B(R)) }.
31/43
Test d’adéquation à une loi donnée
iid
Contexte : X1 , X2 , . . . ∼ P avec P inconnue, quelconque ;
➠ θ = P, Θ = { lois de probabilité sur (R, B(R)) }.
31/43
Statistique de test du χ2
Soient (A1 , . . . , AK ) une partition du support de P0 , et
◮ N = (N1 , . . . , NK ) avec
P
Nk = ni=1 1Ak (Xi ) → effectifs observés,
◮ p = (p1 , . . . , pK ) avec
pk = P0 (X1 ∈ Ak ) → npk = effectifs moyens sous H0 .
Proposition
Sous l’hypothèse H0 , N suit une loi multinomiale Multi(n, p) et
K
X (Nk − npk )2 loi
Tn = −−−→ χ2 (K − 1)
npk n→∞
k=1
.
(loi du χ2 à K − 1 degrés de liberté)
32/43
Statistique de test du χ2
Soient (A1 , . . . , AK ) une partition du support de P0 , et
◮ N = (N1 , . . . , NK ) avec
P
Nk = ni=1 1Ak (Xi ) → effectifs observés,
◮ p = (p1 , . . . , pK ) avec
pk = P0 (X1 ∈ Ak ) → npk = effectifs moyens sous H0 .
Proposition
Sous l’hypothèse H0 , N suit une loi multinomiale Multi(n, p) et
K
X (Nk − npk )2 loi
Tn = −−−→ χ2 (K − 1)
npk n→∞
k=1
.
(loi du χ2 à K − 1 degrés de liberté)
32/43
Test du χ2
Rappel. On veut tester H0 : P = P0 contre H1 : P 6= P0 .
Test d’adéquation du χ2
Soit 0 < α < 1 et soit T la statistique de test
K
X (Nk − npk )2
T = .
npk
k=1
δ = 1T >tα ,
△
! Condition d’application : choisir (A , . . . , A
1 K) tel que npk ≥ 5, ∀k.
33/43
Test du χ2
Rappel. On veut tester H0 : P = P0 contre H1 : P 6= P0 .
Test d’adéquation du χ2
Soit 0 < α < 1 et soit T la statistique de test
K
X (Nk − npk )2
T = .
npk
k=1
δ = 1T >tα ,
△
! Condition d’application : choisir (A , . . . , A
1 K) tel que npk ≥ 5, ∀k.
33/43
Test du χ2
Rappel. On veut tester H0 : P = P0 contre H1 : P 6= P0 .
Test d’adéquation du χ2
Soit 0 < α < 1 et soit T la statistique de test
K
X (Nk − npk )2
T = .
npk
k=1
δ = 1T >tα ,
△
! Condition d’application : choisir (A , . . . , A
1 K) tel que npk ≥ 5, ∀k.
33/43
Quelques mots sur la loi multinomiale Multi(n, p)
Paramètres de la loi
◮ n entier ≥ 1,
K PK
◮ K entier ≥ 2 et p ∈ (R+
⋆ ) tel que k=1 pk = 1.
PK
Soient n1 , . . . , nK entiers ≥ 0 tel que k=1 nk = n :
n!
Si N ∼ Multi(n, p), P (N1 = n1 , . . . , NK = nk ) = p n1 . . . pKnK
n1 ! . . . nK ! 1
Moments
◮ moyenne : Ep (N) = np
◮ matrice de covariance : covp (Ni , Nj ) = n(pi δij − pi pj )
Loi marginales
◮ Les lois marginales sont binomiales : Nj ∼ B(n, pj ).
Quelques mots sur la loi du χ2 (q)
Paramètre de la loi
◮ q entier ≥ 1 : nombre de degrés de liberté.
iid
Définition. Si Y1 , . . . , Yq ∼ N (0, 1) alors
P
T = qk=1 Yk2 ∼ χ2 (q)
Moyenne Variance
◮ Eq (T ) = q ◮ varq (T ) = 2q
Test d’adéquation à une famille de lois
Illustration avec l’exemple « Fiabilité composant »
Objectif : tester si les durées de vie suivent une loi exponentielle.
➠ Hypothèse H0 : ∃θ > 0, P = Pθ = E(θ).
Démarche
1 Estimation de θ à partir des données → θ̂.
2 Test d’adéquation à la loi Pθ̂ .
Mise en œuvre
p̂k = Pθ̂ (X1 ∈ Ak )
K
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (K − 1 − q) avec q = card(θ)
np̂k n→∞
k=1
On rejette H0 si T (x n ) > tα
avec tα quantile d’ordre 1 − α de la loi χ2 (K − 1 − q).
34/43
Test d’adéquation à une famille de lois
Illustration avec l’exemple « Fiabilité composant »
Objectif : tester si les durées de vie suivent une loi exponentielle.
➠ Hypothèse H0 : ∃θ > 0, P = Pθ = E(θ).
Démarche
1 Estimation de θ à partir des données → θ̂.
2 Test d’adéquation à la loi Pθ̂ .
Mise en œuvre
p̂k = Pθ̂ (X1 ∈ Ak )
K
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (K − 1 − q) avec q = card(θ)
np̂k n→∞
k=1
On rejette H0 si T (x n ) > tα
avec tα quantile d’ordre 1 − α de la loi χ2 (K − 1 − q).
34/43
Test d’adéquation à une famille de lois
Illustration avec l’exemple « Fiabilité composant »
Objectif : tester si les durées de vie suivent une loi exponentielle.
➠ Hypothèse H0 : ∃θ > 0, P = Pθ = E(θ).
Démarche
1 Estimation de θ à partir des données → θ̂.
2 Test d’adéquation à la loi Pθ̂ .
Mise en œuvre
p̂k = Pθ̂ (X1 ∈ Ak )
K
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (K − 1 − q) avec q = card(θ)
np̂k n→∞
k=1
On rejette H0 si T (x n ) > tα
avec tα quantile d’ordre 1 − α de la loi χ2 (K − 1 − q).
34/43
Test d’adéquation à une famille de lois
Illustration avec l’exemple « Fiabilité composant »
Objectif : tester si les durées de vie suivent une loi exponentielle.
➠ Hypothèse H0 : ∃θ > 0, P = Pθ = E(θ).
Démarche
1 Estimation de θ à partir des données → θ̂.
2 Test d’adéquation à la loi Pθ̂ .
Mise en œuvre
p̂k = Pθ̂ (X1 ∈ Ak )
K
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (K − 1 − q) avec q = card(θ)
np̂k n→∞
k=1
On rejette H0 si T (x n ) > tα
avec tα quantile d’ordre 1 − α de la loi χ2 (K − 1 − q).
34/43
Exemple « Fiabilité composant »
25
effectifs empiriques Nk
20
effectifs attendus np̂k
15
effectif
10
0
0 3 6 9 12 15 18 24 30
x
classe [0, 3[ [3, 6[ [6, 9[ [9, 12[ [12, 15[ [15, 18[ [18, 24[ [24, ∞[
Nk 19 23 12 4 9 7 14 5
np̂k 22.0 17.2 13.4 10.4 8.14 6.35 8.82 5.36
8
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (8 − 1 − 1)
np̂k n→∞
k=1
35/43
Exemple « Fiabilité composant »
25
effectifs empiriques Nk
20
effectifs attendus np̂k
15
effectif
10
0
0 3 6 9 12 15 18 24 30
x
classe [0, 3[ [3, 6[ [6, 9[ [9, 12[ [12, 15[ [15, 18[ [18, 24[ [24, ∞[
Nk 19 23 12 4 9 7 14 5
np̂k 22.0 17.2 13.4 10.4 8.14 6.35 8.82 5.36
8
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (8 − 1 − 1)
np̂k n→∞
k=1
35/43
Exemple « Fiabilité composant »
25
effectifs empiriques Nk
20
effectifs attendus np̂k
15
effectif
10
0
0 3 6 9 12 15 18 24 30
x
classe [0, 3[ [3, 6[ [6, 9[ [9, 12[ [12, 15[ [15, 18[ [18, 24[ [24, ∞[
Nk 19 23 12 4 9 7 14 5
np̂k 22.0 17.2 13.4 10.4 8.14 6.35 8.82 5.36
8
X (Nk − np̂k )2 loi
T (X n ) = −−−→ χ2 (8 − 1 − 1)
np̂k n→∞
k=1
35/43
Application numérique. n = 100, T (x n ) = 9.75
0.14
densité de la loi χ2 (6)
0.12
Application numérique
0.1
T (x n ) = 9.75
0.08 pval = 0.14
0.06
0.04
0.02 α = 5%
0
0 3 6 T (x n ) tα 15 18
= 9.75 = 12.6
➠ pour un niveau à 5%, H0 est acceptée
36/43
Application numérique. n = 100, T (x n ) = 9.75
0.14
densité de la loi χ2 (6)
0.12
Application numérique
0.1
T (x n ) = 9.75
0.08 pval = 0.14
0.06
0.04
0.02 α = 5%
0
0 3 6 T (x n ) tα 15 18
= 9.75 = 12.6
➠ pour un niveau à 5%, H0 est acceptée
36/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Test d’adéquation à une loi fixée : H0 : P = P0 .
Distance de Kolmogorov-Smirnov
On appelle distance de Kolmogorov-Smirnov la quantité
Dn = sup F̂n (x) − F0 (x) ,
x
Pn
avec F0 la FR de P0 et F̂n la FR empirique ➠ F̂n (x) = 1
n i=1 1{Xi ≤x} .
Test de Kolmogorov-Smirnov
Sous hypothèse H0 , si F0 est continue :
√ loi
T (X n ) = nDn −−−→ K,
n→∞
Distance de Kolmogorov-Smirnov
On appelle distance de Kolmogorov-Smirnov la quantité
Dn = sup F̂n (x) − F0 (x) ,
x
Pn
avec F0 la FR de P0 et F̂n la FR empirique ➠ F̂n (x) = 1
n i=1 1{Xi ≤x} .
Test de Kolmogorov-Smirnov
Sous hypothèse H0 , si F0 est continue :
√ loi
T (X n ) = nDn −−−→ K,
n→∞
Distance de Kolmogorov-Smirnov
On appelle distance de Kolmogorov-Smirnov la quantité
Dn = sup F̂n (x) − F0 (x) ,
x
Pn
avec F0 la FR de P0 et F̂n la FR empirique ➠ F̂n (x) = 1
n i=1 1{Xi ≤x} .
Test de Kolmogorov-Smirnov
Sous hypothèse H0 , si F0 est continue :
√ loi
T (X n ) = nDn −−−→ K,
n→∞
Distance de Kolmogorov-Smirnov
On appelle distance de Kolmogorov-Smirnov la quantité
Dn = sup F̂n (x) − F0 (x) ,
x
Pn
avec F0 la FR de P0 et F̂n la FR empirique ➠ F̂n (x) = 1
n i=1 1{Xi ≤x} .
Test de Kolmogorov-Smirnov
Sous hypothèse H0 , si F0 est continue :
√ loi
T (X n ) = nDn −−−→ K,
n→∞
Application numérique
0.4 n = 30
Dn = 0.13
√
0.2 nDn = 0.71
0
0 10 20 30 40 50 60 70 80
x
38/43
Exemple « Fiabilité composant » (suite)
2
densité de la loi K
1.5
Application numérique
√
nDn = 0.71
1 pval = 0.69
0.5
α = 5%
0
0 T (x n ) tα 1.8 2.4
= 0.71 = 1.36
➠ pour un niveau à 5%, H0 est acceptée
39/43
Exemple « Fiabilité composant » (suite)
2
densité de la loi K
1.5
Application numérique
√
nDn = 0.71
1 pval = 0.69
0.5
α = 5%
0
0 T (x n ) tα 1.8 2.4
= 0.71 = 1.36
➠ pour un niveau à 5%, H0 est acceptée
39/43
Plan du cours
1 – Exemples et généralités
1.1 – Deux exemples introductifs
1.2 – Risques associés à un test
2 – Test paramétrique
2.1 – Hypothèse simple / hypothèse simple
2.2 – Hypothèse composite
2.3 – Tests asymptotiques
3 – Tests d’adéquation
3.1 – Test du χ2 de Pearson
3.2 – BONUS : Test de Kolmogorov-Smirnov
5 – Exercice d’échauffement
Exercice (Comparaison d’une proportion à un standard p0 )
Questions
i Proposer une expérience permettant de tester cette hypothèse.
Préciser le modèle statistique sous-jacent et définirez les
hypothèses nulle et alternative.
ii Proposer un test asymptotique de niveau α.
40/43
Corrigé de l’exercice 1
1 1
H0 : θ = , c’est-à-dire Θ0 = (hypothèse simple),
2 2
vs.
1 1 1
H1 : θ 6= donc Θ1 = 0, ∪ , 1 (hypothèse bilatère).
2 2 2
41/43
Corrigé de l’exercice 1 (suite)
θ̂ − θ loi
p n −−−→ N (0, 1)
θ(1 − θ)/n n→∞
Pour construire un test asymptotique bilatéral de niveau α, on se
place sous H0 . Il vient la convergence en loi suivante :
√ 1 loi
2 n θ̂n − −−−→ N (0, 1).
2 n→∞
√
On considère une zone de rejet de la forme : 2 n|θ̂n − 21 | > cα .
où cα est choisi en fixant le risque de première espèce à α.
42/43
Corrigé de l’exercice 1 (suite)
ii) Soit
√ 1
lim P(2 n|θ̂n − | > cα ) = α.
n→∞ 2
On en déduit que cα = q1− 2 , quantile d’ordre 1 − α2 d’une N (0, 1).
α
43/43