Académique Documents
Professionnel Documents
Culture Documents
Méthodes Statistiques
4 Table de Student 8
Contexte statistique
m inconnu
Hypothèse sur X : X ∼ N (m, σ), σ inconnu
On suppose que X suit une loi normale dont on ne connaı̂t pas les paramètres !
1
Intervalle de confiance
Objectif: Étant donné un échantillon X1 , . . . , Xn de X et une valeur α ∈
]0, 1[, construire un intervalle aléatoire IC(X1 , . . . , Xn ) tel que
P (m ∈ IC(X1 , . . . , Xn )) = 1 − α
Estimateur de m
Estimateur de m : moyenne empirique X̄n .
X̄15 = moyenne empirique de X observée sur les échantillons de taille 15
Théorème 1.1 (Rappel). Dans le cas d’un échantillon de lois normales, on
connaı̂t la distribution exacte de X̄n :
σ
X̄n ∼ N m, √
n
Problème
on ne connaı̂t pas la valeur de σ !
Estimateur de σ
Rappel du chapitre 2 : il y a deux estimateurs d’une variance : la variance
empirique Sn2 et la variance empirique modifiée s2n .
Théorème 1.2 (Rappel). Dans le cas d’un échantillon de lois normales, on
connaı̂t la distribution exacte de s2n :
s2n suit une loi du χ2 à n − 1 degrés de liberté.
Résultat principal
Mais le résultat principal est le suivant :
Théorème 1.3. Dans le cas d’un échantillon de lois normales de moyenne m,
√ X̄n − m
la variable Tn−1 = n suit une loi de Student à n − 1 degrés de liberté
p sn
où sn = s2n est l’écart-type empirique modifié.
n = 15,
s215 = variance empirique modifiée de X observée sur les échantillons de taille
15.
√ X̄15 − m
T14 = 15 suit une loi de Student à 14 degrés de liberté.
s15
2
Intervalle de confiance
Par des calculs similaires à ceux présentés dans le chapitre précédent pour
établir la forme de l’intervalle de confiance sur une moyenne dans le cas où
X ∼ N (m, σ) avec σ inconnu, on montre que
Théorème 1.4.
h sn α i
IC(X1 , . . . , Xn ) = X̄n ± √ QTn−1 1 −
n 2
où Tn−1 est une variable aléatoire suivant une loi de student à n − 1 degrés de
liberté (en abrégé ddl).
Application
n = 15
α = 0.05
QT14 (0.975) = 2.145 (table)
h s15 i
IC(X1 , . . . , X15 ) = X̄15 ± √ × 2.145
15
Cet intervalle correspond à la probabilité suivante :
s15 s15
P X̄15 − 2.145 × √ ≤ m ≤ X̄15 + 2.145 × √ = 0.95
15 15
Application numérique
3
Contexte statistique
Variable : Surface en m2
Paramètre : m = surface moyenne de l’ensemble des appartements de la com-
mune
m inconnu
Hypothèse sur X : X ∼ loi quelconque
On ne connaı̂t pas la distribution de X !
Approximation normale
On ne connait pas la distribution exacte de X̄n , Sn2 et s2n dans ce cas !
Toutefois, on a la convergence suivante :
Théorème 2.1.
√ X̄n − m L
n −→ N (0, 1)
Sn
p
où Sn = Sn2 est l’écart-type empirique.
Approximation normale
Le résultat précédent dit que, quand n est grand, pour tout réel z
√ X̄n − m
P n ≤ z ' P (Z ≤ z) où Z ∼ N (0, 1).
Sn
Intervalle de confiance
Étant donné un échantillon X1 , . . . , Xn de X, on appelle intervalle de confi-
ance à 1−α l’intervalle aléatoire IC(X1 , . . . , Xn ) donné dans l’énoncé ci-dessous
:
Théorème 2.2.
h Sn α i
IC(X1 , . . . , Xn ) = X̄n ± √ QZ 1 −
n 2
où Z est une variable aléatoire suivant une loi normale centrée réduite.
4
Application
n = 39 ≥ 30
α = 0.05
QZ (0.975) = 1.96 (table)
h S39 i
IC(X1 , . . . , X39 ) = X̄39 ± √ × 1.96
39
Cet intervalle correspond à la probabilité suivante :
S39 S39
P X̄39 − 1.96 × √ ≤ m ≤ X̄39 + 1.96 × √ = 0.95
39 39
Application numérique
Valeur observée de X̄39 = 74
Valeur observée de S39 = 50.4
Réalisation de l’intervalle IC(X1 , . . . , X39 ) :
h 50.4 i h i
74 ± √ × 1.96 = 58.2, 89.8
39
5
3 Estimation d’une proportion
Problème
Un maire s’inquiète au sujet de sa réélection lors des prochaines élections munic-
ipales. On choisit au hasard 426 électeurs que l’on interroge sur leurs intentions
de vote ; 201 des 426 électeurs déclarent avoir l’intention de voter pour le maire
sortant lors des prochaines élections municipales.
Contexte statistique
p inconnu
Hypothèse sur X : X ∼ B(p)
On suppose que X suit une loi de Bernoulli dont on ne connaı̂t pas le
paramètre !
Estimateur de m
Estimateur de p : la fréquence empirique Fn .
F426 = fréquence empirique d’électeurs ayant l’intention de voter pour le maire
sortant observée sur les échantillons de taille 426.
201
Valeur observée de F426 : f = = 0.472
426
Distribution de Fn ?
Bien qu’on connaisse la distribution exacte de Fn , nous allons – dans ce
cours – nous restreindre au cas des grands échantillons et utiliser le résultat de
convergence suivant :
Théorème 3.1.
√ Fn − p L
np −→ N (0, 1)
Fn (1 − Fn )
6
Approximation normale
Quand n est grand, pour tout réel z
!
√ Fn − p
P np ≤z ' P (Z ≤ z) où Z ∼ N (0, 1).
Fn (1 − Fn )
Dans ce cours
Grand échantillon : n ≥ 30.
Intervalle de confiance
Étant donné un échantillon X1 , . . . , Xn de X, on appelle intervalle de confi-
ance à 1−α l’intervalle aléatoire IC(X1 , . . . , Xn ) donné dans l’énoncé ci-dessous :
Théorème 3.2.
r
h Fn (1 − Fn ) α i
IC(X1 , . . . , Xn ) = Fn ± QZ 1 −
n 2
où Z est une variable aléatoire suivant une loi normale centrée réduite.
Application
n = 426 ≥ 30, α = 0.05, QZ (0.975) = 1.96 (table)
r
h F426 (1 − F426 ) i
IC(X1 , . . . , X426 ) = F426 ± × 1.96
426
r r !
F426 (1 − F426 ) F426 (1 − F426 )
P F426 − ×1.96 ≤ p ≤ F426 + ×1.96
426 426
= 0.95
7
4 Table de Student
Fonction quantile de la loi de Student