Vous êtes sur la page 1sur 4

3.

Estimation par intervalle de confiance d’un paramètre:


Un intervalle de confiance de l'estimation censé contenir la vraie valeur du paramètre
inconnu de la population avec un fort degré de confiance.
La demi-largeur de l’intervalle de confiance s’appelle la précision de l’estimation.
On obtient l’intervalle de confiance en suivant la procédure suivante:

 On choisit le meilleur estimateur, étant donné le paramètre θ que l’on veut estimer,
et donc chaque fois que possible l’estimateur du maximum de vraisemblance. La
statistique doit avoir pour espérance mathématique le paramètre que l’on désire
estimer et si possible être de variance minimum.
 On détermine, étant données les conditions de l’expérience, la loi suivie par
l’estimateur.
 On fixe le degré de confiance souhaité de l’estimation.
 On détermine l’intervalle aléatoire contenant la vraie valeur du paramètre θ, étant
donné le seuil de confiance choisi.
 Un échantillon étant prélevé aléatoirement, on obtient une réalisation de l’intervalle
aléatoire: l’intervalle de confiance.
Estimation de la moyenne m de la population, au seuil de confiance α:
r
1
Le meilleur estimateur de m est la variable aléatoire moyenne d’échantillon : ^x = ∑(x )
n i=1 i

a) Cas où σ, écart-type de X dans la population est connu:


Si la population d’origine est considérée comme normale (X→ N (m; σ)¿ ou si la taille n de
l’échantillon est suffisamment grande (en pratique, à partir de 30 individus) alors
x−m
σ u= → N (0 ; 1)
x → N (m ; ¿ ¿ )¿ Soit encore σ
√n
√n
L’intervalle aléatoire contenant m, au seuil de confiance  est le suivant :¨
σ σ
[ x−U ; x +U ¿
√n √n
b) Cas où σ, écart-type de X dans la population est inconnu:
Dans ce cas, il faut estimer la variance de X dans la population
n
1
x= ∑ ( x ¿¿ i¿) ¿ ¿ Dans ce cas, il faut estimer la variance de X dans la population
n i =1
n
1
s2= ∑ ¿ ¿ ¿Est le meilleur estimateur de σ 2
n−1 i=1

Supposant par ailleurs que x et S2 sont indépendantes.


x−m
T= →T (n−1)
Soit x → N (m ; σ ) La statistique s
√n
L’intervalle aléatoire contenant m, au seuil α a la forme suivante :
S S
[ x−T ; x +T ¿
√n √n

Estimation de la variance σ2 d’une variable X dans la population, au seuil de confiance α,


dans le cas d’échantillons gaussiens:
a) Cas où m : valeur moyenne de X dans la population est connue:
n
1
'2
Le meilleur estimateur de σ est la variable S2 S = ∑ ¿¿¿
n i=1

CHAPITRE 3 TESTS D’HYPOTHÈSES. LE CONTRÔLE DES NORMES


a) Généralités. Les principes du test d’hypothèses:
La procédure doit permettre d’établir une règle de décision de façon à choisir entre deux
hypothèses portant sur des caractéristiques de la population alors même que cette
population n’aura pas été observée dans sa totalité. De ce fait, la décision, quelle qu’elle
soit, sera toujours entachée d’un risque d’erreur.

b) Les hypothèses:
Les deux hypothèses formulées H0 et H1 portent exclusivement sur la population. On
appelle H0 l’hypothèse nulle et H1 l’hypothèse alternative. On teste H0 contre H1.Si les
hypothèses portent sur les valeurs prises par un ou plusieurs paramètres de cette
population, on parle alors de tests paramétriques. L’hypothèse nulle doit toujours être
formulée sous forme d’une égalité. C’est donc l’hypothèse H1 qui fait réellement apparaitre
le contenu de H0.

c) Le choix des hypothèses:


Les hypothèses H0 et H1 ne jouent pas un rôle symétrique : c’est l’hypothèse nulle qui est
soumise au test et toute la démarche du test s’effectue en considérant cette hypothèse H0
comme vraie
Si le test conduit à rejeter l’hypothèse H0 car elle n’est pas « rendue crédible » par les
résultats de l’expérience réalisée sur l’échantillon, on considère alors l’hypothèse H1 comme
vraisemblable
d) Les risques de première et de deuxième espèce:
Deux risques différents sont courus par le décideur : les risques de première et de deuxième
espèce.

 α: risque de première espèce : α = p { valider H1 alors que H0 est vraie }


 Β : risque de deuxième espèce : β = p { valider H0 alors que H1 est vraie }

e) La variable de décision:
C’est la valeur prise par la variable de décision dans l’échantillon prélevé doit donc nous
apporter une information sur les caractéristiques de la population. Selon l’échantillon
prélevé, la variable prendra des valeurs différentes pour le même paramètre mesuré, selon
cette valeur soit on décide en faveur de H1 ou H0
Les tests d’hypothèses que nous allons étudier s’effectuent à l’aide de la distribution
d’échantillonnage de la variable aléatoire qui sert d’estimateur au paramètre désigné dans
l’hypothèse nulle.

f) Le seuil de signification, la région critique:


Le risque de rejeter, à tort, l’hypothèse H0 est appelé seuil de signification du test et est
noté α.Ce risque est égal au risque de première espèce. Au seuil de signification α, on fait
donc correspondre sur la distribution d’échantillonnage de la statistique, H0 étant supposée
vraie, une zone de rejet de H0 appelée région critique. Il convient en effet de prendre en
compte, lors de la décision, les fluctuations d’échantillonnage
La région critique est l’ensemble des valeurs prises par la variable de décision, conduisant au
rejet, de l’hypothèse H0, étant donné le risque α accepté. Elle prend la forme d’un intervalle
de valeurs, Le complémentaire de la région critique dans l’ensemble des valeurs possibles
de la variable de décision est appelée région d’acceptation de H0.

Vous aimerez peut-être aussi