Vous êtes sur la page 1sur 15

Faculté d’économie et de Gestion

de Kenitra

Statistique inférentielle

PREMIER CHAPITRE : Variables aléatoires

DEUXIÈME CHAPITRE : Lois de probabilités

TROISIEME CHAPITRE : THEORIE D’ECHANTILLONNAGE

QUATRIEME CHAPITRE : LES PROBLEMES D’ESTIMATION

CINQUIEME CHAPITRE : LES TESTS STATISTIQUES

Professeur Omar EL FOURCHI

Semestre 3 Année universitaire 2021/2022

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Chapitre
LES TESTS STATISTIQUES 5
I. Tests D’hypothèses

Nous supposons valable l’application de la loi normale sur la distribution


d’échantillonnage
(Echantillons de taille 𝑛 ≥ 30, Population mère de taille infinie ou
échantillons avec remise)

Problématique
La différence constatée entre les valeurs caractéristiques d’un échantillon
et d’une population mère de référence (ou entre les valeurs
caractéristiques de deux échantillons)
est-elle due aux fluctuations normales d’échantillonnage ?

Comparaison d’un échantillon à une population mère de référence

Soit une population mère de référence et un échantillon dont nous


connaissons les tailles respectives ainsi que les valeurs caractéristiques :
les moyennes (et au moins un des écart types) ou les proportions.

Dans le premier cas, on parle de contrôle par mesures, dans l’autre, on


parle de contrôle par attributs.

La problématique explique qu’on cherche à parvenir à une décision


statistique sur une population compte tenue des résultats expérimentaux
observés sur un échantillon représentatif extrait de la population
concernée.

Décision signifie choix entre deux hypothèses relatives à la valeur d’un


paramètre de la population, en se basant sur les données d’un échantillon
aléatoire prélevé dans cette population.

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Elaboration du test

Définir H0 : hypothèse nulle : « l’échantillon est issu représentatif de la


population de référence » : c’est
l’hypothèse qui nous intéresse concernant
un paramètre de la population. On
suppose que l’hypothèse nulle est vraie
jusqu’à « preuve » du contraire.

H1:L’hypothèse alternative: L’hypothèse qui se réalise si H0 n’est pas vraie

Avec cette hypothèse H0, déterminer un intervalle I devant contenir la


valeur caractéristique θ d’un échantillon aléatoire. En se fixant a priori la
probabilité α telle que p(  I )  

Utilisation du test
• Si cette valeur caractéristique θ de l’échantillon connu est dans
l’intervalle I, on accepte H0 au seuil de signification α 

• Sinon on rejette H0

Remarque
* Il s’agit de voir si les données de l’échantillon observé
fournissent des « preuves » suffisantes contre l’hypothèse nulle
pour pouvoir la rejeter au profit de H1.

* Lorsqu’on effectue un test d’hypothèse, deux types d’erreur


sont susceptibles de survenir :

RÉALITÉ
DÉCISION
SUITE AU TEST H0 vraie H1 vraie

Rejet de H0 Erreur de première espèce Bonne décision


(type I)
Non rejet de H0
Bonne décision Erreur de deuxième
espèce (type II)

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Risque d’erreur de type I : 𝑝 (rejeter H0 avec le test | H0 vraie)
Niveau de signification : = risque d’erreur de type I maximal

Risque d’erreur de type II : 𝑝 (ne pas rejeter H0 avec le test | H1 vraie)

*L’approche classique consiste à contrôler le risque de première


espèce en priorité en fixant le seuil de signification 

Les cinq étapes d’un test d’hypothèse classique :

1. Formuler l’hypothèse nulle et la contre-hypothèse.


2. Fixer le seuil de signification .
3. Déterminer la statistique du test.
4. Formuler une règle de décision.
5. Faire les calculs à l’aide des données d’un échantillon et
prendre une décision.

Exemple : Test de validité d'hypothèse relatif à une moyenne

Le paramètre étudié est la moyenne μ d'un caractère quantitatif dans une


population.
Les hypothèses concernent μ et on note σ l'écart-type de la population.
La moyenne du caractère dans un échantillon de taille n peut être
considérée comme la réalisation d'une variable aléatoire X

Pour un test sur la moyenne d’une population, les hypothèses seront de la


forme :
• On prend H0 : 0comme hypothèse nulle où 0 est une
valeur donnée.
• L'hypothèse alternative H1 s'exprime sous l'une des formes
suivantes :   00 ou 0

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


• La variable de décision Z prend différentes formes :

X  0
∗ Si σ est connu : Z

n

- Sous l'hypothèse H0, X N ( 0 ; ) et donc la loi de Z est loi
n
normale N (0 ; 1) si le caractère est distribué normalement dans la
population ;

- Sous l'hypothèse H0, la loi de Z est approchée par la loi


normale N(0 ; 1) si n ≥ 30.

X  0
∗ Si σ est inconnu : Z  où  est la variable aléatoire qui, à

n
chaque échantillon de taille n, associe son écart-type corrigé et

- Sous l'hypothèse H0, la loi de Z est loi de Student à n – 1


degrés de liberté si le caractère est distribué normalement dans
la population ;
- Sous l'hypothèse H0, la loi de Z est approchée par la loi
normale N(0; 1) si n ≥ 30.

• Sous l'hypothèse H0, le fait que Z prenne des valeurs "très


éloignées" de 0 est rare.

Visualisation de la région critique (zone de rejet de H0)

Test unilatéral à droite :

H0 : 0
H1 : 0 (<)

Si H0 est vraie, alors X N ( 0 ; )
n

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Non rejet de H0 Rejet de H0

0
valeur X
"critique"

On rejettera donc H0 si X > valeur critique


X  0
Ainsi, Z ~ N(0 ; 1)

n

f(z) Non rejet de H0 Rejet de H0

z -3 -2 -1 0 1 2 3

z
Z

Règle de décision : Rejeter H0 si Z > z

Test unilatéral à gauche :

H0 : 0
H1 : 0 (>)

Si H0 est vraie, alors X N ( 0 ; )
n

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


f(X) Rejet de H0 Non rejet de H0

0
valeur
"critique" X

On rejettera donc H0 si X < valeur critique


X  0
Ainsi, Z ~ N(0 ; 1)

n

f(z) Rejet de H0 Non rejet de H0

z -3 -2 -1 0 1 2 3

-z Z

Règle de décision : Rejeter H0 si Z < - z

f(X)

0
valeur
"critique"

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Test bilatéral :

H0 : 0
H1 :   0

f(X) Non rejet de H0

rejet de H0 Rejet de H0

/2 2

X
0
valeur valeur
critique critique
X
1 2

On rejettera donc H0 si X < valeur critique 1


ou si X > valeur critique 2

f(z) Non rejet de H0

rejet de H0 Rejet de H0

/2 2

X
0
- z/2 z/2 Z

Règle de décision : Rejeter H0 si Z < - z


ou si Z > z

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


En résumé : TEST SUR LORSQUE EST CONNU

Hypothèses Région critique 


région de rejet de H0)

H0 :0 ou   0

H1 :  0 Z > z


(test unilatéral à droite)

H0 :0 ou   0
H1 :0
(test unilatéral à gauche) Z < - z

H0 :0
H1 :  0
(test bilatéral) Z > zouZ < - z

TEST SUR LA MOYENNE  D’UNE POPULATION LORSQUE


L’ÉCART TYPE  DE LA POPULATION EST INCONNU :
X  0
Statistique du test : Z

n
Conditions d’utilisation :

- Échantillon aléatoire simple prélevé avec remise ou pouvant être traité


comme tel.
- Dans la population, la distribution de X s’approche d’une Normale.
- L’écart type  de la population est inconnu. On l’estime par l’écart
type échantillonneur «  ».

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


Distribution de la statistique du test si H0 est vraie :
X  0
Z ~ Student à n-1 degrés de liberté

n

Hypothèses Région critique 


région de rejet de H0)

H0 :0 ou   0
T > t
H1 :  0
(unilatéral à droite)

H0 :0 ou   0
H1 :0 T < - t
(unilatéral à gauche)
H0 :0
H1 :  0
(bilatéral) T > tou T < - t

Remarque : Lorsque n est assez grand, t   z et on peut utiliser le


quantile d’une Normale au lieu de celui d’une Student.

LE SEUIL EXPÉRIMENTAL :

Le seuil expérimental α*d’un test correspond au plus petit Niveau de


signification pour lequel la valeur observée de la statistique du test permet
le rejet de H0. Il représente la probabilité, sachant que H0 est vraie,
d'obtenir la valeur observée de la statistique du test ou une valeur plus
extrême que celle-ci (par rapport à H0).

Règle de décision en fonction du seuil expérimental * :

Si le risque maximal de première espèce qu'on est prêt à assumer est


le seuil de signification), alors :

Rejeter H0 si * 

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


TEST SUR LA PROPORTION 𝒑 DE SUCCÈS DANS LA
POPULATION

Conditions d’utilisation :
- échantillon aléatoire simple prélevé avec remise ou pouvant être traité
comme tel;
- n assez grand et p0 ni trop petit ni trop grand
(n>30 ; np0 > 5 ; n(1-p0 ) > 5)
P  p0
Statistique du test : Z
p0 (1  p0 )
n

Distribution de Z si H0 est vraie : Z suit approximativement. N(0,1)

Région critique 
Hypothèses région de rejet de H0)
H0 :pp0 ou p  p0 Z > z
H1 : p p0
(unilatéral à droite)
H0 : p p0 ou p  p0 Z < - z
H1 : p p0
(unilatéral à gauche)
H0 : p p0 Z > zou Z < - z
H1 : p   p0
(bilatéral)

Exemple:Test de validité d'hypothèse relatif à une fréquence

Dans une population, on étudie la fréquence p d'un caractère qualitatif.


Les hypothèses concernent p. La fréquence du caractère dans un
échantillon de taille n peut être considérée comme la réalisation d'une
variable aléatoire F.

• On prend H0 : "p = p0" comme hypothèse nulle où p0 est une valeur


donnée.

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


• L'hypothèse alternative H1 s'exprime sous l'une des formes
suivantes : "p ≠ p0", "p < p0" ou "p > p0"

La variable de décision peut prendre une des formes suivantes :

∗ T = nF dont la loi est la loi binomiale B(n ; p0) sous l'hypothèse H0.
F  p0
∗T dont on approche la loi, sous l'hypothèse H0,
p0 (1  p0 )
n
par la loi normale N(0 ; 1) lorsque n ≥ 30, np0 ≥ 15 et n p0 (1 – p0) > 5

• Sous l'hypothèse H0, le fait que T prenne des valeurs "très éloignées" de
0 est rare.

Tests de comparaison de populations

Comparaison de deux moyennes

Dans deux populations P1 et P2, on étudie un caractère quantitatif ayant


pour moyennes respectives μ1 et μ2 et pour écarts-types respectifs σ1 et σ2.
On veut savoir, au vu d'un échantillon de chacune des populations, s'il
y a une différence significative entre μ1 et μ2.
La moyenne du caractère dans un échantillon de taille ni de la population
Pi peut être considérée comme la réalisation d'une variable aléatoire X i
pour i ∈ {1 ; 2}. X 1 et X 2 sont indépendantes.
Pour i ∈ {1 ; 2},  i est la variable aléatoire qui, à chaque échantillon de
Pi, associe son écart-type corrigé.

• On prend comme hypothèse nulle H0 : "μ1 = μ2".


• L'hypothèse alternative H1 s'exprime sous l'une des formes suivantes
"μ1 ≠ μ2", "μ1 < μ2" ou "μ1 > μ2".

• La variable de décision Z prend différentes formes :

X1  X 2
∗ Si σ1 et σ2 sont connus : Z  et
 12  22

n1 n2

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


- Sous l'hypothèse H0, la loi de T est loi normale N(0;1) si le caractère est
distribué normalement dans les deux populations ;
- Sous l'hypothèse H0, la loi de T est approchée par la loi normale N(0 ; 1)
si n1 et n2 sont supérieurs ou égaux à 30.

X1  X 2
∗ Si σ1 et σ2 sont inconnus mais égaux : Z  ou
1 1
 
n1 n2
2 2
(n1  1)  (n2  1)
 1 1
et
n1  n2  2
- sous l'hypothèse H0, la loi de T est loi de Student à n1 + n2 – 2 degrés de
liberté si le caractère est distribué normalement dans les deux populations
- Sous l'hypothèse H0, la loi de T est approchée par la loi normale N(0 ;
1) si le caractère est distribué normalement dans les deux populations et si
n1 + n2 – 2 ≥ 30 ;
- Sous l'hypothèse H0, la loi de T est approchée par la loi normale N(0; 1)
si n1 et n2 sont supérieurs ou égaux à 30.

X1  X 2
∗ Si σ1 et σ2 sont inconnus mais différents : Z  2 2
dont la loi est
 
1
 2

n1 n2
approchée, sous l'hypothèse H0, par la loi normale N(0 ; 1) si n1 et n2 sont
supérieurs ou égaux à 30.

• Sous l'hypothèse H0, le fait que Z prenne des valeurs "très éloignées" de
0 est rare.

Comparaison de deux proportions

Dans deux populations P1 et P2, on étudie un caractère qualitatif ayant


pour fréquences respectives p1 et p2. On veut savoir, au vu de deux
échantillons des deux populations, s'il existe une différence significative
entre p1 et p2. La fréquence 𝑓𝑖 du caractère dans un échantillon de taille ni
de la population Pi peut être considérée comme la réalisation d'une
variable aléatoire Fi pour i ∈ {1 ; 2}. F1 et F2 sont indépendantes.

• On prend comme hypothèse nulle H0 : "p1 = p2".

• L'hypothèse alternative H1 s'exprime sous l'une des formes


suivantes : "p1 ≠ p2" ou "p1 < p2" ou "p1 > p2".

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


F1  F2
La variable de décision est T  avec
1 1
F(1  F)(  )
n1 n2
n1F1  n2F2
F Sous l'hypothèse H0, on approche la loi de T par la loi
n1  n2
normale N(0 ; 1) lorsque n1 et n2 sont supérieurs à 30, que n1 p1 et n2 p1
sont supérieurs 15 et que n1 p1 (1 – p1) et n2 p1 (1 – p1) sont supérieurs à 5
n f  n2 f2
; pour les calculs, on estime p1 par 1 1 où f1 et f2 sont les
n1  n2
fréquences observées des caractères dans les échantillons de tailles
respectives n1 et n2 dans respectivement les populations P1 et P2.

• Sous l'hypothèse H0, le fait que T prenne des valeurs "très éloignées" de
0 est rare.

Comparaison de deux variances


Dans deux populations P1 et P2, on étudie un caractère quantitatif ayant
pour variances respectives σ1 2 et σ2 2.
On veut savoir, au vu d'un échantillon de chacune des populations, s'il y a
une différence significative σ1 2 et σ2 2. L'écart-type corrigé du caractère
dans un échantillon de taille ni de la population Pi peut être considérée
comme la réalisation d'une variable aléatoire Si pour i ∈ {1 ; 2}. S1 et S2
sont indépendantes.

• On prend comme hypothèse nulle H0 : "σ1 = σ2".


• L'hypothèse alternative H1 s'exprime sous la forme : "σ1 ≠ σ2" ou σ1 <
σ2" ou "σ1 > σ2".
• La variable de décision est T peut prendre plusieurs formes :
2 2
S1 S2
∗ T est l'une des deux variables aléatoires 2
ou 2
. Sous l'hypothèse
S2 S1
H0, ces variables aléatoires suivent les lois F de Snédécor à
respectivement (n1 – 1 ; n2 – 1) et (n2 – 1 ; n1 – 1) degrés de liberté si
le caractère est distribué normalement dans les deux populations ;
2 2
S1  S1
∗T 4 4
dont la loi est approchée, sous l'hypothèse H0, par la
S1 S
2  1
n1 n1
loi normale N (0 ; 1) lorsque n1 et n2 sont supérieurs ou égaux à 30.

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi


• Sous l'hypothèse H0, le fait que T prenne des valeurs "très éloignées" de
1 ou de 0 selon le cas est rare.

Série d’Exercices
Exercice n° 1 :

Un tour est normalement réglé pour une production d’axes de diamètre moyenne 24 mm,
avec un écart type constant 0,0175 mm.
Afin de contrôler la qualité de production de ce tour, on prélève un échantillon de 50 axes, on
trouve pour les diamètres de cet échantillon une moyenne de 24,005 mm
Peut on dire au seuil de signification de 1%, que le tour nécessite un nouveau réglage. ?

Exercice n° 2 :

La production de pièce défectueux d’une machine était p0=1/6, après modification


(p : nouvelle proportion), on teste l’amélioration du rendement en prélevant un échantillon de
100 pièces dans lequel on trouve 10 pièces défectueuses.
Peut-on considérer qu’il y a progrès au seuil de signification de 5%. ?

Exercice n°3 :

Une machine remplit des paquets, on prélève à 2 moments différents deux échantillons de
paquets :
L’un d’effectif n1=100, de moyenne X1=40,00g et d’écart type σe1=0,13g
L’autre d’effectif n2=300, de moyenne X2=40,05g et d’écart type σe2=0,14g
Peut on admettre que la machine était réglée pour le même poids lors des deux prélèvements
au seuil de signification de 1 %

Exercice n°4 :

Afin de prévenir une maladie, on a deux traitements possibles T 1 et T2


T1 est appliqué à 200 enfants : 10% sont atteint par la maladie
T2 est appliqué à 800 enfants : 15% sont atteint par la maladie
Peut on affirmer (au seuil de signification de 5%) que T 1 est meilleur que T2 ?

Email : elfourchi@gmail.com ………………………………-……………………web : https://elfourchi.wixsite.com/elfourchi

Vous aimerez peut-être aussi