Vous êtes sur la page 1sur 61

Test d’une proportion

Tests

I DIR O UASSOU

20 novembre 2017
Test d’une proportion

Proposition du prblème

Supposons connue la valeur θ0 d’un paramètre


relatif à toute la population.
Test d’une proportion

Proposition du prblème

Supposons connue la valeur θ0 d’un paramètre


relatif à toute la population.
Soit T un estimateur sans biais de θ.
Test d’une proportion

Proposition du prblème

Supposons connue la valeur θ0 d’un paramètre


relatif à toute la population.
Soit T un estimateur sans biais de θ.
Si E est un échantillon quelconque de taille n,
on pose T (E) = θ, en générale θ 6= θ0 .
Test d’une proportion

Proposition du prblème

Supposons connue la valeur θ0 d’un paramètre


relatif à toute la population.
Soit T un estimateur sans biais de θ.
Si E est un échantillon quelconque de taille n,
on pose T (E) = θ, en générale θ 6= θ0 .
Question : Il s’agit de décider si cette différence
est significative ou non, d’ou deux hypothèses :
Test d’une proportion

Proposition du prblème

Hypothèse nulle H0 : θ = θ0
la différence observée n’est pas significative,
elle est due aux fluctuation de l’échantillonage :
l’échantillon E est bien représentatif de la
population.
Test d’une proportion

Proposition du prblème

Hypothèse nulle H0 : θ = θ0
la différence observée n’est pas significative,
elle est due aux fluctuation de l’échantillonage :
l’échantillon E est bien représentatif de la
population.
Hypothèse alternative H1 : θ 6= θ0
la différence observée est significative :
l’échantillon E n’est pas représentatif de la
population.
Test d’une proportion

Proposition du prblème

Définition
On défini le seuil de signification d’un test
d’hypthèse (risque de premier espèce) la
probabilité

α = P(rejeter H0 \ H0 vraie) = PH0 (H0 faux)

et le risque de deuxième espèce par :

β = P(ne pas rejeter H0 \ H1 vraie)


= P(accepter H0 \ H1 est vraie)
= PH1 (H0 est; vraie)
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Des études antérieures ont montré que le


pourcentage des gauchers dans l’ensemble de
la population marocaine est de 10%. En
d’autres termes, on suppose que si on choisit
un individu au hasard dans la population
marocaine, la probabilité que cette personne
soit gauchère est p0 = 0, 10.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On se demande si cette hypothèse est vérifiée


pour les étudiants de Sciences.
On suppose que la proportion de gauchers
parmi les étudiants de sciences est p (valeur
inconnue de nous ) et on veut tester si p est
égal à p0 . ou différent de p0 .
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On observe alors un groupe de n étudiants de


DEUG-Sciences et on fait l’hypothèse que cet
échantillon est représentatif de la population
marocaine (tout étudiant de DEUG–Sciences
est, indépendamment des autres étudiants, soit
gaucher, avec la probabilité p soit droitier, avec
la probabilité 1 − p).
Test d’une proportion

Tests

On prend un échantillon constitué de l’ensemble


des étudiants (la taille N est donc à expliciter).
On note η (resp. F ) la v.a. égale au nombre
(resp. à la proportion) de gauchers que l’on va
trouver dans cet échantillon : F = Nη .
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Si la réalisation f de la variable F est voisine de


p0 on aura tendance à accepter cette
hypothèse, si f est éloignée de p0 on sera
amené à la refuser, on cherche donc un
intervalle de la forme [f1 , f2 ] contenant p0 tel que
si f appartient à cet intervalle on accepte
l’hypothèse sinon on la refuse.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Si p0 est la proportion de gauchers parmi les


étudiants en sciences.
Quelle est la loi exacte de η puis la loi
approchée de η et de F ainsi que l’espérance
mathématique de ces variables aléatoires.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Réponse :
η ∼ B(n, p0 ) pour les effectifs, F ∼ B(n, p0 ) pour
les fréquences et dans le cadre de
l’approximation normale (np0 (1 − p0 ) ≥ 8)
 p 
N ∼ N np0 , np0 (1 − p0 )

et r !
p0 (1 − p0 )
F ∈N p0 , .
n
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

p0 étant toujours la proportion de gauchers


parmi les étudiants en sciences, soit α un
nombre positif compris entre 0 et 1.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

1
Déterminer alors 2 régions [0, f1 [ et ]f2 , 1]
telles que
α
P(F < f1 ) <
2
où f1 est le plus grand possible et
α
P(F > f2 ) <
2
où f2 est le plus petit possible.
2
Expliciter le calcul avec α = 0, 05.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Réponse :
Dans le cadre de l’approximation normale :
" r r #
p0 (1 − p0 ) p0 (1 − p0 )
[f1 , f2 ] = p0 − v α2 , p0 + v α2
n n

où vβ est le fractile supérieur d’ordre β de la loi


normale centrée réduite.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On considère les 2 hypothèses :

Hypothèse à tester H0 : p = p0 ,
Hypothèse alternative H1 : p 6= p0
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On se place du point de vue des partisans de


l’hypothèse H0 . Pour les faire changer d’avis, il
faut pouvoir les convaincre, c’est-à-dire que les
faits observés contredisent nettement la validité
de H0 .
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Les partisans de H0 décident qu’ils ne sont pas


prêts à accepter H1 que si la probabilité de se
tromper dans ce cas ne dépasse pas α que l’on
peut choisir égal à 0, 05.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Les partisans de H0 décident qu’ils ne sont pas


prêts à accepter H1 que si la probabilité de se
tromper dans ce cas ne dépasse pas α que l’on
peut choisir égal à 0, 05.
Si H0 est vraie, F a une probabilité supérieure à
1 − α d’être dans l’intervalle [f1 , f2 ].
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Les partisans de H0 décident qu’ils ne sont pas


prêts à accepter H1 que si la probabilité de se
tromper dans ce cas ne dépasse pas α que l’on
peut choisir égal à 0, 05.
Si H0 est vraie, F a une probabilité supérieure à
1 − α d’être dans l’intervalle [f1 , f2 ].
Pour cette raison on met en oeuvre le test de la
manière suivante :
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Si la réalisation f n’est pas dans l’intervalle


[f1 , f2 ], on dit alors que f est dans la région
critique notée C, on optera pour H1 avec une
probabilité α de se tromper.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Si la réalisation f n’est pas dans l’intervalle


[f1 , f2 ], on dit alors que f est dans la région
critique notée C, on optera pour H1 avec une
probabilité α de se tromper.
Si la réalisation f est dans l’intervalle [f1 , f2 ], on
optera pour H0 faute de preuves suffisantes.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Exemple
Pour α = 0, 05, n = 250, p0 = 0, 10 et N = 30.
Déterminer f1 et f2 , N/n appartient–il à
l’intervalle [f1 , f2 ].
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Réponse :
Dans le cadre de l’approximation normale :
" r r #
p0 (1 − p0 ) p0 (1 − p0 )
[f1 , f2 ] = p0 − v α2 , p0 + v α2
n n

ce qui donne :

[f1 , f2 ] = [0, 063, 0, 137],

on remarque que f = 0, 12, f appartient à


l’intervalle [f1 , f2 ].
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On décide de conserver l’hypothèse H0 , mais


rien ne dit que l’on ne se soit pas trompé.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

On décide de conserver l’hypothèse H0 , mais


rien ne dit que l’on ne se soit pas trompé.
Si les partisans de H1 ont raison, étant donné la
règle de décision adoptée, on commettrait une
erreur chaque fois que la réalisation f est en
dehors de [f1 , f2 ], c’est-à-dire que la probabilité
de se tromper est alors

PH1 (F ∈ [f1 , f2 ]),

c’est l’erreur de deuxième espèce .


Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Les 2 hypothèses ne jouent pas des rôles


symétriques, f1 et f2 sont déterminés
uniquement par H0 et α.
Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

L’erreur de première espèce est

α = PH0 (F ∈ C) = P(F ∈ C tel que H0 est vraie)

L’erreur de deuxième espèce est

β = PH1 (F 6∈ C) = (F 6∈ C tel que H1 est vraie)


Test d’une proportion

Test d’une proportion -cas d’un test bilatéral-

Décision
Réalité H0 H1
H0 Conforme Erreur de 1ère espè
H1 Erreur de 2ème espèce Conforme

Ces erreurs sont antagonistes, Car on diminue


l’erreur de première espèce en diminuant le
région critique C, mais alors l’erreur de
deuxième espèce augmente.
Test d’une proportion

Test d’une proportion -cas d’un test unilatéral-

On considère les 2 hypothèses :

Hypothèse à tester H0 : p = p0 ,
Hypothèse alternative H1 : p > p0

On construit fc le plus petit possible tel que

P(F > fc ) < α.

Il s’agit ici d’un test unilatéral. La région de rejet


C est toute entière située à l’extrémité droite de
l’intervalle [0, 1]
Test d’une proportion

Test d’une proportion -cas d’un test unilatéral-

Soit α un nombre positif compris entre 0 et 1.


Déterminer alors la région telle que
P(F > fc ) < α.
Réponse :
Dans le cadre de l’approximation normale :
r
p0 (1 − p0 )
fc = p0 + vα .
n
Test d’une proportion

Test d’une proportion -cas d’un test unilatéral-

Expliciter le calcul avec α = 0, 05 et l’exemple


précédent.
Réponse :
Dans le cadre de l’approximation normale :

v0,05 = 1, 6449

et
fc = 0, 131.
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Parmi deux hypothèses en présence


concernant la valeur inconnue p, laquelle
doit-on retenir comme bonne ?
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Parmi deux hypothèses en présence


concernant la valeur inconnue p, laquelle
doit-on retenir comme bonne ?
Le QUID donne cette double information : le
pourcentage de gauchers est de 10%, mais
tombe à 4% parmi les scientifiques. Mettant en
doute cette information, on désire la tester au vu
d’un échantillon de n = 540 étudiants
considérés comme scientifiques -les étudiants
de DEUG !
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

On a donc en présence deux hypothèses


concernant la proportion p de gauchers parmi
les scientifiques :

l’hypothèse nulle - privilégiée H0 H0 : p = 0, 10


Hypothèse alternative H1 : p = 0, 04 .

Parmi ces deux hypothèses, une seule est juste


mais on ignore laquelle.
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Le test consiste à définir sur quelle statistique


on se base pour prendre cette décision de choix
entre H0 et H1 , et quelles sont les valeurs de
cette statistique qui conduiront à rejeter H0 au
bénéfice de H1 .
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

On note encore F la variable aléatoire égale à la


proportion de gauchers dans un échantillon de
taille n.
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quelle est la loi approchée de F sous chacune


des hypothèses H0 et H1 ?
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quelle est la loi approchée de F sous chacune


des hypothèses H0 et H1 ?
Réponse : p
F ∈ N (0, 10, 0, 10(1 − 0, 10)/540) sous
l’hypothèse Hp 0,
F ∈ N (0, 10, 0, 04(1 − 0, 04)/540) sous
l’hypothèse H1 . On choisit le risque de première
espèce α à 0,05.
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quelle est la loi approchée de F sous chacune


des hypothèses H0 et H1 ?
Réponse : p
F ∈ N (0, 10, 0, 10(1 − 0, 10)/540) sous
l’hypothèse Hp 0,
F ∈ N (0, 10, 0, 04(1 − 0, 04)/540) sous
l’hypothèse H1 . On choisit le risque de première
espèce α à 0,05.
Dans quel intervalle [0, fc ] doit se situer le
pourcentage observé f de gauchers sur les 540
étudiants pour rejeter H0 .
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quelle est donc la décision concernant p ?


Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quelle est donc la décision concernant p ?


Réponse :
On cherche fc le plus grand possible tel que
PH0 (F < fc ) = 0, 05, le fractile inférieur 0, 05 de
la loi normale est égal à −1, 6459, on a donc
fc = 0, 07876.
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quel est alors le risque de seconde espèce,


c.à.d. la probabilité de décider H0 alors que H1
est vraie ?
Test d’une proportion

Test d’une proportion -cas de H0 simple et H1 simple-

Quel est alors le risque de seconde espèce,


c.à.d. la probabilité de décider H0 alors que H1
est vraie ?
Réponse :
On calcule PH1 (F > fc ) = 1 − G(4, 59) ' 0.
Test d’une proportion

Test d’une moyenne

Si (X1 , X2 , . . . , Xn ) est un échantillon gaussien


N (µ, σ) de moyenne µ inconnue et de variance
σ 2 connue ou inconnue suivant le cas, on peut
alors effectuer des tests d’hypothèses comme
pour les proportions.
Test d’une proportion

Test d’une moyenne

Dans le centre agricole, on avait constaté que la


masse d’un oeuf suivait une loi normale de
moyenne 53g et d’écart-type 3.2g.
Les mesures des masses des 36 oeufs ont été
effectuées à la suite d’un changement
d’alimentation. On se demande si on peut
admettre, au vu de l’observation de cet
échantillon, que la moyenne est toujours 53g
(l’écart-type restant de 3.2g).
Test d’une proportion

Test d’une moyenne

Tester au seuil 5% l’hypothèse

H0 : µ = µ0 = 53g

contre
H1 : µ = µ0 = 56g
Il s’agit ici d’un test d’hypothèses simple au
risque α.
Test d’une proportion

Test d’une moyenne

On détermine d’abord une valeur mc la plus


petite possible telle que

P(X > mc ) < α,

on accepte H0 si x ≤ mc et on refuse H0 dans le


cas contraire.
On a
σ
mc = µ0 + vα √
n
puisque la variance est connue.
Test d’une proportion

Test d’une moyenne

Réponse :
On a v0,05 = 1, 6459 et mc = 53, 878 pour le
seuil 5% et v0,02 = 2, 0537 et mc = 54, 095 pour
le seuil 2%
On a x = 55, 0830 on refuse donc l’hypothèse
aux 2 seuils.
Test d’une proportion

Test d’une moyenne

Dans les mêmes conditions, tester au seuil 5%


puis 2% l’hypothèse

H0 : µ = µ0 = 53g

contre
H1 : µ = µ0 6= 53g
Il s’agit ici d’un test bilatéral au risque α.
Test d’une proportion

Test d’une moyenne

On détermine un intervalle [m1 , m2 ] où m1 est la


valeur la plus grande possible telle que
α
P(X < m1 ) <
2
et m2 est la valeur la plus petite possible telle
que
α
P(X > m2 ) < ,
2
on accepte H0 si x ∈ [m1 , m2 ] et on refuse H0
dans le cas contraire.
Test d’une proportion

Test d’une moyenne

On a
σ σ
[m1 , m2 ] = [µ0 − v α2 √ , µ0 + v α2 √ ].
n n
Test d’une proportion

Test d’une moyenne

Réponse :
On a v0,025 = 1, 96 et
[m1 , m2 ] = [51, 955, 54, 045] pour le seuil 5% et
v0,01 = 2, 3263 et [m1 , m2 ] = [51, 762, 54, 237]
pour le seuil 2%
On a x = 55, 0830 on refuse donc l’hypothèse
au 2 seuils.
Test d’une proportion

Test d’une moyenne

On suppose maintenant que le changement


d’alimentation a aussi modifié l’écart-type.
Tester au seuil 5% puis 2% l’hypothèse

H0 : µ = µ0 = 53g

contre
H1 : µ 6= 53g
Il s’agit ici d’un test bilatéral au risque α.
Test d’une proportion

Test d’une moyenne

On détermine un intervalle [m1 , m2 ] où m1 est la


valeur la plus grande possible telle que
α
P(X < m1 ) <
2
et m2 est la valeur la plus petite possible telle
que
α
P(X > m2 ) < ,
2
on accepte H0 si x ∈ [m1 , m2 ] et on refuse H0
dans le cas contraire.
Test d’une proportion

Test d’une moyenne

On a
s s
[m1 , m2 ] = [µ0 − v α2 √ , µ0 + v α2 √ ]
n n
puisque la variance σ 2 inconnue est estimée par
s2 . cette formule est valable à condition que la
taille de l’échantillon soit supérieure ou égale à
30 .
Test d’une proportion

Test d’une moyenne

Réponse :
On a v0,025 = 1, 96 et [m1 , m2 ] = [52, 12, 53, 876]
pour le seuil 5% et v0,01 = 2, 3263 et
[m1 , m2 ] = [51, 96, 54, 04] pour le seuil 2%
On a x = 55, 0830 on refuse donc l’hypothèse
aux 2 seuils.
Test d’une proportion

Test d’une moyenne

Remarque :
L’hypothèse que les variables aléatoires
(X1 , X2 , . . . , Xn ) suivent des lois normales n’est
plus indispensable dès que n est supérieure ou
égale à 30. Il suffit alors que les variables
aléatoires (X1 , X2 , . . . , Xn ) soient indépendantes,
de même moyenne et de même variance.