Vous êtes sur la page 1sur 84

Inférence statistique-

Estimation et tests
Pr Hinde HAMI

2020-2021
Université Ibn Tofail, Kénitra
Tests d’hypothèses

Objectifs

Cette partie du cours aborde la théorie générale des tests statistiques


puis présente les principaux tests utiles.

L’objectif est de réussir, à partir d’un échantillon, à mettre en place


une stratégie pour tester une hypothèse et évaluer le risque de se
tromper lors de la décision.
Principe des tests- Tests de Comparaison
Principe des tests de comparaison

Les tests de comparaison servent à comparer des séries de données entre


elles. Il existe schématiquement deux situations :

1. Comparer un échantillon observé à une population de référence


On se demande si la distribution de la population dont est issu
l'échantillon est identique à la distribution théorique, ou bien si elle est
différente.
2. Comparer deux ou plusieurs échantillons entre eux
On se demande si les distributions des populations dont sont issus les
échantillons sont identiques ou différentes.
Principe des tests- Tests de Comparaison
Principe des tests de comparaison

Comparer un échantillon observé à une population de référence ou comparer


deux ou plusieurs échantillons entre eux, dans les deux situations, l'objet du
test est de comparer des populations.

Population
inconnue Population 1 Population 2
Population
de
Echantillon référence Echantillon 1 Echantillon 2
Principe des tests- Tests de Comparaison
Etablir l’hypothèse nulle (H0)

Cela consiste à poser a priori l'hypothèse que les paramètres ou les


distributions des populations d'où sont issus les échantillons étudiés sont
identiques.

Proposer l ’ hypothèse nulle, c'est supposer que la différence observée


provient seulement des fluctuations d'échantillonnage.

Paramètre
Population 1 = Paramètre
Population 2

Hypothèse nulle H0
Principe des tests- Tests de Comparaison
Proposer une hypothèse alternative (H1)

On appelle hypothèse alternative H1 l'hypothèse qui sera retenue au cas où les


résultats du test aboutiraient à rejeter l'hypothèse nulle H0. Rejeter H0 c'est
dire que la différence observée est trop grande pour qu'on l'attribue à une
simple fluctuation d'échantillonnage. On suppose donc dans ce cas que les
paramètres ou les distributions des populations d'où sont issus les
échantillons étudiés sont différents.

Paramètre
Population 1 ≠ Paramètre
Population 2

Hypothèse alternative H1
Principe des tests- Tests de Comparaison
Calcul d’un test de comparaison

Une fois que les hypothèses sont clairement posées, le test est appliqué. Tous
les tests statistiques de comparaison consistent :

1. A calculer une quantité mathématique exprimant l'écart entre les


paramètres ou les distributions ;
2. A confronter cette quantité à un modèle de distribution théorique..
1 Comparaison de deux
fréquences
Comparaison de deux fréquences

Position du problème

Soit P une population d’effectif infini pour laquelle la fréquence d’un caractère
est pthéorique. Cette fréquence peut être connue ou non.

On dispose d’un échantillon E1 d’effectif N1, dont la fréquence du même


caractère est Pobs1 et d’un échantillon E2 d’effectif N2 dont la fréquence
observée est pobs2
Population Echantillon
Tirage aléatoire ou non

E1 E2

N1 N2

Pth Pobs1 Pobs2


Connue
ou Inconnue
Premier problème
Population Echantillon
Tirage aléatoire ou non

NE

Pth Pobs
Connue ???????
Deuxième problème
Population Echantillon
Tirage aléatoire ou non

E1 E2

N1 N2

Pth Pobs1 Pobs2


Connue
ou Inconnue
Troisième problème
Population Echantillon
Tirage aléatoire

NE

Pth Pobs
Estimation
Inconnue
Test de conformité
Population Echantillon
Tirage aléatoire ou non

NE

Pth Pobs
Connue ???????
Test de conformité

Choix du test

On calcule l’écart réduit P .- P


e = obs th .

obs
pth (1 - pth )
obs obs .

N
Définir les hypothèses H0 et H1

H0: Pobs= Pth

H1: Pobs ≠ Pth


Test de conformité

Hypothèse alternative
H1 bilatérale: l'hypothèse alternative est bilatérale lorsqu'on ne cherche pas à
connaître le sens de la différence. On se contente de postuler que les deux
fréquences sont différentes.
H1 unilatérale: l'hypothèse alternative est unilatérale lorsqu'on s'intéresse à un
sens particulier de l'inégalité de 2 fréquences

H1 unilatérale H1 unilatérale
Test de conformité

Calcul du test de comparaison

-Une fois que les hypothèses sont clairement définies, le test est appliqué.

-Le résultat du test est confronté à un modèle de distribution théorique.


Choix du risque d'erreur- le risque a

Si eobs≤eth5%= 1,96, on accepte H0, la


différence n’est pas significative
Si eobs>eth5%= 1,96, on rejette H0 et on
accepte H1, la différence est significative
à 5%

Le risque a: C'est le risque de se tromper en rejetant Ho


Test d’homogénéité
Population Echantillon
Tirage aléatoire ou non

E1 E2

N1 N2

Pth Pobs1 Pobs2


Connue
ou Inconnue
Test d’homogénéité
Choix du test

p-p
En pratique, pour tester l’hypothèse e = 1 2

é1 1ù
obs

nulle, on calcul l’écart réduit p (1 - p ) ê + ú


ëN N û
th th

1 2

Si pth n’est pas connue au niveau de la population; on l’estime à


partir des deux fréquences observées

N p +N p
p = 1 1 2 2

N +N
théorique

1 2
Test d’homogénéité

Définir les hypothèses H0 et H1

H0: les fréquences observées au niveau des 2 échantillons sont identiques P1 = P2 .

H1: les fréquences observées au niveau des 2 échantillons sont différentes P1 ≠ P2.
Au moins un des 2 échantillons est biaisé si les échantillons sont issus de la même
population ou encore les échantillons sont issus de populations différentes.
Test d’homogénéité

Calcul du test de comparaison

-Une fois que les hypothèses sont clairement définies, le test est appliqué.

-Le résultat du test est confronté à un modèle de distribution théorique.


Signification: lecture sur la table

Si eobs≤eth5%= 1,96, on accepte H0, la


différence n’est pas significative
Si eobs>eth5%= 1,96, on rejette H0 et on
accepte H1, la différence est significative
à 5%
Intervalle de confiance d’une fréquence

Population Echantillon
Tirage aléatoire

NE

Pth Pobs
Estimation
Inconnue
Intervalle de confiance d’une fréquence

Choix du test

p (1 - p ) α% p (1 - p )
Pobs. - 1Ԑ,96
th
α% obs obs
£ pth £ pobs. + 1Ԑ,th96 obs obs

N N
2 Comparaison de deux
fréquences
EXERCICES
Exercice 1
On cherche à savoir si le comportement des étudiants et des étudiantes en France
est différent par rapport à différentes addictions. Par exemple, dans le cas du
cannabis, on interroge 700 étudiants parmi lesquels 250 répondent en fumer au
moins une fois par semaine et 800 étudiantes parmi lesquelles 270 répondent en
fumer au moins une fois par semaine.

Peut-on conclure, au risque 5%, que les étudiants et les étudiantes en France ont
un comportement différent par rapport au cannabis ?
Corrigé
. Choix du test

Comparaison de deux fréquences observées "Test d’homogénéité"

p-p
e = 1 2

é1 1ù
obs

p (1 - p ) ê + ú
ëN N û
th th

1 2

Si pth n’est pas connue au niveau de la population; on l’estime à partir des


deux fréquences observées

N p +N p
p = 1 1 2 2

N +N
théorique

1 2
. Définir les hypothèses H0 et H1

H0: P1=P2
La proportion d’étudiants et d’étudiantes fumant du cannabis au moins
une fois par semaine est la même (homogénéité)

H1: P1≠ P2
La proportion d’étudiants et d’étudiantes fumant du cannabis au moins
une fois par semaine n’est pas la même
. Application

p1= 250/700= 0,357


p2= 270/800= 0,337

N p +N p
p =700×0,357+800×0,337
1 1 2 2
=0,346
N +N
700 + 800
théorique

1 2
. Application

p -p
|0,357-0,337|
e = 1 2
=0,81
é 11 1 ù
obs
1
p (1 - p )
0,346(1-0,346)
ê700 + 800ú
+
ëN N û
th th

1 2
Choix du risque d'erreur- le risque a

5%
α=5%; Ԑth=1,96

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

5%
α=5%; Ԑth=1,96
5%
Ԑobs< Ԑth On accepte H0

Il est impossible de conclure à partir des résultats de l’enquête que le


comportement en France des étudiants est différent de celui des
étudiantes par rapport au cannabis.

La proportion d’étudiants et d’étudiantes fumant du cannabis au moins


une fois par semaine est la même.
Exercice 2
Parmi 400 habitants représentatifs d’une région, 92 (23%) consomment des
anti-dépresseurs. Ce pourcentage diffère-t-il de la valeur 20% donnée par
les chiffres de vente nationaux ?
Corrigé
. Choix du test

On compare une fréquence observée à une fréquence théorique


"Test de conformité "

P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

N
. Définir les hypothèses H0 et H1

H0: Pobs=Pth
La proportion des personnes qui consomment des anti-dépresseurs est la
même (conformité)

H1: Pobs≠ Pth


La proportion des personnes qui consomment des anti-dépresseurs est
différente
. Application

pobs=92/400=0,23
pth=0,20 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . -
|0,23 Pth .
-0,20|
N
e = = 1,5
obs
p0,20
th
obs
- pth )
(1×0,80 obs .

400
N
Choix du risque d'erreur- le risque a

5%
α=5%; Ԑth=1,96

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

5%
α=5%; Ԑth=1,96
5%
Ԑobs< Ԑth On accepte H0

La proportion des personnes qui consomment des anti-dépresseurs


est la même
Exercice 3
En 2000, la proportion de français utilisant internet toutes les semaines était de
55%. On pense à priori que cette utilisation augmente.
On réalise aujourd'hui un sondage qui montre que sur 1500 personnes interrogées,
1000 déclarent utiliser internet toutes les semaines.

Peut-on penser que la proportion de français utilisant internet a augmenté ?


Corrigé
. Choix du test

On compare une fréquence observée à une fréquence théorique


"Test de conformité "

P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

N
. Définir les hypothèses H0 et H1

H0: Pobs=Pth
La proportion de français utilisant internet n’a pas augmenté (conformité)

H1: Pobs> Pth


La proportion de français utilisant internet a augmenté
. Application

pobs=1000/1500=0,67
pth=0,55 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . --0,67|
Pth . N
|0,55
e = = 9,34
obs
p0,55
th
obs
- pth )
(1×0,45 obs .

1500
N
Choix du risque d'erreur- le risque a

Situation unilatérale
la signification est testée à 10%
10%
Ԑth=1,645

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

10%
Ԑth=1,645

5%
Ԑobs> Ԑth On rejette H0

L’utilisation d’internet a augmenté


Exercice 4
Un hôpital provincial dispose au total de 50 000 dossiers de patients. On choisit au
hasard 150 dossiers. On trouve 85 dossiers de femmes et 65 dossiers d’hommes
dans cet échantillon de dossiers.

Estimez un intervalle de confiance (IC) au risque de 2% de la proportion de dossiers


de femmes dans la population totale de dossiers.
Corrigé
. Choix du test

Estimation d ’ une fréquence théorique à partir d ’ une fréquence


observée

α% p (1 - p ) α% p (1 - p )
Pobs. - 1Ԑ,96 obs obs
£ pth £ pobs. + 1Ԑ,96 obs obs

N N
Choix du risque d'erreur- le risque a

2%
α=2%; Ԑth=2,326

Le risque a: C'est le risque de se tromper en rejetant Ho


. Application

α% p (1 - p ) α% p (1 - p )
Pobs. - 1Ԑ,96 obs obs
£ pth £ pobs. + 1Ԑ,96 obs obs

N N

pobs=85/150=0,57
2%
α=2%; Ԑth=2,326

0,57 (1-0,57) ≤ pth ≤ 0,57 + 2,326 0,57 (1-0,57)


0,57 - 2,326
150 150

IC [0,48 - 0,66]
. Conclusion

On peut être sûr à 98% que la proportion de dossiers de femmes dans la


population des dossiers de l’hôpital est comprise entre 48% et 66%
Exercice 5
En France, la fréquence du groupe sanguin A est pF=0,45.

1. Sur un échantillon de 400 Belges, on a trouvé 192 individus de groupe A. La


fréquence du groupe sanguin A chez les Belges diffère-t-elle de pF ?
2. Sur un échantillon de 100 Allemands, on a observé 32 individus de groupe A.
Cette fréquence diffère-t-elle de celle observée chez les Belges ?
Corrigé
1.
. Choix du test

On compare une fréquence observée à une fréquence théorique


"Test de conformité "

P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

N
. Définir les hypothèses H0 et H1

H0: Pobs=Pth
La fréquence du groupe sanguin A chez les Belges est la même que celle
observée en France (conformité)

H1: Pobs≠Pth
La fréquence du groupe sanguin A chez les Belges est différente de celle
observée en France.
. Application

pobs=192/400=0,48
pth=0,45 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . --0,45|
Pth . N
|0,48
e = = 1,21
obs
0,45 - pthobs . )
pthobs (1(1-0,45)
400N
Choix du risque d'erreur- le risque a

5%
α=5%; Ԑth=1,96

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

5%
α=5%; Ԑth=1,96
5%
Ԑobs< Ԑth On accepte H0

La fréquence du groupe sanguin A chez les Belges est la même


que celle observée en France.
2.
. Choix du test
Comparaison de deux fréquences observées "Test d’homogénéité"

p-p
e = 1 2

é1 1ù
obs

p (1 - p ) ê + ú
ëN N û
th th

1 2
. Définir les hypothèses H0 et H1

H0: P1=P2
La fréquence du groupe sanguin A chez les Allemands est la même que
celle observée chez les Belges (homogénéité)

H1: P1≠ P2
La fréquence du groupe sanguin A chez les Allemands est différente de
celle observée chez les Belges.
. Application

p1= 192/400= 0,48


p-p
p2= 32/100= 0,32 e = 1 2

é1 1ù
obs

pth=0,45 p (1 - p ) ê + ú
ëN N û
th th

1 2

p -p
|0,48-0,32|
e = 1 2
=2,87
é 11 1 ù
obs
1
p (1 - p )
0,45(1-0,45)
ê400 +
+
ë N 100N úû
th th

1 2
. Conclusion

5%
α=5%; Ԑth=1,96

5%
Ԑobs> Ԑth On rejette H0
et on accepte H1

La fréquence du groupe sanguin A chez les Allemands est différente


de celle observée chez les Belges.
Exercice 6
La proportion de fumeurs dans une population est évaluée à 34%.

Le gouvernement mène une campagne d'information sur les méfaits du tabac,


augmente conjointement les prix et interdit de fumer dans les lieux publics. On
cherche à savoir si cette politique est efficace. Pour cela on mène une enquête sur
800 personnes de cette population parmi lesquelles, à la suite de la campagne
d'information précitée, 260 déclarent être toujours fumeurs.

1. Peut-on considérer, au risque 5%, que la politique du gouvernement est


efficace?
2. Même question si 200 déclarent être toujours fumeurs.
Corrigé
1.
. Choix du test

On compare une fréquence observée à une fréquence théorique


"Test de conformité "

P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

N
. Définir les hypothèses H0 et H1

H0: Pobs=Pth
La politique du gouvernement n’a pas changé la proportion de fumeurs
de la population (conformité)

H1: Pobs< Pth


La politique du gouvernement a baissé la proportion de fumeurs de la
population (politique efficace).
. Application

pobs=260/800=0,325
pth=0,34 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . - Pth . N
|0,34 -0,325|
e = =0,89
obs
0,34 - pthobs . )
pthobs (1(1-0,34)
800N
Choix du risque d'erreur- le risque a

Situation unilatérale
la signification est testée à 10%
10%
Ԑth=1,645

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

10%
Ԑth=1,645

5%
Ԑobs< Ԑth On accepte H0

Il est impossible de dire à partir des résultats de l’enquête que la


campagne a été efficace.
2.
pobs=200/800=0,25
pth=0,34 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . - Pth . N
|0,34 -0,25|
e = =5,37
obs
0,34 - pthobs . )
pthobs (1(1-0,34)
800N
. Conclusion

10%
Ԑth=1,645

5%
Ԑobs> Ԑth On rejette H0
et on accepte H1

Si 200 personnes déclarent être toujours fumeurs, nous pouvons


conclure que la campagne a été efficace.
Exercice 7
On s’intéresse à la proportion des étudiants réussissant un examen. Dans un
échantillon aléatoire E1 de 200 étudiants, on constate que 80 d’entre eux ont validé
le semestre. Sur un autre échantillon aléatoire E2 de 200 étudiants, on constate
que seulement 40 ont validé le semestre.

1. Calculer, pour chacun des deux groupes, la fréquence des étudiants qui ont
validé le semestre.
2. La différence observée entre les deux fréquences de réussite est-elle
significative ?
3. Déterminer la fréquence théorique de la population dont l’échantillon E1 est issu.
Corrigé
1.
La fréquence des étudiants qui ont validé le semestre :

p1= 80/200= 0,4


p2= 40/200= 0,2
2.
. Choix du test
Comparaison de deux fréquences observées "Test d’homogénéité"
p-p
e = 1 2

é1 1ù
obs

p (1 - p ) ê + ú
ëN N û
th th

1 2

Si pth n’est pas connue au niveau de la population; on l’estime à partir des


deux fréquences observées

N p +N p
p = 1 1 2 2

N +N
théorique

1 2
. Définir les hypothèses H0 et H1

H0: P1=P2
Les deux fréquences de réussite sont les mêmes (homogénéité)

H1: P1≠ P2
Les deux fréquences de réussite sont différentes.
. Application

p1= 80/200= 0,4


p2= 40/200= 0,2

N p +N p
p =200×0,4
1 1 + 200×0,2
2 2
= 0,3
N +N
200 + 200
théorique

1 2
. Application

p1= 0,4
p2= 0,2
pth= 0,3

|0,4p --0,2|
p
e = 1 2
=4,36
é 11 1 ù
obs
1
0,3 -p )
p (1(1-0,3) ê200 + 200ú
+
ëN N û
th th

1 2
. Conclusion

5%
α=5%; Ԑth=1,96
5%
Ԑobs> Ԑth On rejette H0
et on accepte H1

Les deux fréquences de réussite sont différentes.


3.
La fréquence théorique de la population dont l’échantillon E1 est issu :

. Choix du test
Estimation d ’ une fréquence théorique à partir d ’ une fréquence
observée (par IC)

Ԑα% p (1 - p ) Ԑ α% p (1 - p )
Pobs. - 1,96 obs
£ pth £ pobs. + 1,96
obs obs obs

N N
. Application

α% p (1 - p ) α% p (1 - p )
Pobs. - 1Ԑ,96 obs obs
£ pth £ pobs. + 1Ԑ,96 obs obs

N N

pobs=80/200= 0,4
5%
α=5%; Ԑth=1,96

0,4 (1-0,4) ≤ pth ≤ 0,4 + 1,96 0,4 (1-0,4)


0,4 - 1,96
200 200

IC [0,332 - 0,468]
. Conclusion

Au risque 5%, la fréquence théorique de la population dont l’échantillon


E1 est issu est comprise entre 33,2% et 46,8%.
Exercice 8
Sur 4000 naissances, on a relevé 2065 garçons. Cette observation est-elle
conforme avec l’hypothèse que la probabilité théorique qu’il naisse un garçon est
de 0,5 ? On prendra successivement α=0,05 et α=0,01.
Corrigé
. Choix du test

On compare une fréquence observée à une fréquence théorique


"Test de conformité "

P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

N
. Définir les hypothèses H0 et H1

H0: Pobs=Pth
La proportion de naissance des garçons est la même que celle de la
population (conformité)

H1: Pobs≠ Pth


La proportion de naissance des garçons est différente de celle de la
population.
. Application

pobs=2065/4000=0,516
pth=0,5 P .- P
e = obs th .

obs
pth (1 - pth )
obs obs .

Pobs . --0,5|
|0,516 Pth . N
e = =2,02
obs

th
(1 - pth )
p0,5×(1-0,5)
obs obs .

4000
N
Choix du risque d'erreur- le risque a

5%
α=5%; Ԑth=1,96
1%
α=1%; Ԑth=2,576

Le risque a: C'est le risque de se tromper en rejetant Ho


. Conclusion

5%
α=5%; Ԑth=1,96
5%
Ԑobs> Ԑth On rejette H0 et on accepte H1

1%
α=1%; Ԑth=2,576 1%
Ԑobs< Ԑth On accepte H0

Vous aimerez peut-être aussi