Vous êtes sur la page 1sur 22

Introduction Tests Théorie Théorie

1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Tests d’homogénéité : Principe du test de la variance

𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛 1 𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛 2
X1→ 𝐵(𝑛 , 𝑝 ) X2→ 𝐵(𝑛 , 𝑝 )

Un échantillonnage aléatoire simple et indépendant


?
Test d’homogénéité

Les deux statistiques sont elles homogènes ?

H0 : 𝑝 = 𝑝 , H1 : 𝑝 ≠ 𝑝

Exemple : On veut tester l’impact des travaux dirigés dans la


réussite à l’examen de statistique

La variabilité des valeurs obtenues pour les deux prélèvements


est-elle similaire ?
67
Introduction Tests Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Tests d’homogénéité : Principe du test de la variance

On prend la statistique

Z=  Suit la loi N(0,1)


( )

Avec F =

Dans le cas d’un test bilatéral, on obtient la région de rejet pour un risque 𝛼 ∶

ZR = −∞ , −𝑧 / ∪ 𝑧 / , +∞

Avec 𝑧 / le quantile d’ordre 1- de loi N(0, 1)

68
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité : Exercice d’application

L’usine XYZ est soupçonné de polluer une rivière. En effet, des mesures, ayant été effectuées en amont et en aval de
l’usine durant plusieurs jours choisis aléatoirement dans l’année, ont donné les résultats suivants :

Amont 5,32 6 5,64 4,5 5,35 6,17 4,11 5,86 6,13 4,68
Aval 5,33 6,13 5,66 4,59 5,49 6,32 4,24 5,83 6,27 4,86

En ce qui concerne la teneur d’un certain polluant.

On suppose que ces deux séries de mesures ont été effectuées sur deux populations.

L’usine pollue-t-elle la rivière ?

69
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité : Exercice d’application


X1 X2 Pour répondre à cette question, il faut d’abord comparer les variances
Amont Aval
5,32 5,33 H0 : 𝜎 =𝜎
6 6,13 H1 : 𝜎 ≠𝜎 Test bilatéral
5,64 5,66
4,5 4,59 Z1 = Suit ℵ 𝑛1 − 1 Avec un risque de 5%
5,35 5,49
6,17 6,32 Z2 = Suit ℵ 𝑛2 − 1
4,11 4,24
5,86 5,83 F= = Suit ℱ 𝑛2 − 1 , 𝑛1 − 1 = ℱ 9 , 9
6,13 6,27 4,03
0,24
4,68 4,86
,
Moy 5,376 5,472 fObs = = = 1,02314
,
Donc : On accepte l’hypothèse H0 avec un risque de 5%
Var 0,475 0,464
70
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests
T
3 paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité : Exercice d’application


Test de comparaison des moyennes :
H0 : 𝜇 ≤𝜇
On va montrer que l’usine ne pollue pas la rivière
H1 : 𝜇 >𝜇

− Suit 𝑇(𝑛1 + 𝑛2 − 2)
T= ∗  
Loi de Student de degré 𝑛1 + 𝑛2 − 2 T(18)

La densité de la loi de Student de


degré 18 avec un risque 𝛼 = 5% est

1,73
× , × ,
∗ = Estimation sans biais de 𝜎 ∗ = = 0,5219

, ,
tObs =  
= 0,137 Donc : L’hypothèse H0 est acceptée avec un risque 𝛼 = 5%
,

71
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité de deux séries appariées : Princpe


Echantillons de taille n

Mesure 1 𝐷 moyenne de différence Mesure 2

𝑥 d1
𝑥

𝑥 d2
𝑥

… …

dn
𝑥 𝑥

Test sur séries appariées


Série 1 Série 2
H0 : 𝐷 = 0
𝐷 est-elle significativement différente de 0 ?
72
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité de deux séries appariées : Exemple


On souhaite évaluer l’effet d’un nouveau régime alimentaire sur la perte de poids chez 20 sujets. Pour cela, on pèse ces 20
sujets avant de débuter le régime alimentaire, puis une seconde fois, à la fin de celui-ci (2 mois plus tard, par exemple).
Les données pourraient être celles-ci :

Num_P Avant Après Num_P Avant Après Dans cette situation, chaque
couple de valeur appartenant
patient_ 01 88.74 88.90 patient_ 11 110.12 111.41
à un même sujet, constitue
patient_ 02 96.84 95.91 patient_ 12 98.90 93.44 une paire
patient_ 03 86.64 82.68 patient_ 13 88.79 86.29
patient_ 04 110.95 95.46 patient_ 14 72.85 68.94
patient_ 05 98.30 96.48 patient_ 15 106.25 94.05
patient_ 06 86.80 82.18 patient_ 16 94.55 87.75
patient_ 07 99.87 94.10 patient_ 17 94.84 88.13
patient_ 08 102.38 89.91 patient_ 18 104.44 98.92
patient_ 09 100.76 93.33 patient_ 19 103.21 103.55
patient_ 10 91.95 89.44 patient_ 20 100.94 99.71

73
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité de deux séries appariées : Exemple

Déclaration des hypothèses H0 : la moyenne « vraie » de D est nulle, soit μ = 0.


H1 : la moyenne « vraie » de D est non nulle, soit μ ≠ 0.

La variable de décision On suppose que la variable D est distribuée selon une loi normale.

Sa variance est inconnue. La variable T, définie par T=


 

Le risque de première espèce Il faut préciser un risque 𝛼 Suit la loi de Student de degré n-1

La valeur critique D’après l’hypothèse H1, le test est bilatéral. Dans la table de Student à n-1 ddl, on lit 𝑡 ,

La règle de décision Si tobs désigne la valeur de la variable T calculée à partir des résultats dans l’échantillon.
La règle de décision est la suivante :
• Si tobs n’appartient pas à l’intervalle [ - 𝑡 , ;𝑡 , ] on rejette H0 au risque 𝛼
• Si tobs appartient à l’intervalle [ - 𝑡 , ;𝑡 , ] on ne rejette pas H0
74
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’Homogénéité de deux séries appariées : Exemple


X1 X2 D = X 2 – X1
H0 : 𝜇 = 0 Le nouveau régime n’a pas d’effet N° Avant Après avant-après
Déclaration des hypothèses 88,74 88,9 -0,16
H1 : μD ≠ 0. Le test est bilatéral 1
2 96,84 95,91 0,93
3 86,64 82,68 3,96
La variable de décision On suppose que la variable D est distribuée selon une loi normale. 4 110,95 95,46 15,49
5 98,3 96,48 1,82
Sa variance est inconnue. La variable T, définie par 6 86,8 82,18 4,62
99,87 94,1 5,77
T= = Suit la loi de Student de degré 19 7
102,38 89,91 12,47
    8
9 100,76 93,33 7,43
Le risque de première espèce On fixe le risque 𝛼 = 5% 10 91,95 89,44 2,51
11 110,12 111,41 -1,29
D’après l’hypothèse H1, le test est bilatéral. 12 98,9 93,44 5,46
La valeur critique 13 88,79 86,29 2,5
Dans la table de Student à 19 ddl, on lit 𝑡 . , = 2,43 14 72,85 68,94 3,91
15 106,25 94,05 12,2
16 94,55 87,75 6,8
La règle de décision tobs =  
,
  = 3.25 17 94,84 88,13 6,71
, /
18 104,44 98,92 5,52
On rejette l’hypothèse H0 103,21 103,55 -0,34
tobs = 3.25 ∉ −2.43, 2,43 19
20 100,94 99,71 1,23
Moyenne 4,877
Au risque de 5%, au vu de l’échantillon, on peut conclure à un effet du régime
Variance corrigée 42,83423
75
Introduction Tests Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Tests paramétriques par catégorie selon l’objectif

Pour un échantillon :
 Tests de conformité (conformité d’un paramètre à une certaine contrainte)
 Tests d’ajustement (adéquation) à une loi donnée ou à une famille de lois donnée
 Tests de symétrie
 Tests de monotonie
 etc ...

Pour deux échantillons ou plus :


 Tests de comparaison (homogénéité) pour données non appariées
 Tests de comparaison (homogénéité) pour données appariées
 Tests d’indépendance, ou d’association, ou de liaison
 etc ...

76
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Etudier la liaison possible entre deux variables qualitatives


Au moins une variable à échelle nominale ou ordinale

Variable Variable
qualitative 1 : u Test d’indépendance qualitative 2 : v

But : Est-ce qu’il existe un lieu entre deux variables ?

H0 : il n’existe pas de lien entre les variables u et v

77
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Etape 1 : Formuler les hypothèses


Hypothèse nulle H0 : toujours on considère le cas où il n’existait pas de lieu entre les deux variables étudiées
Hypothèse alternative H1 : toujours on considère le cas où il existe un lien entre les deux variables étudiées

Etape 2 : Indiquer le seuil de signification du test


Seuil significatif 𝛼 est la probabilité que le test nous révèle qu’il existe un lien entre les deux variables alors que
dans les faits ce lieu n’existe pas Par exemple, on peut prendre 𝛼 = 5%, 1% et 0,1%

u v Mv_1 … Mv_j … Mv_n


Tableau de Mu_1 O11 … O1j … O1n
contingence … … … … … …
Mu_i Oi1 Oij Oin
… … … … … …
Mu_m Om1 … Omj … Omn

78
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests
T
3 paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Etape 3 : Déterminer les effectifs théorique et vérifier les conditions d’application du test
Mv_1 ET_1 v … Mu_j ET_j … Mu_n ET_n Total
u
Mu_1 o11 t11=TL_1 xTC_1/GT o1j t1j=TL_1 xTC_j/GT … o1n t1n=TL_1 xTC_n/GT TL_1
… … … … … … … … … …
Mu_i oi1 ti1=TL_i xTC_1/GT oij tij=TL_i xTC_j/GT … oin tin=TL_i xTC_n/GT TL_i
… … … … … … … … …
Mu_n on1 tn1=TL_n xTC_1/GT … onj tnj=TL_n xTC_j/GT … omn tmn=TL_m xTC_n/GT TL_m

TC_1 TC_j GT
TC_n

(total de la ligne i) x (total de la colonne j) / grand total

1ère condition d’application n ≥ 30


2ème condition d’application Tij ≥ 5 ∀ 𝑖, 𝑗

79
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe


S’il n’y a pas de lien
On calcule le Khi deux     entre les variables, il y a
𝑂 −𝑇 de faibles chance que la
Somme des carrés des écarts relativisés 𝜒2 =
𝑇 valeur de 𝜒2 soit grande

Il n’y a pas de lien entre les


variables, il y a de fortes chances
que la valeur 𝜒2 soit faible

ddl Risque 𝛼

80
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests
T
3 paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Etape 4 : Déterminer de degrés de liberté

Nombre de degré de liberté 𝜈 = 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑙𝑖𝑔𝑛𝑒 − 1 × (𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑜𝑙𝑜𝑛𝑛𝑒 − 1)

Etape 5 : Déterminer 𝜒 et définir la règle de décision

On détermine la valeur de 𝜒 à partir de la table de Khi deux

Etape 6 : Calculer 𝜒 é

   
𝑜 −𝑡
On calcule 𝜒 =
𝑡

à partir de la table de contingence

81
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests
T
3 paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Etape 7 : Prendre une décision et l’interpréter

Décision Si 𝜒 < 𝜒
on accepte l’hypothèse H0
Si 𝜒 > 𝜒 on rejette l’hypothèse H0

Interprétation Avec un seuil de signification de 𝛼, on ne peut affirmer ( ou peut affirmer)


qu’il existait un lien entre les deux variables u et v

82
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Coefficient de contingence et coefficient de Cramer

Ces nombres servent à déterminer l’intensité d’un lien statistique entre


deux variables dont au moins une à une échelle nominale ou ordinale

   
C= V=
× ,

La valeur de ces coefficient est toujours comprise entre 0 et 1.

• Plus la valeur est près de 1 plus le lien statistique entre les deux variables est fort
• A l’inverse, plus ces coefficients ont une valeur près de 0 plus le lieu est faible

83
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Questionnaire
• Q1: Quelle est la couleur de vos yeux?
population: 300 individus
• Q2: quelle est la couleur de vos cheveux?

Résultat

Yeux/cheveux brun chatain blond

bleus 20 30 40

marrons 60 50 40

verts 10 20 30

84
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

H0 : Il n’ y a pas de lien entre la couleur des yeux et la couleur des cheveux


H1 : Il y a un lien entre la couleur des yeux et la couleur des cheveux

Yeux/cheveux brun chatain blond Total

bleus 20 30 40 90

marrons 60 50 40 150

60
verts 10 20 30

Total 90 100 110 300

85
Introduction Test Théorie Théorie
1 générale 2 Généralités
sur les tests 3
T
paramétriques 4 d’échantillonnage
5 d’ estimation

Test d’indépendance : Principe

Yeux/cheveux brain chatain blond Total

bleus 20 ×
=27 30 ×
=30 40 ×
=33 90

marrons 60 ×
=45 50 ×
=50 40 ×
=55 150

verts 10 ×
=18 20 ×
=20 30 ×
=22 60

Total 90 100 110 300

𝜒 = + + + + + + + + = 18,9

Le degré de liberté (ddl) est (nombre de lignes -1) x (nombre de colonnes -1) = (3-1)x(3-1) = 4

ddl 10% 5% 1% 0,1% 𝜒 = 18,5


3 … … … … On a 𝜒 = 18,5 < 𝜒 = 18,9
4 7,78 9,49 13,3 18,5
5 … … … … A moins de 0,1% de chance de se produire par hasard
86
87
88

Vous aimerez peut-être aussi