Vous êtes sur la page 1sur 90

.

Tests statistiques
.

Michaël Genin

Université de Lille 2
EA 2694 - Santé Publique : Epidémiologie et Qualité des soins
michael.genin@univ-lille2.fr
Plan

1. Principe des tests statistiques


Exemple introductif
Définitions
2. Grands échantillons n ⩾ 30
Comparaison d’une moyenne observée à une moyenne théorique
Comparaison de deux moyennes / Echantillons indépendants
Comparaison de deux moyennes / Echantillons appariés
Comparaison d’une proportion observée à une proportion théorique
Comparaison de deux proportions / Echantillons indépendants
3. Petits échantillons n < 30
Comparaison d’une moyenne observée à une moyenne théorique
Comparaison de deux moyennes / Echantillons indépendants
Comparaison de deux moyennes / Echantillons appariés
4. Conclusions

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 1 / 103
Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 1 : efficacité d’un nouveau médicament

On souhaite tester l’efficacité d’un nouveau médicament par rapport au


médicament couramment utilisé.

On dispose d’un échantillon de 100 patients divisé en 2 groupes :


Groupe A (50 individus) : nouveau médicament
Groupe B (50 individus) : médicament classique

En observant la guérison à 1 mois :


Groupe A : 75% de guérison
Groupe B : 65% de guérison

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 4 / 103
Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 1 : efficacité d’un nouveau médicament

Le nouveau médicament est-il plus efficace que le médicament classique ?


D’un point de vue descriptif → OUI
Si on tire un autre échantillon de patients, retrouve-t-on la même différence
d’efficacité ? (fluctuations d’échantillonnage)
Peut-on extrapoler cette différence d’efficacité à la population ?

Les tests statistiques permettent de fixer une règle de décision objective.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 5 / 103
Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 2 : identification d’un facteur de risque

On s’intéresse au lien entre le tabagisme et et le cancer du poumon sur un


échantillon de 200 individus.

On procède à une étude cas/témoins :

Malade Non malade


Fumeur 70 20
Non fumeur 30 80

Chez les malades, on observe 70% de fumeurs


Chez les non-malades, on observe 20% de fumeurs

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 6 / 103
Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 2 : identification d’un facteur de risque

Comment interpréter la proportion plus élevée de fumeurs dans l’échantillon de


malades que dans celui des non-malades ?
Existence d’un réel lien entre le tabagisme et le cancer du poumon ?
Différence de proportion liée à l’échantillon ?
Cette différence est-elle extrapolable à la population ?

Les tests statistiques permettent de fixer une règle de décision objective.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 7 / 103
Principe des tests statistiques Définitions

Définitions

Objectif : Valider ou non une hypothèse faite sur une ou plusieurs populations

. Outil pour effectuer une preuve


1

Médicament A est meilleur que le le médicament B


Un facteur F est lié à la pathologie P
. Méthode expérimentale (non déterministe)
2

On se base sur un ou plusieurs échantillons


La prise de décision peut être influencée par le choix de l’échantillon
La conclusion ne pourra se faire de manière certaine (notion de risque)
. Raisonnement mathématique particulier : raisonnement par l’absurde → Test
3

d’hypothèse

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 9 / 103
Principe des tests statistiques Définitions

Définitions

Notion d’hypothèse (H0 , H1 )

On pose une hypothèse, appelée Hypothèse nulle, notée H0 .


Souvent, cette hypothèse est le contraire ce que l’on cherche à prouver
(raisonnement par l’absurde) :
H0 : Le médicament classique et le nouveau ont la même efficacité

C’est cette hypothèse qu’on va tester à l’aide des observations sur le (ou les)
échantillon(s).

Un test statistique peut amener à deux décisions possibles :


Conservation de H0
Rejet de H0

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 10 / 103
Principe des tests statistiques Définitions

Définitions

Notion d’hypothèse (H0 , H1 )

Si l’hypothèse testée est rejetée, alors on ”accepte” le complémentaire de cette


hypothèse, appelée hypothèse alternative, notée H1

H1 : Le nouveau médicament et le classique ont des efficacités différentes

Un test statistique présente donc deux hypothèses, H0 et H1 :

H0 : Le médicament classique et le nouveau ont la même efficacité


H1 : Le nouveau médicament et le classique ont des efficacités différentes

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 11 / 103
Principe des tests statistiques Définitions

Définitions

Notion de risque

Le jugement d’une hypothèse se fait sur un ou plusieurs échantillons.

→ La conclusion du test n’est pas certaine mais lui est associé un risque d’erreur
faible.
.
Le risque de première espèce α
.
. Risque de rejeter H0 sachant qu’elle est vraie.

Les deux médicaments n’ont pas la même efficacité


alors qu’en réalité leur efficacité est équivalente

La preuve n’est pas certaine, on lui associe un risque fixé à l’avance


(ex : α = 5%)

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 12 / 103
Principe des tests statistiques Définitions

Définitions

Notion de risque

Si on rejette H0 , le test est dit significatif au risque α.


.
Le risque de seconde espèce β
.
. Risque de conserver H0 sachant que H1 est vraie.

Les deux médicaments ont la même efficacité


alors qu’en réalité leur efficacité est différente

Si on conserve H0 , le test est dit non significatif au risque β

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 13 / 103
Principe des tests statistiques Définitions

Définitions

Risques associés à un test

Réalité
Décision H0 H1
H0 conclusion correcte risque de deuxième espèce

H1 risque de première espèce conclusion correcte

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 14 / 103
Principe des tests statistiques Définitions

Définitions

Règle de décision

Se base sur une statistique de test ST : variable aléatoire observable telle que
sa loi est complètement connue sous H0
La réalisation de ST est observée sur l’échantillon
Les valeurs peu probables de ST observées mettent en cause la validité de H0

Exemple : efficacité de deux médicaments


H0 : Le médicament classique et le nouveau ont la même efficacité
H1 : Le nouveau médicament et le classique ont des efficacités différentes
On suppose de ST ∼ N (0, 1) sous H0 .
On observe sT (réalisation de ST ) sur un échantillon de taille 200 et sT = 3.
sT = 3 est une valeur très peu probable pour une loi N (0, 1).

P(ST > 3) < 0.025

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 15 / 103
Principe des tests statistiques Définitions

Exemple : efficacité de deux médicaments


Sous H0

ST ∼ N (0, 1)

0 3

Valeur de ST observée

Si H0 était vraie, on aurait dû obtenir une valeur de ST plus probable et non une
valeur extrême.
2 explications possibles :
H0 n’est pas vraie ( les deux médicaments ont des efficacités différentes)
Problème d’échantillonnage
Quelles valeurs de ST conduisent au rejet de H0 ???
Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 16 / 103
Principe des tests statistiques Définitions

Définitions

Région critique

On appelle région critique W l’ensemble des valeurs de ST qui conduisent au rejet


de H0 au profit de H1 .

P(ST ∈ W /H0 ) = α
P(ST ∈
/ W /H0 ) = 1 − α
Et
P(ST ∈
/ W /H1 ) = β
P(ST ∈ W /H1 ) = 1 − β

1 − β est appelée la puissance du test

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 17 / 103
Principe des tests statistiques Définitions

Définitions
Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05
N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

Le test est dit bilatéral


H1 : Les deux médicaments ont une efficacité différente

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 18 / 103
Principe des tests statistiques Définitions

Définitions

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

Test unilatéral à gauche Test unilatéral à droite


N (0, 1) N (0, 1)

5% 95% 95% 5%

−z0.95 0 0 z0.95

W =] − ∞; −Z0.95 ] W = [z0.95 ; +∞[


H1 : Le nouveau médicament est moins efficace que le classique H1 : Le nouveau médicament est plus efficace que le classique

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 19 / 103
Principe des tests statistiques Définitions

Définitions

Risques associés à un test

Réalité
Décision H0 H1
H0 Niveau de confiance 1 − α β

H1 α Puissance 1 − β

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 20 / 103
Principe des tests statistiques Définitions

Définitions

Remarques

Le choix de α conditionne la capacité du test à rejeter H0


Si α est trop petit → on ne rejette que très rarement H0 (test conservatif)
Si α est trop grand → on va rejeter très souvent H0 , mais le risque de se
tromper est grand...
Le risque β se calcule si la loi de ST sous H1 est connue
α et β varient en sens inverse
Si on diminue α alors β augmente

Il est d’usage de fixer α = 1%, 5%, 10%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 21 / 103
Principe des tests statistiques Définitions

Définitions

Distribution sous H0 Distribution sous H1

Zone de conservation de H0 Zone de rejet de H0


Seuil
Risque α

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 22 / 103
Principe des tests statistiques Définitions

Définitions

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0


Seuil
Risque β

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 23 / 103
Principe des tests statistiques Définitions

Définitions

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0


Seuil
Puissance 1 − β

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 24 / 103
Principe des tests statistiques Définitions

Définitions

P-value

En pratique, au lieu de calculer la région critique W , on préfère donner un seuil


critique appelé p-value.

La p-value correspond à la plus petite valeur de α conduisant à rejeter H0 .

C’est le degré de signification du test. Plus elle faible par rapport à α, plus le test
a un degré de signification important.

En pratique :
P-value < α alors on rejette H0
P-value ⩾ α alors on ne rejette pas H0

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 25 / 103
Principe des tests statistiques Définitions

Principe des tests statistiques

Démarche d’un test statistique


1. Choix de H
0 et de H1
2. Choix d’un risque α

3. Choix d’une statistique de test S


T et de sa loi sous H0
.4 Détermination de la région critique W
5. Conclusion : observation de la réalisation de S
T sur l’échantillon :
Si sT ∈ W alors Rejet de H0
Si sT ∈
/ W alors Non rejet de H0

Types de tests
Tests paramétriques : comparaison de paramètres (moyennes, variances...)
Tests semi et non-paramétriques : comparaison de distributions

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 26 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit

Exemple : QI et prisonniers...

Objectif : on cherche à déterminer si le QI des prisonniers est le même (en


moyenne) que le QI de la population générale dont on connait la moyenne :
µ0 = 100, l’écart-type étant σ.

Considérons que dans la population de prisonniers le QI est une va X de moyenne


µ et d’écart-type est σ ′ .

Nous ne pouvons faire des tests de QI sur tous les prisonniers, donc on procède à
un échantillonnage.

Soit un échantillon de n = 100 prisonniers sur lequel on calcul la moyenne


empirique x̄ = 85 et l’écart-type empirique sn−1 = 10.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 29 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit

1. Choix des hypothèses

Soit X la va qui associe à un prisonnier son QI


H0 : le QI moyen des prisonniers est identique à celui de la population
générale
H1 : le QI moyen des prisonniers est différent de celui de la population
générale

H0 : µ = µ0
H1 : µ ̸= µ0

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 30 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit

3. Choix de la statistique de test et de sa loi sous H0

Sous H0 ,
.
X̄ − µ0
Z= √ ∼ N (0, 1)
. Sn−1 / n

Pourquoi ?
Sous H0 , on considère que les QI moyens sont égaux. Aussi, l’échantillon de
prisonniers est tout simplement un échantillon de 100 individus de la population
générale de moyenne µ0 et d’écart-type σ (pas de différence).

Or, on sait d’après le T.C.L., que si n ⩾ 30 alors



X̄ ∼ N (µ0 , σ/ n)

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 31 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit


4. Détermination de la région critique W

N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

W =] − ∞; −1.96] ∪ [1.96; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 32 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit

5. Calcul de Z sur l’échantillon et conclusions

x̄ − µ0
z= √
sn−1 / n
85 − 100
z= = −15
10/10

z ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


La moyenne observée sur l’échantillon est significativement différente de la
moyenne théorique.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 33 / 103
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique

Test Z ou de l’écart réduit

Remarques

Test bilatéral → H1 : µ ̸= µ0
Calcul de la p-value :

P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 15) ≈ 0

Comme P(Z > |z|) ≪ 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


un échantillon peu représentatif)
Inférence à la population des prisonniers : Le QI des prisonniers est en
moyenne inférieur à celui de la population générale

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 34 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test de Z ou de l’écart réduit

Exemple : patients diabétiques et taux de mauvais cholestérol (LDL)

Objectif : on désire savoir si le LDL est différent entre les patients diabétiques et
les personnes saines.

En population générale, on considère que le LDL moyen chez les diabétiques a


pour valeur µ1 et un écart-type σ1 .

En population générale, on considère que le LDL moyen chez les personnes saines
a pour valeur µ2 et un écart-type σ2 .

On dispose de 2 groupes de sujets :


Malades (n1 = 100) : x¯1 = 1.8, s1 = 0.5
Témoins (n2 = 50) : x¯2 = 1.3, s2 = 0.2

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 36 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test de Z ou de l’écart réduit

1. Choix des hypothèses

H0 : Le LDL est identique entre les témoins et les malades


H1 : Le LDL est différent entre les témoins et les malades

H0 : µ1 = µ2
H1 : µ1 ̸= µ2

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 37 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test de Z ou de l’écart réduit

3. Choix de la statistique de test et de sa loi sous H0

Sous H0 ,
.
X¯1 − X¯2
Z=√ ∼ N (0, 1)
S12 S22
+
. n1 n2

Pourquoi ? Comme n1 et n2 sont > 30, on applique le T.C.L. :



X¯1 ∼ N (µ1 , σ1 / n1 )

X¯2 ∼ N (µ2 , σ2 / n2 )

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 38 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test de Z ou de l’écart réduit

3. Choix de la statistique de test et de sa loi sous H0

Donc
 √ 
σ12 σ22 
X¯1 − X¯2 ∼ N µ1 − µ2 , +
n1 n2

Et

X¯1 − X¯2 − (µ1 − µ2 )


√ ∼ N (0, 1)
σ12 σ22
+
n1 n2

Car les échantillons sont indépendants

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 39 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test de Z ou de l’écart réduit

3. Choix de la statistique de test et de sa loi sous H0

Or sous H0 , µ1 = µ2

Donc

X¯ − X¯2
√1 ∼ N (0, 1)
σ12 σ22
+
n1 n2
Comme σ1 et σ2 sont inconnus, on utilise S1 et S2 (estimateurs non baisées de
l’écart-type)

Sous H0 , la statistique de test sera ”en moyenne” nulle.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 40 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test Z ou de l’écart réduit


4. Détermination de la région critique W

N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

W =] − ∞; −1.96] ∪ [1.96; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 41 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test Z ou de l’écart réduit

5. Calcul de Z sur l’échantillon et conclusions

x¯1 − x¯2
z=√ ∼ N (0, 1)
s12 s22
+
n1 n2

1.8 − 1.3
z=√ = 9.3
0.52 0.22
+
100 50

z ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


La moyenne observée sur l’échantillon de malades est significativement différente
de la moyenne chez les témoins.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 42 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants

Test Z ou de l’écart réduit

Remarques

Test bilatéral → H1 : µ1 ̸= µ2
Calcul de la p-value :

P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 9.3) ≈ 0

Comme P(Z > |z|) ≪ 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


des échantillons peu représentatifs)
Inférence à la population de malades : Le LDL est en moyenne supérieur à
celui de la population générale.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 43 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Définition de l’appariement

Un échantillon A et un échantillon B sont des échantillons appariés si chaque


observation de A est liée à une observation homologue de B.

Chaque couple de valeurs forme alors une paire.

Exemples :
On mesure la taille pour différents couples de frère et soeur, et l’on souhaite
comparer la taille entre les hommes et les femmes
Mesure d’un paramètre biologique chez des patients, avant et après une
intervention (données répétées)

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 45 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

Principe du test

On se base sur la différence des valeurs associées à chaque observation.


L’hypothèse nulle testée stipule qu’en moyenne ces différences sont nulles.

On se libère de la variabilité intra-échantillon (entre les observations d’un même


échantillon) afin de prendre en compte uniquement la variabilité inter-échantillons
(variabilité des différences entre paires).

Dans le cadre des données appariées, un test Z apparié est plus puissant qu’un
test Z de comparaison de moyennes.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 46 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

Exemple : évaluation d’un traitement contre le cholestérol

Objectif : Un traitement a pour but de réduire le taux de LDL. On veut montrer


que ce traitement est efficace.

Dans la population de malades, on pose :


X1 la mesure du LDL avant TTT
X2 la mesure du LDL après TTT

On dispose d’un échantillon de n = 100 patients pour lesquels on a mesuré


le LDL avant TTT (x¯1 = 1.8)
le LDL après TTT (x¯2 = 1.6)

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 47 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

Exemple : évaluation d’un traitement contre le cholestérol

Dans la population de malades, si le traitement n’a aucun effet, on considère que :


D = X1 − X2 une va d’espérance µD = 0 et de variance σD
2

Dans la population de malades, si le traitement a un effet, on considère que :


D = X1 − X2 une va d’espérance µD = ∆ et de variance σD
2

Ce sont ces considérations qui vont permettre de définir les hypothèses ainsi que
la statistique de test.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 48 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

1. Choix des hypothèses

H0 : Le TTT n’a pas d’effet


H1 : Le TTT a un effet

H0 : µD = 0
H1 : µD = ∆, ∆ ̸= 0

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 49 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

3. Choix de la statistique de test

D̄ − ∆
Z= √ ∼ N (0, 1)
SD / n
Or sous H0 , ∆ = 0, donc :
.

Z= √ ∼ N (0, 1)
SD / n
Avec :
D̄ = X¯1 − X¯2
et √ ∑n
∑n i=1 (Di )
2

i=1 Di − n
SD =
. n−1

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 50 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés


4. Détermination de la région critique W

N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

W =] − ∞; −1.96] ∪ [1.96; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 51 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

5. Calcul de Z sur l’échantillon et conclusions

Posons sur l’échantillon, sD = 0.2


z= √
sD / n

1.8 − 1.6
z= √ = 10
0.2/ 100

z ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


Le TTT est efficace.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 52 / 103
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés

Test Z pour échantillons appariés

Remarques

Test bilatéral → H1 : µD = ∆ ̸= 0
Calcul de la p-value :

P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 10) ≈ 0

Comme P(Z > |z|) ≪ 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


un échantillon peu représentatif)
Inférence à la population de malades : Le LDL est en moyenne inférieur après
TTT. Le TTT est efficace.
Relation de causalité

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 53 / 103
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique

Test sur une proportion

Exemple : Sondage électoral

Objectif On désire comparer les intentions de votes entre le département du Nord


et Pas-De-Calais pour un candidat à l’élection présidentielle.

On sait que dans le Nord, le candidat a π0 = 54% d’intention de vote.

On ne peut recenser l’ensemble des habitants du Pas-De-Calais pour déterminer la


proportion π d’intention de vote. On procède donc à un échantillonnage.

On dispose d’un échantillon de n = 200 individus dans lequel la proportion


d’intention de vote pour le candidat est de π̂ = 42%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 55 / 103
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique

Test sur une proportion

1. Choix des hypothèses


H0 : La proportion d’intention de vote est identique entre le Nord et le
Pas-De-Calais (H0 : π = π0 )
H1 : La proportion d’intention de vote est différente entre le Nord et le
Pas-De-Calais (H1 : π ̸= π0 )
2. Choix d’un risque α
α = 5%
3. Choix de la statistique de test

Sous H0
.
π̂ − π0
Z=√ ∼ N (0, 1)
π0 (1−π0 )
. n

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 56 / 103
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique

Test sur une proportion


4. Détermination de la région critique W

N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

W =] − ∞; −1.96] ∪ [1.96; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 57 / 103
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique

Test sur une proportion

5. Calcul de Z sur l’échantillon et conclusions

π̂ − π0
z=√
π0 (1−π0 )
n

0.42 − 0.54
z=√ = −2.41
0.54(1−0.54)
100

z ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


Les intentions de vote dans le Nord et le Pas-De-Calais sont significativement
différentes .

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 58 / 103
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique

Test sur une proportion

Remarques

Test bilatéral → H1 : π ̸= π0
Calcul de la p-value :

P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 2.41) = 0.0159

Comme P(Z > |z|) < 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


un échantillon peu représentatif)
Inférence à la population du Pas-De-Calais : La proportion d’intention de
vote pour le candidat est significativement plus faible que dans le Nord.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 59 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

Exemple : comparaison de l’efficacité de deux médicaments

Objectif : On veut montrer qu’il y a une différence d’efficacité entre un


médicament classique et un nouveau médicament.

Dans la population de malades prenant le médicament classique, on considère


qu’il y a une proportion π1 de guérison à 1 mois.

Dans la population de malades prenant le nouveau médicament, on considère qu’il


y a une proportion π2 de guérison à 1 mois.

On dispose de deux échantillons :


Médic. classique (n1 = 50) observant πb1 = 65% de guérison à 1 mois.
Nouveau médic. (n2 = 50) observant πb2 = 75% de guérison à 1 mois.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 61 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

1. Choix des hypothèses

H0 : Les deux médicaments ont la même efficacité


H1 : Les deux médicaments ont une efficacité différente

H0 : π1 = π2
H1 : π1 ̸= π2

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 62 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

3. Choix de la statistique de test

πb1 − πb2 − (π1 − π2 )


Z=√ ∼ N (0, 1)
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2

Sous H0 , π1 = π2 , donc :
.
πb1 − πb2
Z=√ ∼ N (0, 1)
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2
.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 63 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants
4. Détermination de la région critique W

N (0, 1)

2.5% 95% 2.5%

−z0.975 0 z0.975

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

W =] − ∞; −1.96] ∪ [1.96; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 64 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

5. Calcul de Z sur l’échantillon et conclusions

πb1 − πb2
z=√
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2

0.65 − 0.75
z=√ = −1.10
0.65(1−0.65) 0.75(1−0.75)
50 + 50

z∈/ W donc on ne rejette pas H0 au risque de seconde espèce β non quantifiable.


A la vue des données, il n’y a pas de différence d’efficacité significative entre le
nouveau médicament et le classique.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 65 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

Remarques - 1
Test bilatéral → H1 : π1 ̸= π2
Calcul de la p-value :

P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 1.10) = 0.2713

Comme P(Z > |z|) > 0.05, on ne rejette pas H0

Causes probables du non-rejet de H0 :


Les deux médicaments ont effectivement des efficacités identiques (H0 vraie)
On ne dispose de pas assez d’individus pour montrer une différence
significative (puissance statistique)

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 66 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

Remarques - 2

Si l’on considère deux échantillons (n1 = 200) et (n2 = 200) dans lesquels les
proportions de guérison à 1 mois sont identique (πb1 = 0.65 et πb2 = 0.75), alors :
0.65 − 0.75
z=√ = −2.19
0.65(1−0.65) 0.75(1−0.75)
200 + 200

P − value = 0.0285 < α

Le test est significatif : il y a une différence d’efficacité entre le nouveau


médicament et le classique. Le premier semble est plus efficace que le deuxième.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 67 / 103
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants

Comparaison de deux proportions / échantillons


indépendants

Remarques - 3
La puissance d’un test est en partie fonction du nombre d’observations
disponibles
Théoriquement, plus on augmente le nombre d’observations, plus le test sera
capable de détecter une différence infime comme significative
En pratique : on se fixe une différence clinique minimale (ex : 10%)...
Estimation du nombre de sujets nécessaires...

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 68 / 103
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique

Test T de Student

Remarques préliminaires :
Le principe est très proche du test Z
On doit supposer que X ∼ N (µ, σ) dans la population

Retour à l’exemple sur le QI des prisonniers

Objectif : on cherche à déterminer si le QI des prisonnier est le même (en


moyenne) que le QI de la population générale distribué selon une loi normale de
moyenne : µ0 = 100, et d’écart-type σ.

Considérons la population de prisonniers dans laquelle le QI est distribué selon une


loi normale de moyenne µ et d’écart-type σ ′ .

Soit un échantillon de n = 10 prisonniers sur lequel on calcul la moyenne


empirique x̄ = 85 et l’écart-type empirique sn−1 = 10.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 71 / 103
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique

Test T de Student

1. Choix des hypothèses

H0 : le QI moyen des prisonniers est identique à celui de la population


générale (H0 : µ = µ0 )
H1 : le QI moyen des prisonniers est différent de celui de la population
générale (H1 : µ ̸= µ0 )
2. Choix d’un risque α
α = 5%
3. Choix de la statistique de test et de sa loi sous H0

Sous H0 ,
.
X̄ − µ0
T = √ ∼ Tn−1 d.d.l
. Sn−1 / n

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 72 / 103
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique

Test T de Student
4. Détermination de la région critique W

T(9 ddl)

2.5% 95% 2.5%

−t0.975, 9 0 t0.975, 9

W =] − ∞; −t0.975,, 9ddl ] ∪ [t0.975,, 9ddl ; +∞[

W =] − ∞; −2.26] ∪ [2.26; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 73 / 103
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique

Test T de Student

5. Calcul de T sur l’échantillon et conclusions

x̄ − µ0
t= √
sn−1 / n
85 − 100
t= √ = −4.74
10/ 10

t ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


La moyenne observée sur l’échantillon est significativement différente de la
moyenne théorique.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 74 / 103
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique

Test T de Student

Remarques

Test bilatéral → H1 : µ ̸= µ0
Calcul de la p-value :

P(T9ddl > |t|) = 2P(T9ddl > t) = 2 × P(T9ddl > 4.74) = 0.001

Comme P(T > |t|) < 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


un échantillon peu représentatif)
Inférence à la population des prisonniers : Le QI des prisonniers est en
moyenne inférieur à celui de la population générale

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 75 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Conditions nécessaires au Test T de Student

Remarques préliminaires :
On doit supposer que dans la population :

X1 ∼ N (µ1 , σ1 )

X2 ∼ N (µ2 , σ2 )

On distingue deux cas de figure :

1. σ12 = σ22

2. σ12 ̸= σ22

Pour différencier ces deux cas, on procède à un test de comparaison de deux


variances

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 77 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test F - Comparaison de deux variances


Considérons :
X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 )
Les hypothèses du test
H0 : σ12 = σ22
H1 : σ12 > σ22
Soient deux échantillons de taille n1 et n2 :
1 ∑ 1 ∑
n1 n2
S12 = (X1i − X¯1 )2 et S22 = (X2i − X¯2 )2
n1 − 1 n2 − 1
i=1 i=1
Statistique de test sous H0
.
S12
F = ∼ F(n1 −1,n2 −1)ddl
. S22

En pratique :
Test unilatéral à droite
On prend la valeur la plus élevée entre s12 et s22 comme numérateur de la
statistique de test
Le rapport est ⩾ 1.
Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 78 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test F - Comparaison de deux variances

Région critique W

Fn1 −1,n2 −1

5%

0 1 2 3 4 5 6
fn1−α
1 −1,n2 −1

W = [fn1−α
1 −1,n2 −1
; +∞[

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 79 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test F - Comparaison de deux variances

Remarques

Les variances σ1 et σ2 sont dites homogènes si le test F est non significatif


→ Notion d’homoscédasticité
Si le test est significatif, les variances sont dites hétérogènes
→ Notion d’hétéroscédasticité
Le test nécessite la normalité de X1 et X2
X1 et X2 doivent être indépendantes

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 80 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test de T de Student

Exemple : patients diabétiques et taux de mauvais cholestérol (LDL)

Objectif : on désire savoir si le LDL est différent entre les patients diabétiques et
les personnes saines.

En population générale, on considère que le LDL chez les diabétiques est distribué
selon une loi normale de moyenne µ1 et d’écart-type σ1 .

En population générale, on considère que le LDL chez les personnes saines est
distribué selon une loi normale de moyenne µ2 et d’écart-type σ2 .

On dispose de 2 groupes de sujets :


Malades (n1 = 25) : x¯1 = 1.8, s1 = 0.5
Témoins (n2 = 20) : x¯2 = 1.3, s2 = 0.2

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 81 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test de T de Student

1. Choix des hypothèses

H0 : Le LDL est identique entre les témoins et les malades


H1 : Le LDL est différent entre les témoins et les malades

H0 : µ1 = µ2
H1 : µ1 ̸= µ2

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 82 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test de T de Student
3. Choix de la statistique de test
1. Si σ 2 = σ 2 = σ 2 , alors sous H
1 2 0 :
.
X¯1 − X¯2
T = √ ∼ Tn1 +n2 −2 ddl
S n11 + n12
.
Avec S 2 l’estimateur de la variance commune σ 2 .
.
(n1 − 1)S12 + (n2 − 1)S22
S2 =
. n1 + n2 − 2

. Si σ 2 ̸= σ 2 , alors sous H0 :
2
1 2
.
X¯1 − X¯2
T =√ 2 ∼ Tn1 +n2 −2 ddl
S1 S22
. n1 + n2

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 83 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student
4. Détermination de la région critique W

T(43 ddl)

2.5% 95% 2.5%

−t0.975, 43 0 t0.975, 43

W =] − ∞; −t0.975,, 43ddl ] ∪ [t0.975,, 43ddl ; +∞[

W =] − ∞; −2.017] ∪ [2.017; +∞[


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 84 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student

5. Calcul de T sur l’échantillon et conclusions

Il faut tout d’abord tester l’égalité des variances σ12 et σ22 :

On pose un risque α = 5%
H0 : σ12 = σ22
H1 : σ12 > σ22

s12 (0.5)2
f = 2 = = 25
s2 (0.1)2

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 85 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student
Région critique W

F24,19

5%

0 1 2 3
0.95
f24,19

0.95
W = [f24,19 ; +∞[
W = [2.11; +∞[

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 86 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student

f ∈ W donc on rejette H0 avec un risque α de première espèce.

Les variances σ12 et σ22 sont différentes. (Hétéroscédasticité).

Pour le test de Student, on choisit donc comme statistique de test :

X¯1 − X¯2
T =√ 2 ∼ Tn1 +n2 −2 ddl
S1 S22
n1 + n2

1.8 − 1.3
t=√ = 4.56
(0.5)2 (0.2)2
25 + 20

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 87 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student

t ∈ W =] − ∞; −2.017] ∪ [2.017; +∞[ donc on rejette H0 avec un risque α de


première espèce.

La moyenne observée sur l’échantillon de malades est significativement différente


de la moyenne chez les témoins.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 88 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants

Test T de Student

Remarques

Test bilatéral → H1 : µ1 ̸= µ2
Calcul de la p-value :

P(T > |t|) = 2P(T > t) = 2 × P(T > 4.56) ≈ 4.10−6

Comme P(T > |t|) ≪ 0.05, on rejette H0

Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à


des échantillons peu représentatifs)
Inférence à la population de malades : Le LDL est en moyenne supérieur à
celui de la population générale.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 89 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student sur échantillons appariés

Exemple : Traitement du diabète 1

Objectif : On désire étudier l’effet d’une nouvelle stratégie de traitement du


diabète en mesurant l’effet sur la glycémie. On dose la glycémie (g/L) chez 15
sujets avant le début du nouveau protocole et 3 mois après.

Dans la population de malades, on pose :


X1 la mesure de glycémie avant TTT
X2 la mesure de glycémie après TTT (3 mois après)

D = X1 − X2 une va distribuée selon une loi normale d’espérance µD et de


2
variance σD

1. Statistique - Epidemiologie, T. Ancelle, p. 141


Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 91 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student sur échantillons appariés

Exemple : Traitement du diabète

Sur l’échantillon

Les mesures sont appariées car elles sont effectuées sur les mêmes individus.

La moyenne des différences entre les mesures :

d̄ = 0.1
L’écart-type des différences entre les mesures :

sD = 0.091

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 92 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student pour échantillons appariés

1. Choix des hypothèses

H0 : les glycémies sont identiques avant et après le nouveau protocole


H1 unilatérale : la glycémie est réduite grâce au nouveau protocole

H0 : µD = 0
H1 : µD = ∆, ∆ > 0

2. Choix d’un risque α


α = 5%

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 93 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student pour échantillons appariés

3. Choix de la statistique de test

D̄ − ∆
T = √ ∼ Tn−1 ddl
SD / n
Or sous H0 , ∆ = 0, donc :
.

T = √ ∼ Tn−1 ddl
SD / n
Avec
D̄ = X¯1 − X¯2
et v [ n ]
u
u n
t 1 ∑ 2 ( )2
SD = Di − D̄
n−1 n
. i=1

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 94 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student pour échantillons appariés


Région critique W

T(14 ddl)

95% 5%

0 t0.95, 14

W = [t0.95, 14 ; +∞[

W = [1.761; +∞[

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 95 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student pour échantillons appariés

5. Calcul de T sur l’échantillon et conclusions


t= √
sD / n

0.1
z= √ = 4.25
0.91/ 15

t ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.


La glycémie est significativement plus basse après administration de la nouvelle
stratégie.

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 96 / 103
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés

Test T de Student pour échantillons appariés

Remarques

Test unilatéral → H1 : µD > 0


Calcul de la p-value :

P(T14ddl > t) = P(T14ddl > 4.25) ≈ 4.10−4

Comme P(T > t) ≪ 0.05, on rejette H0

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 97 / 103
Conclusions

Tests de comparaison

Les tests de comparaison servent à comparer des paramètres entre des populations
différentes.

2 types :
Comparaison d’un échantillon observé à une population de référence
Comparaison de deux échantillons observés (les deux populations sont
inconnues)

Le principe fondamental est le test de la différence des deux paramètres.


Sous H0 cette différence est en moyenne nulle
Sous H1 cette différence est en moyenne non-nulle

Sous H0 , la loi de probabilité de cette différence est toujours connue !!

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 99 / 103
Conclusions

Tests de comparaison

Porter une attention double sur :


Le type de paramètres en jeu (moyennes, proportions, variances...)
Les conditions d’application du test

Distinguer deux cas de figure :


n ⩾ 30
n < 30

Se poser la question :

Les échantillons sont-ils indépendants ?

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 100 / 103
Conclusions

Tests de comparaison - Résumé

Test Comparaison Conditions d’applications


Test Z moyenne observée/théorique n ⩾ 30

2 moyennes n1 et n2 ⩾ 30

2 moyennes appariées n ⩾ 30

Test T moyenne observée/théorique X1 ∼ N (µ, σ)

2 moyennes X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 )

2 moyennes appariées (X1 − X2 ) = D ∼ N (µD , σD )

Test sur % prop. observée/prop. théorique n ⩾ 30 et min{np, n(1 − p)} > 5

2 proportions n1 , n2 ⩾ 30
min{ni p, ni (1 − pi )} > 5, i = 1, 2

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 101 / 103
Conclusions

Tests de comparaison - Résumé

Il reste des cas de figure sans réponse !!


n ⩾ 30 et comparaison de deux proportions sur échantillons appariés
Ex : % avant et après un TTT chez les même individus
→ χ2 de McNemar

n < 30 Comparaison de moyennes (ind. ou appariés) et conditions de


normalité non respectées
→ Test non paramétrique : Test de Wilcoxon pour échantillons indé.
→ Test non paramétrique : Test de Wilcoxon pour échantillons appariés

Comparaison de plus de 2 moyennes


n ⩾ 30 → ANOVA
n < 30 → si normalité alors ANOVA
n < 30 → si non normalité alors Test de Kruskal - Wallis

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 102 / 103
Conclusions

Allons plus loin...

Cours essentiellement basé sur les tests de comparaison.

On peut tester la liaison entre deux variables :


2 variables qualitatives
Ex : Existe-t-il un lien significatif entre le fait d’être malade (non malade) et le
sexe ?
→ Test du χ2 d’indépendance

2 variables quantitatives
Ex : Existe-t-il un lien significatif entre le taux de prothrombine et l’âge ?
→ Test sur le coefficient de corrélation / Régression linéaire

Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 103 / 103