Académique Documents
Professionnel Documents
Culture Documents
Cours 4
Principe des tests statistiques
21 octobre 2021
Master 1 Santé Publique
julie.boucquemont@universite-paris-saclay.fr
Estimation
Prédiction
Valeur attendue
Intervalle de fluctuation
Valeur théorique
Observations
(ou vraie)
Population Echantillon
Estimation
Estimation ponctuelle
Intervalle de confiance
Biostatistique – M1 SP 2
Principe
Valeur théorique
Observations
(ou vraie)
Population 1 Echantillon 1
π1 n1 – p1
Population 0
π0 connue
Biostatistique – M1 SP 3
Principe
Valeur théorique
Observations
(ou vraie)
Population 1 Echantillon 1
π1 n1 – p1
Population 0
Populations semblables ?
π0 connue
Biostatistique – M1 SP 4
Principe
Valeur théorique
Observations
(ou vraie)
Population 1 Echantillon 1
π1 n1 – p1
Population 0
Populations semblables ?
π0 connue
π1=π0 ?
Biostatistique – M1 SP 5
Principe - Exemple
Valeur théorique
Observations
(ou vraie)
Population 0
Populations semblables ?
π0 connue d’HTA = 17%
π1=π0 ?
Biostatistique – M1 SP 6
Principe - Exemple
Valeur théorique
Observations
(ou vraie)
Population 0
Populations semblables ?
π0 connue d’HTA = 17%
π1=π0 ?
Biostatistique – M1 SP 7
Principe
Biostatistique – M1 SP 8
Principe
Biostatistique – M1 SP 9
Tests statistiques – 4 étapes
1. Formuler la question posée et l’hypothèse testée (H0)
2. Déterminer ce que seraient les observations si H0 était vraie
3. Confronter ce qu’on observe à ce qui est attendu sous H0
4. Choisir la règle de décision et conclure au rejet ou au non rejet de H0
Biostatistique – M1 SP 10
Tests statistiques – Etape 1
1. Formuler la question posée et l’hypothèse testée (H0)
Population 0
Populations semblables ?
π0 connue d’HTA = 17%
π1=π0 ?
Biostatistique – M1 SP 11
Tests statistiques – Etape 1
1. Formuler la question posée et l’hypothèse testée (H0)
• Hypothèse nulle
Population de la région Echantillon 1 H0 : π1 = π0 = 0.17
π1 n1 – p1 = 20%
• Hypothèse alternative
Hypothèse pour décrire
Population 0
π0 connue d’HTA = 17%
Populations semblables ? la réalité si H0 fausse
π1=π0 ?
H1 : π1 ≠ π0 (bilatéral)
Biostatistique – M1 SP 12
Tests statistiques – Etape 1
1. Formuler la question posée et l’hypothèse testée (H0)
• Hypothèse nulle
Population de la région Echantillon 1 H0 : π1 = π0 = 0.17
π1 n1 – p1 = 20%
• Hypothèse alternative
H1 : π1 < π0 (unilatéral)
Population 0
π0 connue d’HTA = 17%
Populations semblables ? ou
π1=π0 ?
H1 : π1 > π0 (unilatéral)
Biostatistique – M1 SP 13
Tests statistiques – Etape 1
1. Formuler la question posée et l’hypothèse testée (H0)
• Hypothèse nulle
Population de la région Echantillon 1 H0 : π1 = π0 = 0.17
π1 n1 – p1 = 20%
• Hypothèse alternative
H1 : π1 < π0 (unilatéral)
Population 0
π0 connue d’HTA = 17%
Populations semblables ? ou
π1=π0 ?
H1 : π1 > π0 (unilatéral)
Biostatistique – M1 SP 14
Tests statistiques – Etape 2
2. Déterminer ce que seraient les observations si H0 était vraie
Fluctuations d’échantillonnage Calcul des probabilités
IF d’observer chaque %
𝜋0 (1 − 𝜋0 )
𝑃1 ~𝑁 𝜋0 , sous 𝐻0
Population de la région Echantillon 1 𝑛
π1 n1 – p1 = 20%
Statistique de test
𝑃1 − 𝜋0
Population 0 𝑍= ~𝑁(0,1) sous 𝐻0
π0 connue d’HTA = 17%
𝜋0 (1 − 𝜋0 )
𝑛
Grands échantillons : nπ0 et n(1-π0) ≥ 5
Biostatistique – M1 SP 15
Tests statistiques – Etape 2
2. Déterminer ce que seraient les observations si H0 était vraie
Fluctuations d’échantillonnage
IF
Statistique de test
𝑃1 − 𝜋0
𝑍= ~𝑁(0,1) sous 𝐻0
Population de la région Echantillon 1
𝜋0 (1 − 𝜋0 )
π1 n1 – p1 = 20% 𝑛
Grands échantillons : nπ0 et n(1-π0) ≥ 5
Population 0
Valeur de Z observée sur l’échantillon
π0 connue d’HTA = 17% 𝑝1 − 𝜋0
𝑧= Si H0 vraie :
𝜋0 (1 − 𝜋0 )
𝑛 𝑧 ∈ −1.96; 1.96 dans 95% des cas
Biostatistique – M1 SP 16
Tests statistiques – Etape 3
3. Confronter ce qu’on observe à ce qui est attendu sous H0
Fluctuations d’échantillonnage
IF
• Exemple 1 : n1 = 100
0.2 − 0.17
𝑧= = 0.8
Population de la région Echantillon 1 0.17 × 0.83
π1 n1 – p1 = 20%
100
→ La valeur de z est conforme à ce
qu’on attend si H0 est vraie car elle
Population 0 appartient à [-1.96;1.96]
π0 connue d’HTA = 17%
→ On ne rejette pas H0 au risque α=5%
Biostatistique – M1 SP 17
Tests statistiques – Etape 3
3. Confronter ce qu’on observe à ce qui est attendu sous H0
Fluctuations d’échantillonnage • Exemple 2 : n1 = 100
IF
0.25 − 0.17
𝑧= = 2.13
Population de la région Echantillon 1
0.17 × 0.83
π1 n1 – p1 = 25% 100
→ Ce n’est pas impossible si H0 est vraie
mais c’est peu fréquent (- de 5% des cas)
Population 0
→ La valeur de z n’est pas conforme à ce
π0 connue d’HTA = 17% qu’on attend si H0 est vraie car elle
n’appartient pas à [-1.96;1.96]
→ On rejette H0 au risque α=5%
Biostatistique – M1 SP 18
Tests statistiques – Etape 4
4. Choisir la règle de décision
= choisir une valeur zs au-delà de laquelle on conclura au rejet de H0
Cas bilatéral
Biostatistique – M1 SP 19
Risques d’erreur
Erreur de conclusion si :
• |z| ≥ zs alors que H0 vraie → risque α
• |z| < zs alors que H1 vraie → risque β
Cas bilatéral
Observations
|z| ≥ zs |z| < zs On choisit le risque α
Rejet de H0 Non rejet de H0 qu’on accepte de
prendre pour trouver
H0 est vraie α 1- α la valeur de zs
Réalité
H1 est vraie 1-β β
Biostatistique – M1 SP 20
Risques d’erreur
Erreur de conclusion si :
• |z| ≥ zs alors que H0 vraie → risque α
• |z| < zs alors que H1 vraie → risque β
Cas bilatéral
Observations
|z| ≥ zs |z| < zs On choisit le risque α
Rejet de H0 Non rejet de H0 qu’on accepte de
prendre pour trouver
H0 est vraie α 1- α la valeur de zs
Réalité
H1 est vraie 1-β β
Puissance du test = capacité du test à rejeter H0 quand elle est effectivement fausse
Biostatistique – M1 SP 21
Risque d’erreur α et seuil de décision zs
α/2 α/2
Cas bilatéral
Biostatistique – M1 SP 22
Risque d’erreur α et seuil de décision zs
α/2 α/2
Cas unilatéral ?
Biostatistique – M1 SP 23
Risque d’erreur α et seuil de décision zs
Cas unilatéral ?
α=5% : 𝑧𝛼 = 𝑧𝑠 = 1.64
Biostatistique – M1 SP 24
Conclusions dissymétriques
Observations
|z| ≥ zs |z| < zs
Rejet de H0 Non rejet de H0
H0 est vraie α 1-α
Réalité
H1 est vraie 1-β β
Biostatistique – M1 SP 25
Conclusions dissymétriques
Observations
|z| ≥ zs |z| < zs
Rejet de H0 Non rejet de H0
H0 est vraie α 1-α
Réalité
H1 est vraie 1-β =P(rejeter H0 si H1 est vraie) → si H1 vraie : π1 inconnue
Biostatistique – M1 SP 26
Conclusions dissymétriques
Observations
|z| ≥ zs |z| < zs
Rejet de H0 Non rejet de H0
H0 est vraie α 1- α
Réalité
H1 est vraie 1-β β
Biostatistique – M1 SP 27
Degré de signification
• Quantifie la « force de conviction » de la conclusion d’un test
α → caractéristique du test
p → caractéristique de l’échantillon
Biostatistique – M1 SP 28
Degré de signification
• Exemple 1 : n=100 ; HTA=25 ; p1=0.25
0.25 − 0.17
𝑧= = 2.13
0.17 × 0.83
100
→ H0 est beaucoup moins vraisemblable dans le cas numéro 2 que dans le cas numéro 1
Biostatistique – M1 SP 29
Degré de signification
Biostatistique – M1 SP 30
Résumé
1. Formuler les hypothèses H0 et H1
2. Déterminer ce que seraient les observations si H0 était vraie
Conditions d’application
Choix de la statistique de test et de sa loi sous H0
3-4. Confronter les observations aux valeurs attendues et choisir la
règle de decision
Souvent α=5%
Calcul du p
Biostatistique – M1 SP 31
Test du Chi-2
χ2 d’ajustement
• Contexte identique au précédent mais méthode ≠
Valeur théorique
(ou vraie)
Observations
Population 0
π0 connue d’HTA = 17% Populations semblables ?
π1=π0 ?
Biostatistique – M1 SP 33
χ2 d’ajustement
• Contexte identique au précédent mais méthode ≠
• Hypothèses nulle et alternative identiques
• H0 : π1 = π0
• H1 : π1 ≠ π0
• Ne se base plus sur les % mais sur les effectifs observés et sur les
effectifs attendus sous H0
M+ M- Effectif total
Effectifs
O1 O2 n
observés
Effectifs
C1=nπ0 C2=n(1-π0) n
théoriques
Biostatistique – M1 SP 34
χ2 d’ajustement
• Statistique de test
𝑂1 − 𝐶1 2 𝑂2 − 𝐶2 2
2
χ0 = + ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶1 𝐶2
M+ M- Effectif total
Effectifs
O1 O2 n
observés
Effectifs
C1=nπ0 C2=n(1-π0) n
théoriques
Conditions de validité : effectifs théoriques ≥ 5
Biostatistique – M1 SP 35
χ2 d’ajustement
• Règle de décision
o Si χ20𝑐 ≥ χ1,𝛼
2
: rejet de H0
o Si χ20𝑐 ≤ χ1,𝛼
2
: non rejet de H0
2
→ χ1,𝛼 = 3.84 pour α = 5%
M+ M- Effectif total
Effectifs observés O1 O2 n
Effectifs
C1=nπ0 C2=n(1-π0) n
théoriques
Conditions de validité : effectifs théoriques ≥ 5
Biostatistique – M1 SP 36
χ2 d’ajustement
• Equivalence avec la comparaison de 2 pourcentages
𝑜 − 𝑐 2 𝑜 − 𝑐 2 𝑝1 − 𝜋0 2
2 1 1 2 2 2
χ0𝑐 = + =𝑧 =
𝑐1 𝑐2 𝜋0 (1 − 𝜋0 )
𝑛
• Mêmes conditions d’application
𝑐1 et 𝑐2 ≥ 5 ↔ 𝑛𝜋0 et 𝑛(1 − 𝜋0 ) ≥ 5
Biostatistique – M1 SP 37
χ2 d’ajustement : exemple
• Le % d'habitants d’une région qui consomment des anti-dépresseurs
diffère-t-il de la valeur 20% donnée par les chiffres de vente
nationaux ?
Biostatistique – M1 SP 38
χ2 d’ajustement : exemple
• Le % d'habitants d’une région qui consomment des anti-dépresseurs
diffère-t-il de la valeur 20% donnée par les chiffres de vente
nationaux ?
• Hypothèses nulle et alternative
• H0 : ?
• H1 : ?
Biostatistique – M1 SP 39
χ2 d’ajustement : exemple
• Le % d'habitants d’une région qui consomment des anti-dépresseurs
diffère-t-il de la valeur 20% donnée par les chiffres de vente
nationaux ?
• Hypothèses nulle et alternative
• H0 : π1 = 0.2
• H1 : π1 ≠ 0.2
Biostatistique – M1 SP 40
χ2 d’ajustement : exemple
• Le % d'habitants d’une région qui consomment des anti-dépresseurs
diffère-t-il de la valeur 20% donnée par les chiffres de vente
nationaux ?
• Hypothèses nulle et alternative (à formuler avant d’observer l’échantillon)
• H0 : π1 = 0.2
• H1 : π1 ≠ 0.2
Biostatistique – M1 SP 41
χ2 d’ajustement : exemple
• Hypothèses nulle et alternative (à formuler avant d’observer l’échantillon)
• H0 : π1 = 0.2 et H1 : π1 ≠ 0.2
Biostatistique – M1 SP 42
χ2 d’ajustement : exemple
• Hypothèses nulle et alternative (à formuler avant d’observer l’échantillon)
• H0 : π1 = 0.2 et H1 : π1 ≠ 0.2
Biostatistique – M1 SP 43
χ2 d’ajustement : exemple
• Statistique de test
2 2
2
𝑂1 − 𝐶1 𝑂2 − 𝐶2
χ0 = + ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶1 𝐶2
Biostatistique – M1 SP 44
χ2 d’ajustement : exemple
• Règle de décision
χ20𝑐 = 2.35
Biostatistique – M1 SP 45
χ2 d’indépendance
• Comparaison de deux pourcentages
Valeur théorique
(ou vraie)
Observations
Population 1 Echantillon 1
π1 n1 – p1
Populations semblables ?
π1=π2 ?
Population 2 Echantillon 2
π2 n2 – p2
Biostatistique – M1 SP 46
χ2 d’indépendance
• Hypothèses nulle et alternative
• H0 : π1 = π2
• H1 : π1 ≠ π2
• Se base sur les effectifs observés et sur les effectifs attendus sous H0
E1 E2 Effectif total
M+ o11 o12 m1
M- o21 o22 m2
n1 n2 n
Biostatistique – M1 SP 47
χ2 d’indépendance
• Hypothèses nulle et alternative
• H0 : π1 = π2
• H1 : π1 ≠ π2
• Se base sur les effectifs observés et sur les effectifs attendus sous H0
E1 E2 Effectif total
M+ c11 c12 m1
M- c21 c22 m2
n1 n2 n
Biostatistique – M1 SP 48
χ2 d’indépendance
• Hypothèses nulle et alternative
• H0 : π1 = π2
• H1 : π1 ≠ π2
• Se base sur les effectifs observés et sur les effectifs attendus sous H0
E1 E2 Effectif total
𝑚1 𝑚1
M+ 𝑛1 𝑛2 m1
𝑛 𝑛
𝑚2 𝑚2
M- 𝑛1 𝑛2 m2
𝑛 𝑛
n1 n2 n
→ sous H0, % de malades observés devraient être identiques = m1/n
Biostatistique – M1 SP 49
χ2 d’indépendance
• Statistique de test
2
𝑂𝑖𝑗 − 𝐶𝑖𝑗
χ20 = ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶𝑖𝑗
E1 E2 Effectif total
𝑚1 𝑚1
M+ 𝑛1 𝑛2 m1
𝑛 𝑛
𝑚2 𝑚2
M- 𝑛1 𝑛2 m2
𝑛 𝑛
n1 n2 n
Conditions de validité : effectifs théoriques ≥ 5
• Règle de décision et conclusion
Biostatistique – M1 SP 50
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
Valeur théorique
(ou vraie)
Observations
Populations semblables ?
π1=π2 ?
Population 2 = mères non fumeuses Echantillon 2
π2 n2 – p2
Biostatistique – M1 SP 51
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
Biostatistique – M1 SP 52
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
Biostatistique – M1 SP 53
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
• Effectifs observés
F+ F- Effectif total
Hypotrophie 45 68 113
Poids normal 748 1778 2526
793 1846 2639
Biostatistique – M1 SP 54
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
Biostatistique – M1 SP 55
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
fumé ou pas pendant la grossesse ?
Biostatistique – M1 SP 56
χ2 d’indépendance : exemple
• Statistique de test
2
𝑂𝑖𝑗 − 𝐶𝑖𝑗
χ20 = ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶𝑖𝑗
• Calcul
2 45−34 2 68−79 2 748−759 2
1778−1767 2
χ0𝑐 = + + + = 5.32
34 79 759 1767
Biostatistique – M1 SP 58
χ2 d’indépendance : exemple
• Degré de signification : p = P(χ12 >5.32)
5,32
Biostatistique – M1 SP 59
χ2 d’indépendance : exemple
Biostatistique – M1 SP 60
χ2 d’indépendance : autre écriture
M+ M- Effectif total
E1 a b n1 (𝑎𝑑 − 𝑏𝑐)2 𝑛
χ20𝑐 =
E2 c d n2 𝑛1 𝑛2 𝑚1 𝑚2
m1 m2 n
Biostatistique – M1 SP 61
χ2 d’indépendance : petits échantillons
• Cas où un (au moins) des effectifs théoriques est < 5 mais tous sont ≥ 3
2
|𝑂𝑖𝑗 − 𝐶𝑖𝑗 | − 0.5
χ20 = ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶𝑖𝑗
Biostatistique – M1 SP 62
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon que la mère a
consommé de l’alcool ou non pendant la grossesse ?
Biostatistique – M1 SP 63
χ2 d’indépendance : exemple
% d'hypotrophie du nouveau-né (poids trop petit) ≠ selon la
consommation d’alcool de la mère pendant la grossesse ?
Biostatistique – M1 SP 64
χ2 d’indépendance : exemple
• Statistique de test
2
|𝑂𝑖𝑗 − 𝐶𝑖𝑗 | − 0.5
χ20 = ~χ2 à 1 𝑑𝑑𝑙 sous 𝐻0
𝐶𝑖𝑗
• Calcul
χ20𝑐 = 1.58
• Règle de décision : α=5% → χ20𝑐 < 3.84 donc non rejet de H0 au seuil α=5%
Biostatistique – M1 SP 65
χ2 d’indépendance : autre écriture
M+ M- Effectif total
E1 a b n1 𝑛 2
𝑛 (|𝑎𝑑 − 𝑏𝑐|) −
E2 c d n2 χ20𝑐 = 2
m1 m2 n 𝑛1 𝑛2 𝑚1 𝑚2
Biostatistique – M1 SP 66
Remarques
• Un des effectifs théoriques < 3 : test de Fisher (pas au programme)
Biostatistique – M1 SP 67