Vous êtes sur la page 1sur 74

Analyse Statistique

L2 SVT

Anna Melnykova
Laboratoire de Mathématiques d’Avignon
anna.melnykova@univ-avignon.fr

2022-2023
Organisation

Responsable :
• Nom : Anna Melnykova, MCF, Laboratoire de Mathématiques
• Q& A : anna.melnykova@univ-avignon.fr

Cours :
• 2 CM × 3h, 7 TD × 1.5h
• 2 CC écrits (26 octobre, 29 novembre)

Acknowledgement : Le modèle de présentation est fourni par Vincent


Labatut (Université Avignon). Les supports sont basés sur le cours de
Céline Lacaux (LMA)

Analyse Statistique A. Melnykova 2022-2023 2/75


Chapitre 1

Introduction. Tests de conformité de la


proportion.
Test de conformité d’une fréquence : Exemple

Le fabricant d’un médicament affirme qu’il est efficace à 90% pour


traiter une allergie en 8h. Sur un échantillon de 554 personnes, 482
ont été guéries de cette allergie en 8h. Ce résultat remet-il en
cause l’affirmation du fabricant, au seuil de confiance de 95 % ?

Reformulation de la problématique :
• Notons p la probabilité de guérison
• Notons p0 = 0.9 la valeur annoncée par le fabricant.
• Nous nous demandons si p = p0 ou non.

Analyse Statistique A. Melnykova 2022-2023 5/75


Démarche intuitive

• Considérons la fréquence empirique de guérison

Nombre de personnes guéries dans l’échantillon


Fn =
n
avec n la taille de l’échantillon, i.e. le nombre d’observations.
• Dans l’exemple présenté,
• la taille de l’échantillon est n = 554
• et la valeur observée de Fn est
482 241
fobs = = ≈ 0.87
554 277

Analyse Statistique A. Melnykova 2022-2023 6/75


Démarche intuitive

• On est d’accord que 0.87 != 0.9


• On est aussi d’accord que 0.87 ≈ 0.9
• La question qu’on se pose : Est-ce qu’il s’agit d’une
coïncidence (et la probabilité de guérir est bien 0.9) où
l’efficacité du médicament est en fait différente de 0.9 ?

Analyse Statistique A. Melnykova 2022-2023 7/75


Démarche intuitive
La loi de !Fn −p est approchée par la loi normale N (0, 1) (grâce à
p(1−p)
n

TCL).
f(x)

0.4

0.3

0.2

0.1

5% des valeurs 5% des valeurs

x
−3 −2 −1 1 1.63 2 3

Figure 1 – N (0, 1) = loi normale (ou gaussienne) de moyenne 0 et


variance 1

Analyse Statistique A. Melnykova 2022-2023 8/75


68.2%

95%

99.7%
Frequence

2.1% 13.6% 34.1% 34.1% 13.6% 2.1%

−3 −2 −1 0 1 2 3
L’écarts types
Remarque

En principe, pour utiliser l’approximation par la loi normale, il faut


que :
• La taille d’échantillon soit supérieure à 30
• Le nombre d’individus avec la réponse positive Fn soit
supérieure à 10
• Le nombre d’individus avec la réponse négative 1 − Fn soit
supérieure à 10

Analyse Statistique A. Melnykova 2022-2023 10/75


Objectif d’un test statistique

• Confronter une hypothèse à la réalité, i.e. déterminer si une


hypothèse est vraisemblable ou non vu les données
observées.

Exemples :
• Le fabricant d’un médicament affirme qu’il est efficace à 90%
pour traiter une allergie en 8h. Son affirmation est-elle vraie ?
! Test de conformité : comparaison à une référence
• 70 personnes reçoivent le traitement A1 et 50 autres reçoivent le
traitement A2 . Est-il vraisemblable que le taux moyen de
glucose soit identique dans les 2 groupes ?
! Test d’homogénéité : comparaison de deux échantillons.
• En pratique, il s’agit de comparer deux hypothèses et de
prendre une décision entre les deux.

Analyse Statistique A. Melnykova 2022-2023 11/75


La formulation du test

• On émet une hypothèse H0 , appelée hypothèse nulle.


• C’est l’hypothèse que l’on souhaite confronter aux données.
• On teste cette hypothèse H0 contre une hypothèse H1 ,
appelée hypothèse alternative.
• H1 est souvent la négation de H0 mais pas nécessairement.
• Pour tester H0 contre H1 :
• On choisi une statistique du test t.q. sa loi sous H0 est bien
connu (par exemple : la loi normale)
• On calcule la statistique en utilisant les données existantes
• On décide quelle hypothèse est plus vraisemblable vu des
données

Analyse Statistique A. Melnykova 2022-2023 12/75


Exemple 1 : l’efficacité du médicament est-elle celle
annoncée ?

Le fabricant d’un médicament affirme qu’il est efficace à 90% pour


traiter une allergie en 8h. Sur un échantillon de 554 personnes, 482
ont été guéries de cette allergie en 8h.

Ce résultat remet-il en cause l’affirmation du fabricant, au seuil de


confiance de 95 % ?
• p = probabilité de guérison et p0 = 0.9 = valeur référence.
• Formulation du test : Nous testons H0 : p = p0 contre H1 :
p != p0

Analyse Statistique A. Melnykova 2022-2023 13/75


Exemple 2 : Le fabricant sous-estime-t-il l’efficacité
du médicament ?

Le fabricant d’un médicament affirme qu’il est efficace à 90% pour


traiter une allergie en 8h. Sur un échantillon de 554 personnes, 482
ont été guéries de cette allergie en 8h.

Le fabricant sous-estime-t-il l’efficacité du médicament ?


• p = probabilité de guérison et p0 = 0.9 = valeur référence.
• Formulation du test : Nous testons H0 : p = p0 contre H1 :
p > p0

Analyse Statistique A. Melnykova 2022-2023 14/75


Exemple 3 : Le fabricant surestime-t-il l’efficacité du
médicament ?

Le fabricant d’un médicament affirme qu’il est efficace à 90% pour


traiter une allergie en 8h. Sur un échantillon de 554 personnes, 482
ont été guéries de cette allergie en 8h.

Le fabricant surestime-t-il l’efficacité du médicament ?


• p = probabilité de guérison et p0 = 0.9 = valeur référence.
• Formulation du test : Nous testons H0 : p = p0 contre
H1 : p < p0

Analyse Statistique A. Melnykova 2022-2023 15/75


Construire un test et prendre une décision

• Nous testons l’hypothèse nulle H0 contre l’hypothèse


alternative H1 .
• À partir des observations, le test statistique mis en place
conduit
• soit à rejeter l’hypothèse H0 et retenir l’hypothèse H1 : Cas où
les données sont considérées comme non raisonnables sous H0
et plus raisonnables sous H1

• soit à ne pas rejeter l’hypothèse H0 : Cas où les données sont


considérées comme raisonnables sous H0
! Les données peuvent être aussi raisonnables sous une autre
hypothèse…

Analyse Statistique A. Melnykova 2022-2023 16/75


La statistique du test

• On choisit une quantité T, appelée statistique de test. Cette


statistique
• doit être calculable sur les données observées
• doit apporter suffisamment d’informations pour distinguer
l’hypothèse nulle H0 de l’hypothèse alternative H1
" T est notre variable de décision
• On note tobs la valeur observée pour T sur les données.

Analyse Statistique A. Melnykova 2022-2023 17/75


Règle de décision

• On choisit une région D appelée région de rejet et on adopte


la règle de décision suivante :
• si la valeur observée tobs ∈ D, on rejette H0 et on retient H1
• si tobs ∈
/ D, on ne rejette pas H0 .
• La région de rejet D doit être choisie telle que
• sous H0 , observer pour T une valeur dans D est peu probable
• sous H1 , observer pour T une valeur dans D est raisonnable.

Analyse Statistique A. Melnykova 2022-2023 18/75


La prise de risque

Réalité
H0 vraie H0 fausse
Décision
rejet de H0 α 1−β
non rejet de H0 1−α β

Définition
• Le risque de première espèce est

α = probabilité de rejeter H0 à tort.

• Le risque de seconde espèce est

β = probabilité de ne pas rejeter H0 à tort.

• 1 − β est appelé puissance du test.

Analyse Statistique A. Melnykova 2022-2023 19/75


La prise de risque

Réalité
H0 vraie H0 fausse
Décision
rejet de H0 α 1−β
non rejet de H0 1−α β

• Décision : Rejet de H0 . Les valeurs observées sont très peu


probables si l’hypothèse nulle H0 est vraie.
• Décision : Non rejet de H0 . Les valeurs observées ne sont pas
nécessairement en désaccord avec H0 mais pourraient être
expliquées par une autre hypothèse.
• Rejeter H0 est plus riche en information que de ne pas la
rejeter.

Analyse Statistique A. Melnykova 2022-2023 20/75


Exemple 1 : l’efficacité du médicament est-elle celle
annoncée ?

Les observations remettent-elle en cause l’affirmation du


fabricant, au seuil de confiance de 95 % ?
• p = probabilité de guérison et p0 = 0.9
• Nous testons H0 : p = p0 contre H1 : p != p0
p(1−p)
• Loi de la fréquence empirique Fn ≈ N (p, n
)
• On peut prendre Fn comme statistique de test mais en
général on préfère prendre

Fn − p0 n(Fn − p0 )
T= ! = "
p0 (1−p0 ) p0 (1 − p0 )
n

• Loi de T sous H0 ≈ N (0, 1).

Analyse Statistique A. Melnykova 2022-2023 21/75


Distribution (densité) de T sous H0

Analyse Statistique A. Melnykova 2022-2023 22/75


Exemple 1 : forme de la région de rejet (H1 : p != p0 )

• On prend alors comme région de rejet D = R\[a, b] ;

Analyse Statistique A. Melnykova 2022-2023 23/75


Exemple 1 : forme de la région de rejet (H1 : p != p0 )

Règle de décision Valeurs classiques


• si |T| ! z1−α/2 , non rejet de H0 ; • si α = 10%, z1−α/2 = 1.645
• si |T| > z1−α/2 , rejet de H0 • si α = 5%, z1−α/2 = 1.960
# $
avec P N (0, 1) ! z1−α/2 = 1 − α
2
. • si α = 1%, z1−α/2 = 2.578

Analyse Statistique A. Melnykova 2022-2023 24/75


Exemple 1 : l’efficacité du médicament est-elle celle
annoncée ?

Rappelons que
• nous testons H0 : p = p0 contre H1 : p != p0 avec p0 = 0.9

554( 482
• tobs =
−0.9)
√ 554
0.9×0.1
≈ −2.351
• |tobs | > z0.975 = 1.96, donc prenant comme risque de 1re espèce
α = 5%, on rejette H0 et conclut que p != 0.9, i.e. que le
fabricant a tort.
• |tobs | ! z0.995 = 2.578, donc prenant comme risque de 1re
espèce α = 1%, on ne rejette pas H0 et conclut que les
données ne sont pas en contradiction avec l’affirmation du
fabricant.

Analyse Statistique A. Melnykova 2022-2023 25/75


Exemple 2 : le fabricant sous-estime t-il l’efficacité
du médicament ?

• Nous testons à présent H0 : p = p0 contre H1 : p > p0 où


p0 = 0.9

• Statistique de décision : T = √n(Fn −p0 )
p0 (1−p0 )

• Valeur observée : tobs ≈ −2.351


• Loi approchée de T sous H0 : N (0, 1)

Analyse Statistique A. Melnykova 2022-2023 26/75


Exemple 2 : le fabricant sous-estime t-il l’efficacité
du médicament ?

Distribution (densité) de T sous H0 et H1

Analyse Statistique A. Melnykova 2022-2023 27/75


Exemple 2 : le fabricant sous-estime t-il l’efficacité
du médicament ?

Règle de décision Valeurs classiques


• si T ! z1−α , non rejet de H0 ; • si α = 10%, z1−α = 1.282
• si T > z1−α , rejet de H0 • si α = 5%, z1−α = 1.645
• si α = 1%, z1−α = 2.326
" #
avec P N (0, 1) ! z1−α = 1 − α.

Analyse Statistique A. Melnykova 2022-2023 28/75


Exemple 2 : le fabricant sous-estime t-il l’efficacité
du médicament ?

Rappelons que
• nous testons H0 : p = p0 contre H1 : p > p0 avec p0 = 0.9
• tobs ≈ −2.351
• ici tobs < z0.95 = 1.645, donc prenant comme risque de 1re
espèce α = 5%, on ne rejette pas H0 et on conclut que les
données ne sont pas en contradiction avec l’affirmation du
fabricant.

Analyse Statistique A. Melnykova 2022-2023 29/75


Exemple 3 : le fabricant sur-estime t-il l’efficacité du
médicament ?

• Nous testons à présent H0 : p = p0 contre H1 : p < p0 où


p0 = 0.9

• Statistique de décision : T = √n(Fn −p0 )
p0 (1−p0 )

• Valeur observée : tobs ≈ −2.351


• Loi approchée de T sous H0 : N (0, 1)

Analyse Statistique A. Melnykova 2022-2023 30/75


Exemple 3 : le fabricant sur-estime t-il l’efficacité du
médicament ?
Distribution (densité) de T sous H0 et H1

Analyse Statistique A. Melnykova 2022-2023 31/75


Exemple 3 : le fabricant sur-estime t-il l’efficacité du
médicament ?

Règle de décision Valeurs classiques


• si T " zα , non rejet de H0 ; • si α = 10%, zα = −1.282
• si T < zα , rejet de H0 • si α = 5%, zα = −1.645
avec P (N (0, 1) ! zα ) = α. • si α = 1%, zα = −2.326

Analyse Statistique A. Melnykova 2022-2023 32/75


Exemple 3 :le fabricant sur-estime t-il l’efficacité du
médicament ?

Rappelons que
• nous testons H0 : p = p0 contre H1 = p < p0 avec p0 = 0.9
• tobs ≈ −2.351
• ici tobs < z0.05 = −1.645, donc prenant comme risque de 1re
espèce α = 5%, on rejette H0 et conclut que p < p0 : le
fabricant sur-estime l’efficacité du médicament.

Analyse Statistique A. Melnykova 2022-2023 33/75


Démarche d’un test : récapitulatif

1 Formulation de l’objectif
• Formuler l’hypothèse nulle H0 à tester.
• Formuler une hypothèse alternative H1 .
2 Choix de la statistique T de décision :
• Calculable sur les données observées ;
• Loi, éventuellement approchée, connue sous H0 ;
• Contrôle du comportement sous H1 .
3 Choix de la région de rejet D de H0 en fonction du risque α de
première espèce et de la forme de H1 :

P (rejeter H0 à tort) = PH0 (T ∈ D) ≈ α

" Utilisation de la table statistique de la loi de T sous H0 .


4 Application sur les données # prise de décision. Si on rejette
H0 , α est la probabilité d’erreur.

Analyse Statistique A. Melnykova 2022-2023 34/75


Forme de la région de rejet
• Test bilatéral : zone de rejet située de part et d’autre de la
répartition sous H0 .

Analyse Statistique A. Melnykova 2022-2023 35/75


Forme de la région de rejet
• Test unilatéral : zone de rejet située d’un seul côté de la
répartition sous H0 .

Analyse Statistique A. Melnykova 2022-2023 36/75


Test de conformité d’une fréquence : bilan

Objectif : Comparer la fréquence d’apparition d’un phénomène à


une valeur référence fixée p0 à partir de n expériences
indépendantes identiques.
• Notons p = fréq. théorique du phénomène.
• Formulation du test : nous testons


 H1 : p != p0


 ou
H0 : p = p0 contre H1 : p > p0



 ou

H1 : p < p0 .

Analyse Statistique A. Melnykova 2022-2023 37/75


Test sur une fréquence pour un grand échantillon

Validité du test proposé


• Test considéré comme valide si n " 30, np0 " 10 et
n(1 − p0 ) " 10.

Statistique de test
• Choix de la statistique de décision

n (Fn − p0 )
T= "
p0 (1 − p0 )

• Valeur observée notée tobs


• Loi de T sous H0 ≈ N (0, 1)

Analyse Statistique A. Melnykova 2022-2023 38/75


Test sur une fréquence pour un grand échantillon

Règle de décision lorsque H1 : p #= p0


Prenant un risque de première espèce α, la règle de décision est la
suivante :

• Rejet de H0 pour |T| > z1−α/2


• Non rejet de H0 si |T| ! z1−α/2

avec z1−α/2 quantile d’ordre 1 − α2 de la loi N (0, 1), i.e. le réel tel que
# $ α
P N (0, 1) ! z1−α/2 = 1 − .
2

Analyse Statistique A. Melnykova 2022-2023 39/75


Test sur une fréquence pour un grand échantillon

Règle de décision lorsque H1 : p > p0


Prenant un risque de première espèce α, la règle de décision est la
suivante :

• Rejet de H0 pour T > z1−α


• Non rejet de H0 si T ! z1−α

avec z1−α quantile d’ordre 1 − α de la loi N (0, 1), i.e. le réel tel que

P (N (0, 1) ! z1−α ) = 1 − α.

Analyse Statistique A. Melnykova 2022-2023 40/75


Test sur une fréquence pour un grand échantillon

Règle de décision lorsque H1 : p < p0


Prenant un risque de première espèce α, la règle de décision est la
suivante :

• Rejet de H0 pour T < zα


• Non rejet de H0 si T " zα

avec zα quantile d’ordre α de la loi N (0, 1), i.e. le réel tel que

P (N (0, 1) ! zα ) = α.

Analyse Statistique A. Melnykova 2022-2023 41/75


Chapitre 2

Test de conformité de la moyenne


Objectif dans le cadre de ce cours

# Comparer la moyenne/médiane (paramètre de position) d’un


caractère X d’une population avec la norme.
Exemples de problématiques :
• À partir d’un prélèvement de n comprimés, peut-on déterminer
si le poids moyen est bien celui attendu par le fabricant ?
• Le niveau annuel moyen des pluies dans la Beauce est-il de 600
mm ?
• La contenance moyenne des bouteilles est-elle celle annoncée
par le fabricant ?

Analyse Statistique A. Melnykova 2022-2023 43/75


Introduction : Modèle & Formulation du test

Modélisation probabiliste
• Caractère X distribué selon une loi gaussienne N (m, σ 2 ) de
moyenne m et de variance σ 2 .
• Observation d’un échantillon : les données x1 , . . . , xn sont les
réalisations respectives des variables aléatoires X1 , . . . , Xn
indépendantes de même loi que X.
Formulation du test
• Nous souhaitons tester 

 H1 : m != m0


 ou
H 0 : m = m0 contre H 1 : m > m0



 ou

H 1 : m < m0 .

Analyse Statistique A. Melnykova 2022-2023 44/75


Introduction : Estimateur de la moyenne théorique

• La moyenne théorique m est estimée par la moyenne


empirique
n
1)
Xn = Xi
n i=1
* +
σ2
• La loi de Xn est la loi N m, .
n

Analyse Statistique A. Melnykova 2022-2023 45/75


Statistique de test quand σ 2 est connue

Choix de la statistique de décision


Supposons σ 2 connue. Alors, la statistique de test est :
√ # $
n Xn − m0
Z=
σ

• Calculable sur les observations x1 , . . . , xn car m0 , σ connus.


• Loi sous Z sous H0 : N (0, 1)

Remarque
• Ce test est appelé test de conformité d’une moyenne sur un
échantillon gaussien de variance connue.

Analyse Statistique A. Melnykova 2022-2023 46/75


Région de rejet

Analyse Statistique A. Melnykova 2022-2023 47/75


Région de rejet
• La région de rejet dépend du choix de H1 .
• Choix analogue à celui fait pour un test de conformité de
fréquence sur un grand échantillon.
• Pour H1 : m #= m0 , le test est bilatéral.
• Pour H1 : m > m0 ou encore H1 : m < m0 , le test est unilatéral.

Analyse Statistique A. Melnykova 2022-2023 48/75


Test bilatéral pour H1 : m != m0 , σ 2 est connue

Test lorsque H1 : m #= m0
Nous testons H0 : m = m0 contre H1 : m != m0 avec σ 2 connue.

n(Xn −m0 )
• Statistique de test : Z = σ
• Loi de Z sous H0 : N (0, 1)
• Le risque de 1re espèce étant α, la règle de décision est :

• Rejet de H0 pour |Z| > z1− α


2
• Non rejet de H0 si |Z| ! z1− α
# $ 2

avec PH0 Z ! z1− α2 = 1 − α 2


.

• Valeurs classiques : z0.95 = 1.645, z0.975 = 1.96, z0.995 = 2.576

Analyse Statistique A. Melnykova 2022-2023 49/75


Test unilatéral pour H1 : m > m0 , σ 2 connue

Test lorsque H1 : m > m0


Nous testons H0 : m = m0 contre H1 : m > m0 avec σ 2 connue.

n(Xn −m0 )
• Statistique de test : Z = σ
• Loi de Z sous H0 : N (0, 1)
• Le risque de 1re espèce étant α, la règle de décision est :

• Rejet de H0 pour Z > z1−α


• Non rejet de H0 si Z ! z1−α
avec PH0 (Z ! z1−α ) = 1 − α.

• Valeurs classiques : z0.9 = 1.282, z0.95 = 1.645, z0.99 = 2.326

Analyse Statistique A. Melnykova 2022-2023 50/75


Test unilatéral pour H1 : m < m0 , σ 2 connue

Test lorsque H1 : m < m0


Nous testons H0 : m = m0 contre H1 : m < m0 avec σ 2 connue.

n(Xn −m0 )
• Statistique de test : Z = σ
• Loi de Z sous H0 : N (0, 1)
• Le risque de 1re espèce étant α, la règle de décision est :

• Rejet de H0 pour Z < zα


• Non rejet de H0 si Z " zα
avec PH0 (Z ! zα ) = α.

• Par symétrie de la loi N (0, 1), zα = −z1−α


• Valeurs classiques : z0.1 = −1.282, z0.05 = −1.645, z0.01 = −2.326

Analyse Statistique A. Melnykova 2022-2023 51/75


Application avec un test bilatéral

Les spécifications d’un certain médicament indiquent que chaque


comprimé doit contenir 2.5 g de substance active. On prélève en
sortie de chaîne de production 10 comprimés et on relève la
quantité de substance active contenue dans chaque comprimé :

2.67 3.08 3.07 2.84 3 2.67 2.81 3.05 2.89 2.97

La quantité de substance active contenue dans un comprimé est


supposé de loi gaussienne de variance σ 2 = 0.12 . Nous
souhaitons savoir si la quantité moyenne de substance active est
bien conforme aux spécifications.
Hypothèses :
• La #quantité$ de substance active suit une loi gaussienne
N m, 0.12 .
• Nous avons un échantillon des observations indépendantes.

Analyse Statistique A. Melnykova 2022-2023 52/75


Application avec un test bilatéral

• Formulation du test : Nous testons H0 : m = 2.5 g contre


H1 : m != 2.5 g.
• Valeur observée zobs de la statistique Z : Ici la moyenne
empirique observée est :
2.67 + 3.08 + 3.07 + 2.84 + 3 + 2.67 + 2.81 + 3.05 + 2.89 + 2.97
10
soit xn = 2.905 et donc

10 (xn − 2.5)
zobs = √ ≈ 12.8072
0.12

Analyse Statistique A. Melnykova 2022-2023 53/75


Application avec un test bilatéral

Nous testons H0 : m = m0 contre H1 : m != m0 .

Règle de décision
• Rejet de H0 pour |Z| > z1− α2
• Non rejet de H0 si |Z| ! z1− α2
# $
avec PH0 Z ! z1− α2 = 1 − α2 .

• La loi sous H0 de Z étant la loi N (0, 1), pour un risque de 1re


espèce α = 5%, z1− α2 = z0.975 = 1.96 et donc on rejette H0 car
|zobs | ≈ 12.8072 > 1.96 = z0.975
• Avec une probabilité de 5% de se tromper, on conclut que la
quantité moyenne de substance active n’est pas conforme
aux spécifications.

Analyse Statistique A. Melnykova 2022-2023 54/75


Application : Test unilatéral avec H1 : m > m0

Nous souhaitons savoir si la quantité de substance moyenne n’est


pas sous-estimée dans les spécifications du médicament.
• Formulation du test Nous testons H0 : m = 2.5 g contre
H1 : m > 2.5 g.
• Valeur observée de la statistique de test : zobs ≈ 12.8072
• Loi sous H0 de Z : N (0, 1)

Analyse Statistique A. Melnykova 2022-2023 55/75


Application : Test unilatéral avec H1 : m > m0

Règle de décision
• Rejet de H0 si zobs > z1−α
• Non rejet de H0 si zobs ! z1−α
avec PH0 (Z ! z1−α ) = 1 − α.

• La loi de Z sous H0 étant la loi N (0, 1), pour un risque de 1re


espèce de 5%, z1−α = z0.95 = 1.645 et donc on rejette H0 car
zobs ≈ 12.8072 > 1.645 = z0.95 .
• Autrement dit, avec une probabilité α = 5% de se tromper, on
conclut que la quantité moyenne de substance active est
sous-estimée dans les spécifications du médicament.

Analyse Statistique A. Melnykova 2022-2023 56/75


Application : Test unilatéral avec H1 : m < m0

Nous souhaitons savoir si la quantité de substance moyenne n’est


pas sur-estimée dans les spécifications du médicament.
• Formulation du test Nous testons H0 : m = 2.5 g contre
H1 : m < 2.5 g.
• Valeur observée de la statistique de test : zobs ≈ 12.8072
• Loi sous H0 de Z : N (0, 1)

Analyse Statistique A. Melnykova 2022-2023 57/75


Application : Test unilatéral avec H1 : m < m0

Règle de décision
• Rejet de H0 si zobs < zα
• Non rejet de H0 si zobs " zα
avec PH0 (Z ! zα ) = α

• La loi de Z sous H0 étant la loi N (0, 1), pour un risque de 1re


espèce de 5%, zα = −1.645 et donc on ne rejette pas H0 car
zobs ≈ 12.8072 > −1.645 = z0.05 .
• Autrement dit, prenant α = 5% comme risque de 1re espèce, on
conclut que la quantité moyenne de substance active n’est
pas en contradiction avec les spécifications du médicament.

Analyse Statistique A. Melnykova 2022-2023 58/75


Cas σ 2 inconnue

Supposons à présent σ 2 inconnue.


• La variable Z proposée dans le cas précédent n’est plus
calculable et ne peut donc pas servir de statistique de test.
• La variance σ 2 est estimée (et remplacée dans Z) par la
variance empirique non biaisée
n n
1 ) # $2 1 ) n # $2
S2n = Xi − Xn = X2i − Xn .
n−1 i=1
n−1 i=1
n−1

Analyse Statistique A. Melnykova 2022-2023 59/75


Statistique de test quand σ 2 est inconnue
Choix de la statistique de décision
Supposons σ 2 inconnue. Alors, la statistique de test est
√ # $
n X n − m0
T= "
S2n

• Calculable sur les observations x1 , . . . , xn car m0 connu.


• Sous H0 , T suit la loi dite de Student à (n − 1) degrés de
libertés

Remarque
• Ce test est appelé test de Student (ou test t) de conformité
d’une moyenne sur un échantillon gaussien de variance
inconnue.
Analyse Statistique A. Melnykova 2022-2023 60/75
Forme de la loi de Student
Densités des lois de Student

• Loi symétrique : si la loi de T est


la loi Student(n − 1), alors

P (T ! −x) = P (T " x)

Analyse Statistique A. Melnykova 2022-2023 61/75


Région de rejet
• La région de rejet dépend du choix de H1 .
• Choix analogue à celui fait pour test Z (i.e. dans le cas
variance connue), sauf que le seuil critique s’obtient en lisant
la table d’une loi de Student.
• Pour H1 : m #= m0 , le test est bilatéral.
• Pour H1 : m > m0 ou encore H1 : m < m0 , le test est unilatéral.

Analyse Statistique A. Melnykova 2022-2023 62/75


Cas où σ 2 est inconnue, Test H1 : m #= m1

Test de Student lorsque H1 : m #= m0


Nous testons H0 : m = m0 contre H1 : m != m0 avec σ 2 inconnue.

n(Xn −m0 )
• Statistique de décision : T = √2
Sn

• Loi de T sous H0 : Student(n − 1)


• Le risque de 1re espèce étant α, la règle de décision est :

• Rejet de H0 pour |T| > z1−α/2


• Non rejet de H0 si |T| ! z1−α/2
# $
avec PH0 T ! z1−α/2 = 1 − α2 .

• z1−α/2 = quantile d’ordre 1 − α


2 de la loi Student(n − 1).

Analyse Statistique A. Melnykova 2022-2023 63/75


Cas où σ 2 est inconnue, Test H1 : m > m1

Test de Student lorsque H1 : m > m0


Nous testons H0 : m = m0 contre H1 : m > m0 avec σ 2 inconnue.

n(Xn −m0 )
• Statistique de décision : T = √2
Sn

• Loi de T sous H0 : Student(n − 1)


• Le risque de 1re espèce étant α, la règle de décision est :

• Rejet de H0 pour T > z1−α


• Non rejet de H0 si T ! z1−α
avec PH0 (T ! z1−α ) = 1 − α

• z1−α = quantile d’ordre 1 − α de la loi Student(n − 1).

Analyse Statistique A. Melnykova 2022-2023 64/75


Cas où σ 2 est inconnue, Test H1 : m < m1

Test de Student lorsque H1 : m < m0


Nous testons H0 : m = m0 contre H1 : m < m0 avec σ 2 inconnue.

n(Xn −m0 )
• Statistique de décision : T = √2
Sn

• Loi de T sous H0 : Student(n − 1)


• Le risque de 1re espèce étant α,

• Rejet de H0 pour T < zα


• Non rejet de H0 si T " zα
avec PH0 (T ! zα ) = α.

• zα = quantile d’ordre α de la loi Student(n − 1) = −z1−α .

Analyse Statistique A. Melnykova 2022-2023 65/75


Application : Test de Student bilatéral

Les spécifications d’un certain médicament indiquent que chaque


comprimé doit contenir 2.5 g de substance active. On prélève en
sortie de chaîne de production 10 comprimés et on relève la
quantité de substance active contenue dans chaque comprimé :

2.67 3.08 3.07 2.84 3 2.67 2.81 3.05 2.89 2.97

La quantité de substance active contenue dans un comprimé est


supposé de loi gaussienne de variance σ 2 inconnue. Nous
souhaitons savoir si la quantité moyenne de substance active est
bien conforme aux spécifications.

Hypothèses :
$ de substance active suit une loi gaussienne
• La#quantité
N m, σ 2 de variance σ 2 inconnue.
• Nous avons un échantillon.

Analyse Statistique A. Melnykova 2022-2023 66/75


Application : Test de Student bilatéral

• Formulation du test Nous testons H0 : m = 2.5 g contre


H1 : m != 2.5 g.
• Test bilatéral
• Valeur observée de la statistique T
• la moyenne empirique observée est : xn = 2.905
• la variance σ 2 est estimée par s2 ≈ 0.024
• et donc √
10 (xn − 2.5)
tobs = √ ≈ 8.267
s2
• Sous H0 , T suit la loi Student(10 − 1) = Student(9).

Analyse Statistique A. Melnykova 2022-2023 67/75


Application : Test de Student bilatéral

Règle de décision
• Rejet de H0 pour |T| > z1−α/
• Non rejet de H0 si |T| ! z1−α
# $
avec PH0 T ! z1−α/2 = 1 − α2

• La table de loi Student(9) (i.e. de la loi sous H0 de T) nous


donne pour α = 5%, z0.975 = 2.262
• |tobs | ≈ 8.267 > 2.262 = z0.975 donc pour un risque de 1re espèce
α = 5%, on rejette H0 .
• Avec une probabilité de 5% de se tromper, on conclut que la
quantité moyenne de substance active n’est pas conforme
aux spécifications.

Analyse Statistique A. Melnykova 2022-2023 68/75


Application : Test de Student pour H1 : m > m0

Nous nous demandons si la quantité moyenne de substance


active est sous-estimée dans les spécifications.
• Formulation du test Nous testons H0 : m = 2.5 g contre
H1 : m > 2.5 g.
• Test unilatéral
• Valeur observée de la statistique T : tobs ≈ 8.267
• Sous H0 , T suit la loi Student(9).

Analyse Statistique A. Melnykova 2022-2023 69/75


Application : Test de Student pour H1 : m > m1

Règle de décision
• Rejet de H0 pour T > z1−α
• Non rejet de H0 si T ! z1−α
avec PH0 (T ! z1−α ) = 1 − α

• La table de loi Student(9) (i.e. de la loi sous H0 de T) nous


donne pour α = 5%, z0.95 = 1.833
• Alors tobs ≈ 8.267 > 1.833 = z0.95 et donc pour un risque de 1re
espèce α = 5%, on rejette H0 .
• Avec une probabilité de 5% de se tromper, on conclut que la
quantité moyenne de substance active est sous-estimée (i.e.
est supérieure à 2.5) dans les spécifications du médicaments.

Analyse Statistique A. Melnykova 2022-2023 70/75


Application : Test de Student pour H1 : m < m0

Nous nous demandons si la quantité moyenne de substance


active est sur-estimée dans les spécifications.
• Formulation du test : Nous testons H0 : m = 2.5 g contre
H1 : m < 2.5 g.
• Test unilatéral
• Valeur observée de la statistique T : tobs ≈ 8.267
• Sous H0 , T suit la loi Student(9).

Analyse Statistique A. Melnykova 2022-2023 71/75


Application : Test de Student pour H1 : m < m1

Règle de décision
• Rejet de H0 pour T < zα
• Non rejet de H0 si T " zα
avec PH0 (T ! zα ) = α

• La table de loi Student(9) (i.e. de la loi sous H0 de T) nous


donne pour α = 5%, z0.05 = −1.833
• Alors tobs ≈ 8.267 > −1.833 = z0.05 et donc pour un risque de 1re
espèce α = 5%, on ne rejette pas H0 .

Analyse Statistique A. Melnykova 2022-2023 72/75


Pour finir : Cadre non gaussien

Supposons à présent que le caractère observé n’est pas (a priori)


gaussien.
• Dans ce cas sous l’hyp. H0 , pour n grand

n(Xn − m0 )
T= ≈ N (0, 1)
σ

• Si la variance σ 2 est connue sous H0 , le test proposé reste


valable pour de grands échantillons, i.e. pour n grand (n > 30).
• Risque de première espèce asymptotique.

Analyse Statistique A. Melnykova 2022-2023 73/75


Pour finir : Cadre non gaussien

• De plus, pour n grand,



n(Xn − m0 )
T= " ≈ N (0, 1)
S2n

• Dans le cas d’un grand échantillon, le test proposé dans le cas


d’une variance inconnue reste vrai en remplaçant la loi de
Student par la loi gaussienne N (0, 1).
• Risque de première espèce asymptotique.

Remarque
• Student(n − 1) ≈ N (0, 1) pour n grand.

• Et si l’échantillon est petit non gaussien, sauf cas particulier, on


utilise un test non paramétrique.

Analyse Statistique A. Melnykova 2022-2023 74/75

Vous aimerez peut-être aussi