Vous êtes sur la page 1sur 34

Module CI 27 − 1

A.U. 2023 − 2024

Tests d’hypothèse (Partie 1)

Abdessamad OUSAADANE

ENSAM

11 Mars 2024

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 1 / 34


Plan de cours

1 Introduction

2 Techniques de base pour tester les hypothèses


Hypothèse à tester
Hypothèse nulle H0 et hypothèse alternative H1
Nature du test (unilatéral ou bilatéral)
Risques d’erreur
Test statistique ou variable de décision
Région critique et la zone d’acceptation
Règles de décision

3 Tests statistiques paramétriques

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 2 / 34


1 Introduction

2 Techniques de base pour tester les hypothèses

3 Tests statistiques paramétriques

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 3 / 34


Introduction

Concept fondamental : Les tests d’hypothèse sont des procédures


statistiques utilisées pour prendre des décisions sur la validité d’une
hypothèse concernant une population, en se basant sur des
échantillons de données observées.
Objectif principal : Déterminer si les résultats observés dans un
échantillon sont suffisamment significatifs pour tirer des conclusions
sur une population plus large.
Processus général :
Formulation des hypothèses : Hypothèse nulle (H0 ) vs. hypothèse
alternative (H1 ).
Sélection d’un test statistique approprié en fonction des données et des
hypothèses.
Calcul de la statistique de test et de la valeur p.
Prise de décision : Rejeter ou ne pas rejeter l’hypothèse nulle en
fonction de la valeur p et du niveau de signification.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 4 / 34


Importance pratique : Les tests d’hypothèse sont largement utilisés
dans la recherche scientifique, la prise de décision en entreprise et les
études académiques pour valider ou invalider des hypothèses et faire
des inférences sur la population à partir des échantillons.
Limitations et considérations : Il est crucial de comprendre les
limitations des tests d’hypothèse, y compris la dépendance aux
hypothèses initiales, la sensibilité aux erreurs de type I et de type II ,
ainsi que l’importance de l’interprétation appropriée des résultats.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 5 / 34


Définition
Un test est un mécanisme qui permet de trancher entre deux hypothèses à la
vue des résultats d’un échantillon, en quantifiant le risque associé à la décision
prise. Il nous permet alors de de contrôler (accepter ou rejeter) à partir de
l’étude d’un ou plusieurs échantillons aléatoires, la validité d’hypothèses
relatives à une ou plusieurs populations.

Types de tests réalisés


En fonction de l’hypothèse testée, plusieurs types de tests peuvent être
réalisés :
Tests de conformité : Les tests destinés à vérifier si un échantillon peut
être considéré comme extrait d’une population donnée, vis-à-vis d’un
paramètre comme la moyenne, la variance ou la fréquence observée.
Exemple :
Est-ce que le taux moyen de cholestérol mesuré dans un échantillon de
patients est conforme au taux moyen de cholestérol dans la population
générale ?

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 6 / 34


Types de tests réalisés
Tests d’égalité ou d’homogénéité : Les tests destinés à comparer
plusieurs populations à l’aide d’un nombre équivalent d’échantillons.
Exemple :
Y a-t-il une différence entre le taux moyen de cholestérol mesuré pour
deux échantillons de patients ayant reçu des traitements différents ?
Tests d’ajustement : Les tests destinés à vérifier si un échantillon
peut être considéré comme extrait d’une population donnée par
rapport à sa distribution observée.
Exemple :
Est-ce que les temps de construction des ponts suivent une
distribution normale ?

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 7 / 34


Types de tests réalisés
Tests d’indépendance : Les tests destinés à tester l’indépendance
entre deux caractères, généralement qualitatifs.
Exemple :
Est-ce que la fréquence des accidents de la route dans une ville est
indépendante de la densité de population ?

Pour répondre à ces questions, on doit formuler des hypothèses


statistiques qui sont alors acceptées ou rejetées au vu des résultats
numériques obtenus lors de la réalisation de n expériences
indépendantes.

À noter qu’aucune décision statistique ne peut être prise avec une


certitude absolue ; quelle que soit la conclusion, le risque de se
tromper existe toujours.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 8 / 34


1 Introduction

2 Techniques de base pour tester les hypothèses


Hypothèse à tester
Risques d’erreur
Test statistique ou variable de décision
Région critique et la zone d’acceptation
Règles de décision

3 Tests statistiques paramétriques

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 9 / 34


Principe des tests d’hypothèse
Poser une hypothèse de travail et prédire les conséquences de cette
hypothèse pour la population ou l’échantillon.
Comparer ces prédictions avec les observations et conclure en
acceptant ou en rejetant l’hypothèse de travail à partir de règles de
décisions objectives.

Choix de l’hypothèse à tester


Dans tous les domaines, de l’expérimentation scientifique à la vie
quotidienne, on est amené à prendre des décisions sur une activité risquée
au vu de résultats d’expériences ou d’observation de phénomènes dans un
contexte incertain.
Informatique : au vu des résultats des tests d’un nouveau système
informatique, on doit décider si ce système est suffisamment fiable et
performant pour être mis en vente.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 10 / 34


Essais cliniques : évaluer si l’efficacité d’un nouveau vaccin est
supérieure à celle d’un vaccin existant, en fonction des résultats de son
essai clinique sur des patients.
Finance : au vu du marché, décider si on doit ou pas se lancer dans
une opération financière donnée.
Justice : décider si l’accusé est innocent ou coupable à partir des
informations acquises pendant le procès.
Dans chaque cas, le problème de décision consiste à trancher, au vu
d’observations, entre une hypothèse appelée hypothèse nulle, notée H0 , et
une autre hypothèse dite hypothèse alternative, notée H1 .

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 11 / 34


Hypothèse nulle et hypothèse alternative

Définition
Soient H0 et H1 deux hypothèses, dont une et une seule est vraie.
L’hypothèse nulle ou hypothèse de référence notée H0 est
l’hypothèse que l’on désire contrôler.
Elle consiste à dire qu’il n’existe pas de différence entre les paramètres
comparés ou que la différence observée n’est pas significative et est
simplement due au hasard des échantillons.
L’hypothèse alternative notée H1 (ou encore Ha ) est la négation de
H0 , elle est équivalente à dire "H0 est fausse".
Elle suggère qu’il existe une différence significative entre les
paramètres étudiés ou que la différence observée ne peut pas être
attribuée uniquement au hasard des échantillons.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 12 / 34


Exemple
On considère comme hypothèse nulle

H0 : La moyenne de la population est égale à µ0 ,

et, dans ce cas une hypothèse alternative pourrait être

H1 : La moyenne de la population est différente de µ0 ,

ou encore

H1 : La moyenne de la population est strictement plus grande que µ0 .

Décision
C’est l’hypothèse nulle qui est soumise au test et toute la démarche du
test s’effectue en considérant cette hypothèse comme vraie.
La décision d’un test consiste à choisir entre H0 et H1 .

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 13 / 34


Test unilatéral et test bilatéral

Selon les hypothèses formulées, on applique soit un test bilatéral, soit un


test unilatéral.
Définition
Un test bilatéral s’applique quand on cherche une différence entre
deux paramètres, ou entre un paramètre et une valeur donnée sans se
préoccuper du signe ou du sens de la différence.
Un test unilatéral s’applique quand on cherche à savoir si un
paramètre est supérieur (ou inférieur) à un autre ou à une valeur
donnée.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 14 / 34


Exemple
Dans le département des RH d’une entreprise, on souhaite évaluer si le
salaire moyen des employés de l’entreprise (µ) est égal au salaire moyen de
l’industrie dans la région (µ0 ). On formule les hypothèses de la manière
suivante :
H0 : Le salaire moyen des employés de l’entreprise est égal au salaire
moyen de l’industrie dans la région (µ = µ0 ).
H1 : Le salaire moyen des employés de l’entreprise est différent du salaire
moyen de l’industrie dans la région (µ ̸= µ0 ).
Le test est bilatéral car on considère que le salaire moyen des employés de
l’entreprise peut être soit supérieur, soit inférieur au salaire moyen de
l’industrie dans la région.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 15 / 34


Exemple
Pour le même exemple, on peut formuler les hypothèses de la manière
suivante :
H0 : Le salaire moyen des employés de l’entreprise est égal au salaire
moyen de l’industrie dans la région (µ = µ0 ).
H1 : Le salaire moyen des employés de l’entreprise est supérieur au salaire
moyen de l’industrie dans la région (µ > µ0 ).
Dans ce test, on utilise une approche unilatérale car on s’en concentre
uniquement sur la possibilité que le salaire moyen des employés de
l’entreprise soit supérieur à la norme de l’industrie dans la région.
C’est un test unilatéral à droite. Il aurait été possible également d’avoir :
H0 : µ = µ0 et H1 : µ < µ0 . Dans ce cas, le test sera unilatéral à gauche.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 16 / 34


Risques d’erreur

Dans un problème de décision, on peut toujours se tromper de deux


manières différentes et par conséquent deux types d’erreurs sont possibles :

Définition (Erreur de première espèce)


L’erreur de première espèce est le fait de décider que l’hypothèse
alternative H1 est vraie alors qu’en fait, en réalité, c’est l’hypothèse nulle
H0 qui est vraie.
Le risque d’erreur associé à cette décision est noté généralement α.
Il s’agit donc de la probabilité de décider à tort que l’hypothèse H1 est
vraie.

Remarque
Le risque α de première espèce est celui de rejeter H0 alors qu’elle est
vraie : α = P(rejeter H0 /H0 vraie)
ou accepter H1 alors qu’elle est fausse α = P(accepter H1 /H1 fausse).

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 17 / 34


Définition (Erreur de deuxième espèce)
L’erreur de deuxième espèce est le fait de décider que l’hypothèse nulle
H0 est vraie alors qu’en fait, en réalité, c’est l’hypothèse alternative H1 qui
est vraie.
Le risque d’erreur associé à cette décision est noté généralement β.
Il s’agit donc de la probabilité de décider à tort que l’hypothèse nulle H0
est vraie.

Remarque
Le risque d’erreur β de deuxième espèce est celui de accepter H0 alors
qu’elle est fausse : β = P(accepter H0 /H0 fausse)
ou rejeter H1 alors qu’elle est vraie β = P(rejeter H1 /H1 vraie).

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 18 / 34


Remarque

La première ligne du tableau examine ce qui se passe lorsque le test


conduit à accepter H0 . Si H0 est vraie, cette conclusion est correcte.
Par contre, si H1 est vraie, nous avons fait une erreur de seconde
espèce ; c’est-à-dire, nous avons accepté H0 alors qu’elle est fausse.
La seconde ligne du tableau examine ce qui se passe lorsque le test
conduit à rejeter H0 . Si H0 est vraie, nous avons fait une erreur de
première espèce ; c’est-à-dire, nous avons rejeté H0 alors qu’elle est
vraie. Toutefois, si H1 est vraie, rejeter H0 est correct.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 19 / 34


Exemple des conséquences des deux risques
Les conséquences de ces deux erreurs peuvent être d’importances diverses,
mais en général, une des erreurs est plus grave que l’autre :
Finance : si on décide à tort que l’on peut lancer l’opération, on risque
de perdre beaucoup d’argent ; si on décide à tort de ne pas lancer
l’opération, on peut se priver d’un bénéfice important.
Justice : on peut condamner un innocent ou acquitter un coupable.
À toute décision correspond une probabilité de décider juste et une
probabilité de se tromper : le risque α ou le risque β.

Lien entre les risques


La situation idéale serait que ces deux erreurs soient nulles ou au moins de
trouver une procédure qui minimise les deux risques d’erreur en même
temps, mais ce n’est pas possible.
Pire encore, ces deux erreurs sont antagonistes. Si on diminue α alors β
augmente et inversement si on diminue β alors α augmente.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 20 / 34


Niveau de significativité
Dans la pratique, on va donc considérer que l’une des deux erreurs est
plus importante que l’autre.
Par exemple, dans le cas du procès, on fait en général tout pour éviter de
condamner un innocent, quitte à prendre le risque d’acquitter un
coupable.
On va choisir H0 et H1 de sorte que l’erreur que l’on cherche à éviter soit
l’erreur de première espèce. Mathématiquement, cela revient à se fixer la
valeur du seuil du test α. L’erreur de première espèce est limitée à un
niveau dit niveau de significativité.
Niveaux usuels : Les valeurs les plus courantes pour α sont 10%, 5% ou
1%.

Remarque :
Le risque de première espèce α est choisi à priori par l’expérimentateur et
jamais en fonction des données. Alors que le risque de deuxième espèce β
dépend de l’hypothèse alternative H1 .

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 21 / 34


Puissance et robustesse d’un test

Définition
La puissance d’un test est égale à 1 − β ou encore la puissance est la
probabilité de rejeter H0 à raison,

1 − β = P(rejeter H0 /H0 fausse) = P(accepter H1 /H1 vraie).

Remarques
Généralement la puissance doit au moins être égale à 0, 80 pour être
considérée comme satisfaisante.
Le calcul de la puissance d’un test est généralement assez complexe :
il faut souvent faire appel à des logiciels spécialisés (Gpower3 par
exemple).

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 22 / 34


Test statistique

Définition
Étant fixé le risque d’erreur de première espèce α, il faut choisir une
variable de décision encore appelée statistique de test.
Un test statistique ou une statistique S est une fonction des variables
aléatoires représentant l’échantillon dont la valeur numérique obtenue
pour l’échantillon considéré permet de distinguer entre H0 vraie et H0
fausse.
Sa loi doit être parfaitement déterminée dans H0 afin de ne pas
introduire de nouvelles inconnues dans le problème.

Remarque
Connaissant la loi de probabilité suivie par la statistique S sous l’hypothèse
H0 , il est possible d’établir une valeur seuil, Sseuil , de la statistique associée
au niveau de signification α (pourcentage de risque) du test.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 23 / 34


Région critique et zone d’acceptation

Définition
La région critique notée Rc (ou W pour Wrong), ou encore appelée
zone de rejet est égale à l’ensemble des valeurs de la variable de
décision S qui conduisent à écarter H0 au profit de H1 .
Elle correspond donc aux intervalles où les différences sont tellement
grandes qu’elles ne peuvent pas être simplement dues au hasard
d’échantillonnage.

Remarque
Dans la plupart des situations qu’on rencontrera dans la suite, la région
critique Rc peut être reliée au risque d’erreur de première espèce α par
P(S ∈ Rc ) = α.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 24 / 34


Définition
La région d’acceptation notée Iacc , ou encore appelée zone
d’acceptation est la région complémentaire de la région critique Rc .
Elle correspond à l’intervalle dans lequel les différences observées entre
les réalisations et la théorie sont dues aux variations aléatoires des
échantillons.

Remarque
Dans la plupart des situations qu’on rencontrera dans la suite, la région
d’acceptation Iacc peut être reliée au risque d’erreur de première espèce α
par P(S ∈ Iacc ) = 1 − α.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 25 / 34


La définition de la région critique varie selon la nature unilatérale ou
bilatérale du test.
Pour un test bilatéral, la zone de rejet de l’hypothèse principale se fait
de part et d’autre de la distribution de référence.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 26 / 34


Pour un test unilatéral, la zone de rejet de l’hypothèse principale est
située d’un seul côté de la distribution de probabilité de référence.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 27 / 34


Règles de décision

Règle de décision basée sur la région critique


Sous l’hypothèse "H0 est vraie" et pour un seuil de signification α fixé.
On utilise la règle de décision basée sur la région critique, qui consiste
à comparer la valeur de la statistique de test Scal à une valeur seuil
prédéfinie Sseuil .
Si la statistique de test Scal tombe dans la région critique, alors on
rejette l’hypothèse nulle H0 avec un risque d’erreur α et on accepte
l’hypothèse alternative H1 .
Si la statistique de test Scal ne tombe pas dans la région critique, on
ne rejette pas l’hypothèse nulle H0 .

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 28 / 34


Règle de décision basée sur le niveau de signification (α) : p-value
La valeur de p, ou la p-valeur (p-value), est calculée en fonction de la
statistique du test obtenue à partir de l’échantillon, de la distribution
supposée, et du type de test effectué (bilatéral ou unilatéral).
Elle représente la probabilité critique αobs telle que
P(Scal ∈ Rc ) = αobs .
Si la valeur p est inférieure ou égale à α, on rejette l’hypothèse nulle
H0 .
Si la valeur p est supérieure à α, on ne rejette pas l’hypothèse nulle
H0 .

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 29 / 34


La démarche à suivre pour la mise en place d’un test

Comment réaliser un test et conclure à l’aide d’une région critique ?


1 Choix des deux hypothèses H0 et H1 .
2 Détermination de la variable de décision (la statistique S).
3 Allure de la région critique en fonction de H1 : test bilatéral ou
unilatéral.
4 Calcul de la région critique en fonction de α.
5 Calcul de la variable de décision observée sur l’échantillon.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 30 / 34


La démarche à suivre pour la mise en place d’un test

Comment réaliser un test et conclure à l’aide d’une région critique ?


6 Conclusion du test.
Si la valeur calculée en 5 appartient à la région construite en 4, le test
est donc significatif au niveau α.
On rejette l’hypothèse nulle H0 et on décide que H1 est vraie.
Le risque associé à cette décision est un risque d’erreur de première
espèce qui vaut α.
Si la valeur calculée en 5 n’appartient pas à la région construite en 4, le
test n’est pas significatif au niveau α.
On conserve alors l’hypothèse nulle H0 par défaut.
Le risque associé à cette décision est un risque d’erreur de deuxième
espèce qui vaut β.
Pour évaluer le test, il faudrait calculer la puissance 1 − β du test.
7 Calcul de la puissance du test 1 − β lorsque celui-ci n’est pas
significatif.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 31 / 34


La démarche à suivre pour la mise en place d’un test

Comment réaliser un test et conclure à l’aide d’une p-valeur ?


1 Choix des deux hypothèses H0 et H1 .
2 Détermination de la variable de décision (la statistique S).
3 Calcul de la p-valeur à partir des données de l’échantillon.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 32 / 34


La démarche à suivre pour la mise en place d’un test

Comment réaliser un test et conclure à l’aide d’une p-valeur ?


4 Conclusion du test.
Si la p-valeur est inférieure ou égale à α, le test est donc significatif
au niveau α.
On rejette l’hypothèse nulle H0 et on décide que H1 est vraie.
Le risque associé à cette décision est un risque d’erreur de première
espèce qui vaut α.
Si la p-valeur est strictement supérieure à α, le test n’est pas
significatif au niveau α.
On conserve alors l’hypothèse nulle H0 par défaut.
Le risque associé à cette décision est un risque d’erreur de deuxième
espèce qui vaut β.
Pour évaluer le test, il faudrait calculer la puissance 1 − β du test.
5 Calcul de la puissance du test 1 − β lorsque celui-ci n’est pas
significatif.

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 33 / 34


1 Introduction

2 Techniques de base pour tester les hypothèses

3 Tests statistiques paramétriques

Abdessamad OUSAADANE (ENSAM) Tests d’hypothèse (Partie 1) 11 Mars 2024 34 / 34

Vous aimerez peut-être aussi