Vous êtes sur la page 1sur 7

TD2 - Tests d'hypothèses

Paramètres inconnus => estimation = approximation avec les données

But : comparer un paramètre avec une valeur de référence => test statisque

2 hypothèses : hypothèse nulle et hypothèse alternative, dans le cadre du cours


contraires l'une de l'autre

Objectif = dire quand est fausse ( vraie) en contrôlant la probabilité de se tromper, i.e.
proba de se tromper < avec = seuil de risque fixé.

Comment = en donnant une région critique , i.e. une condition telle que si elle est vérifiée
alors je peux rejeter avec ce risque . Si la condition n'est pas vérifiée on ne conclut rien (les
données ne sont pas de suffisamment bonnes qualité).

Exercice 1
Cours p 58

Les riverains d'une antenne de téléphonie mobile estiment que le niveau moyen d'ondes émis par
l'antenne est nocif pour la santé. Ils souhaitent donc demander le retrait de l'antenne. Le groupe
de téléphonie soutient à l'inverse que la limite réglementaire pour le niveau d'ondes n'est pas
atteinte.

1. Des experts sont chargés de mettre en place une procédure permettant de trancher entre
les deux parties. En raisonnant sur le risque expliquer pourquoi le choix des hypothèses
nulle et alternative peut varier suivant que les experts sont mandatés par le groupe de
téléphonie ou par les riverains.
''la limite est dépassée'' à tort : on retire l'antenne alors que tout va bien => aucun souci pour
les riverains, mais pas bien du tout pour le groupe de téléphonie

risque d'une procédure = affirmer à tort


Groupe de téléphonie : ''la limite réglementaire est dépassée'' et contraire de
.

Riverains : le pire = on laisse l'antenne alors qu'elle est nocive, ''la limite de nocivité
n'est pas dépassée'' et contraire de .
2. Les experts ont relevé fois le niveau des ondes à différents moments de la journée à 150
mètres de l'antenne. On admet que ces niveaux sont distribués selon une loi normale. Le
niveau moyen observé est V/m et l'écart-type observé est V/m. Le
niveau moyen maximal recommandé par une étude indépendante est de 0.6 V/m. Au vu de
ces mesures, les riverains demandent le retrait de l'antenne, mais l'opérateur prétend que le
niveau moyen observé n'est pas suffisamment supérieur à 0.6 V/m pour pouvoir conclure
avec une confiance de 95 % que le niveau limite toléré est dépassé. Qu'en pensez-vous ?

Niveau moyen observé = 0.65 / niveau de référence = 0.6

Quel test ? Groupe téléphonie ou riverains ? = Groupe de téléphonie


Pour s'en convaincre, test des riverains, "seuil non dépassé". Test = on peut soit
affirmer vraie soit rien. Supposons qu'on affirme m<0.6 alors on a une
contradiction car on a observé = niveau moyen observé >0.6. On ne peut pas affirmer
quel que soit le risque .

"seuil est dépassé" , "m>0.6"


Dans toutes les applications, ce qu'on observe doit être cohérent avec ce qu'on met dans
.

Mise en oeuvre du test.


= "vrai niveau moyen de l'antenne" = espérance de avec = niveau d'onde de
l'antenne.

> = seuil de référence

Donc on teste et -contraire de - .

Données gaussiennes = loi normale => cours p 58

Test de contre .

Application numérique.
n=20

La réalisation de vaut .
On compare à .

On a . On est dans .

Conclusion. On peut rejeter . On peut affirmer avec un risque de 5% que le


seuil des ondes est dépassé. Le groupe de téléphonie ne peut pas affirmer le
contraire.

Exercice 2
Cours : p-valeur ?

p-valeur = risque qu'on commet au vu des données si on rejette .

Plus la p-valeur est petite plus j'ai confiance dans .

= risque que je suis prêt à prendre pour valider . Donc :

Si le risque p-valeur, on rejette ,


Si le risque p-valeur, on ne rejette pas .

Comment trouver la p-valeur ?

Si le risque p-valeur, on est dans ,

Si le risque p-valeur, on n'est pas dans


Donc si p-valeur, on a un "=" dans .

Lors d'un TP en 3IF, vous avez simulé des variables aléatoires et testé la qualité de différents
simulateurs. Le but de cet exercice est de reprendre les tests qui ont été faits d'un point de vue
théorique.
On génère plusieurs nombres avec un générateur pseudo-aléatoire donné. On concatène tous les
bits de toutes les réalisations pour obtenir une seule séquence. Le but est de vérifier que les 0 et
les 1 sont bien présents dans des proportions identiques et qu'ils sont répartis de manière non
structurée dans la séquence.

Notons la valeur du -ème bit, est égal à 0 ou 1. Soit la proportion de 1 donnée par le
générateur, . On considère bits. Parmi ceux-ci, on a observé 459 bits
égaux à 1.

1. Quelle est la proportion de 1 dans la séquence ?

2. Pre-test. Réaliser le test usuel de contre avec un risque de 1%.


Calculer la p-valeur du test.
Cours avec .

Application numérique : la réalisation de est .


p-valeur du test = tel qu'on a '=' dans . Donc on cherche tel que

Méthode 1 = valeur approchée mais plus rapide

Table des = Table 2 : on cherche le le plus proche de 0.6

Méthode 2 = plus longue mais plus précise

Définition de (en haut de la Table 2) pour se ramener à une lecture de la Table 1.

Par lecture de la table 1,


Conclusion : la p-valeur est la probabilité de se tromper si on rejette au vu des données
(plus p-valeur petite, plus on a confiance dans ).

Si on affirme qu'on a on se trompe avec une proba . Par contre on ne peut


pas affirmer pour autant que : on peut dire quand un générateur est mauvais,
jamais quand il est bon.

On ne rejette pas ce générateur.

Remarque :
On ne rejette pas mais on ne peut pas valider pour autant.
Idéalement on voudrait échanger et . Mais on ne peut pas ! On ne peut
jamais prouver une égalité (car on ne peut pas distinguer le cas de
par exemple).
3. Test de fréquence monobit. On introduit les variables aléatoires

On peut montrer à l'aide du théorème de la limite centrale que

Montrer que   est égal à .

Immédiat. Le but est de vous montrer que lorsque vous avez codé le pré-test, cela était
inutile : il est parfaitement équivalent au test de fréquence monobit qui avait déjà été
implémenté.

4. Test des runs. Le principe du test des runs est de vérifier si les longueurs moyennes
successives de~0 et de~1 sont identiques. Plus précisément, on peut construire un test de
''la répartition des 1 est aléatoire'' contre ''la répartition des 1 n'est pas
aléatoire''.
On obtient une p-valeur de 6.10%. Commenter.

Si on valide on se trompe avec une probabilité de .

On ne peut pas affirmer que la répartition n'est pas aléatoire. On ne conclut rien.

On peut conserver ce générateur, jusqu'à preuve du contraire.

Remarque : en TP vous avez utilisé la règle du : on dit qu'un générateur est mauvais si la p-
valeur est inférieure à 1%.

Exercice 3
Rappel de cours

Région critique = condition sous laquelle on rejette .

Loi normale ou proportion => cours

Sinon ? Il faut reconstruire.

Démarche

1. Définition de :
Le sup est toujours atteint pour le cas d'égalité dans : on fait le raisonnnement en
prenant pour paramètre celui obtenu par le "=" dans , .

2. On introduit une v.a. dont on connait la loi dans l'équation. La v.a. est fournie par l'énoncé.
3. Dessin de l'équation pour se ramener à une lecture de table

Même démarche que pour l'IC, sauf que 1. = définition de l'IC.

Léopold prend régulièrement le tramway entre 18h00 et 19h00 à la même station. Il a mesuré ses
temps d’attente sur cette plage horaire, pour jours. Il a obtenu un temps
moyen
d’attente de minutes.
Le temps d’attente annoncé par la compagnie de tramway est de minutes. Léopold souhaite
savoir
si ce temps est bien respecté.
On décide de modéliser les temps d’attente par une loi exponentielle : indépendants
de loi
exponentielle de paramètre , .

1. Donner l’estimateur des moments de , noté .


On a donc . moyenne théorique. On remplace par la
moyenne observée , ce qui donne

2. On peut montrer que

On souhaite effectuer le test de contre .

a. Construire la région critique, de la forme avec à déterminer.


On utilisera la variable aléatoire Z ci-dessus.
1. Définition

Le sup est atteint pour "=" dans .

2. Introduire dans l'équation

mais on a

3. Dessin et lecture de table


, et

b. Application. Léopold peut-il affirmer que le temps d’attente est supérieur à celui affiché,
c’est-à-dire que ?
Application numérique.

=1/7.2 =0.13 min^{-1}

n=10

et Table de la loi du

On n'est pas dans .


On ne rejette pas : on ne peut rien conclure.

Pour conclure que le temps moyen de 6 min est dépassé, il fallait observer , c'est-
à-dire un temps moyen observé de >1/106>9,43 min.

 
Exercice 4
Cours p 61

Une machine A fabrique des baguettes métalliques dont la longueur suit une loi gaussienne
d'espérance 4mm et d'écart-type 0.10mm.

Le prototype d'une nouvelle machine B est testé. Sur un échantillon de 25 baguettes fabriquées,
on trouve et . Tester si au seuil de 5% la machine est plus précise que la
machine A.

loi ? loi gaussienne = loi normale


paramètre ? notion de précision / variabilité = variance (estimée par )
valeur de référence ? .

On observe (=> ce qui va dans ). Donc on teste contre

Application numérique. La réalisation de est . On compare à 13.85.

On n'est pas dans .

Conclusion. On ne peut pas conclure que la machine B est plus précise que la machine A.

Vous aimerez peut-être aussi