Vous êtes sur la page 1sur 15

Méthodologie de Recherche

TD n°5

Méthodologie Générale
On rejette une hypothèse du type “moyenne = x” si “x” n’appatient pas à l’intervalle de confiance à 99% autou
de de la moyenne. On “accepte” (on ne rejette pas) une telle affirmation si “x” appartient à l’intervalle de
confiance à 99% autour de la moyenne.

Les instructions R-Stat sont toutes indiquées dans les copies d’écran.

Pour les régressions linéaires,

“ “ ou “.” signifient “pas d’effet significatif”

“*” (significatif à 5%) : effet faiblement significatif ou “pas de quoi fouetter un chat”.

“**” et “***” (significatif respectivement à 1% et 0,1%) : effet significatif.

Pour le choix de considérer 5% comme n’étant pas satisfaisant :

Johnson, V. E. (2013). Revised standards for statistical evidence.


Proceedings of the National Academy of
Sciences, 110(48), 19313-19317.

Exercice 1

Question 1
Une personne lance 50 fois une pièce de monnaie.
On obtient 21 fois “face”.
• On peut soupçonner une tricherie.
• 0,5 appartient à l’intervalle de confiance à 99%, on ne detecte rien d’anormal.
• 0,5 n’appartient pas à l’intervalle de confiance à 99% on soupçonne une tricherie.
• On ne peut rien conclure.
Exercice 2
Une personne lance 50 fois une pièce de monnaie.
On obtient 15 fois “face”.
• On peut soupçonner une tricherie.
• 0,5 appartient à l’intervalle de confiance à 95%, on ne detecte rien d’anormal.
• 0,5 n’appartient pas à l’intervalle de confiance à 99% on soupçonne une tricherie.
• On ne peut rien conclure.

Exercice 3
Question 3

Dans un groupe de 200 patients, on observe 55 personnes atteintes de myopie. Sachant que la proportion de
personnes myopes est de 29%, ce groupe présent-il une spécificité concernant la proportion de personnes
atteintes de myopie ?

• On ne peut rien dire.


• 0,29 appartient à l’intervalle de confiance à 99%, on ne detecte pas de spécificité.
• 0,29 n’appartient pas à l’intervalle de confiance à 99% on soupçonne l’existence d’une spécificité du groupe.
• 0,29 appartient à l’intervalle de confiance à 99% mais pas à l’intervalle de confiance à 95%.

Exercice 4
On veut comparer l’efficacité d’un médicament et d’un placebo. Les résultats sont résumés dans le tableau
suivant :
Positif Négatif
Médicament X 302 124
Placébo 120 241

Question 4

• 0 n’appartient pas à l’intervalle de confiance à 99% on peut penser avec un bon niveau de certitude qu’il existe une différence en
le médicament et le placébo.
• 1 appartient à l’intervalle de confiance à 99%, on ne detecte pas de différence entre médicament et placébo.
• 1 n’appartient pas à l’intervalle de confiance à 99% on peut penser avec un bon niveau de certitude qu’il existe une différence en
le médicament et le placébo.
• 0 appartient à l’intervalle de confiance à 99% il n’y a pas de différence entre le placébo et le médicament.

Exercice 5
Question 5

On fait passer un examen à un groupe d’étudiants. On veut savoir si les filles et les garçons ont réussi l’examen
dans les mêmes proportions.

Reçu Recalé
Garçons 482 23
Filles 235 10

• 0 n’appartient pas à l’intervalle de confiance à 99% on peut penser avec un bon niveau de certitude qu’il existe une différence en
les filles et les garçons.
• 1 appartient à l’intervalle de confiance à 99%, on ne detecte pas de différence entre les sexes.
• 1 n’appartient pas à l’intervalle de confiance à 99%, on peut penser avec un bon niveau de certitude qu’il existe une différence e
filles et garçons.
• 0 appartient à l’intervalle de confiance à 99% il n’y a pas de différence entre filles et garçons
Exercice 6

Le propriétaire d’un site internet a fait refaire son l’interface de son site. Il souhaite savoir si cette refonte du si
à permis d’augmenter le traffic en moyenne. Vous disposez du nombre de visites uniques durant cents journée
avant le changement du site (internet01) et après changement (internet02). Toutes les données se trouvent da
le fichier exam5.csv.
La commande attach() permet de garder en mémoire les données du fichiers exam5. Toutes les données se
trouvent dans ce fichier.
Question 6

A-t-on suffisemment de données pour pouvoir appliquer les méthodes statistiques du cours ?
• Non, il faudrait 30 observations et pas plus
• Oui, on a bien moins de 30 observations
• Oui, avec une centaine d’observations, on peut.
• Oui, on peut.

Il faut un certain nombre de données (100) pour que les calculs soient valides.

Question 7
Quelle est, aproximativement, le nombre moyen de visites avant le changement du site :
• 42 073
• 12 457
• 28 930
• 23 958
Question 8
Quel est, aproximativement, l’ecart-type du nombre de visites avant le changement du site :
• 42 073
• 12 457
• 22 050
• 13 166

Question 9
Quel est, approximativement, l’intervalle de confiance à 99% autour du nombre moyen de visites (avant
changement)
• [26 317.55 ; 31 542.65]
• [37 317.55 ; 48 542.65]
• [25 472.01 ; 32 388.19]
• [37 698.64 ; 46 449.18]

Question 10
Quelle est, aproximativement, le nombre moyen de visites après le changement du site :
• 42 073
• 12 457
• 28 930
• 23 958

Question 11
Quel est, aproximativement, l’ecart-type du nombre de visites après le changement du site :
• 42 073
• 12 457
• 22 050
• 13 166

Question 12
Quel est, approximativement, l’intervalle de confiance à 99% autour du nombre moyen de visites (après
changement)
• [36 282.59 ; 47 865.23]
• [37 317.55 ; 48 542.65]
• [25 698.64 ; 91 449.18]
• [37 698.64 ; 46 449.18]

Question 13
Est-ce que le nombre de visite a augmenté ?
• 0 n’appartient pas à l’intervalle de confiance à 99%, il y a bien une différence.
• 0 appartient à l’intervalle de confiance à 99%, il n’y a pas de différence.
• 1 appartient à l’intervalle de confiance à 99%, il n’y a pas de différence.
• 1 n’appartient pas à l’intervalle de confiance à 99%, il y a bien une différence.
Question 14
Les personnes qui ont travaillé sur le site prétendent qu’en moyenne il y a 9000 visiteurs supplémentaires chaq
jour. Ont ils raison ?
• 9000 n’appartient pas à l’intervalle de confiance à 99%, ils ont raison.
• 9000 n’appartient pas à l’intervalle de confiance à 99%, on ne peut pas conclure.
• 9000 appartient à l’intervalle de confiance à 99%, ils ont très vraisemblablement raison.
• Ils ont très vraisemblablement raison.

Exercice 7
On a trois groupes de copies corrigées par trois professeurs différents (groupe01, groupe02 et groupe03).

Question 15
Quelle est la note moyenne du premier groupe ?
• 12,24
• 13,17
• 10,89
• 11,05

Question 16
Quelle est la note moyenne du second groupe ?
• 12,24
• 13,17
• 10,89
• 11,05
Question 17
Quelle est la note moyenne du troisième groupe ?
• 12,24
• 13,17
• 10,89
• 11,05

Question 18

Quelle est l’écart-type des notes du premier groupe ?

• 2,77
• 3,17
• 2,73
• 3,16

Question 19
Quelle est l’écart-type des notes du second groupe ?
• 2,77
• 3,17
• 2,69
• 3,16
Question 20
Quelle est l’écart-type des notes du troisième groupe ?
• 2,77
• 3,17
• 2,73
• 3,16

Question 21

Peut-on dire que la moyenne des notes du premier groupe est approximativement égale à 12,5 ?
• Non, 12,5 appartient à l’intervalle de confiance à 99% autour de la moyenne.
• Non, 12,5 n’appartient pas à l’intervalle de confiance à 99% autour de la moyenne.
• Oui, 12,5 appartient à l’intervalle de confiance à 99% autour de la moyenne.
• Oui, 12,5 n’appartient pas à l’intervalle de confiance à 99% autour de la moyenne.
Question 22
Peut-on dire que la moyenne des notes du second groupe est approximativement égale à 12 ?
• Non, 12 appartient à l’intervalle de confiance à 99% autour de la moyenne.
• Non, 12 n’appartient pas à l’intervalle de confiance à 99% autour de la moyenne.
• Oui, 12 appartient à l’intervalle de confiance à 95% autour de la moyenne.
• Oui, 12 n’appartient pas à l’intervalle de confiance à 95% autour de la moyenne.

Question 23
Peut-on dire que la moyenne des notes du troisième groupe est approximativement égale à 12 ?
• Non, 12 appartient à l’intervalle de confiance à 99% autour de la moyenne.
• Oui, 12 n’appartient pas à l’intervalle de confiance à 99% autour de la moyenne.
• Oui, 12 appartient à l’intervalle de confiance à 99% autour de la moyenne.
• Non, 12 n’appartient pas à l’intervalle de confiance à 99% autour de la moyenne.

Question 24
Existe-t-il une difference entre les moyennes du premier et du second groupe ?
• 0 n’appartient pas à l’intervalle de confiance à 99%, il existe très vraisembablement une différence.
• 0 appartient à l’intervalle de confiance à 99%, il existe très vraisembablement une différence.
• 0 appartient à l’intervalle de confiance à 95%, on ne rejette pas l’hypothèse d’égalité des moyennes
• 0 n’appartient pas à l’intervalle de confiance à 95%, on rejette l’hypothèse d’égalité des moyennes
Question 25
Existe-t-il une difference entre les moyennes du second et du troisième groupe ?
• 0 n’appartient pas à l’intervalle de confiance à 99%, il existe très vraisembablement une différence.
• 0 appartient à l’intervalle de confiance à 99%, il existe très vraisembablement une différence.
• 0 appartient à l’intervalle de confiance à 95%, on ne rejette pas l’hypothèse d’égalité des moyennes
• 0 n’appartient pas à l’intervalle de confiance à 95%, on rejette l’hypothèse d’égalité des moyennes

Exercice 8

On veut expliquer les valeur de la variable Y en fonction des variables var01, var02, var03, var04, var05, var06
var07, var08, var09, et var10. Pour cela on utilise la technique de la régression linéaire.
La variable var05 est une variable qualitative pouvant prendre les valeurs “good” et “bad”.

Question 26
A-t-on suffisement de données ?
• Le nombre de données n’est pas imortant.
• Non, nous n’avons que 100 données.
• Non, nous avons pas le minimum de 30 données.
• Oui, on a plus de 100 données, ce qui est le minimum.

Question 27
Pourquoi peut-on affirmer que les résultats de la régression sont globalement significatif ?
• La p-value du test de Fisher est inférieure à 1%.
• Il y a beaucoup de variables significatives.
• Seule une variable a une p-value supérieure à 30%.
• On ne peut rien affirmer.
Question 28

Comment interpréte-t-on la variable “var05good” qui apparaît dans les résultats ?


• La valeur “good” a un effet négatif (et significatif) par rapport à la valeur “bad”.
• Il y a une erreur dans le fonctionnement de R-stat.
• La valeur “good” a un effet positif (et significatif) par rapport à la valeur “bad”.
• La valeur “good” appartient à l’intervalle de confiance à 99%.

Question 29
Quelles sont la ou les variables non significatives ?
• La variable var04 n’est pas significative et les variables var07 et var08 sont peu significatives.
• Les variables var08 et var09 ne sont pas significatives.
• La variable var05 n’est pas significative et les variables var06 et var01 sont peu significatives.
• La variable var10 n’est pas significative et les variables var04 et var09 sont peu significatives.
Question 30
Quelles variables ou quelle variables faut-il retirer pour avoir une meilleure régression ?
• Les variables var04, var07 et var08 qui sont peu significatives.
• La variable var04 qui n’est pas significative.
• La variable var04 dont la p-value est inférieure à 30%.
• La variable var04 dont la p-value est supérieure à 30%.

Question 31

Enlevez la ou les variables qui vous semblent non nécessaire. Qu’obtient-on ?


• La variable var07 devient significative.
• La variable var04 n’est toujours pas significative.
• La variable var07 n’est plus significative.
• La variable var07 est faiblement significative.
Questions subsidiaires

Question 32
Quelle est la raison (autre que la p-value) pour laquelle on retire une variable de la régression
• On a trop de variables.
• On manque d’autres variables.
• La variable explicative peut être aussi considérée comme une conséquence.
• La variable apporte approximativement la même information qu’une autre variable.

Question 33
Parmi ces animaux, lequel est le meilleur statisticien ?
• Le tardigrade
• Le rat-taupe-nu
• Les dinosaures
• Jojo le singe

Vous aimerez peut-être aussi