Vous êtes sur la page 1sur 70

UNITÉ D’ENSEIGNEMENT :

BASES POUR L’ANALYSE STATISTIQUE


DESCRIPTIVE ET INFÉRENTIELLE

Module 7
Statistique inférentielle :
tests d’hypothèse paramétriques

Exercices
d’application et d’intégration
(énoncés et procédures)
Module 7

Les exercices A l’issue de ce module,


à réaliser dans ce l’étudiant devra être capable de…
module se réfèrent
aux notions et
concepts du
syllabus de

« Bases pour l’analyse


statistique descriptive
et inférentielle »
(M. Bruyninckx, UMONS, 2019-2020)

7.1. Tester l’homogénéité des variances de


deux échantillons indépendants

7.2. Tester l’homogénéité des moyennes de


deux échantillons indépendants

Chapitre 2 7.3. Tester l’homogénéité des moyennes de


deux échantillons appareillés
Section 3 7.4. Tester la conformité de la moyenne d’un
Point 3.3 échantillon à celle d’une population
2
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


En statistique inférentielle, les tests d’hypothèse
permettent de vérifier si la différence observée entre deux
indices statistiques (ou entre un indice statistique et le
paramètre correspondant) a une signification statistique
ou non.

Au départ du test, on pose l’« hypothèse nulle », l’hypothèse selon laquelle la


différence observée est statistiquement nulle, n’est pas significative au point de vue
statistique. Le résultat du test permet de déterminer deux probabilités
complémentaires :  et 1-.
 est la probabilité d’accepter l’hypothèse nulle (AH0) ; c’est donc la probabilité que
la différence observée soit… due au hasard de l’échantillonnage,
due à une cause aléatoire,
non significative.
1- est la probabilité de rejeter l’hypothèse nulle (RH0) ; c’est donc la probabilité que
la différence observée soit… due à une cause systématique,
significative.

Par convention, on considère que quand…


 > .05 (et 1- < .95)
le test est non significatif (la différence observée est statistiquement nulle) : on peut AH0
 ≤ .05 (et 1- ≥ .95)
le test est significatif (la différence observée n’est pas statistiquement nulle,
elle est significative) : on peut RH0

Procédure générale pour l’application d’un test d’hypothèse


PROCÉDURE
1. Formuler l’hypothèse nulle du test.
2. Calculer la statistique appropriée au plan de données à traiter.
3. Comparer cette statistique aux intervalles de confiance déterminés
par les tables appropriées : déterminer les probabilités d’accepter
et de rejeter l’hypothèse nulle ( et 1-).
4. Interpréter le résultat du test et conclure en infirmant ou confirmant
l’hypothèse nulle posée au départ selon les valeurs conventionnelles
de l’accepter ou de la rejeter.
3
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


On peut distinguer deux catégories de tests :
les tests d’homogénéité (qui comparent les statistiques de deux
échantillons indépendants ou appareillés) et les tests de conformité
(qui comparent la statistique d’un échantillon au paramètre
correspondant dans la population).

 est alors aussi la probabilité que les 2


échantillons soient homogènes quant à  est alors aussi la probabilité que
l’indice comparé, ou issus d’une même l’échantillon soit conforme à la
population statistique. population quant à l’indice comparé.

1- est alors aussi la probabilité que les 1- est alors aussi la probabilité que
2 échantillons soient hétérogènes l’échantillon ne soit pas conforme à la
quant à l’indice comparé, ou issus de population quant à l’indice comparé.
populations statistiques différentes.

La détermination des valeurs d’ et de 1- pour l’interprétation


d’un test dépend également du nombre d’issues possibles.
Si on n’a pas d’a priori sur le sens de la différence entre
les indices comparés, l’interprétation se fait à
2 issues. Si on a un a priori, on peut justifier
une interprétation à 1 issue.

En « Bases pour l’analyse statistique descriptive


et inférentielle », on travaille 3 tests d’homogénéité
paramétriques et 1 test de conformité paramétrique.
(En « Techniques quantitatives paramétriques et non
paramétriques », d’autres techniques de tests seront
étudiées.)
4 Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des variances
de deux échantillons indépendants
7. 1
Le test F de Snedecor compare les variances de
2 échantillons indépendants de données métriques
(on cherche à savoir si les dispersions des données
dans chaque échantillon diffèrent significativement
ou si les échantillons sont homogènes quant
à leurs variances).

PROCÉDURE
1. Si nécessaire, déterminer les statistiques descriptives des
échantillons (effectifs, moyennes, écarts types).
2. Poser l’hypothèse nulle sur la différence des variances (H0).
3. Déterminer la variance estimée de chaque échantillon (soit son écart
type estimé élevé au carré).
4. Calculer le F de Snedecor :

ou
(toujours avec la variance estimée la plus grande au numérateur)
5. Déterminer les degrés de liberté pour l’interprétation du F (L1 étant
toujours calculé sur l’échantillon présentant la plus grande variance
estimée).
6. Déterminer les valeurs critiques des IC du F grâce aux tables pour
les valeurs de L1 et de L2.
7. Situer le F calculé entre ces valeurs et déterminer les valeurs d’ et
de 1-.
8. Interpréter le résultat du test en fonction de ces probabilités
d’accepter et de rejeter H0.
9. Statuer sur la significativité de la différence entre les variances et
conclure.
5
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Manipulation des tables de la loi de Snedecor
Les tables de la loi de Snedecor sont 3 tableaux à double entrée :
• par la ligne du haut, on « entre » dans la table par la valeur de L1 ;
• par la colonne de gauche, on « entre » dans la table par la valeur de L2 ;
• à l’intersection, on trouve la valeur critique du F pour le taux de confiance
susmentionné : ce sont les bornes supérieures des IC à .90, .95 et .99.

EXEMPLE
Si L1 = 12 et L2 =15

Quand L ne figure pas dans la


table, on prend en considération
le plus proche.

Rappel !
Les IC de F sont
toujours à 1 issue !

En situant le F calculé entre


ces valeurs critiques, on peut
déterminer les probabilités
d’AH0 ou de RH0.

.99
.95
.90

2.02 2.48 3.67


6
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


EXEMPLE
Deux groupes de sujets ont présenté la même épreuve, notée sur 20. Leurs résultats sont les
suivants :
N1 = 29 m1 = 15.80 1 = 2.74
N2 = 41 m2 = 14.75 2 = 2.81
Leurs résultats se dispersent-ils de manière homogène ?

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les variances des résultats des deux échantillons.
(Ou) La différence entre les variances des résultats des deux échantillons est due à une cause aléatoire, au
hasard.
(Ou) Les deux échantillons sont statistiquement homogènes quant aux variances de leurs résultats.
(Ou) Les deux échantillons proviennent d’une même population statistique quant aux variances de leurs
résultats.

2° Application du test F de Snedecor


Calcul du F :
²1est = ²1 x N1/L1 = 2.74² x 29/28 = 7.78 Attention !
C’est l’échantillon 2
²2est = ²2 x N2/L2 = 2.81² x 41/40 = 8.09 qui a la plus grande
variance estimée !
→ F = ²2est / ²1est = 8.09/7.78 = 1.04

3° Interprétation
Détermination des degrés de liberté :
L1 = N2 - 1 = 40 L2 = N1 - 1 = 28
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.59 1.82 2.35


F=1.04
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux échantillons
soit due à une cause aléatoire, que les échantillons proviennent d’une même population statistique.
ET
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux échantillons
soit due à une cause systématique, que les échantillons proviennent de populations statistiques
différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.
7
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.1.1

Après avoir mené l’expérience auprès de travailleurs d’une grande entreprise bruxelloise (cf.
résultats de l’énoncé 2.1.4), on a mesuré le sentiment de compétence de travailleurs d’une filiale
liégeoise de la même société. Le chercheur obtient les résultats suivants et souhaite savoir si les
distributions se dispersent de manière homogène.

29 19 20 8 36 20 21 32 16 30
33 37 26 14 22 26 29 35 9 30
26 28 9 32 30 30 12 17 35 21
34 19 36 6 28 30 14 19 18 33
36 21 15 12 15 19 37 16 31 22

Testez l’hypothèse nulle sur les variances en appliquant la technique appropriée et interprétez
les résultats pour répondre à cette question. Formulez une conclusion sur la base de la
probabilité d’accepter/rejeter l’hypothèse nulle.

Exercice d’application 7.1.2

Le concours de création littéraire auquel ont participé 32 adolescents (cf. résultats de l’énoncé
2.1.1) est réorganisé dans un autre pays de l’Organisation internationale de la Francophonie. Le
second échantillon de participants obtient les résultats suivants. Peut-on considérer que ces deux
échantillons proviennent d’une même population statistique quant à leurs variances ?

12.5 18 16.5 17 14 11.5 13 13 13.5


14 13.5 12 16 15.5 11 2 11.5 .5
18 16 7 14.5 17.5 19.5 16 14 11
14.5 10.5 12 15 15.5 14 17.5 17 16
6.5 12.5 14 10 18 5.5 14 18 9.5

Testez l’hypothèse nulle sur les variances en appliquant la technique appropriée et interprétez
les résultats pour répondre à cette question. Formulez une conclusion sur la base de la
probabilité d’accepter/rejeter l’hypothèse nulle.

Exercice d’application 7.1.3

Les élèves des deux classes ayant été évalués en mathématique par des enseignants appliquant
des critères docimologiques différents (l’énoncé 3.1.1) présentent-ils des résultats se dispersant de
manière significativement différente ?

Testez l’hypothèse nulle sur les variances en appliquant la technique appropriée et interprétez
les résultats pour répondre à cette question. Formulez une conclusion sur la base de la
probabilité d’accepter/rejeter l’hypothèse nulle.
8
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des moyennes
de deux échantillons indépendants
7. 2
Le test t de Student pour échantillons indépendants
Attention !
compare les moyennes de 2 échantillons de données
Le calcul du t de Student
métriques (on cherche à savoir si les moyennes des déprend de l’homogénéité
échantillons diffèrent significativement ou si les - ou non - des variances
échantillons sont homogènes quant (toujours vérifier le résultat du
F de Snedecor au préalable) !
à leurs moyennes).

PROCÉDURE
1. Si nécessaire, déterminer les statistiques descriptives des
échantillons (effectifs, moyennes, écarts types).
2. Si nécessaire, tester l’homogénéité des variances (test F de
Snedecor).
3. Poser l’hypothèse nulle sur la différence des moyennes (H0).
4. Déterminer les variances estimées des deux échantillons (soit leur
écart type estimé élevé au carré).
5. Calculer le t de Student :

ou
(en fonction de la significativité ou non du F)
6. Déterminer le degré de liberté pour l’interprétation du t (en fonction
de la formule du t qui a été appliquée).
7. Déterminer les valeurs critiques des IC du t grâce à la table pour la
valeur de L.
8. Situer le t calculé entre ces valeurs et déterminer les valeurs d’ et
de 1- (selon le nombre d’issues possibles du test).
9. Interpréter le résultat du test en fonction de ces probabilités
d’accepter et de rejeter H0.
10. Statuer sur la significativité de la différence entre les moyennes et
conclure.
9
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


EXEMPLE
Reprenons les données de l’exemple de la section 7.1 :
N1 = 29 m1 = 15.80 1 = 2.74
N2 = 41 m2 = 14.75 2 = 2.81
Les deux groupes ont-ils des résultats moyens statistiquement égaux ?

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats des deux échantillons.
(Ou) La différence entre les moyennes des résultats des deux échantillons est due à une cause aléatoire, au
hasard.
(Ou) Les deux échantillons sont statistiquement homogènes quant aux moyennes de leurs résultats.
(Ou) Les deux échantillons proviennent d’une même population statistique quant aux moyennes de leurs
résultats.

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧 𝑥 𝐩 𝑥 𝐪+ 41 x 2.81²)/68] = 2.82
+N
1m =2)/(N p 2-2)] = [(29 x 2.74²m
nx1+N = nxp
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 1.05 / [2.82 x
𝑥𝐩𝑥𝐪
(29+41)/(29 x41)] = 1.53

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 68
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.90
.80

0 1.30 1.68
t=1.53
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les moyennes des résultats des deux échantillons
soit due à une cause aléatoire, que les échantillons proviennent d’une même population statistique.
ET
Il y a moins de 90% de chance que la différence entre les moyennes des résultats des deux échantillons
soit due à une cause systématique, que les échantillons proviennent de populations statistiques
différentes.

On peut donc considérer que les moyennes des deux échantillons ne sont pas statistiquement
différentes et que les échantillons sont homogènes quant à leurs moyennes.
10
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.1

Après avoir comparé les variances des deux échantillons de travailleurs interrogés quant à leur
sentiment de compétence (cf. résultats de l’énoncé 7.1.1), le chercheur souhaite savoir si les
résultats moyens dans les deux entreprises sont homogènes.

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.2.2

Peut-on considérer que les deux échantillons d’adolescents francophones ayant participé au
concours de création littéraire (cf. résultats de l’énoncé 7.1.2) proviennent d’une même population
statistique quant à leurs résultats moyens ?

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.2.3

En sachant que les critères docimologiques utilisés par l’enseignant en mathématique de la classe
2 sont plus sévères que ceux de l’enseignant de la classe 1(cf. résultats de l’énoncé 7.1.3), les
résultats moyens de leurs élèves sont-ils significativement différents ?

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.2.4

L’examen pour l’évaluation certificative externe en fin de scolarité primaire comprend une épreuve
de « traitement des données ». La moyenne obtenue par les 25 élèves d’une école de la
commune est de 12/20 (avec un écart type de 5). Le directeur souhaite comparer ces résultats
avec ceux de cinq autres classes de l’entité dont les résultats sont les suivants. Ses élèves ont-ils
des résultats moyens équivalents à ceux des autres ?

1. NA = 25 mA = 11 A = 4
2. NB = 30 mB = 13 B = 4
3. NC = 20 mC = 14 C = 4
4. ND = 41 mD = 14.5 D = 3
5. NE = 24 mE = 16 E = 3

Pour chaque comparaison de la classe du directeur à chacune des cinq autres, testez
l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette question.
Formulez, pour chaque comparaison, une conclusion sur la base de la probabilité
d’accepter/rejeter l’hypothèse nulle.
11
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.5

Des tests d’acquisition de la lecture ont été effectués auprès d’élèves du début de l’enseignement
primaire. Dans chacune des cinq écoles participantes, deux classes ont été évaluées. Les données
sont présentées ci-dessous. Pour chaque école, peut-on dire que les résultats des élèves d’une des
deux classes de première année sont meilleurs que ceux des autres ?

1. N1 = 30 m1 = 13 1 = 5 N2 = 40 m2 = 9 2 = 4.5
2. N1 = 35 m1 = 12.5 1 = 5 N2 = 40 m2 = 10 2 = 3.5
3. N1 = 30 m1 = 14 1 = 3 N2 = 38 m2 = 13.5 2 = 4.5
4. N1 = 33 m1 = 11 1 = 2 N2 = 45 m2 = 13 2 = 2.5
5. N1 = 35 m1 = 12 1 = 1.5 N2 = 29 m2 = 10 2 = 3.5

Pour chaque comparaison de ces classes 2 à 2, testez l’hypothèse nulle sur les moyennes et
interprétez les résultats pour répondre à cette question. Formulez, pour chaque comparaison,
une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse nulle.

Exercice d’application 7.2.6

Afin d’évaluer le potentiel de 30 candidats à un emploi quant à leur possibilité de travailler de


manière flexible, le psychologue d’une société leur a fait passer un test de « capacité de
raisonnement abstrait » qui mesure la capacité de raisonnement intellectuel et logique. Outre les
résultats au test (noté sur 30), il a consigné le sexe du candidat et son expérience préalable en
matière d’occupation d’un emploi à responsabilités.

Sexe Expérience Résultat Sexe Expérience Résultat


Candidat préalable au test Candidat préalable au test
1 1 0 27 16 1 0 19
2 1 1 19 17 2 1 22
3 2 1 23 18 1 1 14
4 1 1 25 19 2 0 28
5 2 0 18 20 1 0 22
6 2 1 23 21 1 1 17
7 2 1 17 22 2 1 20
8 1 1 22 23 2 0 21
9 2 0 19 24 2 1 18
10 2 0 22 25 1 0 24
11 1 1 14 26 1 0 16
12 1 1 20 27 1 0 25
13 2 1 19 28 2 1 20
14 1 1 19 29 1 1 17
15 1 0 21 30 2 0 22
Légende : Sexe : Expérience :
1 : femme 0 : sans responsabilités
2 : homme 1 : avec responsabilités

Répondez aux questions suivantes.


1. Peut-il affirmer quels candidats féminins et masculins ont des résultats statistiquement
similaires ?
2. Peut-il considérer que les sujets présentent des résultats statistiquement différents selon leur
expérience professionnelle préalable ?
12
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.7

Pour les résultats des comparaisons des moyennes dans les situations suivantes, indiquez si les
propositions d’interprétation et de conclusions sont exactes.

1. Deux échantillons de sujets (27 francophones et 34 néerlandophones) ont présenté un examen


d’admission à un emploi dans la fonction publique. La comparaison de leurs résultats a montré
qu’ils se dispersaient de manière homogène et que le t de Student était égal à 1.48.

VRAI FAUX
1. Il y a moins de 90% de chance que la différence entre les moyennes des
échantillons soit significative.
2. Il y a plus de 10% de chance d’accepter l’hypothèse nulle sur la différence
des moyennes des deux groupes.
3. Il y a moins de 10% de chance que les sujets néerlandophones et
francophones constituent des échantillons hétérogènes quant à leur moyenne.
4. Il y a plus de 5% de chance que le hasard soit à l’origine des différences
observées entre les moyennes des deux groupes.
5. Il y a moins de 20% de chance qu’un groupe ait de meilleurs résultats moyens
que l’autre.

2. Les résultats d’un test psychométrique sur les capacités empathiques ont montré que les
distributions de données des 19 sujets de moins de 25 ans et des 15 sujets de 25 ans et plus se
dispersaient de manière significativement différente. La comparaison de leurs résultats moyens a
donné un t de Student égal à 2.79.

VRAI FAUX
1. Il y a plus de 99% de chance de rejeter l’hypothèse nulle sur la différence des
moyennes des deux groupes.
2. Il y a moins de 2% de chance que la différence entre les moyennes des deux
groupes soit due à une cause aléatoire.
3. Il y a plus de 98% de chance que les sujets de moins de 25 ans et de 25 ans
et plus aient obtenu des résultats moyens homogènes.
4. On peut conclure de cette expérience que les sujets ne présentent pas de
capacités empathiques significativement différentes en fonction de leur âge.
5. Il y a plus de 95% de chance qu’une cause systématique soit à l’origine des
différences observées entre les moyennes des deux groupes.
13
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


3. Cinq classes d’élèves de l’enseignement secondaire ont passé un test de connaissance sur les
effets du réchauffement climatique (noté sur 50). Pour chacune d’elles, on a comparé les résultats
des filles et des garçons, en pensant a priori que les premières avaient de meilleures
connaissances. Dans tous les cas de figure, l’homogénéité des variances de leurs résultats a été
confirmée.

VRAI FAUX
1. NF= 14 mF = 27 NG = 16 mG = 23 t = 7.57
Il y a plus de 999.5% de chance que les filles aient un résultat moyen
significativement meilleur que celui des garçons.
2. NF= 13 mF = 30 NG = 19 mG = 31 t = 1.22
Il y a plus de 10% de chance que la différence entre les moyennes des filles et
des garçons soit non significative.
3. NF= 17 mF = 34 NG = 18 mG = 32 t = 2.65
Il y a plus de 99% de chance que les filles aient un résultat moyen significativement
inférieur à celui des garçons.
4. NF= 21 mF = 26 NG = 12 mG = 28 t = 2.80
Il y a moins de .5% de chance que les filles et les garçons aient des résultats
significativement différents.
5. NF= 19 mF = 31 NG = 22 mG = 32 t = 1.69
Il y a entre 5% et 10% de chance d’accepter l’hypothèse nulle sur la différence
des résultats moyens des filles et des garçons.

14
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des moyennes
de deux échantillons appareillés
7. 3
Le test t de Student pour échantillons appareillés
compare 2 séries de données métriques d’un même
groupe de sujets (on cherche à savoir si, en moyenne,
les échantillons diffèrent significativement
ou s’ils sont homogènes).

PROCÉDURE
1. Pour chaque sujet, calculer la différence entre ses deux mesures
individuelles (toujours dans le même sens).
2. Calculer la moyenne (mD) et l’écart type (D) de la distribution de ces
différences.
3. Poser l’hypothèse nulle sur la différence des moyennes (H0).
4. Calculer le t de Student :

5. Déterminer le degré de liberté pour l’interprétation du t.


6. Déterminer les valeurs critiques des IC du t grâce à la table pour la
valeur de L.
7. Situer le t calculé entre ces valeurs et déterminer les valeurs d’ et
de 1- (selon le nombre d’issues possibles du test).
8. Interpréter le résultat du test en fonction de ces probabilités
d’accepter et de rejeter H0.
9. Statuer sur la significativité de la différence entre les moyennes et
conclure.
15
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


EXEMPLE
Supposons que 170 sujets aient participé à une formation sur la mise en œuvre de méthodes
pédagogiques basées sur les technologies. Ils ont passé deux épreuves de connaissances, notées
sur 100, pour vérifier si elles ont évolué grâce à la formation. La moyenne et l’écart type des
évolutions individuelles ont été calculées :
N = 170 mD = 1.37 D = 9.93
Peut-on considérer que la formation a eu un effet positif sur le niveau de connaissance des
participants ?

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des sujets aux deux épreuves. Les deux échantillons
appareillés sont homogènes quant à leurs moyennes. La différence entre les moyennes est due à une
cause aléatoire, au hasard. La formation n’a pas eu d’effet sur le niveau moyen de connaissances des
sujets.

2° Application du test t de Student


Calcul du t m
pour=
échantillons
nxp appareillés
m: = nxp
tapp = mD / 
[D =
x 1/ 𝐧 𝑥𝐩
(N-1)] =𝑥
1.37/ =
𝐪 [9.93 x 1/ 𝐧 𝑥 𝐩=
(170-1)] 𝑥 1.79
𝐪
Remarque !
Si on avait interprété
3° Interprétation le test à 2 issues,  aurait été
compris entre .05 et .10
Détermination du degré de liberté : et on n’aurait pas pu formuler les
mêmes conclusions !
L = N-1 = 169
Détermination des valeurs critiques dans la table de Student :
(Pour L = 120 dans la table ; à 1 issue : on peut justifier un a priori sur le sens de la différence, on peut en
effet s’attendre à ce que la formation ait amélioré le niveau de connaissances des sujets)

.975

.95

0 1.66 1.98
t=1.79
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les moyennes sont statistiquement différentes).

4° Conclusion
Il y a moins de 5% de chance que les moyennes des résultats des sujets aux deux épreuves soient
statistiquement égales, que les échantillons soient homogènes quant à leurs résultats moyens, que la
différence entre les moyennes soit due à une cause aléatoire.
ET
Il y a plus de 95% de chance que les moyennes des résultats des sujets aux deux épreuves soient
statistiquement différentes, que les échantillons soient hétérogènes quant à leurs résultats moyens, que
la différence entre les moyennes soit due à une cause systématique.

On peut donc considérer que les résultats moyens aux épreuves sont statistiquement différents
et que la formation a eu un effet significatif sur le niveau de connaissances des sujets.
16 Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.3.1

Dans une classe de 10 élèves, on évalue la performance à un test de lecture à une semaine
d’intervalle. Les résultats sont les suivants. Ont-ils significativement évolué d’un test à l’autre ?

Élèves Test 1 Test 2


1 8 9
2 7 7
3 6 6
4 7 8
5 4 3
6 7 6
7 6 8
8 9 8
9 8 9
10 6 5

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.3.2

Un psychologue travaillant dans un centre de nutrition a mis au point, sur la base d’études montrant
l’efficacité de techniques équivalentes, une nouvelle méthode visant à renforcer la motivation des
patients suivant un régime alimentaire pour perdre du poids. Les résultats suivants montrent
l’évolution pondérale de 22 patients à un mois d’intervalle. Peut-il considérer que les patients ayant
suivi sa méthode ont un poids moyen moins élevé après un mois de traitement ?

Patients Poids en avril (en kilos) Poids mai (en kilos)


1 97 91
2 91 89
3 89 91
4 86 83
5 96 87
6 95 88
7 98 97
8 104 96
9 87 88
10 89 89
11 87 94
12 105 96
13 86 81
14 116 103
15 95 92
16 87 81
17 102 95
18 92 88
19 85 81
20 99 96
21 94 93
22 90 88

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
17

nulle.
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.3.3

A partir des données de l’énoncé 2.1.5 (résultats de 24 étudiants à deux examens), peut-on dire
qu’ils ont significativement mieux réussi un examen que l’autre ?

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.3.4

A partir des données de l’énoncé 2.1.6 (résultats quant aux capacités mnésiques de patients),
peut-on dire que les deux épreuves utilisées donnent des résultats statistiquement équivalents ?

Testez l’hypothèse nulle sur les moyennes et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

18
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester la conformité de la moyenne
d’un échantillon à celle d’une population
7. 4
Le test t de Student de conformité compare la
moyenne d’1 échantillon à celle de sa population
de provenance (on cherche à savoir si la moyenne de
l’échantillon diffère significativement de celle de la
population ou s’il lui est conforme à la
population quant à l'indice mesuré).

PROCÉDURE
1. Si nécessaire, déterminer les statistiques descriptives de
l’échantillon (effectif, moyenne, écart type).
2. Poser l’hypothèse nulle sur la différence des moyennes (H0).
3. Calculer l’erreur type sur la moyenne :

4. Calculer le t de Student (avec A, la moyenne de la population):

5. Déterminer le degré de liberté pour l’interprétation du t.


6. Déterminer les valeurs critiques des IC du t grâce à la table pour la
valeur de L.
7. Situer le t calculé entre ces valeurs et déterminer les valeurs d’ et
de 1- (selon le nombre d’issues possibles du test).
8. Interpréter le résultat du test en fonction de ces probabilités
d’accepter et de rejeter H0.
9. Statuer sur la significativité de la différence entre les moyennes et
conclure.
19
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


EXEMPLE
Supposons que 25 enfants aient passé un test de performance visuo-spatiale (dont on sait que le
résultat moyen pour la population des enfants du même âge vaut 83). Leurs résultats sont les
suivants :
N = 25 m = 78.5  = 9.76 et A = 83
Peut-on considérer que les enfants de l’échantillon présentent des performances moyennes
conformes à celles de la population ?

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre le résultat moyen des enfants de l’échantillon au test de
performance visuo-spatiale et celle de la population. Le résultat moyen des sujets l’échantillon est conforme
à celui des sujets de la population. La différence entre les moyennes est due à une cause aléatoire, au
hasard.
2° Application du test t de Student
Calcul
m =duntxde
pm conformité
= nxp:
S =
m = /
𝐧
L= =𝑥 𝐪
𝑥9.76/
𝐩 𝐧
24 𝑥
=𝐩 𝑥𝐪
1.99
tc = |m - A|/ Sm = 4.5 / 1.99 = 2.26

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 24
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.98
.95

0 2.06 2.49
t=2.26
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 5% de chance que la différence entre le résultat moyen des enfants de l’échantillon au
test de performance visuo-spatiale et celui de la population soit due à une cause aléatoire, que
l’échantillon soit conforme à la population quant à sa moyenne.
ET
Il y a plus de 95% de chance que la différence entre le résultat moyen des enfants de l’échantillon au
test de performance visuo-spatiale et celui de la population soit due à une cause systématique, que
l’échantillon ne soit pas conforme à la population quant à sa moyenne.

On peut donc considérer que le résultat moyen des enfants de l’échantillon au test de
performance visuo-spatiale est statistiquement différent de celui de la population et que
l’échantillon ne lui est donc pas conforme. Les enfants de l’échantillon présentent un résultat
20

moyen significativement inférieur à celui de la population.


Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.1

On a évalué le poids moyen de 80 femmes âgées de 30 à 35 ans à 64 kilos (avec un écart type
de 3.5). Le poids moyen des femmes du même âge dans la population belge étant de 66 kilos,
peut-on dire que celui déterminé sur l’échantillon lui est bien conforme ?

Testez l’hypothèse nulle sur la moyenne et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.4.2

A partir des données de l’énoncé 2.1.3 (taille des élèves), et en sachant que la taille moyenne des
élèves de 6ème année du secondaire de l’ensemble de la population vaut 171.18 cm ( = 7.56),
peut-on considérer que les élèves de l’échantillon ne sont ni plus grands ni plus petits que les
autres ?

Testez l’hypothèse nulle sur la moyenne et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.4.3

A partir des données groupées de l’énoncé 2.2.6 (résultats de 400 étudiants), peut-on affirmer que
les sujets de l’échantillon font preuve de performances statistiquement différentes de celles de
l’ensemble de jeunes du même âge de la population dont on sait que la note moyenne s’élève
à 19.6/30 ( = 2.3) ?

Testez l’hypothèse nulle sur la moyenne et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.

Exercice d’application 7.4.4

A partir des données de l’énoncé 1.2.8 (nombre de pièces produites par jour par 103 ouvriers),
peut-on affirmer que cet échantillon présente une productivité quotidienne meilleure que celle
des ouvriers des usines du même secteur pour l’ensemble du pays (qui s’élève à 73.4 pièces
produites en moyenne, avec un écart type de 6.5) ?

Testez l’hypothèse nulle sur la moyenne et interprétez les résultats pour répondre à cette
question. Formulez une conclusion sur la base de la probabilité d’accepter/rejeter l’hypothèse
nulle.
21
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.5

Un psychologue d’un Centre psycho-médicosocial fait passer la WISC (test d’intelligence) à


5 groupes d’enfants de 11-12 ans en vue de déterminer leur « quotient intellectuel » moyen. Les
résultats sont les suivants. En sachant que dans la population, le QI moyen vaut 100 (pour un écart
type de 15), déterminez, pour chaque classe, si son QI moyen est conforme à celui de la
population.

1. NA = 25 mA = 106 A = 12
Le t de conformité vaut :
 4.73  2.18  1.11  2.45  3.19

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a moins de 1% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.
 Il y a moins de 5% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la classe
et celui de la population.
 Il y a plus de 95% de chance que QI moyen de la classe ne soit pas conforme à celui de la population.
 Il y a plus de 98% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a moins de 2% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la classe
et celui de la population.

2. NB = 30 mB = 102 B = 10
Le t de conformité vaut :
 5.63  1.08  .88  3.27  2.09

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a plus de 20% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la classe et
celui de la population.
 Il y a moins de 2% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.
 Il y a plus de 90% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a entre 60% et 80% de chance que QI moyen de la classe ne soit pas conforme à celui de la
population.
 Il y a moins de 80% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.
22
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


3. NC = 27 mC = 94 C = 9
Le t de conformité vaut :
 5.84  4.31  1.40  3.79  3.16

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a moins de 1% de chance que la différence entre le QI moyen de la classe et celui de la population
ne soit pas significative.
 Il y a moins de 99% de chance qu’il y ait une différence significative entre le QI moyen de la classe et
celui de la population.
 Il y a moins de 1% de chance que les élèves de cette classe présentent un QI moyen significativement
meilleur que celui de la population.
 Il y a plus de 99% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a moins de 90% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.

4. ND = 18 mD = 105 D = 13
Le t de conformité vaut :
 1.59  6.45  2.93  3.12  .93

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a plus de 10% de chance que la différence entre le QI moyen de la classe et celui de la population
ne soit pas significative.
 Il y a entre 20% et 40% de chance que les élèves de cette classe présentent un QI moyen statistiquement
égale à celui de la population.
 Il y a entre 10% et 20% de chance que les élèves de cette classe présentent un QI moyen
significativement meilleur que celui de la population.
 Il y a moins de 90% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a entre 10% et 20% de chance que la différence entre le QI moyen de la classe et celui de la
population ne soit pas significative.
23
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


5. NE = 23 mE = 83 E = 15
Le t de conformité vaut :
 1.45  .29  3.65  7.83  5.08

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .02  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a moins de 5% de chance que la différence entre le QI moyen de la classe et celui de la population
ne soit pas significative.
 Il y a plus de 99.9% de chance que les élèves de cette classe présentent un QI moyen significativement
inférieur à celui de la population.
 Il y a moins de .1% de chance que le QI moyen de la population soit significativement meilleur que celui
des élèves de cette classe.
 Il y a moins de 95% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a plus de 95% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.

24
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


UNITÉ D’ENSEIGNEMENT :
BASES POUR L’ANALYSE STATISTIQUE
DESCRIPTIVE ET INFÉRENTIELLE

Module 7
Statistique descriptive :
tests d’hypothèse paramétriques

Exercices
d’application et d’intégration
(solutions)
25
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des variances
de deux échantillons indépendants
7. 1
Exercice d’application 7.1.1

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les variances des résultats des deux échantillons de travailleurs.
(Ou) La différence entre les variances des résultats des deux échantillons de travailleurs est due à une cause
aléatoire, au hasard.
(Ou) Les deux échantillons de travailleurs sont statistiquement homogènes quant aux variances de leurs
résultats.
(Ou) Les deux échantillons de travailleurs proviennent d’une même population statistique quant aux
variances de leurs résultats.

2° Application du test F de Snedecor


Détermination des statistiques descriptives :
N1 = 60 m1 = 23.33 1 = 9.12
N2 = 50 m2 = 23.86 2 = 8.70 (calculés par la machine)
Calcul du F :
²1est = ²1 x N1/L1 = 9.12² x 60/59 = 84.58
²2est = ²2 x N2/L2 = 8.70² x 50/49 = 77.23

→ F = ²1est / ²2est = 84.58/77.23 = 1.10

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 59 L2 = N2 - 1 = 49
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 60 et L2 = 40 dans les tables)

.99
.95
.90

1.47 1.64 2.02


F=1.10

Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).
26
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a plus de 10% de chance que les variances des résultats des travailleurs des deux échantillons soient
statistiquement égales, que les échantillons soient homogènes quant à la dispersion de leurs résultats,
qu’ils proviennent d’une même population statistique, que la différence entre les variances soit due à une
cause aléatoire.
Il y a moins de 90% de chance que les variances des résultats des travailleurs des deux échantillons soient
statistiquement différentes, que les échantillons soient hétérogènes quant à la dispersion de leurs résultats,
qu’ils proviennent de populations statistiques différentes, que la différence entre les variances soit due à
une cause systématique.

Le chercheur peut donc considérer que les variances des deux échantillons sont
statistiquement égales et que les deux distributions se dispersent de manière homogène.

Exercice d’application 7.1.2

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les variances des résultats des deux échantillons d’adolescents.
(Ou) La différence entre les variances des résultats des deux échantillons d’adolescents est due à une cause
aléatoire, au hasard.
(Ou) Les deux échantillons d’adolescents sont statistiquement homogènes quant aux variances de leurs
résultats.
(Ou) Les deux échantillons d’adolescents proviennent d’une même population statistique quant aux
variances de leurs résultats.

2° Application du test F de Snedecor


Détermination des statistiques descriptives :
N1 = 32 m1 = 12.70 1 = 4.48
N2 = 45 m2 = 13.30 2 = 4.06 (calculés par la machine)
Calcul du F :
²1est = ²1 x N1/L1 = 4.48² x 32/31 = 20.72
²2est = ²2 x N2/L2 = 4.06² x 45/44 = 16.86

→ F = ²1est / ²2est = 20.72/16.86 = 1.23

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 31 L2 = N2 - 1 = 44
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 30 et L2 = 40 dans les tables)

.99
.95
.90

1.54 1.74 2.20


F=1.23
27
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que les variances des résultats des adolescents des deux échantillons soient
statistiquement égales, que les échantillons soient homogènes quant à la dispersion de leurs résultats,
qu’ils proviennent d’une même population statistique, que la différence entre les variances soit due à une
cause aléatoire.
Il y a moins de 90% de chance que les variances des résultats des adolescents des deux échantillons
soient statistiquement différentes, que les échantillons soient hétérogènes quant à la dispersion de leurs
résultats, qu’ils proviennent de populations statistiques différentes, que la différence entre les variances
soit due à une cause systématique.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux échantillons proviennent d’une même population quant à leurs variances.

Exercice d’application 7.1.3

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les variances des résultats des deux classes.
(Ou) La différence entre les variances des résultats des deux classes est due à une cause aléatoire, au
hasard.
(Ou) Les deux classes sont statistiquement homogènes quant aux variances de leurs résultats.
(Ou) Les deux classes proviennent d’une même population statistique quant aux variances de leurs résultats.

2° Application du test F de Snedecor


Rappel des statistiques descriptives (calculés au « Module 3 ») :
N1 = 11 m1 = 13.68 1 = 3.42
N2 = 12 m2 = 16.79 2 = 1.44
Calcul du F :
²1est = ²1 x N1/L1 = 3.41² x 11/10 = 12.87
²2est = ²2 x N2/L2 = 1.44² x 12/11 = 2.26

→ F = ²1est / ²2est = 12.87/2.26 = 5.69

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 10 L2 = N2 - 1 = 11
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

2.25 2.85 4.54


28

F=5.69
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  = .01 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que les variances des résultats des deux classes soient statistiquement
égales, que les classes soient homogènes quant à la dispersion de leurs résultats, qu’ils proviennent d’une
même population statistique, que la différence entre les variances soit due à une cause aléatoire.
Il y a plus de 99% de chance que les variances des résultats des deux classes soient statistiquement
différentes, que les classes soient hétérogènes quant à la dispersion de leurs résultats, qu’ils proviennent
de populations statistiques différentes, que la différence entre les variances soit due à une cause
systématique.

On peut donc considérer que les variances des deux classes ne sont pas statistiquement égales
et que leurs résultats se dispersent bien de manière significativement différente.

29
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des moyennes
de deux échantillons indépendants
7. 2
Exercice d’application 7.2.1

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats des deux échantillons de travailleurs.
(Ou) La différence entre les moyennes des résultats des deux échantillons de travailleurs est due à une cause
aléatoire, au hasard.
(Ou) Les deux échantillons de travailleurs sont statistiquement homogènes quant aux moyennes de leurs
résultats.
(Ou) Les deux échantillons de travailleurs proviennent d’une même population statistique quant aux
moyennes de leurs résultats.

2° Application du test t de Student


Rappel des statistiques descriptives :
N1 = 60 m1 = 23.33 1 = 9.12
N2 = 50 m2 = 23.86 2 = 8.70
Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧 𝑥 𝐩 𝑥 𝐪+ 50 x 8.70²)/(108)] = 9.01
+N
1m =2)/(N p 2-2)] = [(60 x 9.12²
nx1+N m = nxp
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = .53 / [9.01 x
𝑥𝐩𝑥𝐪
(60+50)/(60x50)] = .31

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 108
Détermination des valeurs critiques dans la table de Student :
(Pour L = 120 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .845
t = .31

Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).
30
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a plus de 40% de chance que les moyennes des résultats des travailleurs des deux échantillons soient
statistiquement égales, que les échantillons soient homogènes quant à leurs résultats moyens, qu’ils
proviennent d’une même population statistique, que la différence entre les moyennes soit due à une
cause aléatoire.
Il y a moins de 60% de chance que les moyennes des résultats des travailleurs des deux échantillons
soient statistiquement différentes, que les échantillons soient hétérogènes quant à leurs résultats moyens,
qu’ils proviennent de populations statistiques différentes, que la différence entre les moyennes soit due à
une cause systématique.

Le chercheur peut donc considérer que les moyennes des deux échantillons sont
statistiquement égales, que les résultats moyens dans les deux entreprises sont bien
homogènes.

Exercice d’application 7.2.2

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats des deux échantillons d’adolescents.
(Ou) La différence entre les moyennes des résultats des deux échantillons d’adolescents est due à une cause
aléatoire, au hasard.
(Ou) Les deux échantillons d’adolescents sont statistiquement homogènes quant aux moyennes de leurs
résultats.
(Ou) Les deux échantillons d’adolescents proviennent d’une même population statistique quant aux
moyennes de leurs résultats.

2° Application du test t de Student


Rappel des statistiques descriptives :
N1 = 32 m1 = 12.70 1 = 4.48
N2 = 45 m2 = 13.30 2 = 4.06
Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧 𝑥 𝐩 𝑥 𝐪+ 45 x 4.06²)/(75)] = 4.30
+N
1m =2)/(N p 2-2)] = [(32 x 4.48²
nx1+N m = nxp
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = .60 / [4.30 x
𝑥𝐩𝑥𝐪
(32+45)/(32x45)] = .60

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 75
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .848
t = .60
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
31

globalement non significatif (pas de différences entre les moyennes).


Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a plus de 40% de chance que les moyennes des résultats des adolescents des deux échantillons
soient statistiquement égales, que les échantillons soient homogènes quant à leurs résultats moyens, qu’ils
proviennent d’une même population statistique, que la différence entre les moyennes soit due à une
cause aléatoire.
Il y a moins de 60% de chance que les moyennes des résultats des adolescents des deux échantillons
soient statistiquement différentes, que les échantillons soient hétérogènes quant à leurs résultats moyens,
qu’ils proviennent de populations statistiques différentes, que la différence entre les moyennes soit due à
une cause systématique.

Le chercheur peut donc considérer que les moyennes des deux échantillons sont
statistiquement égales, que les deux groupes d’adolescents francophones proviennent bien
d’une même population.

Exercice d’application 7.2.3

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats des deux classes.
(Ou) La différence entre les moyennes des résultats des deux classes est due à une cause aléatoire, au
hasard.
(Ou) Les deux classes sont statistiquement homogènes quant aux moyennes de leurs résultats.
(Ou) Les deux classes proviennent d’une même population statistique quant aux moyennes de leurs résultats.

2° Application du test t de Student


Rappel des statistiques descriptives (calculées au « Module 3 ») :
N1 = 11 m1 = 13.68 1 = 3.42
N2 = 12 m2 = 16.79 2 = 1.44
Calcul du m
t (pour
=unnF xdepSnedecor significatif) : m = nxp
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est ²2est /N2)=
/N1𝑥+ 𝐪 =/
3.11 𝐧 𝑥𝐩𝑥𝐪
[(12.87/11)+(2.26/12)] = 2.67

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 10.5
Détermination des valeurs critiques dans la table de Student :
(Pour L = 10 dans la table ; à 1 issue : on peut justifier un a priori sur le sens de la différence, on peut en
effet s’attendre à m2>m1)

.99

.975

0 2.23 2.76
t=2.67
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .975 et  < .025
Il y a donc moins de 2.5% de chance d’AH0 et plus de 97.5% de chance de RH0. Le test est
donc significatif à  .025 (les moyennes sont statistiquement différentes).
32
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a moins de 2.5% de chance que les moyennes des résultats des deux classes soient statistiquement
égales, que les échantillons soient homogènes quant à leurs résultats moyens, qu’ils proviennent d’une
même population statistique, que la différence entre les moyennes soit due à une cause aléatoire.
Il y a plus de 97.5% de chance que les moyennes des résultats des deux classes soient statistiquement
différentes, que les échantillons soient hétérogènes quant à leurs résultats moyens, qu’ils proviennent de
populations statistiques différentes, que la différence entre les moyennes soit due à une cause
systématique.

On peut donc considérer que les résultats moyens des deux classes, évaluées par des
enseignants différents, sont statistiquement différents.

Exercice d’application 7.2.4

1. Comparaison à la classe A

Détermination des statistiques descriptives :


NO = 25 mO = 12 O = 5
NA = 25 mA = 11 A = 4

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 25/24 = 26.04
²2est = ²2 x N2/L2 = 4² x 25/24 = 16.67

→ F = ²1est / ²2est = 26.04/16.67 = 1.56

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 24 L2 = N2 - 1 = 24
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.70 1.98 2.66


F=1.56
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).
33
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.

COMPARAISON DES MOYENNES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧𝑥𝐩𝑥 +𝐪
+N
1m =2)/(N p 2-2)] = [(25 x 5²m
nx1+N =xn
25 4²)/48]
xp = 4.62
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 1 / [4.62 x
𝑥𝐩𝑥𝐪
(25+25)/(25x25)] = .77

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 48
Détermination des valeurs critiques dans la table de Student :
(Pour L = 40 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .851
t = .77

Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 40% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 60% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement égales,
que les deux classes ont des résultats statistiquement équivalents.
34
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


2. Comparaison à la classe B

Détermination des statistiques descriptives :


NO = 25 mO = 12 O = 5
NB = 30 mB = 13 B = 4

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 25/24 = 26.04
²2est = ²2 x N2/L2 = 4² x 30/29 = 16.55

→ F = ²1est / ²2est = 26.04/16.55 = 1.57

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 24 L2 = N2 - 1 = 29
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.65 1.90 2.49


F=1.57
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.
35
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧𝑥𝐩𝑥 +𝐪
+N
1m =2)/(N p 2-2)] = [(25 x 5²m
nx1+N =xn
30 4²)/53]
xp = 4.57
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 1 / [4.57 x
𝑥𝐩𝑥𝐪
(25+30)/(25x30)] = .81

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 53
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .848
t = .81

Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 40% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 60% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement égales,
que les deux classes ont des résultats statistiquement équivalents.
36
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


3. Comparaison à la classe C

Détermination des statistiques descriptives :


NO = 25 mO = 12 O = 5
NB = 20 mB = 14 B = 4

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 25/24 = 26.04
²2est = ²2 x N2/L2 = 4² x 20/19 = 16.84

→ F = ²1est / ²2est = 26.04/16.55 = 1.55

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 24 L2 = N2 - 1 = 19
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.79 2.11 2.92


F=1.55
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.
37
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧𝑥𝐩𝑥 +𝐪
+N
1m =2)/(N p 2-2)] = [(25 x 5²m
nx1+N =xn
20 4²)/43]
xp = 4.69
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 1 / [4.69 x
𝑥𝐩𝑥𝐪
(25+20)/(25x20)] = 1.42

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 43
Détermination des valeurs critiques dans la table de Student :
(Pour L = 40 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.90
.80

0 1.30 1.68
t=1.42
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a moins de 90% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement égales,
que les deux classes ont des résultats statistiquement équivalents.
38
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4. Comparaison à la classe D

Détermination des statistiques descriptives :


NO = 25 mO = 12 O = 5
NB = 41 mB = 14.5 B = 3

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 25/24 = 26.04
²2est = ²2 x N2/L2 = 3² x 41/40 = 9.23

→ F = ²1est / ²2est = 26.04/9.23 = 2.82

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 24 L2 = N2 - 1 = 40
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.57 1.79 2.29


F=2.82
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a plus de 99% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement
différentes et que les deux distributions se dispersent de manière hétérogène.
39
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test t de Student


Calcul du m
t (pour :
=unnF xdepSnedecor significatif) m = nxp
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est /N1𝑥+ 𝐪 2.5
²2est /N2)= =/ 𝐧 𝑥𝐩𝑥𝐪
[(26.04/25)+(9.23/41)] = 2.22

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 32

Détermination des valeurs critiques dans la table de Student :


(Pour L = 30 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.98
.95

0 2.04 2.46
t=2.22
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 5% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a plus de 95% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes.
40
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


5. Comparaison à la classe E

Détermination des statistiques descriptives :


NO = 25 mO = 12 O = 5
NB = 24 mB = 16 B = 3

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 25/24 = 26.04
²2est = ²2 x N2/L2 = 3² x 24/23 = 9.39

→ F = ²1est / ²2est = 26.04/9.39 = 2.77

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 24 L2 = N2 - 1 = 23
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.72 2.01 2.70


F=2.77
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a plus de 99% de chance que la différence entre les variances des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement
différentes et que les deux distributions se dispersent de manière hétérogène.
41
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes à l’épreuve de
« traitement des données ».

2° Application du test t de Student


Calcul du m
t (pour m: = nxp
=unnF xdepSnedecor significatif)
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est ²2est /N
/N1𝑥+ 𝐪 =
2)= 4 /
𝐧 𝑥𝐩𝑥𝐪
[(26.04/25)+(9.39/24)] = 3.34

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 23.5
Détermination des valeurs critiques dans la table de Student :
(Pour L = 23 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.999
.99

0 2.81 3.77
t=3.34
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause aléatoire, que les échantillons proviennent
d’une même population statistique.
Il y a plus de 99% de chance que la différence entre les moyennes des résultats des deux classes à
l’épreuve de « traitement des données » soit due à une cause systématique, que les échantillons
proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes.
42
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.5

1. Comparaison de la paire 1

Détermination des statistiques descriptives :


N1 = 30 m1 = 13 1 = 5
N2 = 40 m2 = 9 2 = 4.5

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 30/29 = 25.86
²2est = ²2 x N2/L2 = 4.5² x 40/39 = 20.77

→ F = ²1est / ²2est = 25.86/20.77 = 1.25

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 29 L2 = N2 - 1 = 39
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 30 et L2 = 40 dans les tables)

.99
.95
.90

1.54 1.74 2.20


F=1.25
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.
43
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧𝑥𝐩𝑥 +𝐪
+N
1m =2)/(N p 2-2)] = [(30 x 5²m
nx1+N =xn
40 4.5²)/68]
xp = 4.79
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 4 / [4.79 x
𝑥𝐩𝑥𝐪
(30+40)/(30x30)] = 3.46 (3.4575)

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 68
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.999
.99

0 2.66 3.46
t=3.46
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a plus de 99% de chance que la différence entre les moyennes des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes et que les résultats moyens de la classe 1 sont significativement meilleurs que ceux
de la classe 2.
44
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


2. Comparaison de la paire 2

Détermination des statistiques descriptives :


N1 = 35 m1 = 12.5 1 = 5
N2 = 40 m2 = 10 2 = 3.5

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 5² x 35/34 = 25.74
²2est = ²2 x N2/L2 = 3.5² x 40/39 = 12.56

→ F = ²1est / ²2est = 25.74/12.56 = 2.05

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 34 L2 = N2 - 1 = 39
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 30 et L2 = 40 dans les tables)

.99
.95
.90

1.54 1.74 2.20


F=2.05
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 5% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a plus de 95% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement
différentes et que les deux distributions se dispersent de manière hétérogène.
45
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test t de Student


Calcul du m
t (pour :
=unnF xdepSnedecor significatif) m = nxp
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est /N1𝑥+ 𝐪 2.5
²2est /N2)= =/ 𝐧 𝑥𝐩𝑥𝐪
[(25.74/35)+(12.56/40)] = 2.44

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 36.5
Détermination des valeurs critiques dans la table de Student :
(Pour L = 40 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.99
.98

0 2.42 2.70
t=2.44
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .98 et  < .02
Il y a donc moins de 2% de chance d’AH0 et plus de 98% de chance de RH0. Le test est donc
significatif à  .02 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 2% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a plus de 98% de chance que la différence entre les moyennes des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes et que les résultats moyens de la classe 1 sont significativement meilleurs que ceux
de la classe 2.
46
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


3. Comparaison de la paire 3

Détermination des statistiques descriptives :


N1 = 30 m1 = 14 1 = 3
N2 = 38 m2 = 13.5 2 = 4.5

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 3² x 30/29 = 9.31
²2est = ²2 x N2/L2 = 4.5² x 38/37 = 20.80

→ F = ²2est / ²1est = 20.80/9.31= 2.23 (Attention : ²2est > ²1est)

3° Interprétation
Détermination des degrés de liberté :
L1 = N2 - 1 = 37 L2 = N1 - 1 = 29
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 40 et L2 = 29 dans les tables)

.99
.95
.90

1.58 1.81 2.33


F=2.23
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 5% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a plus de 95% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement
différentes et que les deux distributions se dispersent de manière hétérogène.
47
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test t de Student


Calcul du m
t (pour : = nxp
=unnF xdepSnedecor significatif)m
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est ²2est /N2
/N1𝑥+ 𝐪 =/
)= .5 𝐧 𝑥𝐩𝑥𝐪
[(9.31/30)+(20.80/38)] = .54

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 33
Détermination des valeurs critiques dans la table de Student :
(Pour L = 30 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .854
t = .54
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 40% de chance que la différence entre les moyennes des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a moins de 60% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement égales
et qu’aucune de ces deux classes n’a de résultats moyens significativement meilleurs que ceux
de l’autre.
48
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4. Comparaison de la paire 4

Détermination des statistiques descriptives :


N1 = 33 m1 = 11 1 = 2
N2 = 45 m2 = 13 2 = 2.5

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 2² x 33/32 = 4.13
²2est = ²2 x N2/L2 = 2.5² x 45/44 = 6.39

→ F = ²2est / ²1est = 6.39/4.13= 1.55 (Attention : ²2est > ²1est)

3° Interprétation
Détermination des degrés de liberté :
L1 = N2 - 1 = 44 L2 = N1 - 1 = 32
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 40 et L2 = 30 dans les tables)

.99
.95
.90

1.57 1.79 2.30


F=1.55
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les deux distributions se dispersent de manière homogène.
49
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧𝑥𝐩 2² 𝑥 𝐪
+N
1m =2)/(N p 2-2)] = [(33 xm
nx1+N =45nxx2.5²)/76]
+ p = 2.33
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 2 / [2.33
𝑥𝐩𝑥𝐪
(33+45)/(33x45)] = 3.75

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 76
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.999

0 3.46
t=3.75
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .999 et  < .001
Il y a donc moins de .1% de chance d’AH0 et plus de 99.9% de chance de RH0. Le test est donc
significatif à  .001 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de .1% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a plus de 99.9% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes et que les résultats moyens de la classe 2 sont significativement meilleurs que ceux
de la classe 1.
50
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


5. Comparaison de la paire 5

Détermination des statistiques descriptives :


N1 = 35 m1 = 12 1 = 1.5
N2 = 29 m2 = 10 2 = 3.5

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 1.5² x 35/34 = 2.32
²2est = ²2 x N2/L2 = 3.5² x 29/28 = 12.69

→ F = ²2est / ²1est = 12.69/2.32= 5.47 (Attention : ²2est > ²1est)

3° Interprétation
Détermination des degrés de liberté :
L1 = N2 - 1 = 28 L2 = N1 - 1 = 34
Détermination des valeurs critiques dans les tables de Snedecor :
(Pour L1 = 30 et L2 = 30 dans les tables)

.99
.95
.90

1.61 1.84 2.39


F=5.47
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les variances sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une même
population statistique.
Il y a plus de 99% de chance que la différence entre les variances des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement
différentes et que les deux distributions se dispersent de manière hétérogène.
51
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des deux classes au test d’acquisition
de la lecture.

2° Application du test t de Student


Calcul du m
t (pour m: = nxp
=unnF xdepSnedecor significatif)
→ t = |m1
-m2=
|/ 𝐧 𝑥𝐩
(²1est ²2est /N
/N1𝑥+ 𝐪 =
2)= 2 /
𝐧 𝑥𝐩𝑥𝐪
[(2.32/35)+(12.69/29)] = 2.82

3° Interprétation
Détermination du degré de liberté :
L = (N1+N2-2)/2 = 31
Détermination des valeurs critiques dans la table de Student :
(Pour L = 30 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.999
.99

0 2.75 3.65
t=2.82
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .99 et  < .01
Il y a donc moins de 1% de chance d’AH0 et plus de 99% de chance de RH0. Le test est donc
significatif à  .01 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 1% de chance que la différence entre les moyennes des résultats des deux classes au
test d’acquisition de la lecture soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a plus de 99% de chance que la différence entre les moyennes des résultats des deux classes au test
d’acquisition de la lecture soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes et que les résultats moyens de la classe 1 sont significativement meilleurs que ceux
de la classe 2.
52
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.6

1. Comparaison des résultats des femmes et des hommes

Détermination des statistiques descriptives pour les deux échantillons indépendants constitués selon la
variable « sexe » :
N1 = 16 m1 = 20.6 1 = 3.82 (calculés par la machine)
N2 = 14 m2 = 20.86 2 = 2.72 (calculés par la machine)

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des femmes et des hommes au test
de « capacité de raisonnement abstrait ».

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 3.82² x 16/15 = 15.57
²2est = ²2 x N2/L2 = 2.72² x 14/13 = 7.97
→ F = ²1est / ²2est = 15.57/7.97 = 1.95

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 15 L2 = N2 - 1 = 13
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

2.05 2.53 3.82


F=1.95
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des femmes et des
hommes au test de « capacité de raisonnement abstrait » soit due à une cause aléatoire, que les
échantillons proviennent d’une même population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des femmes et des
hommes au test de « capacité de raisonnement abstrait » soit due à une cause systématique, que les
échantillons proviennent de populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les distributions des résultats des femmes et des hommes se dispersent de manière
homogène.
53
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des femmes et des hommes au test
de « capacité de raisonnement abstrait ».

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧 𝑥 𝐩 𝑥 𝐪+ 14 x 2.72²)/28] = 3.47
+N
1m =2)/(N p 2-2)] = [(16 x 3.82²
nx1+N m = nxp
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = .80 / [3.47 x
𝑥𝐩𝑥𝐪
(16+14)/(16x14)] = .63

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 28
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .855
t = .63
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 40% de chance que la différence entre les moyennes des résultats des femmes et des
hommes au test de « capacité de raisonnement abstrait » soit due à une cause aléatoire, que les
échantillons proviennent d’une même population statistique.
Il y a moins de 60% de chance que la différence entre les moyennes des résultats des femmes et des
hommes au test de « capacité de raisonnement abstrait » soit due à une cause systématique, que les
échantillons proviennent de populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement égales
et que les femmes et les hommes ont bien des résultats moyens statistiquement égaux.
54
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


2. Comparaison des résultats des sujets ayant, ou non, une expérience préalable en matière
d’occupation d’un emploi à responsabilités

Détermination des statistiques descriptives pour les deux échantillons indépendants constitués selon la
variable « expérience préalable » :
N0 = 13 m0 = 21.85 0 = 3.35 (calculés par la machine)
N1 = 17 m1 = 19.35 1 = 2.97 (calculés par la machine)

COMPARAISON DES VARIANCES


1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les variances des résultats des sujets au test de « capacité de
raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation d’un emploi à
responsabilités.

2° Application du test F de Snedecor

Calcul du F :
²1est = ²1 x N1/L1 = 3.35² x 13/12 = 12.16
²2est = ²2 x N2/L2 = 2.97² x 17/16 = 9.37
→ F = ²1est / ²2est = 12.16/9.37 = 1.30

3° Interprétation
Détermination des degrés de liberté :
L1 = N1 - 1 = 12 L2 = N2 - 1 = 16
Détermination des valeurs critiques dans les tables de Snedecor :

.99
.95
.90

1.99 2.42 3.55


F=1.30
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le F calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les variances).

4° Conclusion
Il y a plus de 10% de chance que la différence entre les variances des résultats des sujets au test de
« capacité de raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation
d’un emploi à responsabilités soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a moins de 90% de chance que la différence entre les variances des résultats des sujets au test de
« capacité de raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation
d’un emploi à responsabilités soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les variances des deux échantillons sont statistiquement égales
et que les distributions des résultats des sujets ayant, ou non, une expérience préalable en
matière d’occupation d’un emploi à responsabilités se dispersent de manière homogène.
55
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


COMPARAISON DES MOYENNES
1° Formulation de l’hypothèse nulle
Il n’y a pas de différence significative entre les moyennes des résultats des sujets au test de « capacité de
raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation d’un emploi à
responsabilités.

2° Application du test t de Student


Calcul
m = du
nxtp(pour un F de Snedecormnon= nxp :
significatif)


est=
= 𝐧 [(N1𝑥²𝐩 𝑥2²
𝐪  = 𝐧 𝑥 𝐩 𝑥 𝐪+ 17 x 2.97²)/28] = 3.25
+N
1m =2)/(N p 2-2)] = [(13 x 3.35²m
nx1+N = nxp
= 𝐧
→ t = |m1-m2| / [est x (N1𝑥
+N𝐩 𝑥𝐪 = 𝐧
2)/(N1xN2)] = 2.50 / [3.25 x
𝑥𝐩𝑥𝐪
(13+17)/(13x17)] = 2.09

3° Interprétation
Détermination du degré de liberté :
L = N1+N2-2 = 28
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.98
.95

0 2.05 2.47
t=2.09
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .95 et  < .05
Il y a donc moins de 5% de chance d’AH0 et plus de 95% de chance de RH0. Le test est donc
significatif à  .05 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 5% de chance que la différence entre les moyennes des résultats des sujets au test de
« capacité de raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation
d’un emploi à responsabilités soit due à une cause aléatoire, que les échantillons proviennent d’une
même population statistique.
Il y a plus de 95% de chance que la différence entre les moyennes des résultats des sujets au test de
« capacité de raisonnement abstrait » ayant, ou non, une expérience préalable en matière d’occupation
d’un emploi à responsabilités soit due à une cause systématique, que les échantillons proviennent de
populations statistiques différentes.

On peut donc considérer que les moyennes des deux échantillons sont statistiquement
différentes et que les sujets n’ayant pas d’expérience préalable en matière d’occupation d’un
emploi à responsabilités ont des résultats moyens significativement supérieurs à ceux ayant
une telle expérience.
56
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.2.7

1. Situation 1

Interprétation (pour L = 59 → 60 dans la table) :

.90
.80

0 1.30 1.67
t=1.48
(1-) < .90 et  > .10

VRAI FAUX
1. Il y a moins de 90% de chance que la différence entre les moyennes des
échantillons soit significative. x
2. Il y a plus de 10% de chance d’accepter l’hypothèse nulle sur la différence
des moyennes des deux groupes. x
3. Il y a moins de 10% de chance que les sujets néerlandophones et
francophones constituent des échantillons hétérogènes quant à leur moyenne.
Entre 10% et 20% de chance que les moyennes soient homogènes. x
Entre 80% et 90% de chance qu’elles soient hétérogènes.
4. Il y a plus de 5% de chance que le hasard soit à l’origine des différences
observées entre les moyennes des deux groupes.
x
Plus de 10% de chance que ce soit le cas (donc plus de 5%).
5. Il y a moins de 20% de chance qu’un groupe ait de meilleurs résultats moyens
que l’autre.
Entre 80% et 90% de chance que ce soit le cas. x
Entre 10% et 20% de chance que les groupes aient des résultats
statistiquement égaux.

2. Situation 2

Interprétation (pour L = 16) :

.99
.98

0 2.58 2.92
t=2.79
(1-) > .98 et  < .02
57
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


VRAI FAUX
1. Il y a plus de 99% de chance de rejeter l’hypothèse nulle sur la différence des
moyennes des deux groupes.
x
Entre 98% et 99% de chance de RH0.
2. Il y a moins de 2% de chance que la différence entre les moyennes des deux
groupes soit due à une cause aléatoire. x
3. Il y a plus de 98% de chance que les sujets de moins de 25 ans et de 25 ans
et plus aient obtenu des résultats moyens homogènes.
Plus de 98% de chance que les moyennes soient hétérogènes. x
Moins de 2% de chance qu’elles soient homogènes.
4. On peut conclure de cette expérience que les sujets ne présentent pas de
capacités empathiques significativement différentes en fonction de leur âge.
x
Si ! Il y a plus de 98% de chance que ce soit bien le cas.
5. Il y a plus de 95% de chance qu’une cause systématique soit à l’origine des
différences observées entre les moyennes des deux groupes.
Plus de 98% de chance que les différences soient dues à une cause x
systématique (donc plus de 95%).

3. Situation 3

Interprétations pour des tests à 1 issue ! VRAI FAUX


1. NF= 14 mF = 27 NG = 16 mG = 23 t = 7.57
Il y a plus de 99.95% de chance que les filles aient un résultat moyen
significativement meilleur que celui des garçons.
x
(1-) > .9995 et  < .0005
mF > mG
2. NF= 13 mF = 30 NG = 19 mG = 31 t = 1.22
Il y a plus de 10% de chance que la différence entre les moyennes des filles et
des garçons soit non significative. x
(1-) < .90 et  > .10
3. NF= 17 mF = 34 NG = 18 mG = 32 t = 2.65
Il y a plus de 99% de chance que les filles aient un résultat moyen significativement
inférieur à celui des garçons.
x
(1-) > .99 et  < .01
mF > mG
4. NF= 21 mF = 26 NG = 12 mG = 28 t = 2.80
Il y a moins de .5% de chance que les filles et les garçons aient des résultats
significativement différents.
(1-) > .995 et  < .005
x
Moins de .5% de chance qu’ils soient statistiquement égaux.
Plus de 99.5% de chance qu’ils soient significativement différents.
5. NF= 19 mF = 31 NG = 22 mG = 32 t = 1.69
Il y a entre 5% et 10% de chance d’accepter l’hypothèse nulle sur la différence
des résultats moyens des filles et des garçons.
x
(1-) > .95 et  < .05
Entre 2.5% et 5% de chance que ce soit le cas.
58
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester l’homogénéité des moyennes
de deux échantillons appareillés
7. 3
Exercice d’application 7.3.1

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats des élèves aux deux tests de lecture.
Les deux échantillons appareillés sont homogènes quant à leurs moyennes. La différence entre les
moyennes aux deux tests est due à une cause aléatoire, au hasard. Il n’y a pas d’évolution significative entre
les moyennes aux deux tests.

2° Application du test t de Student


Calcul des différences individuelles entre les deux mesures, de la moyenne et de l’écart type de cette
distribution :
Différence
Élèves
(test2 - test1)
1 1
2 0 mD = .10
3 0
4 1 D = 1.04
5 -1
(calculés par la
6 -1
machine)
7 2
8 -1
9 1
10 -1
Calcul du t m
pour=
échantillons
nxp appareillés
m: = nxp
tapp = mD / 
[D =
x 1/ 𝐧 𝑥𝐩
(N-1)] =𝑥 =
.10𝐪/ [1.04 x 1/ 𝐧 𝑥 𝐩=𝑥.29
(10-1)] 𝐪

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 9
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .883
t = .29
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).
59
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


4° Conclusion
Il y a plus de 40% de chance que les moyennes des résultats des élèves aux deux tests soient
statistiquement égales, que la différence entre les moyennes soit due à une cause aléatoire.
Il y a moins de 60% de chance que les moyennes des résultats des élèves aux deux tests soient
statistiquement différentes, que la différence entre les moyennes soit due à une cause systématique.

On peut donc considérer que les moyennes des deux échantillons appareillés sont
statistiquement égales, que les deux échantillons sont bien homogènes quant à leurs
moyennes, que les élèves n’ont pas significativement pas évolué entre les deux tests.

Exercice d’application 7.3.2

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des poids des patients. Les deux échantillons
appareillés sont homogènes quant à leurs moyennes. La différence entre les moyennes est due à une
cause aléatoire, au hasard. Il n’y a pas d’évolution significative du poids des patients entre les deux mesures.

2° Application du test t de Student


Calcul des différences individuelles entre les deux mesures, de la moyenne et de l’écart type de cette
distribution :
Différence Différence
Patients Patients
(mai - avril) (mai - avril)
1 -6 12 -9
2 -2 13 -5
3 2 14 -13 mD = -3.77
4 -3 15 -3
5 -9 16 -6 D = 4.26
6 -7 17 -7
(calculés par la machine)
7 -1 18 -4
8 -8 19 -4
9 1 20 -3
10 0 21 -1
11 7 22 -2
Calcul du t m
pour=
échantillons
nxp appareillésm
: = nxp

tapp = mD / 
[D =
x 1/ 𝐧 𝑥𝐩
(N-1)] =𝑥
-3.77/ =
𝐪 [4.26 x 1/ 𝐧 𝑥 𝐩=𝑥-4.06
(22-1)] 𝐪

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 21
Détermination des valeurs critiques dans la table de Student :
(A 1 issue : on peut justifier un a priori sur le sens de la différence, on peut en effet s’attendre à m2<m1 si la
méthode produit des effets.)

.9995

-3.82 0
t=-4.06
60
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .9995 et  > .0005
Il y a donc plus de 99.95% de chance de RH0 et moins de .05% de chance d’AH0. Le test est
donc significatif à  .0005 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de .05% de chance que les moyennes des poids des patients soient statistiquement égales,
que la différence entre les moyennes soit due à une cause aléatoire.
Il y a plus de 99.95% de chance que les moyennes des poids des patients soient statistiquement
différentes, que la différence entre les moyennes soit due à une cause systématique.

On peut donc considérer que les moyennes des deux échantillons appareillés sont
statistiquement différentes, que les deux échantillons sont hétérogènes quant à leurs poids
moyens, que le poids des patients a significativement diminué entre avril et mai.

Exercice d’application 7.3.3

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des étudiants aux deux examens. Les deux
échantillons appareillés sont homogènes quant à leurs moyennes. La différence entre les moyennes est due
à une cause aléatoire, au hasard. Les étudiants n’ont pas significativement mieux réussi un examen que
l’autre.

2° Application du test t de Student


Calcul des différences individuelles entre les deux mesures, de la moyenne et de l’écart type de cette
distribution :
Différence
Différence
Étudiants Étudiants (note B - note
(note B - note Al)
Al)
1 3 13 1
2 -2 14 5
3 -7 15 -3 mD = 1.38
4 2 16 -5
5 -2 17 2 D = 5.30
6 2 18 1
(calculés par la machine)
7 1 19 1
8 2 20 1
9 15 21 8
10 -1 22 10
11 5 23 6
12 -1 24 -11
Calcul du t m
pour=
échantillons
nxp appareillés
m: = nxp
tapp = mD / 
[D =
x 1/ 𝐧 𝑥𝐩
(N-1)] =𝑥
1.38/ =
𝐪 [5.30 x 1/ 𝐧 𝑥 𝐩=𝑥1.25
(24-1)] 𝐪

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 23
61
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.80
.60

0 .858 1.32
t=1.25
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .80 et  > .20
Il y a donc plus de 20% de chance d’AH0 et moins de 80% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 20% de chance que les moyennes des résultats des étudiants aux deux examens soient
statistiquement égales, que la différence entre les moyennes soit due à une cause aléatoire.
Il y a moins de 80% de chance que les moyennes des résultats des étudiants aux deux examens soient
statistiquement différentes, que la différence entre les moyennes soit due à une cause systématique.

On peut donc considérer que les moyennes des deux échantillons appareillés sont
statistiquement égales, que les deux échantillons sont bien homogènes quant à leurs
moyennes, que les étudiants n’ont pas significativement mieux réussi un examen que l’autre.

Exercice d’application 7.3.4

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre les moyennes des résultats aux deux épreuves mesurant les
capacités mnésiques des patients. Les deux échantillons appareillés sont homogènes quant à leurs
moyennes. La différence entre les moyennes est due à une cause aléatoire, au hasard. Les épreuves
mesurant les capacités mnésiques des patients donnent des résultats statistiquement équivalents.

2° Application du test t de Student


Calcul des différences individuelles entre les deux mesures, de la moyenne et de l’écart type de cette
distribution :
Différence Différence
Patients Patients
(ECMB - ECMA) (ECMB - ECMA)
1 -5 14 1
2 0 15 1
3 -2 16 1
4 0 17 -2 mD = .19
5 0 18 -2
6 -5 19 9 D = 4.11
7 0 20 -1
(calculés par la machine)
8 -2 21 4
9 2 22 -2
10 -3 23 9
11 3 24 4
12 -5 25 3
13 -9 26 6
62
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Calcul du t m
pour=
échantillons
nxp appareillés
m : = nxp
tapp = mD / 
[D =
x 1/ 𝐧 𝑥𝐩
(N-1)] =𝑥
.19/ =
𝐪[4.11 x 1/ 𝐧 𝑥 𝐩=𝑥.23
(26-1)] 𝐪

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 25
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.60

0 .856
t = .23
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .60 et  > .40
Il y a donc plus de 40% de chance d’AH0 et moins de 60% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 40% de chance que les moyennes des résultats des patients aux deux épreuves mesurant
leurs capacités mnésiques soient statistiquement égales, que la différence entre les moyennes soit due
à une cause aléatoire.
Il y a moins de 60% de chance que les moyennes des résultats des patients aux deux épreuves mesurant
leurs capacités mnésiques soient statistiquement différentes, que la différence entre les moyennes soit
due à une cause systématique.

On peut donc considérer que les moyennes des deux échantillons appareillés sont
statistiquement égales, que les deux échantillons sont bien homogènes quant à leurs
moyennes, que les deux épreuves mesurant les capacités mnésiques des patients donnent des
résultats statistiquement équivalents.

63
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Tester conformité de la moyenne
d’un échantillon à celle d’une population
7. 4
Exercice d’application 7.4.1

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre la moyenne du poids des femmes de l’échantillon et celle de la
population. Le poids moyen des sujets l’échantillon est conforme à celui des sujets de la population. La
différence entre les moyennes est due à une cause aléatoire, au hasard.

2° Application du test t de Student


Détermination des statistiques descriptives et du paramètre de la population :
A = 66 N = 80 m = 64  = 3.5
Calcul
m =duntxm
de
pconformité
= nxp:
 =
Sm = / 𝐧L=𝑥= 𝐩 𝑥𝐧
3.5/ 𝐪𝑥
79 𝐩𝑥 𝐪
= .39
tc = |m - A|/ Sm = 2 / .39 = 5.13

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 79
Détermination des valeurs critiques dans la table de Student :
(Pour L = 60 dans la table ; à 2 issues : pas d’a priori sur le sens de la différence)

.999

0 3.46
t=5.13
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .999 et  < .001
Il y a donc moins de .1% de chance d’AH0 et plus de 99.9% de chance de RH0. Le test est donc
significatif à  .001 (les moyennes sont significativement différentes).
4° Conclusion
Il y a moins de .1% de chance que la différence entre la moyenne du poids des femmes de l’échantillon
et celle de la population soit due à une cause aléatoire, que l’échantillon soit conforme à la population
quant à sa moyenne.
Il y a plus de 99.9% de chance que la différence entre la moyenne du poids des femmes de l’échantillon
et celle de la population soit due à une cause systématique, que l’échantillon ne soit pas conforme à la
population quant à sa moyenne.
On peut donc considérer que le poids moyen de l’échantillon est statistiquement différent de
64

celui de la population et que l’échantillon ne lui est donc pas conforme.


Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.2

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre la moyenne des tailles des élèves de l’échantillon et celle de la
population. La taille moyenne des sujets l’échantillon est conforme à celle des sujets de la population. La
différence entre les moyennes est due à une cause aléatoire, au hasard.

2° Application du test t de Student

Détermination des statistiques descriptives et du paramètre de la population :


A = 171.18 N = 25 m = 168.52  = 9.26
Calcul
m =duntxde
m
p conformité
= nxp :
 =
Sm = / 𝐧L=𝑥9.26/
=𝐩𝑥 𝐪 𝐧24 𝑥 𝐩𝑥 𝐪
= 1.89
tc = |m - A|/ Sm = 2.66 / 1.89 = 1.41

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 24
Détermination des valeurs critiques dans la table de Student :
(A 2 issues : pas d’a priori sur le sens de la différence)

.90
.80

0 1.32 1.71
t=1.41
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) < .90 et  > .10
Il y a donc plus de 10% de chance d’AH0 et moins de 90% de chance de RH0. Le test est donc
globalement non significatif (pas de différences entre les moyennes).

4° Conclusion
Il y a plus de 10% de chance que la différence entre la moyenne des tailles des élèves de l’échantillon
et celle de la population soit due à une cause aléatoire, que l’échantillon soit conforme à la population
quant à sa moyenne.
Il y a moins de 90% de chance que la différence entre la moyenne des tailles des élèves de l’échantillon
et celle de la population soit due à une cause systématique, que l’échantillon ne soit pas conforme à la
population quant à sa moyenne.

On peut donc considérer que la taille moyenne de l’échantillon est statistiquement égale à
celle de la population et que l’échantillon lui est donc bien conforme. Les élèves de
l’échantillon ne sont significativement ni plus grands ni plus petits que ceux de la population.
65
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.3

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre la moyenne des résultats des étudiants de l’échantillon à l’épreuve
de maîtrise de la langue française et celle de la population. Le résultat moyen des sujets l’échantillon est
conforme à celui des sujets de la population. La différence entre les moyennes est due à une cause
aléatoire, au hasard.

2° Application du test t de Student

Détermination des statistiques descriptives et du paramètre de la population :


A = 19.6 N = 400 m = 14.75  = 6.48
Calcul
m =duntxde
m
p conformité
= nxp :
 =
Sm = / 𝐧L=𝑥6.48/
=𝐩𝑥 𝐪 𝐧399𝑥=𝐩.32
𝑥 𝐪

tc = |m - A|/ Sm = 4.85 / .32 = 15.16

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 399
Détermination des valeurs critiques dans la table de Student :
(Pour L = 120 ; à 2 issues : pas d’a priori sur le sens de la différence)

.999

0 3.37
t=15.16
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .999 et  < .001
Il y a donc moins de .1% de chance d’AH0 et plus de 99.9% de chance de RH0. Le test est donc
significatif à  .001 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de .1% de chance que la différence entre la moyenne des résultats des étudiants de
l’échantillon et celle de la population soit due à une cause aléatoire, que l’échantillon soit conforme à la
population quant à sa moyenne.
Il y a plus de 99.9% de chance que la différence entre la moyenne des résultats des étudiants
l’échantillon et celle de la population soit due à une cause systématique, que l’échantillon ne soit pas
conforme à la population quant à sa moyenne.

On peut donc considérer que la moyenne des résultats des étudiants de l’échantillon est
statistiquement différente de celle de la population et que l’échantillon ne lui est donc pas
conforme. Les étudiants de l’échantillon font preuve de performances statistiquement
différentes à l’épreuve de maîtrise de la langue française de celles de l’ensemble de jeunes
du même âge de la population.
66
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.4

1° Formulation de l’hypothèse nulle


Il n’y a pas de différence significative entre la productivité moyenne des ouvriers de l’échantillon et celle de
la population. La productivité moyenne des sujets l’échantillon est conforme à celle des sujets de la
population. La différence entre les moyennes est due à une cause aléatoire, au hasard.

2° Application du test t de Student

Détermination des statistiques descriptives et du paramètre de la population :


A = 73.4 N = 103 m = 76.17  = 10.75
(calculés par la machine)
Calcul
m =duntxde
pmconformité
= nx:p
 =
Sm = / 𝐧 
L =𝑥 =𝑥 𝐪𝐧
𝐩
10.75/ 102𝑥=𝐩1.06
𝑥 𝐪

tc = |m - A|/ Sm = 2.77 / 1.06 = 2.61

3° Interprétation
Détermination du degré de liberté :
L = N-1 = 102
Détermination des valeurs critiques dans la table de Student :
(Pour L = 120 ; à 2 issues : pas d’a priori sur le sens de la différence)

.99
.98

0 2.36 2.62
t=2.61
Détermination des probabilités d’accepter et de rejeter l’H0 (en situant le t calculé parmi les IC) :
(1-) > .98 et  < .02
Il y a donc moins de 2% de chance d’AH0 et plus de 98% de chance de RH0. Le test est donc
significatif à  .02 (les moyennes sont significativement différentes).

4° Conclusion
Il y a moins de 2% de chance que la différence entre la productivité moyenne des ouvriers de
l’échantillon et celle de la population soit due à une cause aléatoire, que l’échantillon soit conforme à la
population quant à sa moyenne.
Il y a plus de 98% de chance que la différence entre la productivité moyenne des ouvriers de l’échantillon
et celle de la population soit due à une cause systématique, que l’échantillon ne soit pas conforme à la
population quant à sa moyenne.

On peut donc considérer que la productivité moyenne des ouvriers de l’échantillon est
statistiquement différente de celle de la population et que l’échantillon ne lui est donc pas
conforme. Les ouvriers de l’échantillon présentent donc bien une productivité quotidienne
significativement meilleure que celle des ouvriers des usines du même secteur pour l’ensemble
du pays de la population.
67
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


Exercice d’application 7.4.5

1. NA = 25 m = nx mpA = 106 A = 12

→ tc = |m - A|/ Sm =
6 /=
(12/ 𝐧
24)𝑥 𝐩𝑥 𝐪
= 2.45 (1-) > .95 et  < .05

Le t de conformité vaut :
 4.73  2.18  1.11 ✓ 2.45  3.19

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS ✓ S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
 Il y a moins de 1% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.
✓ Il y a moins de 5% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la
classe et celui de la population.
✓ Il y a plus de 95% de chance que QI moyen de la classe ne soit pas conforme à celui de la population.
 Il y a plus de 98% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a moins de 2% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la classe
et celui de la population.

2. NB = 30 m = nx mpB = 102 B = 10
 = 𝐧
→ tc = |m - A|/ Sm = 2 / (10/ 29)𝑥 𝐩𝑥 𝐪
= 1.08 (1-) < .80 et  > .20

Le t de conformité vaut :
 5.63 ✓ 1.08  .88  3.27  2.09

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


✓ NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
✓ Il y a plus de 20% de chance qu’il n’y ait pas de différence significative entre le QI moyen de la
classe et celui de la population.
 Il y a moins de 2% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.
 Il y a plus de 90% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
✓ Il y a entre 60% et 80% de chance que QI moyen de la classe ne soit pas conforme à celui de la
population.
✓ Il y a moins de 80% de chance que la différence entre le QI moyen de la classe et celui de la
population soit significative.
68
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


3. NC = 27 m = nxm pC = 94 C = 9

→ tc = |m - A|/ Sm 
= 6=
/ (9/ 𝐧
26)𝑥 𝐩𝑥 𝐪
= 3.39 (1-) > .99 et  < .01

Le t de conformité vaut :
 5.84  4.31  1.40  3.79  3.16

✓ Aucune de ces propositions, la valeur correcte vaut : 3.39

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02 ✓ S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
✓ Il y a moins de 1% de chance que la différence entre le QI moyen de la classe et celui de la
population ne soit pas significative.
 Il y a moins de 99% de chance qu’il y ait une différence significative entre le QI moyen de la classe et
celui de la population.
 Il y a moins de 1% de chance que les élèves de cette classe présentent un QI moyen significativement
meilleur que celui de la population.
✓ Il y a plus de 99% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
 Il y a moins de 90% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.

4. ND = 18 m = nx mpD = 105 D = 13

→ tc = |m - A|/ Sm =
5 /=
(13/ 𝐧
17)𝑥 𝐩𝑥 𝐪
= 1.59 (1-) < .90 et  < .10

Le t de conformité vaut :
✓ 1.59  6.45  2.93  3.12  .93

 Aucune de ces propositions, la valeur correcte vaut :

La différence entre la moyenne de l’échantillon et celle de la population est :


✓ NS  S à  .05  S à  .02  S à  .01  S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
✓ Il y a plus de 10% de chance que la différence entre le QI moyen de la classe et celui de la population
ne soit pas significative.
 Il y a entre 20% et 40% de chance que les élèves de cette classe présentent un QI moyen statistiquement
égale à celui de la population.
 Il y a entre 10% et 20% de chance que les élèves de cette classe présentent un QI moyen
significativement meilleur que celui de la population.
✓ Il y a moins de 90% de chance que les élèves de cette classe présentent un QI moyen
significativement différent de celui de la population.
✓ Il y a entre 10% et 20% de chance que la différence entre le QI moyen de la classe et celui de la
population ne soit pas significative.
69
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)


5. NE = 23 m = nmxEp = 83 E = 15

→ tc = |m - A|/ Sm = 
17 / =
(15/ 𝐧
22)𝑥 𝐩𝑥 𝐪
= 5.31 (1-) > .999 et  < .001

Le t de conformité vaut :
 1.45  .29  3.65  7.83  5.08

 Aucune de ces propositions, la valeur correcte vaut : 5.31

La différence entre la moyenne de l’échantillon et celle de la population est :


 NS  S à  .05  S à  .02  S à  .02 ✓ S à  .001
Parmi les propositions suivantes, lesquelles sont exactes ?
✓ Il y a moins de 5% de chance que la différence entre le QI moyen de la classe et celui de la
population ne soit pas significative.
✓ Il y a plus de 99.9% de chance que les élèves de cette classe présentent un QI moyen
significativement inférieur à celui de la population.
 Il y a moins de .1% de chance que le QI moyen de la population soit significativement meilleur que celui
des élèves de cette classe.
 Il y a moins de 95% de chance que les élèves de cette classe présentent un QI moyen significativement
différent de celui de la population.
✓ Il y a plus de 95% de chance que la différence entre le QI moyen de la classe et celui de la population
soit significative.

70
Page

BASDI (exercices) - Module 7 (tests d’hypothèse paramétriques)

Vous aimerez peut-être aussi