Vous êtes sur la page 1sur 29

Licence Psychologie L3 -Semestre 1

STATISTIQUES POUR PSYCHOLOGUES 3 -PL5EC7

TRAVAUX DIRIGES – CORRIGES

-1-
CORRECTION DES EXERCICES DE TD - SÉANCES 1 & 2

--------------------------------------------------------------------------------------------------------------------------------------

EXERCICE 1 :
La réponse correcte est D. Dans cette expérience, l'expérimentateur examine l'impact de l'anxiété sur
la performance des étudiants aux examens. La performance est supposée dépendre du niveau
d'anxiété. Les étudiants ne représentent pas une variable mais sont les sujets de l'étude.
Faire réfléchir les étudiants sur le dispositif qui pourrait être mis en place. La VI sera simplement
invoquée si elle n’est pas directement manipulée, tous les étudiants n’ayant pas le même niveau
d’anxiété en période d’examen. Elle pourra également être provoquée par induction expérimentale.
Faire réfléchir les étudiants sur les différentes inductions susceptibles de faire varier le niveau d’anxiété
(par exemple, faible anxiété : « Cet examen sera d’un même niveau de difficulté que les exercices
d’entraînement réalisés jusqu’ici » versus anxiété élevée : « cet examen sera d’un niveau de difficulté
plus élevé que vos exercices d’entraînement »).

EXERCICE 2 :
La proposition incorrecte est la C. Cette expérience comporte bien deux conditions (B est vraie) : une
expérimentale destinée à créer une humeur positive et une contrôle (D est vraie). L'humeur est
manipulée en inter-sujets puisque les participants sont répartis soit dans l'une soit dans l'autre
condition (A est vraie). Enfin, il s'agit bien d'une variable provoquée, puisque c'est le chercheur lui-
même qui manipule l'humeur des sujets (E est vraie).

EXERCICE 3 :
Veillez à ce que les étudiants utilisent le plus possible des noms de modalités qui s’accordent avec
l’intitulé de leur variable (par exemple sexe à 2 modalités féminin vs. masculin et non 2 modalités
garçon vs. fille, l’expression « sexe garçon ou « sexe fille » étant maladroite).
Rappelez que plusieurs noms de variables sont possibles.

1) VI : Dose d'alcool absorbée à trois modalités (a1 = moyenne ; a2 = forte ; a3 = placebo). Il s'agit d'une
variable inter-sujets provoquée.
VD : Nombre de photos correctement reconnues.
Groupe contrôle : placebo
Plan : S21<A3>
Faire réfléchir les étudiants sur les raisons pour lesquelles cette expérience serait difficile à réaliser
(essentiellement éthique, le debriefing ne suffit pas supprimer les effets dommageables de l’alcool).

2) VI 1 : Version du film (A) à deux modalités (a1 = avec violence ; a2 = sans violence) ou bien Catégorie
du film à deux modalités (a1 = violent ; a2 = non violent) ou encore Violence du film projeté (a1 =
présente ; a2 = absente). Il s'agit d'une variable inter-sujets provoquée.
VI 2 : Sexe des sujets (B) à deux modalités (b1 = masculin ; b2 = féminin). Il s'agit d'une variable inter-
sujets invoquée.
VD : Nombre de réponses correctes.
Groupe contrôle : sans violence
Plan : S10<A2*B2>

3) VI : Type de stimuli présenté à deux modalités (a1 = images ; a2 = mots). Il s'agit d'une variable intra-
sujets provoquée.
VD : Pourcentage de réponses correctes.
-2-
Pas de groupe contrôle.
Plan : S50*A2
Faire réfléchir les étudiants sur l’hypothèse de Shepard. Est-elle validée ? (Oui, les résultats vont dans
le sens de l’hypothèse, il conviendrait de s’assurer que la différence observée est bien significative et
n’aurait pu être produite par le hasard –d’où l’intérêt du recours aux statistiques inférentielles).

4) VI 1 : Âge des sujets (A) à trois modalités (a1 = 9 ans ; a2 = 10 ans ; a3 = 18 ans ou plus) ou Type de
public (a1 = enfants de 9 ans ; a2 = enfants de 10 ans ; a3 = adultes âgés d’au moins 18 ans). Ici, faire
remarquer que convient également : a3 = majeurs. Il s'agit d'une variable inter-sujets invoquée.
VI 2 : Temps de latence entre le problème et la solution à 4 modalités (b1 = 0 ms ; b2 = 100 ms ; b3
= 300 ms ; b4 = 500 ms) ou bien Délai entre le problème et la solution ou encore Moment de
présentation des solutions (B) à quatre modalités (b1 = simultanément ; b2 = 100 ms après ; b3 =
300 ms après ; b4 = 500 ms après). Il s'agit d'une variable inter-sujets provoquée.
VI 3 : Type d'opération (C) à deux modalités (c1 = addition ; c2 = multiplication) ou encore Type de
problème d’arithmétique. Il s'agit d'une variable intra-sujets provoquée.
VD : Temps de rejet des réponses incorrectes. Temps de réaction pour les réponses incorrectes.
Temps de détection des réponses fausses. Là encore, plusieurs dénominations sont correctes.
Pas de groupe contrôle.
Plan : Sn<A3*B4>*C2
Cela signifie ici que le Délai entre la présentation du problème et la solution est inter-sujets.
Cela signifie que les sujets ne travaillent qu’avec un et un seul même Délai de latence entre le problème
et la solution sur l’ensemble des 2 types d’opération (addition vs. multiplication). Autrement dit, il y
aura un groupe de sujets par combinaison des variables A et B. Ainsi, par exemple, pour A1*B1, cela
signifie que les sujets en a1, c’est-à-dire âgés de 9 ans, seront exposés à un Temps de latence de 0ms,
soit b1, et cela pour les 2 types d’opération (c1 = addition ; c2 = multiplication). Pour la combinaison
A1*B2, ce sera un autre groupe d’enfants également âgés de 9 ans qui sera exposé à un Temps de
latence de 100 ms, b2, et cela pour les 2 types d’opérations arithmétiques.
Dans l’énonçé, nous avions les termes « soit et soit », c’est-à-dire ou l’un ou l’autre, pour nous
guider sur le caractère inter-sujets du Temps de latence (« Les auteurs présentent les réponses soit en
même temps que le problème, soit 100, 300 ou 500 millisecondes après »). On notera que c’est un choix
des auteurs ici et qu’il aurait été possible de faire varier les temps de présentation pour tous les sujets.

Les plans ci-dessous seraient également réalisables à condition de modifier le statut (inter vs. intra
de vos VI.
Plan : Sn<A3>*B4*C2
Cela signifie ici que le Délai ou la Latence entre la présentation du problème et la solution est intra-
sujets. Autrement dit, les enfants sont exposés à tous les délais de latence (0 ms ; 100 ms ; 300 ms ;
500 ms) différents sur tous les différents types de problèmes (addition ou multiplication).
Plan : Sn<A3*B4*C2>
Cela signifie ici que toutes vos VI sont inter-sujets et que les participants sont exposés à une et une
seule des combinaisons possibles. Ainsi A1B1C1 signifie qu’un groupe de sujets d’enfants âgés de 9 ans
(A1) est exposé à un temps de latence de 0 ms entre la présentation du problème et la solution (B1)
pour des additions (C1). Autrement dit, pour la combinaison A1B2C1, un autre groupe d’enfants âgés de
9 ans sera nécessaire. Rappelons que la multiplication des indices des variables emboîtées nous donne
le nombre de groupes nécessaires, ici 3 x 4 x 2, soit 24 groupes de sujets. Si l’on souhaite 12 sujets par
groupes, nous écrirons S12 <A3*B4*C2>. L’effectif total sera de 288 sujets.

5) VI 1 : Lieu de l'apprentissage (A) à deux modalités (a1 = sur terre ; a2 = sous l'eau) ou Contexte de
mémorisation ou Condition d’apprentissage ou bien encore milieu d’apprentissage. Il s'agit d'une
variable inter-sujets provoquée.

-3-
VI 2 : Lieu du rappel (B) à deux modalités (b1 = sur terre ; b2 = sous l'eau) ou bien Lieu de restitution
ou encore Contexte de rappel à 2 modalités. Il s'agit d'une variable inter-sujets provoquée.
VD : Nombre de mots correctement rappelés.
Pas de groupe contrôle.
Plan : Sn<A2*B2>. Ici le nombre de participants au total n’était pas indiqué.
Faire réfléchir les étudiants sur l’écriture du plan si l’effectif total était de 80, nous aurions : S20<A2*B2>.

6) VI A : Type de mots ou Type de syllables (a1 = sans signification ; a2 = ayant une signification) ou
bien Type d’items (a1 = non mots ; a2 = mots). Il s'agit d'une variable provoquée intra-sujets.
VI B : Présence d'autrui (b1 = oui ; b2 = non) ou Contexte social d’apprentissage (b1 = présence
d’autrui ; b2 = isolement). Il s'agit d'une variable provoquée inter-sujets.
VD 1 : Nombre de répétions nécessaires à la mémorisation.
VD 2 : Nombre d'erreurs commises.
On peut considérer que les sujets apprenant seuls constitue le GR contrôle.
Plan : S20<B2>* A2
Faire remarquer que certaines informations sont non pertinentes et qu’il s’agit donc de savoir faire le
tri entre les informations utiles et non utiles pour répondre à la question. C’est une des compétences
à acquérir.

7) VI A : Catégorie d'âge (a1 = âgés ; a2 = jeunes). Il s'agit d'une variable invoquée inter-sujets.
VI B : Type de problèmes (b1 = facile ; b2 = difficile) ou Niveau de difficulté (b1 = faible ; b2 = élevé)
ou Degré de difficulté. Il s'agit d'une variable provoquée inter-sujets.
VD 1 : Nombre de réponses correctes.
VD 2 : Temps de réponse ou Temps nécessaire à la résolution.
Pas de groupe contrôle.
Plan : S10<A2*B2>

8) VI A : Milieu professionnel (a1 = libéral ; a2 = salarié) ou Catégorie professionnelle ou Milieu


d’exercice des participants ou bien encore Statut professionnel des sujets. Il s'agit d'une variable
invoquée inter-sujets.
VI B : Type de situations proposées (b1 = milieu salarié ; b2 = milieu libéral ; b3 = milieu extra-
professionnel) ou bien Catégorie professionnelle des situations proposées ou encore Milieu
professionnel des situations proposées. Il s'agit d'une variable provoquée intra-sujets.
VI C : Type d'explications (c1 = mise en cause des personnes ; c2 = mise en cause du contexte) ou
bien Nature de l’explication causale proposée ou encore Nature de l’attribution causale proposée
(c1 = interne ; c2 = externe). Il s'agit d'une variable provoquée intra-sujets.
VD : Degré d’accord avec les attributions causales de 1 à 4. Note attribuée sur le degré d’accord
avec les attributions causales.
Pas de groupe contrôle.
Plan : S30<A2>* B3*C2

9) VI A : Période de la journée dédiée à l’apprentissage (a1 = début; a2 = milieu ; a3 = fin) ou Moment


de la journée dédiée à l’apprentissage (a1 = en début de journée ; a2 = à la mi-journée ; a3 = en fin
de journée). Il s'agit d'une variable provoquée intra-sujets.
VI B : Temps de latence entre l’apprentissage et le rappel (b1 = immédiat ; b2 = 3h après ; b3 = 6h
après ; b4 = 12h après) / Moment de restitution (b1 = à la fin de l'apprentissage ; b2 = 3h après ; b3
= 6h après ; b4 = 12h après) /Temps écoulé entre l’apprentissage et le rappel (b1 = 0 ms ; b2 = 3h ;
b3 = 6h ; b4 = 12h). Il s'agit d'une variable provoquée intra-sujets.
VD : Nombre de réponses correctes dans l'ordre.
Pas de groupe contrôle.
Plan : S30*A3* B4
-4-
EXERCICE 4 :
Les variables 1, 6, 7 et 9 sont des échelles nominales ; la variable 8 une échelle ordinale et les variables
2, 3, 4 et 5 des échelles d’intervalles ou dites numériques.
1 = Sexe (1 = masculin ; 2 = féminin) -Nominale
2 = Taille (en centimètres) -Numérique
3 = Note à l’examen de statistiques descriptives (0-20) -Numérique
4 = Note à l’examen de statistiques inférentielles (0-20) -Numérique
5 = Note au module de statistiques en juin (0-20) -Numérique
6 = Résultat obtenu en juin (1 = admis ; 2 = recalé) -Nominale
7 = Résultat obtenu en septembre (1 = admis ; 2 = recalé) -Nominale
8 = Niveau au module (1 = < 10 ; 2 = ³ 10 et < 14 ; 3 = ³ 14) -Ordinale
9 = Choix de la spécialité (1 = sociale ; 2 = cognitive ; 3 = clinique ; 4 = développement) -Nominale

EXERCICE 5 :
Plusieurs solutions sont possibles. En voici deux pour chaque type d’échelle :
- Echelle ordinale :
. À trois modalités : 1 = < 8 ; 2 = ³ 8 et < 12 ; 3 = ³ 12
. À cinq modalités : 1 = 0-4 ; 2 = 5-9 ; 3 = 10-13 ; 4 = 14-17 ; 5 = 18-20

- Echelle nominale :
. À deux modalités : Échec ; Réussite
. À trois modalités : Échec : Réussite ; Réussite avec mention

EXERCICE 6 :
Je range par ordre croissant les valeurs de ma distribution de données : 2,2,4,5,7.
La bonne réponse est la C. La médiane des visites est égale à N+1 /2, et correspond au nombre du
milieu (le troisième rang ou (5+1)/2 dans la séquence. Le rang 3 est occupé par la valeur 4) soit 4 et
non 2 (B est donc fausse). La réponse A est fausse puisque le nombre moyen de visites est égal à la
somme des visites (20) divisée par le nombre de relevés (5), soit 4. Les réponses D et E sont aussi
fausses car le mode renvoie au chiffre le plus fréquent, soit 2.

EXERCICE 7 :
Seule la réponse A est incorrecte. Quand toutes les valeurs d'une variable sont observées avec une
fréquence égale, leur distribution sur cette variable est uniforme (horizontale et rectangulaire) et non
en forme de cloche. Comme le suggère la réponse D, quand une variable est normalement distribuée,
les valeurs les plus extrêmes sont les moins souvent observées. Les affirmations B et E sont vraies car
une variable normalement distribuée est symétrique autour de sa moyenne et la moyenne, la médiane
et la mode sont égaux. Enfin, comme l'indique la réponse C, la distribution normale est couramment
observée avec des données de recherches en psychologie parce que la plupart des phénomènes
psychologiques sont normalement distribués (QI, scores de personnalité, etc.).

EXERCICE 8 :
Seule la réponse C est incorrecte. En effet, la distribution est positivement penchée : sa moyenne ayant
tendance à être une mesure excessivement positive de la tendance centrale. La médiane donne donc
une meilleure indication de la tendance centrale (comme le souligne l'affirmation E). La médiane et la
moyenne sont toutes deux plus grandes que le mode (les affirmations A et D sont donc vraies) qui est
le temps de réaction le plus courant (soit 240 ms, comme l'indique l'affirmation B). Notons que nous
pouvons déduire toutes ces réponses sans avoir à faire de calculs.
-5-
EXERCICE 9 :

• Variable 3
Nous devons établir la distribution des notes et allez chercher les effectifs correspondants puis calculer
les effectifs cumulés croissants :

Note 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Effectifs 0 0 0 0 0 0 0 0
Effectifs cumulés
croissants 0 0 0 0 0 0 - -

Note 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Effectifs 0 0 0 0 0 0 1 4 7 6 6 1 4 4 3 8 1 1 3 0 0
Effectifs cumulés
croissants 0 0 0 0 0 0 1 5 12 18 24 25 29 33 36 44 45 46 49 - -

Certaines valeurs ou notes n’étant pas observées, nous pouvons rapporter le tableau suivant :

Note 6 7 8 9 10 11 12 13 14 15 16 17 18
Effectifs 1 4 7 6 6 1 4 4 3 8 1 1 3
Effectifs cumulés
croissants 1 5 12 18 24 25 29 33 36 44 45 46 49

Mode = 15 (car n = 8 et qu’il s’agit du plus grand effectif sur cette distribution de données)

Médiane : On doit extraire la note correspondant au rang médian, soit (49+1)/2 = 25. En se reportant
aux effectifs cumulés croissants, on constate que cette note est de 11.

Ecart semi-interquartile : On doit déterminer le premier quartile (Q1) qui correspond à la note
correspondant au rang N/4, soit 12.25 (car 49/4 = 12.25). Je vais donc au 12.25e rang et je regarde
quelle note correspond à ce rang. Ici, le 12e rang occupe la note de 8 et le 13e rang la note de 9. Je
choisis donc la note entre les deux qui correspond à 8.5. Ainsi, Q1 est égal à 8.5. Je note qu’il est
également admis de prendre le prochain nombre entier, c’est-à-dire la note de 9. En effet, nous
travaillons avec des sujets humains, 0.75 d’un rang associé à une personne, ou 0.25 d’un rang associé
à un individu n’a guère de sens ici. Je peux ainsi également considérer que Q1 est égal à 9. Je peux donc
utiliser l’une ou l’autre de ces méthodes, mais attention je dois la conserver, et pour le calcul de Q1, et
pour le calcul de Q3.
On doit ensuite déterminer le troisième quartile (Q3) qui correspondant au rang 3N/4, soit 36.75. Là
encore, le 36.75e rang tombe entre 2 notes. Je choisis alors de prendre la moyenne des 2, donc je
retiens 14.5. Q3 est donc égal à 14.5. Comme précédemment, j’aurais pu retenir la valeur entière
supérieure, c’est-à-dire 15. Dans ce cas, j’aurais retenu Q1 = 9 et Q3 = 15.

L'écart semi-interquartile nous est donné par : (Q3-Q1)/2 = (14.5-8.5)/2 = 3 ou bien si j’ai préféré utiliser
les valeurs entières (15 – 9)/2 = 6/2 = 3.

-6-
Moyenne
Moyenne = [(1x6) + (4x7) + (7x8) + (6x9) + (6x10) + (1x11) + (4x12) + (4x13) + (3x14) + (8x15) + (1x16)
+ (1x17) + (3x18) / 49 = (6 + 28 + 56 + 54 + 60 + 11 + 48 + 52 + 42 + 120 + 16 + 17 +
54)/49 = 564/49
Moyenne = 11.5102. J’arrondis à 11.51

Variance
(" $.&)2
! #.%2 & (
Variance =
'&(

(" $.)*+,-./01)$)2
! #.)*+,-./01)#2 &
(* 23 )*+,-./01)$+
Variance =
'* 23 )*+,-./01)#+ & (

On cherche :
Total
Note 6 7 8 9 10 11 12 13 14 15 16 17 18
Effectifs 1 4 7 6 6 1 4 4 3 8 1 1 3 49
Effectifs cumulés
croissants 1 5 12 18 24 25 29 33 36 44 45 46 49
n.observation2
62 4x 72 7 x 82 6 x 92 6 x 102 112 4 x 122 4 x 132 3 x 142 8 x 152 162 172 3x 182
2
n.observation
36 196 448 486 600 121 576 676 588 1800 256 289 972 7044

S n.observation² = (6²) + (4x7²) + (7x8²) + (6x9²) + (6x10²) + (11²) + (4x12²) + (4x13²) + (3x14²) + (8x15²)
+ (16²) + (17²) + (3x18²) = 36 + 196 + 448 + 486 + 600 + 121 + 576 + 676 + 588 + 1800 + 256 + 289 + 972
= 7044

Et :
(S n.observation)² = 564² = 318096
Je me rappelle du calcul de la moyenne. Il s’agit ici du numérateur utilisé pour le calcul de la moyenne.

On applique alors la formule :


Variance = [7044 – (318096/49)] / 48 = (7044 – 6491.7551) /48 = 552.2449 /48 = 11.5051
J’arrondis à 11.51

Ecart-type = Variance ; soit √11.51 = 3.3926


J’arrondis à 3.39

• Variable 4

Note 2 5 6 7 8 9 10 11 12 13 14 15 17 18
Effectifs 2 4 3 2 4 2 6 2 5 4 6 4 2 3
Effectifs cumulés
croissants 2 6 9 11 15 17 23 25 30 34 40 44 46 49

-7-
Mode = 10 (car n = 6) et 14 (car n = 6). Cette distribution est dite bimodale. Le mode n’est donc pas
très informatif ici. Il conviendra donc de privilégier d’autres indices de cette distribution de données.

Médiane
On doit extraire la note correspondant au rang médian, (N+1)/2, soit 50/2 = 25. En se reportant aux
effectifs cumulés croissants, on constate que ce rang correspond à la note 11. On prendra donc la
valeur 11 pour médiane.

Ecart semi-interquartile
On doit déterminer le premier quartile (Q1) qui correspond à la note correspondant au rang N/4 =
12.25. Ce rang correspond à la note 8. On prendra donc la valeur 8 pour Q1.
On doit ensuite déterminer le troisième quartile (Q3) qui correspond à la note correspondant au rang
3N/4 = 36.75. Ce rang correspond à la note 14. On prendra donc la valeur 14 pour Q3.
L'écart semi-interquartile nous est donné par : (Q3-Q1)/2 = (14-8)/2 = 3

Moyenne
Moyenne = [(2x2) + (4x5) + (3x6) + (2x7) + (4x8) + (2x9) + (6x10) + (2x11) + (5x12) + (4x13) + (6x14) +
(4x15) + (2x17) + (3x18)]/49 = (4 + 20 + 18 + 14 + 32 + 18 + 60 + 22 + 60 + 52 + 84 + 60 + 34 + 54)/49 =
532/49
Moyenne = 10.8571
J’arrondis à 10.86

Variance

(" $.&)2
! #.%2 &
(
Variance =
'&(

(" $.)*+,-./01)$)2
! #.)*+,-./01)#2 &
(* 23 )*+,-./01)$+
Variance =
'* 23 )*+,-./01)#+ & (

On cherche :

Total
Note 2 5 6 7 8 9 10 11 12 13 14 15 17 18
Effectifs 2 4 3 2 4 2 6 2 5 4 6 4 2 3
Effectifs
cumulés 2 6 9 11 15 17 23 25 30 34 40 44 46 49
croissants
n.observation2
2x 4x 3x 2x 4x 2x 6x 2x 5x 4x 6x 4x 2x 3x
22 52 62 72 82 92 102 112 122 132 142 152 172 182
n.observation2
8 100 108 98 256 162 600 242 720 676 1176 900 578 972 6596

S n.observation² = (2x2²) + (4x5²) + (3x6²) + (2x7²) + (4x8²) + (2x9²) + (6x10²) + (2x11²) + (5x12²) +
(4x13²) + (6x14²) + (4x15²) + (2x17²) + (3x18²) = 8 + 100 + 108 + 98 + 256 + 162 + 600 + 242 + 720 +
676 + 1176 + 900 + 578 + 972 = 6596
-8-
Et :
(S n.observation)² = 532² = 283024

On applique alors la formule :


Variance = [6596 – (283024/49)] / 48 = (6596 – 5776)/48 = 820/48 = 17.0833
J’arrondis à 17.08

Ecart-type = Variance = 4.1328


J’arrondis à 4.13

• Variable 5

Note 4.5 5 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5 12


Effectifs 1 1 1 2 2 1 1 4 1 5 4 6 1 4
Effectifs cumulés
croissants 1 2 3 5 7 8 9 13 14 19 23 29 30 34

Note 12.5 13.5 14.5 15 15.5 16 16.5 18


Effectifs 1 2 3 2 1 1 4 1
Effectifs cumulés
croissants 35 37 40 42 43 44 48 49

Mode = 11 (car n = 6)

Médiane
On doit extraire la note correspondant au rang médian, (N+1)/2, soit 50/2 = 25. En se reportant aux
effectifs cumulés croissants, on constate que ce rang correspond à la note 11. On prendra donc la
valeur 11 pour médiane.

Ecart semi-interquartile
On doit déterminer le premier quartile (Q1) qui correspond à la note correspondant au rang N/4, soit
= 12,25. Ce rang correspond à la note 9. On prendra donc la valeur 9 pour Q1.
On doit ensuite déterminer le troisième quartile (Q3) qui correspond à la note correspondant au rang
3N/4, soit = 36.75. On prendra donc la valeur 13,5 pour Q3.
L'écart semi-interquartile nous est donné par : (Q3-Q1)/2 = (13.5-9)/2 = 2.25

Moyenne
Moyenne = [(4,5) + (5) + (6,5) + (2x7) + (2x7,5) + (8) + (8,5) + (4x9) + (9,5) + (5x10) + (4x10,5) + (6x11)
+ (11,5) + (4x12) + (12,5) + (2x13,5) + (3x14,5) + (2x15) + (15,5) + (16) + (4x16,5) + (18)]/49 = (4 + 20 +
18 + 14 + 32 + 18 + 60 + 22 + 60 + 52 + 84 + 60 + 34 + 54)/49 = 553/49 = 11.2857
J’arrondis à 11.29

Variance

(" $.&)2
! #.%2 & (
Variance =
'&(

-9-
(" $.)*+,-./01)$)2
! #.)*+,-./01)#2 &
(* 23 )*+,-./01)$+
Variance =
'* 23 )*+,-./01)#+ & (

On cherche :

Note 4.5 5 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5 12


Effectifs 1 1 1 2 2 1 1 4 1 5 4 6 1 4
Effectifs cumulés
croissants 1 2 3 5 7 8 9 13 14 19 23 29 30 34
n.observation2
1 x 4.52 1 x 52 1 x 6.52 2 x 72 2 x 7.52 1 x 82 1 x 8.52 4 x 92 1 x 9.52 5 x 102 4 x 10.52 6 x 112 1 x 11.52 4 x 122
n.observation2
20.25 25 42.25 98 112.5 64 72.25 324 90.25 500 441 726 132.25 576

Total
Note 12.5 13.5 14.5 15 15.5 16 16.5 18
Effectifs 1 2 3 2 1 1 4 1
Effectifs cumulés
croissants 35 37 40 42 43 44 48 49
n.observation2
1 x 12.52 2 x 13.52 3 x 14.52 2 x 152 1 x 15.52 1 x 162 4 x 16.52 1 x 182
n.observation2
156.25 364.5 630.75 450 240.25 256 1089 324 6734.5

S n.observation² =(4,5²) + (5²) + (6,5²) + (2x7²) + (2x7,5²) + (8²) + (8,5²) + (4x9²) + (9,5²) + (5x10²) +
(4x10,5²) + (6x11²) + (11,5²) + (4x12²) + (12,5²) + (2x13,5²) + (3x14,5²) + (2x15²) + (15,5²) + (16²) +
(4x16,5²) + (18²) = (20.25 + 25 + 42.25 + 98 + 112.5 + 64 + 72.25 + 324 + 90.25 + 500 + 441 + 726 +
132.25 + 576 + 156.25 + 364.5 + 630.75 + 450 + 240.25 + 256 + 1089 + 324 = 6734.5

Et :
(S n.observation)² = 553² = 305809

On applique alors la formule :


Variance = [6734.5 – (305809/49)] / 48 = (6734.5 – 6241)/48 = 493.5/48 = 10.2813
J’arrondis à 10.28

Ecart-type = Variance = 3.2062


J’arrondis à 3.21

-10-
CORRECTION DES EXERCICES DE TD - SÉANCES 3 & 4

EXERCICE 10 :
Nous sommes dans le cas d'une comparaison d’une moyenne (moyenne obtenue par les étudiants de
l'université X) et d’une norme (moyenne obtenue au niveau national) avec un effectif supérieur à 30.
On applique donc la formule du z :

Moyenne de l'échantillon - Norme


z=
Ecart - type de l'échantillon
n

On utilise la moyenne et l’écart-type calculés précédemment. Nous avions M = 11.29 et SD = 3.21.


On remarquera que si vous avez utilisez une précision à 4 chiffres après la virgule pour la moyenne et
l’écart-type, la statistique rapportée sera légèrement modifiée, mais cela n’altérera pas votre
conclusion.

On obtient :

11.29 − 10.2 1.09


𝑧 = = = 2.3768
3.21 0.4586
√49

On arrondit à 2.38

On se souvient que le ddl dans le cas d’un test de Student de comparaison à une norme est de N-1 (ici
49 – 1, soit 48).

On se reporte à la table de la loi normale centrée-réduite et l'on cherche quelle est la probabilité qui
correspond à la valeur z trouvée. La ligne supérieure de la table de z correspond au point au 2e chiffre
après la virgule. On lit donc z à 2.3 en colonne puis à 0.08 en ligne, ce qui nous une probabilité de
0.01731. On arrondit à 0.02. Cette probabilité étant inférieure au seuil critique de 0.05. On peut donc
dire, avec 2% de risques de se tromper, que la moyenne de l’échantillon diffère significativement de la
moyenne nationale. L’échantillon a obtenu de meilleurs résultats en statistiques que la moyenne
nationale, z(48) = 2.38, p < .02. Conformément aux normes APA, nous rapportons le ddl entre
parenthèses et écrivons le z ou t en italique tout comme le p. Nous pouvons aussi utiliser la notation
en étoiles et écrire : z(48) = 2.38*

En résumé, pour présenter notre résultat, nous écrivons : Nous avons conduit un test de Student pour
comparaison à une norme qui révèle que nos étudiants ont une moyenne générale en statistiques
descriptives (M = 11.29 ; S = 3.21) significativement supérieure à la moyenne nationale des étudiants
de Licence, z(48) = 2.38, p < .02.

EXERCICE 11 :

-11-
Nous sommes dans le cas d'une comparaison d’une moyenne (moyenne obtenue par les étudiants
inscrits en développement) et d’une norme (la note de 10) avec un effectif inférieur à 30. En effet, la
variable 9 (choix de la spécialité) nous apprend qu’il n’y a que 7 étudiants inscrits en développement.

On applique donc la formule du t :


Moyenne de l' échantillon - Norme
t=
Ecart - type de l' échantillon
n
On notera que la racine de 7 est de 2.6458.

On obtient :

10.28 − 10 0.28
𝑡 = = = 0.2599
2.85 1.0772
√7
On arrondit à 0.26

On se souvient que le ddl dans le cas d’un test de Student de comparaison à une norme est de N-1 (ici
7 – 1, soit 6).

On se reporte à la table du t de Student et l'on cherche quel est le t critique fourni pour un degré de
liberté égal à (7-1) = 6. L’hypothèse est unilatérale car on cherche à savoir si les étudiants en
développement ont obtenu une note en statistiques au-dessus de la moyenne de 10/20. Ainsi, on
regarde non pas au seuil de 0.05 dans la table, mais au seuil de 0.10. On constate que le t calculé est
bien inférieur aux t critiques donnés par la table, et ce quel que soit d’ailleurs le seuil de confiance. On
peut donc conclure que les notes obtenues par les étudiants de développement ne se situent pas
significativement au-dessus d'une moyenne de 10/20, t(6) = 0.26, p > .05, ns.

EXERCICE 12 :
Nous avons besoin de savoir combien d’étudiants étaient inscrits en développement et combien
étaient inscrits en cognitive. La variable 9 nous apprend qu’il y avait 7 étudiants en développement et
9 en cognitive. Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons
indépendants dont les effectifs sont inférieurs à 30. On applique donc la formule du t de Student :

Moyenne échantillon 1 - Moyenne échantillon 2


t=
1 1
Ecart - type commun +
Effectif échantillon 1 Effectif échantillon 2

L'écart-type commun étant donné par la formule :

[Variance éch.1 ´ (Eff. éch.1 - 1)] + [Variance éch. 2 ´ (Eff. éch. 2 - 1)]
(Eff. éch.1 + Eff. éch. 2) - 2

On calcule d'abord l'écart-type commun :


-12-
Ecart-type commun = √ (2.44² x 8) + (2.85² x 6) = 2.62
(9 + 7) - 2
Variance de l’échantillon 1 = 2.44². On obtient ainsi : 5.9536
Variance de l’échantillon 2 = 2.85² On obtient ainsi : 8.1225
Calculs intermédiaires :
(5.9536 x 8 + 8.1225 x 6) /14 = (47.6288 + 48.735) /14 = 96.3638 / 14 = 6.8831
Je cherche ensuite la racine de 6.8831. J’obtiens 2.6236.
J’arrondis à 2.62.

Maintenons que nous avons calculé l’écart-type commun, il ne reste plus qu’à appliquer la formule
du t citée précédemment :

13.61 − 10.28
𝑡 = = 2.5419
1 1
2.62 29 + 7

Calculs intermédiaires : 1/7 + 1/9 = 0.1429 + 0.1111 = 0.254


Je cherche la racine de 0.254 et j’obtiens 0.5039. Je conserve 0.50
Ainsi : 13.61 – 10.28 / (2.62 x 0.5) = 3.33 / 1.31 = 2.5419
J’arrondis à 2.54

On se reporte à la table du t de Student et l'on cherche quel est le t critique correspondant à un degré
de liberté égal à (9 + 7) - 2 = 14. On se souvient en effet que le ddl dans le cas d’un test de Student
pour groupes indépendants est : (n1 + n2) – 2.
L’hypothèse est bilatérale, et jusqu'au seuil .05, le t calculé est supérieur au t critique (t = 2.15). On
peut donc conclure que les deux moyennes diffèrent significativement avec 5% de risques de se
tromper, t(14) = 2.54, p < .05. Une autre manière d’écrire ce résultat serait de noter, t(14) = 2.54*.
Pour savoir dans quel sens s’exprime cette différence, je peux aller regarder les moyennes de chaque
groupe ou bien regarder le signe positif ou négatif du t calculé. S’il est positif, cela signifie que le
premier terme de la différence est plus élevé que le second ou autrement dit que le premier groupe a
une moyenne plus élevée que le second. Ici, le t étant positif, ce sont les étudiants en cognitive qui ont
une meilleure moyenne que ceux en développement.

La phrase de conclusion serait : Nous avons réalisé un test de Student pour groupes indépendants qui
révèle une différence significative entre les moyennes des étudiants de cognitive (M = 13.61, S = 2.44)
et ceux de développement (M = 10.28, S = 2.85) à l’avantage des premiers, t(14) = 2.54, p < .05.

EXERCICE 13 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons appariés avec un
effectif inférieur à 30. C'est donc le t de Student qui servira d'estimateur des différences observées. On
appliquera alors la formule :

Moyenne des différences


t=
Ecart - type des différences
Nombre de couples de données

-13-
La moyenne des différences est obtenue par :

Md = Somme des différences entre chaque couple de données


Nombre de couples de données

et l'écart-type des différences par :

!"##$ &$ (&())é+$,-$. $,/+$ -0123$ -"345$ &$ &",,é$. 6 7"8$,,$ &$. &())é+$,-$.)!
Écart-type des différences =2 :; &$ -"345$ &$ &",,é$. 6<

On doit donc établir une nouvelle distribution, la distribution d des différences terme à terme, puis
calculer la moyenne et l'écart-type de cette distribution.

Sujet Note en Stat. Descriptives Note en Stats. Inférentielles Différence de notes


1 18 15 3
2 9 13 -4
3 15 14 1
4 14 15 -1
5 15 15 0
6 15 17 -2
7 14 6 8
8 15 14 1
9 9 12 -3
10 14 17 -3
11 15 18 -3
Somme -3

Moyenne des différences : Md = -3 / 11 = -0.2727


On arrondit à -0.27

Calcul de l’écart-type des différences :


Le plus pratique est d'établir un tableau de décomposition des termes nécessaires au calcul :

Sujet Note 1 Note 2 Différence Diff. - Md (Diff. - Md)²


1 18 15 3 3 – (-0 .27) = 3.27
3.27² = 10.69
2 9 13 -4 -4 – (-0.27) = -3.73
-3.73² = 13.91
3 15 14 1 1– (-0.27) = 1.27
1.61
4 14 15 -1 -0.73
0.53
5 15 15 0 0.27
0.07
6 15 17 -2 -1.73
2.99
7 14 6 8 8.27
68.39
8 15 14 1 1.27
1.61

-14-
9 9 12 -3 -2.73
7.45
10 14 17 -3 -2.73
7.45
11 15 18 -3 -2.73
7.45
Somme -3 122.15

!"##$ &$ (&())é+$,-$. $,/+$ -0123$ -"345$ &$ &",,é$. 6 7"8$,,$ &$. &())é+$,-$.)!
Ecart-type des différences = 2 :; &$ -"345$ &$ &",,é$. 6<

<==.<?
On obtient : 2 <<6< = √12.215 = 3.4949

On arrondit à 3.49

On peut alors calculer le t en appliquant la formule :


On notera que la racine de 11 est de 3.3166

−0.27 −0.27
𝑡 = = = −0.2571
3.49 1.05
√11
On arrondit à -0.26

On se souvient que dans le cas d’un test de Student pour groupes appariés, le ddl s’obtient par le
nb de couples – 1, soit ici : 11 – 1 = 10

On se reporte à la table de Student. L’hypothèse étant bilatérale, pour un ddl de 10 et un risque


d’erreur à 5%, p =.05, nous constatons que le t critique est de 2.23. Le t calculé (-0.26) lu en valeur
absolue /0.26/ étant inférieur au t critique, on ne peut pas rejeter l’hypothèse nulle (absence de
différence). Ainsi, je peux conclure que les notes en statistiques descriptives et inférentielles ne
diffèrent pas entre elles, t(10) = -0.26, p > .05, ns.

La phrase conclusion pourrait être : Nous avons réalisé un test de Student pour groupes pairés qui
révèle une absence de différence entre les notes à l’examen de statistiques différentielles et celles
obtenues à l’examen de statistiques descriptives, t(10) = -0.26, p > .05, ns.

EXERCICE 14 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons indépendants
d'effectifs inférieurs à 30 (On se souvient qu’il suffit que l’un des deux échantillons soit inférieur à 30
pour demeurer sur le calcul d’un t. Dans notre mémo, il est écrit « si n1 et/ou n2 ≤ 30 »). Les étudiants
sont 35 dans le groupe 1 (sociale, cognitive et développement pris ensemble) et 14 en clinique.
L'indicateur des différences sera donc le t que l'on calculera en appliquant la formule suivante :

𝑀𝑜𝑦𝑒𝑛𝑛𝑒 𝑑𝑒 𝑙 @ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 1 − 𝑀𝑜𝑦𝑒𝑛𝑛𝑒 𝑑𝑒 𝑙 @ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 2


𝑡=
1 1
𝐸𝑐𝑎𝑟𝑡 − 𝑡𝑦𝑝𝑒 𝑐𝑜𝑚𝑚𝑢𝑛2 +
𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙 @ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 1 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙 @ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 2

-15-
L'écart-type commun étant donné par la formule suivante :

[Variance de l! échantillon 1 × (Effectif de l! échantillon 1 − 1)] + [Variance de l! échantillon 2 × (Effectif de l! échantillon 2 − 1)]
!
(Effectif de l! échantillon 1 + Effectif de l! échantillon 2) − 2

Je calcule d’abord l’écart-type commun :


(3.42= × 34) + (2.33= × 13)

(35 + 14) − 2

Je calcule d’abord l’écart-type commun :


468.2533

47

√ 9.9628 = 3.1564

Calculs intermédiaires :
3.422 x 34 + 2.332 x 13 = 11.6964 x 34 + 5.4289 x 13. J’obtiens alors : 397.6776 + 70.5757 = 468.2533
J’ai ainsi d’ores et déjà le numérateur, il ne me reste plus qu’à calculer le dénominateur :
(35 + 14) – 2 = 49 – 2. J’obtiens ainsi 47.

Ainsi : 468.2533 / 47 = 9.9628


La racine de 9.9628 est de 3.1564. J’arrondis à 3.16 et j’obtiens ainsi l’écart-type commun.
Je l’insère dans la formule de t
`
On obtient ici :
11.72 − 10.17
𝑡 =
(3.42= × 34) + (2.33= × 13) 2 1 1
√ × +
(35 + 14) − 2 35 14

(.44
t=
4 4
5.(6 × 8 9
56 47

Calculs intermédiaires :
1/35 = 0.028571. On arrondit à 0.0286
1/14 = 0.07142. On arrondit à 0.0714
0.0286 + 0.0714 = 0.1. On va chercher la racine de 0.1. On obtient 0.3162
Ainsi, au dénominateur : 3.16 x 0.3162 = 0.999192. On retient 0.9992

1.55
𝑡 = 0.9992 = 1.5512

On arrondit à 1.55

-16-
Nous avons besoin du ddl pour aller lire dans la table de Student. Le ddl pour un test de Student pour
groupes indépendants est (n1 + n2) -2, soit ici (35 + 14) – 2 = 47. Cette valeur n’étant pas présente dans
la table, il convient de privilégier le ddl le plus proche, nous pouvons donc retenir ici un ddl de 50. Nous
remarquons que plus le ddl est grand et plus le t théorique est faible. Autrement dit, privilégier un petit
ddl sera un test plus conservateur de l’hypothèse nulle. Ainsi, si nous avions un ddl de 45, on
s’orienterait vers un ddl de 40 dans la table.
Notre hypothèse est unilatérale, on lira donc dans la colonne de 0.10 et non dans celle de 0.05. Le t
calculé est inférieur au t critique (ici le t théorique est de 1.68). Nous pouvons donc conclure que les
deux moyennes ne diffèrent pas significativement entre elles. En d’autres termes, nous ne pouvons
pas rejeter H0 car il n’y a pas de différence significative entre les deux moyennes. Les étudiants inscrits
en « sociale », « cognitive » et « développement » n’ont pas de meilleurs résultats en statistiques que
les étudiants inscrits en « clinique », t(47) = 1.55, p > .05, ns.

La phrase de conclusion pourrait être : Nous avons réalisé un test de Student pour groupes
indépendants qui révèle une absence de différence entre les notes en statistiques obtenues par les
étudiants de cognitive, sociale et développement par rapport aux notes de ceux inscrits en clinique,
t(47) = 1.55, p > .05, ns.

-17-
CORRECTION DES EXERCICES DE TD - SÉANCES 4 & 5

EXERCICE 15 :
Nous sommes dans le cas d'une comparaison d’une moyenne (moyenne d’âge dans la succursale) et
d’une norme (moyenne d’âge dans l’ensemble des succursales) avec un effectif supérieur à 30. On
applique donc la formule du z :

Moyenne de l'échantillon - Norme


z=
Ecart - type de l'échantillon
n
On obtient :
47.8 − 43.6
𝑧= = 3.03775
8.96
√42

Calculs intermédiaires :
La racine de 42 est de 6.4807
Au dénominateur, on obtient : 8.96 / 6.4807 = 1.382566.
Ainsi : (47.8 – 43.6) / 1.3826 = 4.2 / 1.3826 = 3.03775
On arrondit à 3.04

On se reporte à la table de la loi normale centrée-réduite pour lire la probabilité correspondante à


cette valeur z de 3.04. On obtient 0.00237, ainsi p = .002. Nous étions dans une hypothèse unilatérale,
nous pouvons donc diviser par deux cette probabilité, p = .001185. Ainsi nous pourrons conclure à une
différence significative à p < .002
La succursale en question accuse bien un vieillissement du personnel par rapport à l’ensemble des
succursales, z(41) = 3.04, p < .002. Le ddl est ici de n-1, soit 42-1 = 41. Une autre manière d’écrire ce
résultat serait de noter, z(41) = 3.04**.

Pour l’ensemble des exercices ci-dessous, faire rédiger la conclusion aux étudiants. Cette dernière
doit préciser : 1/ le type de test de Student retenu ; 2/ la statistique correspondante écrite selon les
normes APA; 3/ le sens de la différence si celle-ci est observée avec un rappel des moyennes et écart-
types pour chacun des deux groupes.

EXERCICE 16 :
Nous sommes dans le cas d'une comparaison d’une moyenne (moyenne quotidienne des cigarettes
fumées par Jean durant 15 jours) et d’une norme (moyenne nationale des fumeurs français) avec un
effectif inférieur à 30. En effet, nous avons 15 observations (nombre de cigarettes fumées par jour
durant 15 jours). Nous devons appliquer la formule du t de Student :

Moyenne de l'échantillon - Norme


t=
Ecart - type de l'échantillon
n
5?&?@
On obtient : 𝑡 = 4.8 = 16.1394
√46

-18-
On arrondit à 16.14

Calculs intermédiaires :
La racine de 15 est 3.87298. On retient 3.8730
Au dénominateur : 1.2 / 3.8730 = 0.30983. On arrondit à 0.3098
Ainsi : (32-27) / 0.3098 = 5 / 0.3098 = 16.139444

On se reporte à la table du t de Student pour un degré de liberté égal à 14 (le ddl est de n-1, soit 15-1
ici). On trouve, au seuil de probabilité de .05, une valeur critique de 2.15. Le t calculé de 16.14 est donc
supérieur à cette valeur (il l’est d’ailleurs toujours au seuil .00001), ce qui nous amène à rejeter
l’hypothèse nulle. On peut conclure que la consommation moyenne de cigarettes de Jean est
supérieure significativement à celle de la moyenne des fumeurs français avec 1 risque sur 100 000 de
se tromper (1/100 000 = .00001). On s’arrête généralement à .001 (***), ainsi on notera en conclusion,
t(14) = 16.14, p < .001. Nous avons 1 risque sur 1000 de nous tromper ici en rejetant H0.

-19-
EXERCICE 17 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons appariés avec un
effectif inférieur à 30. C'est donc la loi de Student qui servira d'estimateur des différences observées.
On appliquera alors la formule :

Moyenne des différences


t=
Ecart - type des différences
Nombre de couples de données

La moyenne des différences est obtenue par :

md = Somme des différences entre chaque couple de données


Nombre de couples de données
et l'écart-type des différences par :

å (différences entre chaque couple - md )²


Nombre de couples - 1

On doit donc établir une nouvelle distribution, la distribution d des différences terme à terme, puis
calculer la moyenne et l'écart-type de cette distribution.

md = -2 + 0 + 0 + 1 + 0 + 0 + 4+ 4+ 1 + 1 + 5 + 3 + 5 + 3 + (-1) = 24 = 1.6
15 15

Pour le calcul de l'écart-type, le plus pratique est d'établir un tableau de décomposition des termes
nécessaires au calcul :

Sujet Différence Diff. - Moyenne (Diff. - Moyenne)²


1 -2 -2 – 1.6 = +3.6 12.96
2 0 0 – 1.6 = -1.6 2.56
3 0 0 – 1.6 = -1.6 2.56
4 1 1-1.6 = -0.6 0.36
5 0 -1.6 2.56
6 0 -1.6 2.56
7 4 2.4 5.76
8 4 2.4 5.76
9 1 -0.6 0.36
10 1 -0.6 0.36
11 5 3.4 11.56
12 3 1.4 1.96
13 5 3.4 11.56
14 3 1.4 1.96
15 -1 2.6 6.76
Somme 24 69.6

Ecart-type des différences = √69.6 / (15-1) = 2. 23.

-20-
Calculs intermédiaires :
69.6/14 = 4.9714
Je cherche la racine de 4.9714 et j’obtiens 2.22966. J’arrondis à 2.23

On peut alors calculer le t en appliquant la formule :

1.6 1.6
𝑡 = = = 2.77874
2.23 0.5758
√15
J’arrondis à 2.78

Calculs intermédiaires :
Je cherche la racine de 15 et j’obtiens 3.87298. J’arrondis à 3.8730
2.23 / 3.8730 = 0.57578. J’arrondis à 0.5758

On se reporte à la table de la loi du t de Student et l'on confronte le t calculé au t critique donné par la
table au seuil maximal d'erreur de 5% pour un ddl de 14 (15-1 = 14). On obtient 2.15. Le t calculé est
supérieur à ce t critique. On en conclut que les moyennes des scores de qualité de vie diffèrent
significativement du temps 0, T0, au temps 1, T1, c’est-à-dire un an plus tard. On constate que le t
calculé demeure supérieur au t théorique également au seuil de .02. Nous pouvons donc conclure avec
seulement de 2% de risques de nous tromper que le score de qualité de vie varie significativement au
cours de l’infection, t(14) = 2.78, p < .02. Il était fait l’hypothèse ici que le score de qualité de vie allait
diminuer au cours du temps, nous étions donc dans une hypothèse unilatérale, nous pouvons donc
écrire, t(14) = 2.78, p < .01.

T0 étant soustrait à T1 (12 mois après), une différence positive indiquera que le score à T0 est plus
élevé qu’à T1, et donc que la qualité de vie rapportée à T0 est supérieure à celle rapportée à T1, tandis
qu’une différence négative indiquera le contraire. Les différences étant majoritairement positives, t
est positif, ce qui signifie que le score de qualité de vie diminue au cours de l’infection. L’hypothèse du
chercheur est validée.

EXERCICE 18 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons indépendants
dont l’un des effectifs est inférieur à 30. On applique donc la formule du t de Student :

Moyenne échantillon 1 - Moyenne échantillon 2


t=
1 1
Ecart - type commun +
Effectif échantillon 1 Effectif échantillon 2

L'écart-type commun étant donné par la formule :


[Variance de l! échantillon 1 × (Effectif de l! échantillon 1 − 1)] + [Variance de l! échantillon 2 × (Effectif de l! échantillon 2 − 1)]
!
(Effectif de l! échantillon 1 + Effectif de l! échantillon 2) − 2

On calcule d'abord l'écart-type commun :


(3.29= x 32) + (2.34= x 26)
Ecart − type commun = U = 2.90284
58

Calculs intermédiaires

-21-
√ (3.29² x 32) + (2.34² x 26)
(33 + 27) – 2

√ (10.8241 x 32) + (5.4756 x 26)


60-2
√ 346.3712 + 142.3656
58

W488.7368/58
Ecart-type commun = √8.426496
Je cherche la racine de 8.4265 et j’obtiens 2.90284
J’arrondis à 2.90

On applique alors la formule du t :


22 − 14
𝑡 = = 10.634621
1 1
2.90233 + 27

Calculs intermédiaires :
1/33 + 1/27 = 0.0303 + 0.0370 = 0.0673
Je cherche la racine de 0.0673 et j’obtiens 0.2594
Au dénominateur, j’obtiens : 2.90 x 0.2594 = 0.75226
Au numérateur, j’obtiens : 22-14 = 8
Ainsi : 8 / 0.75226 = 10.634621
J’arrondis à 10.63

On se reporte à la table du t de Student et l'on cherche quel est le t critique correspondant à un degré
de liberté égal à (33 + 27) - 2 = 58 (un ddl de 60 lu dans la table fournie ou à un ddl de 50 pour se placer
dans une démarche plus conservatrice de l’hypothèse nulle). Comme nous sommes dans une
hypothèse unilatérale, nous pouvons aller lire dans la table théorique au seuil bilatéral de .10. Quel
que soit le seuil considéré à disposition dans la table théorique (de .10 à .00001), on constate que le t
calculé demeure supérieur aux t critiques fournis (c’est le cas pour un ddl de 60 et également pour un
ddl de 50). On peut donc conclure que les deux moyennes diffèrent significativement, t(58) = 10.63, p
< .00001.
Ainsi, conformément à l’hypothèse posée, ce sont les sujets engagés dans leur acte de solidarité qui
font les dons les plus importants. En conclusion, on retiendra que les sujets en condition d’engagement
donnent significativement plus d’argent pour la lutte contre le cancer que les sujets de la condition
contrôle, t(58) = 10.63***. Si nous étions dans la rédaction d’un compte rendu de recherche, le texte
à rédiger pourrait donc être :
Nous avons conduit un test de Student pour groupes indépendants qui nous montre qu’il existe une
différence significative dans le montant des dons des sujets engagés par la stratégie de pied dans la
porte par rapport à celui des sujets non engagés, t(58) = 10.63***. Le montant des dons est supérieur
pour les sujets engagés (M = 22, SD = 3.29) par rapport à ceux non engagés (M =14, SD = 2.34).

EXERCICE 19 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons appariés avec un
effectif inférieur à 30. C'est donc la loi de Student qui servira d'estimateur des différences observées.
On appliquera alors la formule :

-22-
Moyenne des différences
t=
Ecart - type des différences
Nombre de couples de données

La moyenne des différences est obtenue par :


Somme des différences entre chaque couple de données
md =
Nombre de couples de données

et l'écart-type des différences par :


å (différences entre chaque couple - md )²
Nombre de couples - 1

On doit établir une nouvelle distribution, la distribution d des différences terme à terme, puis calculer
la moyenne et l'écart-type de cette distribution.

(30 - 25) + (25 - 20) + (15 - 12) + ... + (20 - 15) + (18 - 15) + (8 - 8) 43
md = = = 4.3
10 10

Pour le calcul de l'écart-type, le plus pratique est d'établir un tableau de décomposition des termes
nécessaires au calcul :

Sujet Différence Diff. - Moyenne (Diff. - Moyenne)²


1 5 5 - 4.3 = 0.7 0.49
2 5 5 - 4.3 = 0.7 0.49
3 3 3 - 4.3 = -1.3 1.69
4 10 10 – 4.3 = 5.7 32.49
5 8 3.7 13.69
6 0 -4.3 18.49
7 4 -0.3 0.09
8 5 0.7 0.49
9 3 -1.3 1.69
10 0 -4.3 18.49
Somme 43 88.1

88.1
Ecart − type des différences = U = 3.12871
10 − 1

Calculs intermédiaires :
88.1 / 9 = 9.7889. Je cherche ensuite la racine de 9.7889. J’obtiens 3.12871.
J’arrondis à 3.13

On peut alors calculer le t en appliquant la formule :


4.3
𝑡 = = 4.3443
3.13
√10

-23-
La racine de 10 est 3.162277. J’arrondis à 3.1623
Au dénominateur : 3.13 / 3.1623 = 0.98978. J’arrondis à 0.9898
Ainsi, 4.3 / 0.9898 = 4.3443. J’arrondis à 4.34

On se reporte à la table de la loi du t de Student et l'on confronte le t calculé au t critique donné par la
table au seuil maximal d'erreur de 5% pour un ddl de 9 (10 - 1 = 9). On obtient 2.26. Le t calculé est
supérieur à ce t critique, il l'est d'ailleurs à celui correspondant au seuil de 1% d'erreur. On en conclut
que la moyenne des temps de réaction des enfants à la première expérience est significativement
différente de celle correspondante à la deuxième expérience, t(9) = 4.34, p < .01. Une autre manière
d’écrire ce résultat serait de noter t(9) = 4.34**.
La moyenne des différences nous montre que les temps de réaction sont plus long lors de la deuxième
expérience. Les enfants se montrent plus patients la deuxième fois par rapport à la première.
Autrement dit, il semblerait que les enfants aient "appris" la séparation avec leur mère suite à la
première expérience.

EXERCICE 20 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons indépendants
d'effectifs supérieurs à 30. On applique donc la formule du z :

Moyenne échantillon 1 - Moyenne échantillon 2


z=
Variance échantillon 1 Variance échantillon 2
+
Effectif échantillon 1 Effectif échantillon 2
On obtient :

8.62 − 12.43 −3.81


𝑧 = = = −3.57679
= = 1.0652
24.21 + 5.26
40 40

J’arrondis à -3.58

Calculs intermédiaires :
4.212 =17.7241
5.262 =27.6676
(17.7241 / 40) + (27.6676 / 40) = 0.4431 + 0.6917 = 1.1348
Je cherche la racine de 1.1348 et j’obtiens 1.06526. J’arrondis à 1.0652

ddl = (n1 + n2) – 2


ddl = (40 + 40) – 2
Le ddl est ici de 78

On se reporte à la table de la loi normale centrée-réduite et l'on cherche quelle est la probabilité
correspondante à la valeur z calculée. On obtient 0.00034. Cette valeur est largement inférieure au
seuil d'erreur de 5% (0.05). De plus, l’hypothèse du chercheur étant unilatérale, cette probabilité peut
être divisée par deux (0.00034 /2 = 0.00017). Dès lors qu’une probabilité est inférieure ou égale au
seuil critique en test bilatéral, elle le demeurera bien évidemment en test unilatéral. On peut donc dire,
avec très peu de risque d’erreur de se tromper, que les deux moyennes diffèrent significativement.
L’observation des moyennes nous montre que l’hypothèse du chercheur est confirmée puisque le
groupe A, ayant réalisé le montage au préalable, produit la notice plus rapidement que le groupe B,

-24-
lequel n’a pas réalisé le montage au préalable. En conclusion, il existe une différence significative entre
les 2 groupes à l’avantage du groupe A, z(78) = -3.58***.

La phrase de conclusion à rédiger pourrait être :


Nous avons réalisé un test de Student pour groupes indépendants qui révèle qu’avoir réalisé au
préalable le montage permet de rédiger plus rapidement la notice explicative (M = 8.62 ; SD = 4.21)que
ne pas avoir eu cette opportunité (M = 12.43; SD = 5.26), z(78) = -3.58, p < 0.0002. L’hypothèse du
chercheur est donc confirmée.

EXERCICE 21 :
Nous sommes dans le cas d'une comparaison de moyennes calculées sur échantillons indépendants
d'effectifs inférieurs à 30. On applique donc la formule du t de Student :

Moyenne échantillon 1 - Moyenne échantillon 2


t=
1 1
Ecart - type commun +
Effectif échantillon 1 Effectif échantillon 2

L'écart-type commun étant donné par la formule :

[Variance de l! échantillon 1 × (Effectif de l! échantillon 1 − 1)] + [Variance de l! échantillon 2 × (Effectif de l! échantillon 2 − 1)]
!
(Effectif de l! échantillon 1 + Effectif de l! échantillon 2) − 2

On calcule d'abord l'écart-type commun :


(0.45= x 15) + (0.43= x 15)
Ecart − type commun = U = 0.44011
30

Calculs intermédiaires :
(0.452 x 15) + (0.432 x 15) = (0.2025 x 15) + (0.1849 x 15) = 3.0375 + 2.7735 = 5.811
5.811 /30 = 0.1937
Je cherche la racine de 0.1937 et j’obtiens 0.44011.
J’arrondis à 0.44.
Je peux à présent calculer le t :
4.57 − 5.06
𝑡 = = −3.14910
1 1
0.44 216 + 16
J’arrondis à -3.15

Calculs intermédiaires :
Au numérateur : 4.57 – 5.06 = -0.49
1/16 + 1/16 = 0.0625 + 0.0625 =0.125
Je cherche la racine de 0.125 et j’obtiens 0.35355. J’arrondis à 0.3536
Au dénominateur : 0.44 x 0.3536 = 0.15558. J’arrondis à 0.1556
Ainsi -0.49 / 0.1556 = -3.14910.

On se reporte à la table du t de Student et l'on cherche quel est le t critique correspondant à un degré
de liberté égal à (16 + 16) - 2 = 30. Le t calculé est supérieur aux t critique correspondant au seuil de
.01. On peut donc dire que les deux moyennes diffèrent significativement, avec moins de 1% de risques
de se tromper. L’observation des moyennes révèle que l'anticipation à l'hypnose provoque une
-25-
ventilation respiratoire plus élevée qu'une absence d'anticipation, t(30) = -3.15, p < .01. Les chercheurs
donnaient une explication plausible de la ventilation plus importante observée en condition
d’anticipation à l’hypnose. Il s’agissait d’une explication à postériori aux vues des données descriptives.
La question posée était celle de l’existence ou non d’une différence de ventilation respiratoire entre
les 2 groupes, nous sommes donc ici dans le cas d’un test bilatéral.

En phrase de conclusion, nous pourrions écrire : Le test de Student pour groupes indépendants réalise
ici révèle une différence significative entre les 2 groupes, t(30) = -3.15, p < .01, à savoir que les sujets
prêts à être hypnotisés ont une ventilation respiratoire plus élevé (M = 5.06; SD = 0.43) que ceux non
en attente d’être hypnotisés (M = 4.57; SD = 0.45).

-26-
CORRECTION DES EXERCICES DE TD - SÉANCES 6, 7 & 8

EXERCICE 22 :
Au niveau descriptif, les moyennes sont différentes : les étudiants de cognitive ont obtenu les meilleurs
résultats, suivis des étudiants de sociale, puis des étudiants de développement et enfin des étudiants
de clinique. Pour tester cette différence, on va appliquer une ANOVA avec un seul facteur de variation
(la spécialité suivie) à 4 modalités inter-sujets : S<Spécialité4>

- Les hypothèses
H0 : Les moyennes des 4 groupes ne diffèrent pas entre elles
H1 : Au moins une des moyennes diffère

- Les degrés de liberté (ddl)


ddl Inter = (k – 1) = 4 – 1 = 3
ddl Intra = (N-1) – (k-1) = 48 – 3 = 45
ddl Total = (N-1) = 49 – 1 = 48

- Les Sommes des Carrés (SC)


Somme des Carrés du Total
On l'obtient par : variance totale x (N-1)
SC Total = 3.20² x 48 = 491.52

Calculs intermédiaires
3.20² = 10.24
10.24 x 48 = 491.52

Sur cet exercice, nous avons la chance que la variance totale, c’est-à-dire l’écart-type au carré de
l’ensemble de notre échantillon, nous soit donnée. Nous n’avons donc pas besoin de calculer
directement la Somme des Carrés du Total.
Si nous avions eu besoin de le faire, nous aurions appliqué la formule : SCtotal : Σ(X − M)=

Id Sujet Spécialité Note X – Moy Générale (X-Moy Générale)2


1 1 15.5 15.5 – 11.28 = 4.22 4.222 = 17.8084
2 1 16.5 16.5 – 11.28 = 5.22 5.222 = 27.248
3 1 6.5 6.5 – 11.28 = -4.78 22.8484
4 2 16.5 16.5 – 11.28 = 5.22 27.2484
5 2 11 11 – 11.28 = -0.28 0.0784
6 4 13.5 13.5 – 11.28 = 2.22 4.9284
7 1 12 12 – 11.28 = 0.72 0.5184
8 1 18 18 – 11.28 = 6.72 45.1584
9 3 12 12 – 11.28 = 0.72 0.5184
10 1 8.5 8.5 – 11.28 = -2.78 7.7284
… … …
49 3 9 9 – 11.28 = -2.28 5.1984

SOMME 493.5016

Ainsi. SC Total = 493.50


-27-
Ce calcul étant plus précis, il correspond à ce que vous auriez obtenu en utilisant un logiciel statistique
(voir diapo du cours magistral).

Somme des Carrés Intergroupes


Pour chaque groupe, on effectue : (m – M)² * n puis on somme le tout

Sociale : (11.36 – 11.28)² x 19 = 0.12


Calculs intermédiaires
11.36 - 11.28 = 0.08
0.08² = 0.0064
0.0064 x 19 = 0.1216. J’arrondis à 0.12

Cognitive : (13.61 – 11.28)² x 9 = 48.86


Calculs intermédiaires
13.61 - 11.28 = 2.33
2.33² = 5.4289
5.4289 x 9 = 48.8601. J’arrondis à 48.86

Clinique : (10.17 – 11.28)² x 14 = 17.25


Calculs intermédiaires
10.17 – 11.28 = - 1.11
-1.11² = 1.2321
1.2321 x 14 = 17.2494. J’arrondis à 17.25

Développement : (10.28 – 11.28)² x 7 = 7


Calculs intermédiaires
10.28 – 11.28 = - 1
-1²=1
1x7=7

SC Inter = 0.12 + 48.86 + 17.25 + 7 = 73.23

Somme des Carrés Intragroupes


On peut l'obtenir par différence en effectuant : SC Total – SC Inter
SC Intra = 491.52 – 73.23 = 418.29
OU bien avec le SC Total calculé précisément de 493.50 :
SC Intra = 493.50 – 73.23 = 420.27

- Les Carrés Moyens (CM)


CM Inter = SC Inter / ddl Inter = 73.23 / 3 = 24.41
CM Intra = SC Intra / ddl Intra = 418.29 / 45 = 9.2953. J’arrondis à 9.30
OU bien avec le SC Total de 493.50
CM Intra = SC Intra / ddl Intra = 420.27 / 45 = 9.3393. J’arrondis à 9.34

- Calcul du F et Tableau d'ANOVA


F (3, 45) = CM Inter / CM Intra = 24.41 / 9.30 = 2.6247. J’arrondis à 2.62
OU bien avec le SC Total de 493.50
F (3, 45) = CM Inter / CM Intra = 24.41 / 9.34 = 2.6134. J’arrondis à 2.61

-28-
Source SC Ddl CM F
Intergroupes
73.23 3 24.41 2.62
(Spécialité)
Intragroupes
418.29 45 9.30
(Erreur)
Total 491.52 48

OU bien avec le SC Total de 493.50

Source SC Ddl CM F
Intergroupe
73.23 3 24.41 2.61
(Spécialité)
Intragroupe
420.27 45 9.34
(Erreur)
Total 493.50 48

- Lecture de la table et conclusion


On cherche les valeurs critiques correspondant à F(3,45). Nous n’avons pas ddl 2 = 45, on se
rapproche le plus possible du degré de liberté approprié. En demeurant à un ddl inférieur à celui
recherché, nous serons dans un test plus conservateur de l’hypothèse nulle. On regarde à F(3,44)
(valeur immédiatement inférieure à la valeur manquante que l'on cherche). On trouve 2.82 au seuil .05
et 4.26 au seuil .01. La valeur calculée de 2.62 (ou 2.61 selon la méthode de calcul du SC total) est
inférieure à ces valeurs critiques. On ne peut donc pas rejeter l’hypothèse nulle. On en conclue que les
résultats en statistiques ne sont pas liés à la spécialité suivie par les étudiants, F (3, 45) = 2.62, p > .05,
ns.
La phrase de conclusion à reporter pourrait être : Nous avons réalisé une ANOVA Intersujets à 1 facteur
à 4 modalités qui révèle une absence d’effet de la spécialité choisie par les étudiants sur leurs notes en
statistiques (M = 11.28 ; SD = 3.20), F (3, 45) = 2.62, p > .05, ns.

-29-

Vous aimerez peut-être aussi