Vous êtes sur la page 1sur 58

2022-10-11

Méthodologie de la recherche I

ADM-8005

Thème 3 : Empirisme

Méthodologie de la
recherche I

ADM-8005

Séance 7 : Les tests d’hypothèses

Nabil Amara, Ph.D.

1
2022-10-11

1
CARACTÉRISTIQUES DE TENDANCE CENTRALE, DE DISPERSION
ET DE FORME

• Certains nombres représentatifs peuvent résumer


de façon assez complète l’ensemble des valeurs de
la distribution d’une variable;

• Ces nombres qu’on désignera par caractéristiques


des séries statistiques d’une variable donnent une
signification concrète à l’interprétation des résultats
et facilitent la comparaison de deux ou plusieurs
séries d’une variable donnée.

3 PRINCIPAUX TYPES DE CARACTÉRISTIQUES

• Les caractéristiques (ou mesure) de tendance


centrale : elles donnent une idée sur l’ordre de
grandeur des valeurs qui constituent la série et
indiquent aussi la position où semblent se concentrer
les valeurs de la série (moyenne, mode, médiane);
• Les caractéristiques (ou mesure) de dispersion : elles
quantifient les fluctuations des valeurs observées
autour de la valeur centrale. Elles permettent
d’apprécier l’étalement de la série, c’est-à-dire de
préciser dans quelle mesure les valeurs observées
s’éloignent les unes des autres ou s’éloignent de leur
valeur centrale (écart type, CV);
• Les caractéristiques de forme : elles donnent une idée
de la symétrie et de l’aplatissement d’une distribution
(distribution normale, symétrique, etc..).

2
2022-10-11

LES TESTS STATISTIQUES

INFÉRENCE: UTILITÉ DES STATISTIQUES

• Pour s’assurer que les différences observées ne


sont pas simplement le résultat du hasard?

• Pour savoir à quel seuil de risque on peut


généraliser le résultat de l’échantillon à la
population.

3
2022-10-11

5
QUESTIONS IMPORTANTES À SE POSER AVANT D’EFFECTUER
UNE ANALYSE STATISTIQUE

• Les observations sont-elles indépendantes?

• Est-ce qu’elles composent un échantillon aléatoire?

• Les données récoltées permettent-elles de répondre


à votre question de recherche?

• L’outil d’analyse envisagé est-il approprié pour


répondre à votre question? (type de données
disponibles)

• Existe-t’il une analyse alternative? (Ex: moins de 5


observations par cellule et Chi-carré).

TESTS D’HYPOTHÈSES

• “Hypothesis testing is nothing else but a systematic


approach to assessing beliefs about realities: It is
confronting a belief (such as a tentative idea about
the value of an unknown population parameter) with
evidence (such as the value of a statistic computed
from a random sample taken from the population in
question) and then deciding, in light of this evidence,
whether the initial belief (or hypothesis) can be
maintained as reasonable or must be discarded as
untenable.” (Kohler, 1988: 340).

4
2022-10-11

A. HYPOTHÈSES STATISTIQUES

• Ce sont des affirmations relatives aux distributions de probabilité;

• Ces affirmations peuvent être vraies ou fausses;

• Dans la plupart des tests on formule une hypothèse dans le but de


la rejeter;

• Hypothèse nulle (H0) généralement (mais pas toujours) formulée


pour indiquer qu’il n’y a pas de différence;

• Hypothèse alternative (H1) prévaut lorsque H0 est rejetée.

B. TESTS D’HYPOTHÈSES

• Test d’hypothèses: les techniques (procédures) statistiques qui permettent de


décider si les hypothèses énoncées sont vraies ou fausses pour prendre une
décision concernant le phénomène (la situation) à l’étude;

• Domaine des statistiques inférentielles;

• Le choix d’un test dépend:

✓ du type de la variable étudiée (quantitative/qualitative: nominale; ordinale;


intervalle; ratio);

✓ du type de problème étudié (comparaison de 2 moyennes; comparaison de plus


de 2 moyennes; ajustement à une distribution particulière, etc..);

✓ Taille de la population ou de l’échantillon;

✓ Des conditions d'application (modélisation en terme de loi de probabilité).

Toutefois (heureusement) la procédure d'un test est toujours la même.

10

5
2022-10-11

9
C. TEST PARAMÉTRIQUE ET TEST NON PARAMÉTRIQUE

• Tests paramétriques: Tests utilisant des méthodes permettant de


tirer des conclusions sur les paramètres d’une population (moyenne,
écart type, variance) à partir d’une information partielle (échantillon);

• Or, parfois on veut tirer des conclusions non pas sur les paramètres
de la population mais plutôt sur d’autres aspects d’une variable
donnée dans la population : la distribution de cette variable; ses
relations avec d’autres variables; etc.;

• Dans ce cas, on fait appel à une méthode d’inférence non


paramétrique;

• De façon générale, on appelle méthodes non paramétriques, les


méthodes d’inférences statistiques qui n’exigent pas comme condition
la connaissance des paramètres de la distribution de la population.

11

10

D. TEST BILATÉRAL ET TEST UNILATÉRAL

• L’hypothèse nulle (H0) renvoie généralement à l’égalité.


• Les hypothèses alternatives : Différent ; Plus grand que ;
Plus petit que;
• Lorsque l’on considère l’ensemble des hypothèses
alternatives  Test bilatéral;
• Lorsque, à priori, on ne considère qu’une partie des
hypothèses alternatives : soit plus grand soit plus petit 
Test unilatéral;
▪ Exemple : On cherche à comparer la taille des enfants de
3 et 6 ans. Le test est (selon le bon sens) unilatéral:
✓H0 : Moyenne Taille 3 ans = Moyenne Taille 6 ans.
✓H1 : Moyenne Taille 3 ans < Moyenne Taille 6 ans.

12

6
2022-10-11

11
E. LES ERREURS DU TYPE I (a) ET DU TYPE II (b)

▪ L’erreur du type I : Rejeter H0 alors qu’elle est vraie.


✓Exemple: Comparaison de 2 insecticides (efficacité) : un
nouveau et un ancien. On arrive à la conclusion que le nouveau
est plus efficace alors que c’est faux  On commet une erreur du
type I;

▪ L’erreur du type II : Accepter H0 alors qu’elle n’est pas vraie.


✓Exemple: On arrive à la conclusion qu’il n’y a pas de différence
entre les 2 insecticides alors qu’en réalité le nouveau est plus
efficace  On commet une erreur du type II.

13

12
E. LES ERREURS DU TYPE I (a) ET DU TYPE II (b)

H0: Pas enceinte


H1: Enceinte

14

7
2022-10-11

13
E. LES ERREURS DU TYPE I (a) ET DU TYPE II (b)

Décisions Accepter H0 Rejeter H0

États
H0 est vraie Bonne décision Erreur du type I
1-a a

H0 est fausse Erreur du type II Bonne décision


b 1-b

1- b = Puissance du test = Probabilité de rejeter H0 alors


qu’elle est effectivement fausse.

15

14
F. NIVEAU DE SIGNIFICATION DU TEST (a)

• Seuil (niveau) de signification: la probabilité avec laquelle


on accepte de faire une erreur du type I (Rejeter H0 alors
qu’elle est vraie);

• Ce risque est spécifié avant l’expérience, au moment où


l’on pose le problème;

• Lechoix de a dépend du degré de précision recherché:


Poids moyen des boites de conserves Vs quantité
moyenne d’une drogue puissante dans un médicament;

• a de 5% (.05): on accepte le risque que 5 fois sur 100 on


se trompe en rejetant H0 alors qu’elle est vraie.

16

8
2022-10-11

15

G. LES ÉTAPES D’UN TEST

1. Formuler l’hypothèse nulle (H0);


2. Formuler l’hypothèse alternative et choisir un test
unilatéral ou bilatéral;
3. Choisir le test statistique approprié (Chi-carré; t de
Student; ANOVA; etc.);
4. Déterminer la valeur critique à partir de la loi de
probabilité de la statistique et du risque a accepté;
5. Déterminer le nombre de d.l. (si on utilise les tables);
6. Calculer la valeur du test à partir de l’échantillon;
7. Confronter la valeur critique et la valeur calculée;
8. Décision:

17

16

DÉCISION: (Très important)

• Deux façons:

1. Comparer la valeur calculée à la valeur critique


(obtenue à partir d’une table de la loi de la
statistique en tenant compte du seuil choisi et du
nombre de d.l. ): Rejeter H0 si Valeur calculée >
Valeur critique.

18

9
2022-10-11

17

DÉCISION: (Très important)

19

18

DÉCISION: (Très important)

2. Comparer le P.Value au seuil a : Rejeter H0 si P.value <


Seuil de signification (a)

20

10
2022-10-11

19
HYPOTHÈSES SUR LA MOYENNE D’UNE POPULATION

• Exemples:

Forme 1: Forme 2: Forme 3:


H0: m = m0 H0: m ≥ m0 H0: m ≤ m0
H0: m < m0 H0: m  m0 H0: m  m0

21

20
HYPOTHÈSES SUR LA MOYENNE D’UNE POPULATION : EXEMPLES

▪ Forme 1 (two-sided hypothesis = bilatérale):


H0: La machine M fabrique des tiges d’une longueur moyenne de 5 m.
H1: La longueur moyenne des tiges est différente de 5 m.

▪ Forme 2 (one-sided-hypothesis = unilatérale):


H0: La durée de vie moyenne d’une pile de marque X est au moins de 100
heures.
H1: La durée de vie moyenne d’une pile de marque X est inférieure à 100
heures.

▪ Forme 3 (one-sided-hypothesis = unilatérale):


H0: Le temps de livraison moyen d’une compagnie C est au plus d’une semaine.
H1: Le temps de livraison moyen d’une compagnie C est supérieur à une
semaine.

22

11
2022-10-11

21
HYPOTHÈSES SUR LA DIFFÉRENCE DE MOYENNES DE DEUX
POPULATIONS

Forme 1: Forme 2: Forme 3:


H0: mA = mB H0: mA ≥ mB H0: mA ≤ mB
H1: mA ≠ mB H0: mA < mB H0: mA  mB

• On peut aussi formuler des hypothèses sur la


proportion d’une population ou la différence de
proportions entre 2 populations.

23

22

AUTRES HYPOTHÈSES :

• Approximation d’une distribution:


H0: La variable X suit la distribution normal
(uniforme, binomial, etc.)
H1: La variable X ne suit pas la distribution…….

• Indépendance (association) entre 2 variables:


H0: Les variables X et Y sont indépendantes
H1: Les variables X et Y sont dépendantes

24

12
2022-10-11

23
LES MESURES D’ASSOCIATION ET DE CORRÉLATION

• Définition : une mesure d’association statistique est


une procédure de calcul dont le résultat indique la force
de l’association;

• Un coefficient d’association statistique varie entre 0 et 1


ou de -1 à 1. Il est appelé coefficient de corrélation
quand les variables sont ordinales ou quantitatives;

• On ne calcule pas le coefficient de corrélation entre


deux variables nominales.

25

24
TEST DE CORRÉLATION : MESURE D’ASSOCIATION
LINÉAIRE ENTRE 2 VARIABLES

• Le sens de la causalité n’est pas prédéterminé;


• Le coefficient de corrélation varie entre -1 et 1. Plus on
s’approche des extrémités, plus la corrélation est forte;
• Coefficient de corrélation = 1→ Corrélation positive parfaite;
• Coefficient de corrélation = -1→ Corrélation négative parfaite;
• Variables continues (du type ratio) et normalement distribuées
→ Coefficient de Pearson;
• Variables intervalles ou quantitatives non normalement
distribuées → Coefficient de Spearman (version non
paramétrique du Pearson);
• H0: Il n’y a pas de corrélation entre les deux variables (la
corrélation est nulle);
• H1: La corrélation entre les 2 variable diffère de 0.

26

13
2022-10-11

25

ILLUSTRATION GRAPHIQUE

⚫ Scattergrams: ==> Graphs Vous Negative Correlation Positive Correlation

permet de vous faire une idée;


100 100

Score on Exam

Score on Exam
90 90
80 80

⚫ r: Symbole du coefficient de
70 70
60 60
50 50
crorrélation de pearson; 40
30
40
30
20 20

⚫ Informe sur l’association: par la 10


0
10
0

présence (absence) de co-


1 6 11 1 6 11
Hours Spent Studying Hours Spent Studying

variation manifeste dans un sens


ou dans l’autre; Figure 7.2

⚫ Auquel cas: on peut présumer une


No Correlation Between Hours Spent Studying and Exam
Scores

association significative dans les 100


90

travaux de régression c.a.d: 80


70

explication.

Scores on Exam
60
50
40
30
20
10
0
0 2 4 6 8 10 12
Hours Spent Studying

27

26

CORRÉLATION

• Corrélation très forte = 0.80 à 1


• Corrélation modérement forte = 0.60 à 0.79
• Corrélation modérée = 0.50 à 0.59
• Corrélation modéremment faible = 0.30 à .49
• Corrélation faible à nulle de 0 à 0.29

-1.00 0.00 1.00


Corrélation Aucune relation Relation
négative parfaite
parfaite

28

14
2022-10-11

27
CORRÉLATION BIVARIÉE: EXEMPLE AVEC SPSS

• On veut savoir s’il y a une relation entre le niveau des


ventes des entreprises manufacturières opérant dans la
région de Québec/Chaudière-Appalaches et la taille de
ces entreprises;

Opérationnalisation:

✓Niveau des ventes: Chiffre d’affaires réalisé en 1997 (en


$);
✓Taille: Nombre d’employés.

29

28

HYPOTHÈSES

• H0: Il n’y a pas de corrélation (association) entre la taille


de l’entreprise et son niveau des ventes;

• H1: Il y a une corrélation.

• Seuil de signification (a) =.05;

• On rejette H0 si P-value <.05;

• Avant tout, vérifier la normalité des deux variables : taille


et niveau des ventes (Analyse graphique).

30

15
2022-10-11

29
EXEMPLE SPSS: VÉRIFICATION DE LA NORMALITÉ DE LA
VARIABLE AGE

31

30
EXEMPLE SPSS: VÉRIFICATION DE LA NORMALITÉ DE LA
VARIABLE AGE

32

16
2022-10-11

31
EXEMPLE SPSS: VÉRIFICATION DE LA NORMALITÉ DE LA
VARIABLE AGE

33

32
EXEMPLE SPSS : TEST DE CORRÉLATION BIVARIÉE

34

17
2022-10-11

33
EXEMPLE SPSS : TEST DE CORRÉLATION BIVARIÉE

35

34
APRÈS AVOIR VÉRIFIÉ LA NORMALITÉ DES 2 VARIABLES

Correlations
Nombre Chiffre
employés d'affires97
total
Nombre Pearson 1,000 ,877**
employés Correlation
total
Sig. (2-tailed) , ,000
N 794 654
Chiffre Pearson ,877 1,000
d'affires97 Correlation
Sig. (2-tailed) ,000 ,
N 654 655
** Correlation is significant at the 0.01 level (2-tailed).

Décision: Il y a une très forte corrélation positive entre la taille


de l’entreprise et le niveau de ses ventes.

36

18
2022-10-11

35
SOURCES POSSIBLES DES DÉVIATIONS

• Trois raisons peuvent expliquer les écarts entre les


valeurs observées et prédites :

Des mesures imprécises;


L’hypothèse est fausse;
Combinaison de (1) et (2).

37

35
36
SOURCES POSSIBLES DES DÉVIATIONS

LES TESTS D’HYPOTHÈSES SUR


DES MOYENNES

38

19
2022-10-11

37
TEST D’HYPOTHÈSE SUR UNE MOYENNE (ONE-
SAMPLE T-TEST)

Tester si la moyenne d’un échantillon est égale à une valeur


théorique mT en calculant:

X − mT
t=
sX
• On compare la valeur de t obtenue à la valeur critique de
la distribution du t de Student avec n-1 degrés de liberté.
n = taille de l’échantillon.
ou:
• On compare le P-value avec le seuil a (.05).

39

38

TEST SUR UNE MOYENNE AVEC SPSS

On cherche à tester si la moyenne d’une variable diffère


ou non d’une constante spécifiée;

• H0: La moyenne des exportations des entreprises


manufacturières de la région Québec/Chaudière-
Appalaches = 10% de la moyenne des ventes totales

• H1: La moyenne………diffère……….

Condition : normalité de la variable du type ratio:


exportations

40

20
2022-10-11

39

EXEMPLE SPSS : TEST DE MOYENNE (ONE SAMPLE T-TEST)

41

40

EXEMPLE SPSS : TEST DE MOYENNE (ONE SAMPLE T-TEST)

42

21
2022-10-11

41

EXEMPLE SPSS : TEST DE MOYENNE (ONE SAMPLE T-TEST)

43

41

EXEMPLE SPSS : TEST DE MOYENNE (ONE SAMPLE T-TEST)

44

22
2022-10-11

42

CONDITIONS D’APPLICATION

• p est calculé en assumant que t suit la distribution du


t de Student;

• Ceci est vrai seulement si les données sont


distribuées normalement.

45

43
SOLUTIONS LORSQUE LES DONNÉES NE SONT PAS DISTRIBUÉES
NORMALEMENT ET p EST PRÈS DE a?

A. Augmenter la taille de l’échantillon;

B. Transformer les données;

C. Utiliser un test non paramétrique qui ne requiert


pas que les données soient distribuées
normalement.

46

23
2022-10-11

44

TRANSFORMATION DES DONNÉES

• Utiliser des fonctions mathématiques simples comme: Ln;


racine carrée; etc.;

• Essai-erreur;

• Trouver la transformation adéquate est parfois très difficile


car des fois il faut respecter certains aspects théoriques
rattachés à la variable à transformer (ex: Loi des
rendements décroissants);

• Certaines données ne peuvent pas être normalisées: (ex: 0


lorsqu’on utilise la transformation logarithmique).

47

45

VÉRIFICATION DE L’AJUSTEMENT D’UNE VARIABLE

Analyse graphique:

Permet à l’aide d’un diagramme de confronter les


fréquences cumulées observées de la variable à
l’étude à celles des distributions connues (normale;
uniforme; binomiale, etc..);

• Exemple: On veut savoir si la distribution des


publications des chercheurs canadiens en sciences
et génies suit la distribution normale.

48

24
2022-10-11

46
EXEMPLE SPSS : VÉRIFICATION DE LA NORMALITÉ D’UNE
VARIABLE

49

47
EXEMPLE SPSS : VÉRIFICATION DE LA NORMALITÉ D’UNE
VARIABLE

50

25
2022-10-11

48
EXEMPLE SPSS : VÉRIFICATION DE LA NORMALITÉ D’UNE
VARIABLE

51

49
EXEMPLE SPSS : VÉRIFICATION DE LA NORMALITÉ D’UNE
VARIABLE

52

26
2022-10-11

50

LE RECOURS À DES TESTS STATISTIQUES

• Chi-carré; Kolmogorov-Smirnov;
• Le test de Kolmogorov-Smirnov sur une variable compare la
fonction de distribution cumulative de cette variable à la fonction de
distribution cumulative d’une distribution théorique connue
(normale; uniforme; etc.);
• La valeur calculée Z du KS est donnée par la plus grande
différence en (valeur absolue) entre les fonctions de distribution
observée et théorique;
• Z indique si les observations de la variable à l’étude peuvent,
raisonnablement, provenir de la distribution théorique spécifiée;
• Hypothèses:

✓ H0 : La distribution de la variable X suit la distribution Y.


✓ H1 : La distribution de la variable X ne suit pas la distribution Y.

53

51

EXEMPLE SPSS : TEST DE KOLMOGOROV-SMIRNOV

54

27
2022-10-11

52

EXEMPLE SPSS : TEST DE KOLMOGOROV-SMIRNOV

55

53

EXEMPLE SPSS : TEST DE KOLMOGOROV-SMIRNOV

One-Sample Kolmogorov-Smirnov Test


Publications (Article*1+
Livres*5 +Chapitres*1)
N 1553
Uniform Minimum ,00
Parameters
Maximum 223,00
Most Extreme Absolute ,734
Differences
Positive ,734
Negative -,001
Kolmogorov- 28,942
Smirnov Z
Asymp. Sig. ,000
(2-tailed)

Décision:

On rejette H0 au seuil .05 car le Z calculé (28.942) > à la valeur critique donnée par
1.36/√n = .034

Autre façon pour décider ?

56

28
2022-10-11

54
TESTS DE DIFFÉRENCE DE MOYENNE SUR 2 ÉCHANTILLONS
INDÉPENDANTS
• Comparaison de deux populations distinctes (indépendantes);

• On veut effectuer un test sur des paramètres de même nature de


chacune de ces deux populations;

• Les deux populations sont distribuées normalement;

• Une variable continue et une variable catégorielle qui distingue entre


les deux échantillons;
• On distingue deux cas:
✓ Les variances des deux population sont égales;
✓ Les variances des deux populations ne sont pas égales.
• Donc, pour tester la différence de moyenne, il faut commencer par
tester l’égalité ou non des variances;
• Heureusement, les logiciels statistiques font tout cela simultanément.

57

55

EXEMPLE AVEC SPSS

• On veut comparer les exportations des entreprises


manufacturières dans deux régions du Québec:
Québec et Chaudière-Appalaches;

• On doit effectuer deux tests:


1. Test d’égalités des variances:
H0: Les variances des deux populations en ce qui a trait
à la variable exportation sont égales
H1: ≠

2. Tests de différence des moyennes:


H0: La moyenne des exportations dans la région de
Québec = La moyenne des exportations dans la
région de Chaudière-Appalaches.
H1: ≠
58

29
2022-10-11

56
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
INDÉPENDANTS)

59

57
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
INDÉPENDANTS)

60

30
2022-10-11

58
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
INDÉPENDANTS)

T-Test: (Exportation en % du chiffre d’affaires)


Group Statistics
Régions N Mean Std. Std. Error Mean
(Québec=0; Deviation
Chaudière-
Appalaches=1)
Exportations Québec 288 13,0139 26,8316 1,5811
en dehors du
Canada
Chaudière- 264 15,2576 26,0278 1,6019
Appalaches

Independent Samples Test


Levene's t-test for
Test for Equality
Equality of of Means
Variances
F Sig. t df Sig. (2- Mean Std. Error
tailed) Difference Difference

Exportations Equal ,371 ,543 -,996 550 ,320 -2,2437 2,2537


en dehors du variances
Canada assumed

Equal -,997 548,233 ,319 -2,2437 2,2507


variances
not
assumed

61

59

DÉCISION:

• On ne peut rejeter l’hypothèse H0 relative à l’égalité des


variances car: P-Value .543 >.05;
• Ou encore car: Fcalculée = .371 < Fthéorique au seuil .05 et
avec
(n1-1; n2-1) d.l. (287; 263);
• Le Fthéorique= 1.15;

• Puisque les variances sont égales, on utilise le test t de la


première ligne du deuxième tableau;

• Dans ce cas, on ne peut rejeter l’hypothèse H0 relative à


l’égalité des moyennes.

62

31
2022-10-11

60
TEST DE DIFFÉRENCE DE MOYENNE SUR DEUX ÉCHANTILLONS
APPARIÉS

• Dans les échantillons appariés, les observations


(sujets) dans un groupe forment des paires avec les
observations (sujets) de l’autre groupe (Salaires
joueurs Hockey avant et après grève; pollution
entreprises avant et après Kyoto; etc..);

• Exemple sur SPSS: On veut tester l’effet d’un


traitement sur la pression artérielle d’un groupe
d’individus.
• H0:  Pressions = 0
• H1:  Pressions ≠ 0

63

61
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
APPARIÉS)

64

32
2022-10-11

62
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
APPARIÉS)

65

63
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
APPARIÉS)

66

33
2022-10-11

64
EXEMPLE SPSS : TEST DE MOYENNE (2 ÉCHANTILLONS
APPARIÉS)

Paired Samples Statistics


Mean N Std. Std. Error
Deviation Mean
Pair 1 Pression sanguine 13,8182 11 2,4008 ,7239
avant traitement
Pression sanguine 12,6364 11 1,4334 ,4322
après traitement

Paired Samples Correlations


N Correlation Sig.
Pair 1 Pression sanguine avant 11 ,880 ,000
traitement & Pression
sanguine après traitement

Paired Samples Test


Paired t df Sig. (2-
Differences tailed)
Mean Std. 95%
Deviation Confidence
Interval of
the
Difference
Lower Upper
Pair 1 Pression 1,181 1,328 ,289 2,074 2,95 10 ,014
avant -
Pression
après

67

65

TEST DU CHI-CARRÉ

3 applications majeures:

1. Indépendance entre 2 variables;


2. Test de proportions (une autre façon pour formuler le
test d’indépendance);
3. Ajustement d’une distribution.

68

34
2022-10-11

66

CHI-CARRÉ : TEST D’INDÉPENDANCE

• Permet de tester si la probabilité d’occurrence d’une


variable dépend de la probabilité d’occurrence d’une
autre variable:

✓Relation entre risque de crise cardiaque et style de vie;


✓Occurrence d’une maladie donnée et un type de vaccin;
✓Niveau d’éducation et préférences pour un produit

• Niveau de mesure: nominal.

69

67

TEST DU CHI-CARRÉ : EXEMPLE

On veut tester s’il y a une relation entre le sexe (Femme;


Homme) et la préférence pour 3 marques de café (A; B; C).

• Étape 1: Formulation des hypothèses:


H0: Le sexe et la préférence pour les marques de café sont deux
variables indépendantes;
H1: Le sexe et la préférence pour les marques de café sont deux
variables dépendantes.
• Étape 2: Sélection du test statistique: 2=  (Fo- Ft)2/ Ft
• Étape 3: Règle de décision: Accepter H0 si 2 calculé  2 théorique
• Étape 4: Construire le tableau de contingence
Calculer les fréquence théoriques Ft :
Ft= (Total Ligne * Total Colonne) /Taille échantillon

70

35
2022-10-11

68

TEST DU CHI-CARRÉ : EXEMPLE

Marque de café
Sexe A B C Total
(1)Homme 20 10 30 60
(2)Femme 15 15 10 40

Total 35 25 40 100

Ligne/ Fréquences Fréquences Fo- Ft (Fo- Ft)2 (Fo- Ft)2/ Ft


Colonne observées théoriques
(Fo) (Ft)
si H0 vrai
(1,A) 20 21 -1 1 .05
(1,B) 10 15 -5 25 1.67
(1,C) 30 24 6 36 1.50
(2,A) 15 14 1 1 .07
(2,B) 15 10 5 25 2.5
(2,C) 10 16 -6 36 2.25

Total 100 100 0 2= 8.04

(1,A) = 60 X 35 /100 =21


(1,B) = 60 X 25/100 =15

71

69

RÉCAPITULATION

• 2 calculé = 8.04;

• Dégrés de liberté (d.l.) = (Nbre colonne –1)*(Nbre ligne-1);

• 3 marques de café et 2 sexes  d.l. = 2;

• 2 théorique seuil .05 avec 2 d.l. = 5.99;

• Règle de décision: Rejeter H0 si 2 calculé  2 théorique;

• Décision: On rejette H0 dépendance entre Sexe et


Marque de café.

72

36
2022-10-11

70

CHI-CARRÉ : TEST D’INDÉPENDANCE

73

71

EXEMPLE AVEC SPSS

• On veut savoir s’il existe une association entre le


domaine de recherche (discipline) et l’effort en matière
de PPI;

• Hypothèses:
H0: Le domaine et le PIP sont deux variables
indépendantes;
H1: Le domaine et le PIP sont deux variables
dépendantes.

Domaine: 6 domaines (variable nominale);


PIP: Oui ou Non (variable nominale).

74

37
2022-10-11

72
EXEMPLE SPSS : TEST CHI-CARRÉ (TEST D’INDÉPENDANCE)

75

73
EXEMPLE SPSS : TEST CHI-CARRÉ (TEST D’INDÉPENDANCE)

76

38
2022-10-11

74
EXEMPLE SPSS : TEST CHI-CARRÉ (TEST D’INDÉPENDANCE)

Count
Protection of IP Total
No Yes

Domains Engineering 240 212 452


Chemistry 78 48 126
Physics, 196 32 228
Mathematics and
Statistics
Computer 75 45 120
Sciences
Earth Sciences 84 26 110
Life Sciences 282 143 425

Total 955 506 1461

Chi-Square Tests
Value df Asymp. Sig. (2-
sided)
Pearson Chi-Square 79,948 5 ,000
Likelihood Ratio 85,896 5 ,000
Linear-by-Linear 16,021 1 ,000
Association
N of Valid Cases 1461

Chi-Carré théorique au seuil .05 et avec 5 d.l.= 11.07

Décision : Chi-carré calculé (79.948) > Chi-carré théorique.

Donc………………………………..H0.

77

75

CHI-CARRÉ: TEST DE PROPORTIONS

• Compare les fréquences observées et les fréquences


théoriques (si H0 est vraie) des différentes catégories
d’une variable;

• Permet de tester si toutes les catégories ont des


proportions égales ou encore les catégories ont les
proportions spécifiées dans H0;

• Niveau de mesure: nominal;

• Hypothèses (proportions égales):


H0: Π1= Π2= Π3= Π4=…= Πn
H1: Au moins une inégalité

78

39
2022-10-11

76

EXEMPLE AVEC SPSS

•À partir d’un échantillon, on veut tester si les


chercheurs en sciences et génies sont répartis de
façon égale entre 6 regroupements disciplinaires :

1. Génies;
2. Chimie;
3. Physique, mathématiques et statistiques;
4. Informatique;
5. Sciences de la terre;
6. Sciences de la vie.

• Taille de l’échantillon: 1554.

79

77
EXEMPLE SPSS : TEST CHI-CARRÉ (TEST DE PROPORTIONS)

80

40
2022-10-11

78

CHI-CARRÉ: TEST DE PROPORTIONS

81

Nabil Amara Ph.D.,


82
ADM-8005

82

41
2022-10-11

Test de proportion :

Domaines Observed N Expected N Residual

Engineering 479 259,0 220,0


Chemistry 128 259,0 -131,0
Physics, 246 259,0 -13,0
Mathematics and
Statistics
Computer Sciences 126 259,0 -133,0
Earth Sciences 126 259,0 -133,0
Life Sciences 449 259,0 190,0
Total 1554

Test Statistics
Chi-Square 529,761
df 5
Asymp. Sig. ,000

Décision : P-value < .05  On rejette Ho.

Nabil Amara Ph.D.,


83
ADM-8005

83

Nabil Amara Ph.D.


84
ADM-8005

84

42
2022-10-11

79

LES TESTS D’ASSOCIATION

Conditions d’application de différents tests


d’association entre deux variables :
TESTS CONDITIONS D’APPLICATION
Coefficient de Les 2 variables suivent une distribution normale
corrélation de et
Pearson Les 2 variables sont continues (quantitatives)
Coefficient de Les 2 variables ne suivent pas une distribution
corrélation de normale
Spearman ou
Les 2 variables sont intervalles
Chi-carré Les 2 variables sont nominales (catégorielles)
Phi et V de Les 2 variables sont nominales (catégorielles)
Cramer et
Les 2 variables suivent une distribution multinomiale
Gamma Les 2 variables sont ordinales
Eta Une variable est continue et l’autre est catégorielle
Kappa Les 2 variables ont les mêmes catégories
(Ex : Cotes attribuées à une thèse de Doctorat par
deux évaluateurs)

85

35
80
SOURCES POSSIBLES DES DÉVIATIONS

ANALYSE DE VARIANCE (ANOVA)

86

43
2022-10-11

81

QUAND UTILISER L’ANOVA

• Pour tester l’effet d’une variable indépendante discrète


(catégorielle) sur une variable continue;
• Chaque variable indépendante est appelée un facteur et
chaque facteur peut avoir deux ou plusieurs niveaux ou
traitements;
• L’ANOVA teste si toutes les moyennes sont égales;
• On l’utilise quand le nombre de niveaux (catégories) est
supérieur à deux;
• La variable continue doit être distribuée normalement;
• L’ANOVA suppose l’homogénéité des variances: donc il faut
tester préalablement l’égalité des variances (Levene Test);
• Si égalité des variance, utiliser par la suite, par exemple, le
test de Duncan, si inégalité des variances alors utiliser par la
suite, par exemple, le test Tamhane’s.

87

82

POSSIBILITÉS ET LIMITES DE l’ANOVA

• Permet de tester si toutes les moyennes sont égales


(au seuil a)...

• …mais si on rejette H0, l’ANOVA n’indique pas quelle


moyenne est plus élevée ou moins élevée que les
autres.

88

44
2022-10-11

83
ANOVA: L’HYPOTHÈSE NULLE ET L’HYPOTHÈSE ALTERNATIVE

• H0: les moyennes de tous les groupes sont les mêmes;


ou
• H0: il n’y a pas d’effet des groupes;
• H1: au moins une moyenne diffère des autres;

pour k groupes et pour un nombre d’observations N, on


compare avec la distribution de F au niveau a avec k - 1
et N - k degrés de liberté.

89

84

EXEMPLE AVEC SPSS

• On veut comparer le nombre moyen d’employés dans les entreprises


manufacturières du Saguenay-Lac-Saint-Jean selon les MRC de
localisation des entreprises;
• Variable dépendante: Nombre d’employés (vérifier la normalité);
• Variable indépendante (facteur): MRC
1. Fjord-du-Saguenay
2. Lac-St-Jean-Est
3. Maria-Chapdelaine
4. Domaine-du-Roy

• Hypothèses:
H0: Les nombres moyens d’employés dans les 4 MRC sont égaux.
H1: Ce nombre n’est pas égal pour au moins une MRC.

Conditions: Normalité de la variable ratio (nombre d’employés)

90

45
2022-10-11

85

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

91

86

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

92

46
2022-10-11

87

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

93

88

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

Ho: Les variances sont égales

H1: Les variances ne sont pas égales (au moins une inégalité)

Décision: Rejeter Ho si Sig. < .05, donc…….

94

47
2022-10-11

89

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

ANOVA
Nombre moyen d'employés
Sum of Squares df Mean F Sig.
Square
Between 37237,735 3 12412,578 1,099 ,350
Groups
Within 4135374,708 366 11298,838
Groups
Total 4172612,443 369

Décision :
Nombre d’observations (N) = 370
Nombre de facteurs (k) = 4
Fcalculée : 1.099
Fthéorique au seuil .05 et avec k-1 et N-k d.l. (3 ; 366)
= 2,66

Puisque Fcalculée  Fthéorique, alors on ne peut rejeter


H0.
P.value (Sig.) =.35  .05, donc on ne peut rejeter
H0.

95

90

POST HOC ANALYSIS (TEST DE DUNCAN)

• Une fois qu’on détecte avec l’ANOVA une différence de


moyenne (Rejeter H0);

• On peut utiliser, si les variances sont égales, d’autres


tests (par exemple le test de Duncan) pour tester les
différences de moyennes entre plusieurs groupes;

• Si les variances ne sont pas égales, alors utiliser les tests


pour variances inégales, par exemple le test Tamhane’s;

• …pour classer ces groupes dans des sous-ensembles


homogènes.

96

48
2022-10-11

91

EXEMPLE SPSS : TEST DE DUNCAN

97

92

EXEMPLE SPSS : TEST DE DUNCAN

Homogeneous Subsets

Nombre moyen d'employés


Duncan
N Subset for alpha = .05
MRC 1
Maria- 49 22,7143
Chapdelaine
Lac-St-Jean-Est 57 29,7193
Fjord-du- 207 38,3913
Saguenay
Domaine-du-Roy 57 57,5789

Sig. ,085

98

49
2022-10-11

93

LES TESTS STATISTIQUES

Tableau 4.3
Comparaison de la taille des entreprises manufacturières selon les MRC
(Région du Saguenay-Lac-Saint-Jean: Enquête 2001)
MRC Nombre Moyenne Écart type
d’entreprises
Nombre d’employés

Maria-Chapdelaine 49 22,71 18,91


Lac-Saint-Jean-Est 57 29,72 15,93
Fjord-du-Saguenay 207 38,39 10,77
Domaine-du-Roy 57 57,58 16,45

99

94

POST HOC ANALYSIS (TEST DE DUNCAN)

100

50
2022-10-11

95

EXEMPLE AVEC SPSS (2)

• On veut comparer le nombre de publications scientifiques produites


par les chercheurs canadiens en sciences et génies entre 2000 et
2003 selon le statut du chercheur;
• Variable dépendante: Nombre d’articles scientifiques publiés;
• Variable indépendante (facteur): Statut
1. Assistant (Adjoint);
2. Associate (Agrégé);
3. Full (titulaire).

Après vérification de la normalité de la variable dépendante


Hypothèse :
H0: Le nombre moyen des publications des Adjoints, des Agrégés et
des Titulaires sont égaux;
H1: Ce nombre n’est pas égal pour au moins une catégorie des
chercheurs.

101

96

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

102

51
2022-10-11

97

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

103

98

EXEMPLE SPSS : TEST DE MOYENNE ANOVA

104

52
2022-10-11

99

EXEMPLE SPSS : TEST DE TAMHANE

105

100

EXEMPLE SPSS : TEST DE MOYENNE ANOVA


Ho: Moyennes publications égales
selon le statut
H1: Au moins une inégalité

Conclusion: Assistant publie en moyenne moins que Associate et Full

106

53
2022-10-11

101

EXEMPLE AVEC SPSS (3)

• On veut comparer l’importance accordée par les chercheurs canadiens en


sciences et génies au financement privé dans la réalisation de leurs activités de
recherche selon les disciplines des chercheurs;
• Variable dépendante: Financement privé mesuré sur une échelle de Likert
variant de 1 à 5 (1=Pas du tout important et 5= Décisif);
• Variable indépendante (facteur): Disciplines des chercheurs
1. Chemistry
2. Computing & Information Sciences
3. Engineering
4. Earth sciences
5. Life sciences
La variable dépendante étant du type intervalle, elle ne peut être considérée
comme une variable continue. Le test de comparaison de moyennes doit
s’effectuer sur les rangs.
▪ Hypothèse :
H0: Le rang moyen de l’importance accordée au financement privé ne diffère
pas selon les disciplines;
H1: Le rang moyen diffère pour au moins une discipline.

107

102
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

108

54
2022-10-11

103
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

109

104
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

110

55
2022-10-11

105
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

111

106
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

112

56
2022-10-11

107
EXEMPLE SPSS : TEST DE MOYENNE ANOVA (VARIABLE
DÉPENDANTE DE TYPE INTERVALLE)

113

108

EXEMPLE SPSS : TEST DE DUNCAN

114

57
2022-10-11

109

EXEMPLE SPSS : TEST DE DUNCAN

115

117
INTERPRÉTATION DES RÉSULTATS

Fin

116

58

Vous aimerez peut-être aussi