Vous êtes sur la page 1sur 21

rudit est un consortium interuniversitaire sans but lucratif compos de l'Universit de Montral, l'Universit Laval et l'Universit du Qubec

Montral. Il a pour mission la promotion et la valorisation de la recherche. rudit offre des services d'dition numrique de documents
scientifiques depuis 1998.
Pour communiquer avec les responsables d'rudit : erudit@umontreal.ca
Article

Jimmy Bourque, Nomie Poulin et Alicia F. Cleaver
Revue des sciences de l'ducation, vol. 32, n 2, 2006, p. 325-344.



Pour citer cet article, utiliser l'information suivante :

URI: http://id.erudit.org/iderudit/014411ar
DOI: 10.7202/014411ar
Note : les rgles d'criture des rfrences bibliographiques peuvent varier selon les diffrents domaines du savoir.
Ce document est protg par la loi sur le droit d'auteur. L'utilisation des services d'rudit (y compris la reproduction) est assujettie sa politique
d'utilisation que vous pouvez consulter l'URI http://www.erudit.org/apropos/utilisation.html
Document tlcharg le 29 May 2014 08:02
valuation de lutilisation et de la prsentation des rsultats danalyses factorielles et
danalyses en composantes principales en ducation
valuation de lutilisation et de la prsentation
des rsultats danalyses factorielles
et danalyses en composantes principales
en ducation
Jimmy Bourque, chercheur invit
Haute cole pdagogique de Berne
Nomie Poulin, tudiante la matrise
Universit de Sherbrooke
Alicia F. Cleaver, assistante de recherche
Universit de Sherbrooke
rsum - Nous valuons lutilisation et la prsentation des rsultats danalyses
factorielles et danalyses en composantes principales dans six priodiques cana-
diens en ducation publis entre 1995 et 2005. partir de 1089 articles, nous
avons relev 61 utilisations de ces analyses. En ayant recours une grille de lecture,
nous avons recueilli des informations sur le but de lutilisation de lanalyse, la taille
de lchantillon, les variables, la mthode dextraction, le critre de dimensionna-
lit, la mthode de rotation des axes et les rsultats prsents. Nous avons identifi
des lacunes, tant au niveau des pratiques que de la prsentation des rsultats.
Enfin, nous formulons quelques recommandations quant lutilisation rigoureuse
de ces types danalyses.
Introduction
Depuis lavnement des logiciels de statistiques conviviaux, lanalyse
factorielle est rgulirement utilise en sciences sociales et sert gnralement
lvaluation de la validit de construit dinstruments psychomtriques. Or des
recherches rcentes sur lutilisation de ces procdures en recherche organisation-
nelle (Conway et Huffcutt, 2003), en psychologie (Fabrigar, Wegener, MacCallum
et Strahan, 1999 ; Russell, 2002), en ducation (Henson, Capraro et Capraro, 2001 ;
Pohlmann, 2004) et en communication (Park, Dailey et Lemus, 2002) dmontrent
que, dans la majorit des cas, les chercheurs de divers pays font un usage inadquat
de lanalyse factorielle ou nen rapportent pas les rsultats de faon convenable.
la suite de ces rsultats, nous voulions vrier si la situation tait la mme
dans les recherches publies au Canada. Nous avons donc entrepris dvaluer
lutilisation de lanalyse factorielle exploratoire et de lanalyse en composantes
principales, ainsi que les pratiques de communication des rsultats de ces analyses
dans six priodiques scientiques canadiens en ducation. Nous croyons que cet

Volume 32, n
o
2, 2006 325 - 344
326 Revue des sciences de lducation
article contribuera clairer lutilisation de ces analyses, notamment parce quil
traite un crneau peu abord dans les crits francophones et ce, dans un langage
accessible aux non-spcialistes.
Analyse factorielle exploratoire et analyse en composantes principales
Usage de lanalyse factorielle
Lobjectif premier de lanalyse factorielle exploratoire est darriver une concep-
tualisation parcimonieuse de traits latents, en dterminant le nombre et la nature
dun ensemble restreint de facteurs expliquant les rseaux de corrlations parmi
un ensemble de variables (Fabrigar et al., 1999). Cette opration se base sur ce que
Pohlmann (2004) considre comme le thorme fondamental de lanalyse facto-
rielle selon lequel la corrlation entre deux variables dpend de la similarit de
leur relation avec les facteurs latents. Ce type danalyse se distingue notamment
de lanalyse en composantes principales, cette dernire visant simplement la rduc-
tion du nombre de variables (data reduction). En dautres termes, lanalyse en
composantes principales sert rduire le nombre de variables requises pour cal-
culer un score total pour le trait mesur, tout en conservant le plus dinformations
possibles de lensemble original (Bryant et Yarnold, 1995 ; Fabrigar et al., 1999).
Dans ce dernier cas, la structure des corrlations entre les variables nest pas nces-
sairement conserve.
Fabrigar et ses collaborateurs (1999) identient cinq dcisions prendre avant
dentreprendre une collecte de donnes devant mener une analyse factorielle :
1) tenir compte de la nature et du nombre des variables, ainsi que de la taille de
lchantillon ; 2) juger de la cohrence du type danalyse choisi avec lobjectif de
recherche ; 3) slectionner la mthode dextraction ; 4) dterminer la dimension-
nalit de la solution factorielle ; et 5) choisir une mthode adquate de rotation
des axes.
Variables et taille de lchantillon
Comme pour toute procdure statistique, lefficacit de lanalyse factorielle repose
sur le respect de postulats concernant les donnes analyses. Lun de ces postulats
stipule que les variables doivent tre continues (Bryant et Yarnold, 1995). Malgr
cela, Pohlmann (2004) a document la nature majoritairement ordinale (chelles
de Likert) des variables utilises pour ce type danalyse dans les articles publis
dans le Journal of Educational Research entre 1992 et 2002. Pour des variables
ordinales, il serait possible de compenser partiellement cette drogation en effec-
tuant les analyses factorielles partir dune matrice de corrlations polychoriques
ou, pour des variables dichotomiques, dune matrice de corrlations ttrachoriques.
Ces deux types de corrlations estiment la valeur que prendraient des corrlations
effectues sur des variables ordinales ou dichotomiques si elles avaient t calcules
sur des variables continues. Or si les logiciels statistiques SAS et LISREL offrent
une commande pour le calcul de telles corrlations, ce nest pas le cas de SPSS.
Nanmoins, lanalyse de la matrice des corrlations polychoriques na pas t
rapporte par les auteurs ayant valu lutilisation de lanalyse factorielle dans
divers domaines des sciences sociales et ce, malgr la nature majoritairement
catgorielle des variables (Conway et Huffcutt, 2003 ; Fabrigar et al., 1999 ; Henson
et al., 2001 ; Park et al., 2002 ; Pohlmann, 2004 ; Russell, 2002).
De plus, des rgles informelles ont t formules quant la taille minimale de
lchantillon requise pour effectuer des analyses factorielles. Lefcacit de ces rgles
dpend cependant dun ventail dautres paramtres propres chaque tude tels
que le nombre de variables par facteurs ou la valeur des communauts (commo-
nalities)
1
(Reise, Waller et Comrey, 2000). McCallum, Widaman, Zhang et Hong
(1999) ont dailleurs dmontr que la non prise en compte de ces paramtres
rendait ces rgles caduques. Ainsi, dans le cas o les communauts sont leves
(suprieures 0,60), un chantillon de moins de 100 rpondants peut sufre, mme
si les facteurs sont peu surdtermins (ratio variables/facteurs autour de 20 : 7). Si
les communauts diminuent environ 0,50, un chantillon de 100 200 rpon-
dants peut convenir condition que les facteurs soient sufsamment surdtermins
(ratio variables/facteurs suprieur 10 : 3). Par contre, dans le pire des cas (com-
munauts faibles et facteurs faiblement surdtermins), un chantillon de plus de
500 rpondants peut tre requis. Le facteur le plus important considrer est la
valeur des communauts qui ne peut malheureusement tre connue quaprs la
collecte de donnes. Le chercheur prudent veillera nanmoins prvoir un
minimum de quatre six variables par facteur et maximiser la taille de son
chantillon. Il est aussi noter que, comme ils sont souvent plus homognes que
les chantillons probabilistes, les chantillons de convenance tendent rduire
lunivers de variation des donnes, ayant pour consquence dinuencer les cor-
rlations entre variables et daffecter les rsultats des analyses factorielles (Fabrigar
et al., 1999 ; Reise et al., 2000).
Objectif de recherche
Selon Conway et Huffcutt (2003), la principale motivation poussant les chercheurs
utiliser lanalyse factorielle est la validation ou la construction dinstruments
psychomtriques. Il sagit alors dvaluer la validit de construit (ou validit de
structure) dun instrument, nouveau ou ancien. La validit de construit implique
quun instrument de mesure possde une structure et un contenu cohrents avec
ce qui est connu du trait latent mesur, que sa structure factorielle soit gnralisable
parmi un ensemble de populations pertinentes et quil permette la hirarchisation
univoque et raisonnablement prcise dindividus sur le continuum dfini par le
trait mesur (Reise et al., 2000).
Or, pour ce faire, lanalyse factorielle conrmative se veut la plus approprie
(Reise et al., 2000). Toutefois, comme les procdures pour effectuer de telles ana-
lyses ne sont pas fournies avec les versions de base des principaux logiciels dana-
lyse statistique (elles peuvent tre effectues avec le module AMOS de SPSS ou
avec la procdure CALIS de SAS), et que les logiciels destins spciquement ce
type danalyse (LISREL et EQS par exemple) sont moins conviviaux et moins
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 327
328 Revue des sciences de lducation
polyvalents que les logiciels les plus populaires, les chercheurs sen remettent
souvent par dfaut un usage conrmatif de lanalyse factorielle exploratoire ou
de lanalyse en composantes principales. Selon Burnett et Dart (1997), lanalyse
factorielle exploratoire produirait gnralement des rsultats quivalents ceux
obtenus par lanalyse factorielle conrmative, du moins lorsque ces analyses se
basent sur des matrices de corrlations. Toutefois, lanalyse factorielle conrmative
donnant accs davantage dinformations quant lajustement des donnes au
modle test, elle devrait tre prfre lanalyse factorielle exploratoire pour
lvaluation de la validit de construit dinstruments psychomtriques ou pour la
vrication de la correspondance dune structure factorielle empirique avec un
modle thorique.
Extraction des facteurs
Lextraction des facteurs demande dabord de choisir la matrice qui sera analyse.
Dans le cas dune analyse factorielle exploratoire, Pett, Lackey et Sullivan (2003)
recommandent dutiliser la matrice des corrlations plutt que la matrice des
covariances puisquelle facilite notamment linterprtation de la matrice de struc-
ture, dans les cas de rotations obliques, et minimise les risques dobtenir des
solutions incohrentes. Il faut aussi sassurer que les corrlations entre items ne
soient ni trop fortes (r > 0,80), auquel cas il y aurait danger de colinarit, ni trop
faibles (r < 0,30), ce qui indiquerait de faibles probabilits que la variance des items
puisse tre explique par des traits latents communs.
Avant de procder une analyse factorielle, ce dernier cas peut tre test laide
du test de sphricit de Bartlett. Prenant la forme dun khi-carr, celui-ci teste
lhypothse nulle selon laquelle la matrice des corrlations serait une matrice
identit et quil nexisterait donc aucune relation entre les items. Si le rsultat est
signicatif, lhypothse nulle est rejete, signalant ainsi quil existe des corrlations
inter-items. Ce test savre toutefois hautement inuenc par la taille de lchan-
tillon et, pour un chantillon important, les corrlations les plus inmes sufront
faire rejeter lhypothse nulle. Si ce test nindique aucune diffrence signicative
entre la matrice identit et la matrice analyse, le chercheur devrait sabstenir
deffectuer une analyse factorielle, moins de pouvoir identier et liminer des
items qui, en raison dune variance insufsante ou de communauts trop faibles,
causeraient ce rsultat (Pett et al., 2003).
Un deuxime test, celui de Kaiser-Meyer-Olkin (KMO), permet de vrier
quune fois leffet linaire des autres items contrl, les corrlations partielles de
chaque paire ditems sont faibles, ce qui conrmerait la prsence de facteurs latents
liant les items entre eux. Sa valeur varie de 0 1,1, indiquant un effet nul des cor-
rlations partielles, ce qui quivaut dire que les facteurs latents expliquent len-
semble des corrlations entre items. Une valeur du KMO de 0,90 ou plus dnote
un excellent ajustement des items aux facteurs latents ; de 0,80 0,90, un bon
ajustement ; de 0,70 0,80, un ajustement moyen ; de 0,60 0,70, un ajustement
faible et, pour les valeurs infrieures 0,60, lajustement est insufsant et lanalyse
factorielle ne devrait pas tre entreprise moins de pouvoir identier et retirer des
items qui seraient lorigine de ce rsultat (Pett et al., 2003).
Les mthodes dextraction peuvent tre divises en modles de composantes et
en modles de facteurs communs. Ces deux approches diffrent par leur but : les
modles de composantes visent la rduction du nombre ditems pour obtenir une
mesure parcimonieuse expliquant un maximum de variance de la mesure originale,
alors que les modles de facteurs communs visent lattribution de la variance des
facteurs latents (Conway et Huffcutt, 2003).
Au niveau du calcul, cette diffrence se traduit par la distinction, dans les
modles de facteurs communs, entre la variance due aux facteurs communs (qui
inuencent plus dune mesure), la variance due un facteur unique (qui nin-
uence quune seule mesure) et la variance de lerreur. Le caractre particulier de
ces trois sources de variance nest pas pris en compte dans lanalyse en composantes
principales puisquelle ne vise pas lattribution de la variance des facteurs latents
(Conway et Huffcutt, 2003 ; Pett et al., 2003). Concrtement, ce que postule lana-
lyse en composantes principales, en plaant des 1 comme estimateurs des com-
munauts dans la matrice initiale des corrlations, cest que toute la variance des
items peut tre explique par des facteurs communs. En utilisant dautres estima-
teurs tels les carrs des corrlations multiples (R
2
), les modles de facteurs com-
muns reconnaissent que les traits latents ne devraient pas expliquer la variance de
lerreur ou celle particulire litem (Pett et al., 2003).
Cest pour cette raison que Conway et Huffcutt (2003) suggrent dutiliser des
mthodes dextraction par facteurs communs plutt que lanalyse en composantes
principales lorsque le but du chercheur est didentier des facteurs latents ou de
leur attribuer des items. En somme, les modles de facteurs communs sont prf-
rables aux modles de composantes dans la majorit des cas tandis que les
mthodes seraient peu prs quivalentes dans les cas restants (notamment lorsque
la valeur des communauts approche 1). Il en ressort donc quil y a peu davantages
utiliser lanalyse en composantes principales pour ltude de facteurs latents. En
dpit de ces arguments, probablement en partie parce que cest la mthode dex-
traction par dfaut de SPSS et SAS, lanalyse en composantes principales demeure
la plus recense dans les publications de domaines aussi varis que la recherche
organisationnelle (Conway et Huffcutt, 2003), la psychologie (Fabrigar et al., 1999 ;
Russell, 2002), lducation (Henson et al., 2001 ; Pohlmann, 2004) et la commu-
nication (Park et al., 2002) et ce, mme pour des tches qui incomberaient tho-
riquement lanalyse factorielle conrmative ou lanalyse factorielle explora-
toire.
Il existe plusieurs mthodes dextraction par facteurs communs. Lorsque la
distribution multivarie des items est normale, la mthode du maximum de vrai-
semblance (maximum likelihood), un cas particulier de modlisation par quations
structurelles (structural equation modeling), peut tre applique. Cette mthode
dextraction permet le calcul de plusieurs indices dajustement, de tests de signi-
cativit des coefcients de saturation factorielle (factor loadings) et de corrlations
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 329
330 Revue des sciences de lducation
entre les facteurs, ainsi que le calcul dintervalles de conance pour ces paramtres
(Fabrigar et al., 1999). Par contre, cette mthode gnre parfois des cas de com-
munauts suprieures 1 (Heywood cases), signiant quun facteur expliquerait
plus que la totalit de la variance dun item (Pett et al., 2003).
Si le postulat de normalit de la distribution multivarie des items nest pas
respect, le chercheur peut se tourner vers la factorisation en axe principal (prin-
cipal axis factoring). Cette mthode fournit un meilleur ajustement que lanalyse
en composantes principales et produit moins de cas de communauts suprieures
1 ou dchecs de convergence que la mthode du maximum de vraisemblance.
Cependant, elle ne donne pas accs aux tests de signicativit et dajustement que
permet cette dernire (Fabrigar et al., 1999 ; Pett et al., 2003).
Les autres mthodes disponibles incluent la mthode des moindres carrs non
pondrs (unweighted least squares), utile pour les distributions non paramtriques,
mais qui exige la spcication a priori du nombre de facteurs extraits. La mthode
de factorisation de limage (image factoring), qui utilise les mmes estimateurs que
la mthode de factorisation en axe principal, fournirait, selon les simulations de
Buley (1995), les facteurs les plus cohrents en termes de dlit (tel quentendu
en thorie classique des tests). Enn, la mthode des moindres carrs gnralise
(generalized least squares) et la mthode de factorisation des Alpha (Alpha facto-
ring), boude parce quelle gnre habituellement trop peu de facteurs, demeurent
peu utilises (Pett et al., 2003). Costello et Osborne (2005) font valoir que, contrai-
rement aux deux premires mthodes prsentes (maximum de vraisemblance et
axe principal), peu de donnes existent sur les mrites relatifs aux mthodes moins
usites. Cependant, ces auteurs avancent que, dans la majorit des cas, les deux
mthodes principales sufraient fournir une solution adapte aux distributions
multivaries normales (maximum de vraisemblance) ou quelconques (axe prin-
cipal).
Dtermination du nombre de facteurs
Une autre dcision que doit prendre le chercheur consiste en la dtermination du
nombre de facteurs extraire des donnes. Cette dcision peut sappuyer sur plu-
sieurs rgles. La plus populaire est le critre de Kaiser-Guttman (Conway et
Huffcutt, 2003 ; Fabrigar et al., 1999 ; Henson et al., 2001 ; Park et al., 2002 ;
Pohlmann, 2004 ; Russell, 2002). Ce critre suggre de conserver les facteurs qui
prsentent une valeur propre (eigenvalue) suprieure 1. Le secret de sa popularit
rside probablement dans le fait que ce critre soit celui fix par dfaut dans les
principaux logiciels, puisque son utilisation savre gnralement problmatique.
Tout dabord, ce critre ne devrait tre utilis quavec lanalyse en composantes
principales puisquil postule que les estimateurs de dpart des communauts
galent 1 (Pett et al., 2003 ; Russell, 2002). Il nen demeure pas moins bien prsent
dans la documentation scientifique aux cts de plusieurs types danalyses facto-
rielles exploratoires. Par ailleurs, son caractre arbitraire amne Fabrigar et ses
collaborateurs (1999) en questionner la pertinence : comment justifier quun
facteur dont la valeur propre est 0,99 devrait tre limin doffice alors quun autre,
dont la valeur propre serait de 1,01, devrait tre conserv ? Enfin, ce critre tend
surestimer le nombre de facteurs (Conway et Huffcutt, 2003 ; Henson et al.,
2001).
Le deuxime critre le plus frquemment rencontr est celui de Cattell, bas sur
linterprtation du graphique de la progression des valeurs propres (scree plot).
Cette rgle consiste conserver le nombre de facteurs situs avant le point din-
exion du graphique. Or ce point dinexion nest pas toujours clair et rend
parfois lapplication de ce critre hasardeuse (Fabrigar et al., 1999).
Lanalyse parallle constitue un troisime critre qui exige de comparer la pro-
gression des valeurs propres de lchantillon empirique avec celle dun chantillon
alatoire simul, comptant le mme nombre de rpondants et le mme nombre
ditems. Le nombre de facteurs conservs correspond alors au nombre de valeurs
propres empiriques suprieures aux valeurs propres simules lorsquelles sont
compares une une, de la plus leve la plus faible (Fabrigar et al., 1999). Le
principal problme pourrait tre la difcult den obtenir la syntaxe, puisque la
commande nest comprise ni avec SPSS ni avec SAS (Fabrigar et al., 1999).
Cependant, OConnor (2000) a publi les commandes SPSS et SAS permettant de
gnrer les valeurs propres dchantillons alatoires en xant le nombre de rpon-
dants et ditems et les rend disponibles sur son site Internet de lUniversit
Lakehead. Selon Henson et ses collaborateurs (2001), il sagit dune mthode parmi
les plus efcaces pour dterminer la dimensionnalit dune solution factorielle
puisque linterprtation en est univoque.
Une quatrime mthode consiste xer a priori un pourcentage de variance
expliquer. Toutefois, cette mthode se veut largement arbitraire et les auteurs ne
parviennent pas sentendre sur un seuil minimal. Pour lanalyse en composantes
principales, Pett et ses collaborateurs (2003) mentionnent un seuil de 75 % ou
80 %, mais prcisent que ce critre risque dtre trop exigeant pour les mthodes
de facteurs communs. Henson et son quipe (2001) xent quant eux ce seuil
70 %.
Pour sa part, la mthode dextraction du maximum de vraisemblance comporte
un test de la qualit de lajustement de type Khi-carr o lobtention dun rsultat
non signicatif signie que lajustement est adquat. Quoique lhypothse nulle
(lajustement parfait) soit irraliste, il sagit dune mthode efcace de dtermina-
tion du nombre de facteurs (Fabrigar et al., 1999), aussi disponible pour la mthode
des moindres carrs gnralise (Pett et al., 2003). Dautres indices dajustement
sont aussi disponibles pour la mthode du maximum de vraisemblance. Lindice
RMSEA (Root Mean Standard Error of Approximation), par exemple, mesure lcart
entre la solution propose et les donnes par degr de libert et indique un bon
ajustement lorsquil est infrieur 0,05, un ajustement acceptable de 0,05 0,08,
un ajustement marginal de 0,08 0,10 et un ajustement faible sil est suprieur
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 331
332 Revue des sciences de lducation
0,10. Un autre indice dajustement, lindice ECVI (Expected Cross-Validation Index),
value le degr avec lequel la solution obtenue pourrait tre gnralise dautres
chantillons. Plus la valeur de cet indice est petite, plus lajustement est adquat.
Ces indices ables, quoique sensibles la taille de lchantillon, devraient tre
utiliss plus couramment (Fabrigar et al., 1999 ; Park et al., 2002).
Une dernire mthode souvent applique consiste simplement xer a priori
le nombre de facteurs selon des critres thoriques, puis vrier si la solution,
notamment la rpartition des items en facteurs, correspond une solution attendue
et interprtable. En fait, peu importe la mthode choisie, il demeure crucial que
les solutions retenues soient interprtables au niveau conceptuel, sans quoi leur
valeur explicative des variables latentes serait compromise (Bryant et Yarnold,
1995 ; Conway et Huffcutt, 2003 ; Pett et al., 2003). Enn, dans un souci de rigueur
mthodologique, il est recommand dutiliser plusieurs mthodes de dtermina-
tion de la dimensionnalit de la solution factorielle et den comparer les rsultats
an de retenir une solution appuye sur des critres solides et hautement cohrente
avec les fondements conceptuels du trait tudi (Conway et Huffcutt, 2003).
Rotation des axes
Comme les facteurs sont dabord extraits selon leur importance, lanalyse factorielle
tend produire un premier facteur gnral difficile interprter puisquil regroupe
un grand nombre ditems (Pett et al., 2003). Par consquent, le chercheur a gn-
ralement recours une rotation des axes afin de faciliter linterprtation de la
solution factorielle (Kieffer, 1998). Il sagit alors de faire pivoter les axes autour de
lorigine afin dobtenir un ajustement optimal la distribution empirique des
donnes.
Les rotations peuvent tre divises selon quelles conservent ou non la perpen-
dicularit des axes. Ainsi, les rotations orthogonales conservent cette relation
gomtrique entre les axes et produisent, par consquent, des facteurs indpendants
(non corrls). Par contre, en ne contraignant pas langle entre les axes, les rotations
obliques permettent les corrlations entre facteurs (Conway et Huffcutt, 2003).
Le premier critre de rotation orthogonale apparatre fut le Quartimax qui
tente de faire en sorte quun item donn ne puisse tre attribu qu un seul facteur.
Or ce critre tend produire un facteur gnral et ne savre adquat que lorsque
le chercheur souponne une solution unidimensionnelle (Kieffer, 1998 ; Pett et al.,
2003).
Cest pour rsoudre ce problme que Kaiser propose le critre de rotation
Varimax. Celui-ci vise minimiser le nombre ditems attribus un facteur donn
en maximisant la variance intra-facteurs, cest--dire lcart entre les coefcients
de saturation factorielle levs et faibles. Mme si la rotation Varimax savre plus
approprie pour les structures multidimensionnelles que la rotation Quartimax,
elle tend toutefois diviser les structures unidimensionnelles et goner limpor-
tance de facteurs marginaux (Browne, 2001 ; Pett et al., 2003). Cette rotation
demeure nanmoins la plus utilise (Conway et Huffcutt, 2003 ; Fabrigar et al.,
1999 ; Henson et al., 2001 ; Park et al., 2002 ; Pohlmann, 2004) et, selon Browne
(2001) ainsi que Fabrigar et ses collaborateurs (1999), gnralement la plus ad-
quate parmi les rotations orthogonales.
Quant au critre Equimax, il cherche simplier la fois les rangs et les colonnes
de la matrice factorielle. Toutefois, son comportement savre souvent erratique
et amne Pett et son quipe (2003) nen conseiller lusage que si le nombre de
facteurs est clairement identi. En gnral, il semble clair que les rotations ortho-
gonales sont plus faciles interprter que les rotations obliques et quelles produi-
sent des rsultats plus susceptibles dtre reproduits. Nanmoins, pour en arriver
cette sduisante simplicit, elles contraignent la ralit sociale en postulant que
les traits latents ne sont pas corrls (Kieffer, 1998).
En ne xant pas de contrainte quant langle entre les axes, les rotations obli-
ques permettent lobtention de facteurs indpendants, mais aussi, et cest l leur
principale force, de facteurs corrls convenant gnralement mieux la ralit
des sciences sociales (Pett et al., 2003).
Les premiers critres de rotation oblique furent la rotation orthoblique ainsi
que le critre Promax qui font suivre une rotation orthogonale dune rotation
oblique (Browne, 2001). La rotation orthoblique requiert dlever la matrice fac-
torielle orthogonale la puissance p, dont la valeur recommande est 0,5.
Cependant, la solution sera orthogonale si la valeur de p est xe 1. Or le choix
de la valeur de p savre difcile et arbitraire (Pett et al., 2003) et rend cette
approche un peu hasardeuse. Quant la rotation Promax, elle vise accentuer les
carts entre les coefcients de saturation factorielle levs et faibles en les levant
la puissance , gnralement 2, 4 ou 6. Ainsi, alors que la valeur absolue des
coefcients diminue, lcart entre eux saccrot (Kieffer, 1998). Le choix de la valeur
de pose toutefois un problme similaire celui de p puisquil semble plutt
arbitraire. La valeur de ce paramtre a un effet sur les corrlations entre les facteurs,
les puissances leves tendant en accrotre lampleur (Pett et al., 2003).
La particularit de ces deux premiers critres consiste en la ncessit de faire
prcder la rotation oblique dune rotation orthogonale. Cependant, le critre
Oblimin direct effectue directement une rotation oblique (Browne, 2001).
Lutilisation de ce type de rotation exige tout dabord de xer la valeur du para-
mtre an de dterminer lampleur des corrlations admises entre les facteurs
(Russell, 2002). Une valeur ngative de diminuera lampleur des corrlations
alors quune valeur positive laugmentera. Lorsque est gal 0, la rotation est
connue sous le nom de Quartimin directe (Kieffer, 1998). Comme les deux rota-
tions vues prcdemment, la difcult dutilisation du critre Oblimin direct
provient de lobligation de xer la valeur de . Cette difcult est exacerbe par le
fait quil nexiste pas de correspondance vidente entre la valeur de et la valeur
de r (coefcient de corrlation), outre le fait que les valeurs ngatives de tendront
faire diminuer r et que les valeurs positives tendront le faire augmenter (Pett
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 333
334 Revue des sciences de lducation
et al., 2003). Dans la mesure o le chercheur ne dispose pas dinformation quant
lampleur de la corrlation attendue entre les facteurs, la valeur de sera gn-
ralement xe 0. Selon Browne (2001), les critres Quartimin direct et Promax
nen demeurent pas moins les rotations obliques les plus efcaces.
Dautres critres de rotation sappliquent galement aux rotations orthogonales
et obliques (Browne, 2001). Il en est ainsi des rotations procrustennes qui forcent
les facteurs pivoter vers une structure cible xe par le chercheur. Le nom de ce
critre fait rfrence Procruste, un htelier et bandit de la mythologie grecque,
qui dtroussait les voyageurs sur la route dAthnes. son htel, Procruste afrmait
disposer de lits magiques dont la taille convenait nimporte quel invit. En fait,
lorsque linvit tait trop grand, Procruste lui coupait les membres. Lorsquil tait
trop petit, il ltirait sur un chevalet. Cette conception du one size ts all illustre le
fait que lajustement de la solution obtenue par le biais de ce critre de rotation a
t contraint et, mme sil parat adquat, ne correspond pas ncessairement la
solution hypothtique (Pett et al., 2003).
La difcult dinterprtation des solutions factorielles obtenues partir de
rotations obliques provient de deux sources principales. Dune part, les facteurs
peuvent tre corrls, ce qui les rend plus difciles distinguer. Dautre part, les
rotations obliques produisent deux matrices que le chercheur doit interprter.
Dans le cas de rotations orthogonales, ces deux matrices sont identiques et le
chercheur na donc pas deux interprtations effectuer. Or, pour les rotations
obliques, la solution factorielle est exprime sous la forme dune matrice de con-
guration (pattern matrix) et dune matrice de structure (structure matrix).
Dans la matrice de conguration, les coefcients indiquent la contribution
unique de chaque variable chaque facteur. Ces coefcients jouent donc un rle
analogue aux coefcients dans une rgression linaire (Henson et al., 2001 ; Pett
et al., 2003). Par ailleurs, les coefcients de la matrice de structure reprsentent
les corrlations bivaries entre chaque variable et chaque facteur latent et seraient,
selon Henson et ses collaborateurs (2001), analogues aux coefcients de saturation
factorielle que lon obtient la suite dune analyse en composantes principales.
Comme cette dernire matrice nest pas affecte par les corrlations entre les fac-
teurs, Pett et ses collaborateurs (2003) avancent que cest elle qui devrait tre
interprte pour dnir les facteurs. La matrice de conguration devrait, quant
elle, servir assigner le poids relatif de chaque item dans le calcul des scores pour
chaque facteur. Cependant, Russell (2002) souligne que la simple addition ou le
calcul de la moyenne des rsultats aux items pour obtenir un score aux facteurs
ne semble pas poser problme puisquil savre peu probable que les poids relatifs
puissent tre gnraliss.
Bien que les rotations orthogonales produisent des solutions plus faciles
interprter, les auteurs sentendent sur le fait quelles transmettent une vision
biaise de la ralit. Les situations o des composantes dun mme trait gnral
ne seraient pas corrles sont rares en sciences sociales. De plus, si les facteurs rels
savraient tre indpendants, ils seraient exprims comme tels par une solution
issue dune rotation oblique puisque ce type de rotation peut produire une solution
orthogonale. Par contre, une rotation orthogonale ne pourra rendre compte cor-
rectement dune solution o les facteurs seraient corrls (Browne, 2001 ; Conway
et Huffcutt, 2003 ; Fabrigar et al., 1999 ; Pett et al., 2003).
Mthode
Cette recherche descriptive, base sur des donnes documentaires, vise tudier
lutilisation de lanalyse factorielle et de lanalyse en composantes principales dans
des revues scientifiques canadiennes en ducation.
Pour ce faire, nous avons choisi six revues : la Revue canadienne de lducation
(RCE), la Revue des sciences de lducation (RSE), la Revue canadienne denseigne-
ment suprieur (RCES), Mesure et valuation en ducation (MEE), l Alberta Journal
of Educational Research (AJER) et la Revue des sciences de lducation de McGill
(RSEM). Cette slection a t effectue selon deux critres : le rayonnement pan-
canadien ou international de ces revues et la rigueur de leur processus dvaluation
des manuscrits.
Les articles tudis ont t identis par un recensement de tous les articles,
publis dans ces revues de 1995 2005, rapportant lutilisation dune forme ou
lautre de lanalyse factorielle. Sur les 1089 articles recenss, nous avons identi
37 articles (18 en franais et 19 en anglais) mentionnant lutilisation dune analyse
factorielle (RCE : 7 ; RSE : 6 ; RCES : 5 ; MEE : 10 ; AJER : 7 ; RSEM : 2) pour un total
de 73 utilisations (certains articles en comprennent plus dune).
Lanalyse des articles sest appuye sur une grille
2
construite partir de recher-
ches similaires (Conway et Huffcutt, 2003 ; Fabrigar et al., 1999 ; Henson et al.,
2001 ; Russell, 2002 ; Park et al., 2002 ; Pohlmann, 2004). La grille visait lobtention
dinformations sur : 1) le but de lutilisation de lanalyse factorielle ; 2) le type
danalyse factorielle utilis ; 3) la taille de lchantillon ; 4) le nombre ditems soumis
lanalyse factorielle ; 5) le format de rponse des items ; 6) le nombre de facteurs
extraits ; 7) la mthode dextraction des facteurs ; 8) lutilisation du test de sph-
ricit de Bartlett et du KMO ; 9) le critre de dimensionnalit ; 10) le critre de
rotation des axes ; 11) la matrice analyse ; et 12) les rsultats prsents.
An dassurer la stabilit du codage entre les trois chercheurs qui se sont
consacrs lanalyse, la grille a t valide par lintercodage (De Ketele et Roegiers,
1996) dun sous-chantillon darticles. Le calcul de laccord intercodeurs, cest--
dire le rapport entre le nombre dlments de la grille cods de faon identique
par les trois codeurs et le nombre total dlments cods, a produit un taux nal
satisfaisant de 93 % (41/44). Le 7 % de dsaccord sexplique surtout par les cas o
les informations prsentes dans un article ntaient pas claires ou faisaient un
usage erron du lexique statistique (par exemple : extraction Varimax ). Les
rsultats prsents ci-dessous consistent en un dnombrement des divers lments
de la grille.
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 335
336 Revue des sciences de lducation
Rsultats
Les 37 articles analyss rapportent un total de 73 cas dutilisation danalyses fac-
torielles, certains de ces articles comportant plus dune utilisation. Les rsultats
qui suivent traitent des pratiques en ce qui a trait la taille des chantillons, au
nombre et la nature des variables, au but de lutilisation et au type danalyse
factorielle utilis, la mthode dextraction des facteurs prconise, au critre de
dimensionnalit, au critre de rotation des axes et aux rsultats prsents.
Taille des chantillons
La taille des chantillons recenss varie de 65 24 599 rpondants, pour une taille
mdiane de 313 rpondants. Cinq des analyses rapportes sont effectues sur des
chantillons de 100 rpondants ou moins. Par la suite, nous avons dnombr 19
analyses factorielles comptant de 101 200 rpondants par chantillon, sept sur
des chantillons oscillant de 201 300 rpondants, six sur un nombre de rpon-
dants se situant de 301 400 alors que 26 des chantillons comprenaient au moins
401 rpondants. Enfin, la taille de lchantillon nest pas prcise pour dix des
analyses factorielles.
Par ailleurs, le rapport entre le nombre de rpondants et le nombre de variables
stale de 1 : 1 911 : 1, pour un rapport mdian de 15 : 1. Ce rapport stablit 5 :
1 ou moins pour neuf des analyses tudies alors quil se situe de 6 : 1 10 : 1 pour
onze autres tudes. Treize analyses impliquent un rapport de 11 : 1 15 : 1, six
autres situent ce rapport de 16 : 1 20 : 1, alors que 21 analyses prsentent un
rapport rpondants/variable suprieur 20 : 1. Ce rapport na pu tre calcul pour
13 des analyses factorielles tudies parce quune des informations ncessaires tait
manquante.
Nombre et nature des variables
Tel quobserv par Pohlmann (2004), la majorit des cas recenss utilisent des
formats de rponse de type Likert (40 sur 73). Dans les autres cas, six analyses
portent sur un format catgoriel qui nest pas spcifi davantage, quatre sur des
variables continues (des scores drivs dinstruments psychomtriques, par
exemple), deux sur des variables dichotomiques et, dans 21 cas sur 73, le format
de rponse nest pas prcis.
Le nombre de variables, quant lui, oscille entre sept et 80, pour un nombre
de variables mdian de 22. Par ailleurs, le rapport entre le nombre de variables et
le nombre de facteurs stend de 2 : 1 54 : 1, pour une mdiane de 7 : 1. Ce rapport,
qui devrait prfrablement tre de quatre six variables pour un facteur (Fabrigar
et al., 1999 ; McCallum et al., 1999), est de 3 : 1 ou moins pour huit des utilisations
danalyse factorielle releves. Les autres rapports observs slvent 4 : 1 dans sept
cas, 5 : 1 dans cinq cas, 6 : 1 dans dix cas et il est suprieur 6 : 1 pour 30 cas.
Ce rapport na pu tre calcul dans 13 cas puisquune des informations ncessaires
tait manquante.
But de lutilisation et type danalyse factorielle
Conformment aux rsultats obtenus par Conway et Huffcutt (2003), lanalyse
factorielle est surtout utilise dans le but dvaluer la validit de construit dins-
truments psychomtriques (54 cas sur 73). Le dsir de dgager une structure latente
dun ensemble de variables (13 cas), de rduire le nombre de variables tudies (4
cas) ou de tester des hypothses (2 cas) constituent les autres motifs invoqus pour
lutilisation de lanalyse factorielle.
Au total, trente-six des analyses effectues sont des analyses en composantes
principales (ACP), douze sont des analyses factorielles conrmatives et dix sont
des analyses factorielles exploratoires (AFE). Notons que six des cas utilisent deux
types danalyse factorielle (ACP et AFE) et que le type danalyse nest pas spci
dans vingt et un des cas recenss. Pour les prochaines sections, vu lobjectif de
notre tude et la nature particulire de lanalyse factorielle conrmative, les seuls
rsultats prsents correspondront aux 61 cas danalyse en composantes principales
et danalyse factorielle exploratoire.
Lanalyse factorielle exploratoire sert identier des structures latentes parmi
un ensemble de variables dans sept cas et, dans une moindre mesure (3 cas),
valuer la validit de construit dinstruments psychomtriques. Par contre, contrai-
rement lusage qui en est prescrit, lanalyse en composantes principales savre
applique diverses tches : validation dinstruments (21 cas), identication de
structures latentes (11 cas), et rduction du nombre de variables (3 cas) qui cons-
titue pourtant le seul usage pour lequel cette analyse est vraiment indique
(Conway et Huffcutt, 2003).
Mthode dextraction des facteurs
Avant de procder lextraction des facteurs, le chercheur doit dcider quelle
matrice sera soumise lanalyse et dterminer si la structure des donnes est pro-
pice lanalyse factorielle. Peu darticles spcifient la matrice analyse. En fait, cette
information est manquante dans 49 des 61 cas analyss. Pour ce qui est des douze
cas restants, onze se basent sur la matrice des corrlations de Pearson et une seule
sur la matrice des corrlations polychoriques. Dautre part, lutilisation des tests
de Bartlett et de Kaiser-Meyer-Olkin savre encore plus rare, puisquun seul cas
rapporte lutilisation des deux tests et quun autre fait uniquement appel au
KMO.
En ce qui a trait la mthode dextraction des facteurs, nos rsultats saccordent
avec ceux de Conway et Huffcutt (2003), Fabrigar et ses collaborateurs (1999) ainsi
que Park et son quipe (2002) : la mthode dextraction en composantes principales
demeure la plus utilise (36 cas), alors que les autres mthodes sont utilises de
faon marginale. Ainsi, nous retrouvons six cas de factorisation de limage (dans
un seul article) et un cas o la mthode utilise est celle du maximum de vraisem-
blance. Dans six cas, on rapporte lutilisation de deux mthodes dextraction et
cette dernire nest pas prcise dans 22 cas.
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 337
338 Revue des sciences de lducation
Critre de dimensionnalit
Comme lavaient remarqu Fabrigar et ses collaborateurs (1999), le critre de
dimensionnalit le plus populaire demeure celui de Kaiser-Guttman (25 cas). Il
est suivi du graphique des valeurs propres de Cattell (18 cas), alors que les autres
critres sont utiliss plus rarement : la dtermination du nombre de facteurs
partir de la possibilit de les interprter selon des bases conceptuelles sert sept fois
de critre, le pourcentage de variance expliqu cinq occasions, un a priori tho-
rique deux occasions et on fait deux fois appel la comparaison des valeurs
propres. Notons que dans 22 cas, les chercheurs mettent plusieurs critres con-
tribution (souvent celui de Kaiser-Guttman et celui de Cattell), dmontrant ainsi
un souci de rigueur. loppos, la faon de dterminer le nombre de facteurs nest
pas prcise dans 26 cas sur 61.
Critre de rotation des axes
Ici encore, nos rsultats confirment les tendances observes par Conway et Huffcutt
(2003), Fabrigar et ses collaborateurs (1999) ainsi que Park et son quipe (2002) :
le critre de rotation Varimax domine les pratiques dutilisation avec 21 occur-
rences alors que des rotations orthogonales dont on ne prcise pas la nature sont
utilises dans six autres cas. Quant aux rotations obliques, sept cas font rfrence
au critre Oblimin, un au critre Promax et huit autres cas mentionnent lusage
dune rotation oblique sans en prciser le critre exact. Notons quen aucun cas
lauteur ne prcise la valeur du paramtre ou . Enfin, si quatre cas ont recours
plus dun critre de rotation, dans 19 cas on omet de prciser sil y a eu ou non
rotation des axes. Finalement, trois cas ne comportent aucune rotation parce que
la solution factorielle postule est unidimensionnelle.
Rsultats prsents
Notons demble que les auteurs fournissent gnralement plus dun type de
rsultats partir de leurs analyses. Parmi les rsultats prsents dans les articles
recenss, le pourcentage de variance expliqu est le plus frquemment rencontr
(35 cas). Les coefficients de saturation provenant de lune ou lautre des matrices
factorielles sont fournis dans 33 cas, alors que les valeurs propres sont indiques
15 fois. Plus rarement, nous retrouvons la matrice des corrlations inter-items
analyse (7 cas) ou les communauts des items (1 cas). Dans 14 cas, aucun rsultat
nest mentionn.
Discussion
Notre objectif, travers la ralisation de cet article, tait dtudier lutilisation de
lanalyse factorielle exploratoire et de lanalyse en composantes principales dans
les recherches publies dans des revues canadiennes en ducation.
Nos constats correspondent troitement aux rsultats de recherches provenant
dautres domaines ou dautres pays en ce quune part notable des pratiques dutili-
sation ou de prsentation des rsultats comporte un certain nombre de lacunes.
De faon gnrale, les chantillons sont sufsamment importants pour justier
lutilisation danalyses factorielles. Ainsi, plus du tiers des analyses rapportes
comptent plus de 400 rpondants. Toutefois, le mutisme frquent des chercheurs
quant aux valeurs des communauts ne permet pas vraiment de statuer sur lad-
quation des chantillons.
Cependant, la nature des variables analyses pourrait poser problme. Si elles
sont gnralement en nombre sufsant pour surdterminer adquatement les
facteurs, leur chelle de mesure est presque toujours ordinale avec un nombre
limit de modalits, ce qui ne satisfait pas lune des conditions dutilisation de
lanalyse factorielle, savoir quelle doit sappliquer des variables continues. De
plus, les prcautions qui contribueraient attnuer limpact de cette violation,
telles lanalyse de la matrice des corrlations polychoriques plutt que celle des
corrlations de Pearson, sont rarement prises. Ce choix risque de biaiser les struc-
tures factorielles obtenues puisque la valeur du coefcient de corrlation de
Pearson (r) tend tre rduite par les restrictions de lunivers de variation impo-
ses par des variables catgorielles. Par ailleurs, notons que lanalyse pralable des
donnes laide du test de Bartlett et du KMO nest pratiquement jamais effectue,
ce qui augmente le risque de ne pas pouvoir dtecter les cas qui ne se prteraient
pas une analyse factorielle sans llimination de certains items problmatiques.
Deux fois sur trois, le chercheur fait appel lanalyse factorielle pour valuer la
validit de construit dinstruments de mesure. Lanalyse factorielle exploratoire
savre surtout utilise, conformment ses vises thoriques, pour identier des
structures latentes. Dans une moindre mesure, elle sert aussi valuer la validit
de construit, un usage acceptable pour ce type danalyse. Cependant, lusage gn-
ralis de lanalyse en composantes principales pour des tches thoriquement
dvolues lanalyse factorielle conrmative (validation dinstruments) ou lana-
lyse factorielle exploratoire (recherche de structures latentes) mrite dtre ques-
tionn. Sagit-il dune simple consquence du fait que lanalyse en composantes
principales demeure la mthode dextraction par dfaut des logiciels les plus uti-
liss ? Sagit-il plutt de pratiques inculques lors de la formation des chercheurs ?
Il y a l un phnomne explorer davantage.
Lorsque vient le moment de dterminer le nombre de facteurs signicatifs
extraits, les auteurs recenss se tournent le plus souvent vers le critre de Kaiser-
Guttman, parfois utilis en conjonction avec celui de Cattell. Bien que ces critres
ne soient pas les plus efcaces, leur utilisation concomitante permet, sils convergent,
de mieux appuyer la dimensionnalit de la solution retenue. Or tant donn que
dans les articles tudis le graphique de la progression des valeurs propres et sou-
vent les valeurs propres elles-mmes ntaient pas fournis, il nous tait difcile de
juger de la convergence des critres. Par ailleurs, lusage du pourcentage de variance
explique comme critre de dimensionnalit nous a sembl problmatique. Les
chercheurs qui ont utilis cette mthode ne xaient pas de seuil a priori et sem-
blaient faire un choix arbitraire dont les bases taient rarement prcises.
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 339
340 Revue des sciences de lducation
Quant la rotation des axes, les rsultats correspondent ceux provenant
dautres recherches : lutilisation de rotations orthogonales dans les deux tiers des
cas o une rotation est prcise vient soulever le dbat sur le ralisme, en ducation,
de solutions o des facteurs sont totalement indpendants alors que conceptuel-
lement, cest rarement le cas. La popularit de ces rotations, et plus particulirement
du critre Varimax, pourrait tre partiellement explique par deux facteurs : lattrait
de solutions orthogonales faciles interprter et le fait que ces rotations soient si
rpandues dans la documentation scientique en sciences sociales quelles se
perptuent par modelage. Ici encore, il y a lieu de se questionner sur le rle de la
formation dispense aux chercheurs dans ces pratiques de recherche.
Mais quen est-il des rsultats prsents la suite de lutilisation danalyses
factorielles ? Dans la moiti des cas, le pourcentage de variance explique est com-
muniqu, de mme que les coefcients de saturation (loadings). Toutefois, dans le
cas des rotations obliques, il est rarement prcis de quelle matrice (de congu-
ration ou de structure) ces coefcients sont tirs. Le fait que ces rsultats soient
perus par les chercheurs comme mritant davantage dtre publis que, par
exemple, les valeurs propres ou les communauts, pique notre curiosit. Il est
possible quon leur attribue davantage une valeur de rsultat tmoignant de la
qualit de la structure nale quaux autres informations disponibles. Or, ces indi-
cateurs savrent insufsants pour juger de ladquation de la structure factorielle
publie ou pour orienter une ventuelle rplication des rsultats.
Enn, nous observons que, bien que les auteurs annoncent souvent lusage
danalyses factorielles exploratoires, il sagit plus frquemment dune utilisation
de lanalyse en composantes principales des ns exploratoires, mme si ces deux
types danalyses ciblent des rsultats diffrents. De plus, nous demeurons surpris
par la quantit dinformations importantes napparaissant pas dans les textes. Plus
du quart des analyses tudies omettent de prciser au moins un des aspects sui-
vants : le format de rponse des items (21/73), la matrice analyse (49/61), la
mthode dextraction utilise (22/61), le critre de dimensionnalit (26/61) ou le
critre de rotation des axes (19/61). Plus tonnant encore, 14 cas sur 61 sen tien-
nent mentionner quils ont valid leurs instruments laide danalyses factorielles,
mais nen prsentent aucun rsultat. Il est vrai que lespace allou par les diffrents
priodiques est souvent restreint, mais il importe nanmoins de divulguer un
minimum de renseignements sur les procdures utilises, ne serait-ce que pour
faciliter la rplication des rsultats et sassurer que les lecteurs disposent de toutes
les informations requises pour porter un regard critique sur les rsultats prsents.
Il en va de la scienticit et de la rigueur de la recherche en ducation.
Conclusion
En guise de conclusion, nous formulerons quelques recommandations sur la base
des lectures ayant men la rdaction de cet article :
- prvoir un chantillon comportant au moins dix fois plus de rpondants quil
y a de variables inclure dans lanalyse factorielle et se rfrer larticle de
McCallum et ses collaborateurs (1999) pour des critres plus rigoureux ;
- surdterminer les facteurs en comptant un minimum de quatre items pour
chacun dentre eux ;
- avant de passer lanalyse factorielle, vrier si les donnes se prtent ce type
danalyse laide des tests de Bartlett et de Kaiser-Meyer-Olkin. Si la valeur de
ces indices est insatisfaisante, identier et supprimer les items qui causent cette
situation ;
- si lanalyse factorielle a pour but la validation dinstruments, opter pour lana-
lyse conrmative ou, faute de mieux, pour une analyse factorielle explora-
toire ;
- lextraction par facteurs communs devrait tre prfre lanalyse en compo-
santes principales pour lidentication de traits latents ;
- la dtermination du nombre de facteurs devrait mettre contribution au moins
deux critres dont, si possible, lanalyse parallle ;
- moins dtre certain que les facteurs latents ne peuvent pas tre corrls, choisir
une rotation oblique plutt quorthogonale ;
- inclure tous les rsultats des analyses dans les publications, de mme que les
difcults rencontres lors de lapplication de ces analyses.
Notes
1. Les communauts, ou variance partage, reprsentent la proportion de la variance dun item
explique par le trait mesur.
2. La grille danalyse est disponible sur demande auprs du premier auteur.
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 341
342 Revue des sciences de lducation
Rfrences bibliographiques
Browne, M.W. (2001). An overview of analytic rotation in exploratory factor analysis.
Multivariate Behavioral Research, 36(1), 111-150.
Bryant, F.B. et Yarnold, P.R. (1995). Principal-components analysis and exploratory and
confirmatory factor analysis. In L.G. Grimm et P.R. Yarnold (dir.), Reading and
Understanding Multivariate Statistics (p. 99-136). Washington, DC : American
Psychological Association.
Buley, J.L. (1995). Evaluating exploratory factor analysis : Which initial extraction techniques
provide the best factor delity ? Human Communication Research, 21(4), 478-493.
Burnett, P.C. et Dart, B.C. (1997). Conventional versus conrmatory factor analysis :
Methods for validating the structure of existing scales. Journal of Research and
Development in education, 30(2), 126-132.
Conway, J.M. et Huffcutt, A.I. (2003). A review and evaluation of exploratory factor analysis
practices in organizational research. Organizational Research Methods, 6(2), 147-168.
Costello, A.B. et Osborne, J.W. (2005). Best Practices in Exploratory Factor Analysis : Four
Recommendations for Getting the Most from Your Analysis. Practical Assessment,
Research and Evaluation, 10(7). Document tlacessible ladresse URL : <http ://pareon-
line.net/pdf/v10n7.pdf>.
De Ketele, J.-M. et Roegiers, X. (1996). Mthodologie du recueil dinformations. Fondements
des mthodes dobservations, de questionnaires, dinterviews et dtudes de documents.
Bruxelles : De Boeck/Larcier (3
e
d.).
Fabrigar, L.R., Wegener, D.T., MacCallum, R.C. et Strahan, E.J. (1999). Evaluating the use
of exploratory factor analysis in psychological research. Psychological Methods, 4(3),
272-299.
Henson, R.K., Capraro, R.M. et Capraro, M.M. (2001). Reporting practice and use of explo-
ratory factor analysis in educational research journals. Communication prsente dans
le cadre du Annual Meeting of the Mid-South Educational Research Association, Little
Rock, AZ.
Kieffer, K.M. (1998). Orthogonal versus oblique factor rotation : A review of the literature
regarding the pros and cons. Communication prsente dans le cadre du Annual Meeting
of the Mid-South Educational Research Association, Nouvelle-Orlans, LA.
McCallum, R.C., Widaman, K.F., Zhang, S. et Hong, S. (1999). Sample Size in Factor
Analysis. Psychological Methods, 4(1), 84-99.
OConnor, B.P. (2000). SPSS and SAS programs for determining the number of components
using parallel analysis and Velicers MAP test. Behavior Research Methods, Instrumentation,
and Computers, 32, 396-402. Document tlaccessible ladresse URL : <http ://ash.
lakeheadu.ca/~boconno2/nfactors.html>
Park, H.S., Dailey, R. et Lemus, D. (2002). The use of exploratory factor analysis and prin-
cipal component analysis in communication research. Human Communication Research,
28(4), 562-577.
Pett, M.A., Lackey, N.R. et Sullivan, J.J. (2003). Making sense of factor analysis. The use of
factor analysis for instrument development in health care research. Thousand Oaks, CA :
Sage.
Pohlmann, J.T. (2004). Use and interpretation of factor analysis in The Journal of
Educational Research : 1992-2002. Journal of Educational Research, 98(1), 14-22.
Reise, S.P., Waller, N.G. et Comrey, A.L. (2000). Factor analysis and scale revision.
Psychological Assessment, 12(3), 287-297.
Russell, D.W. (2002). In search of underlying dimensions : The use (and abuse) of factor
analysis in Personality and Social Psychology Bulletin. Personality and Social Psychology
Bulletin, 28(5), 1629-1646.
valuation de lutilisation et de la prsentation des rsultat danalyses factorielles 343
344 Revue des sciences de lducation
summary - This paper presents an evaluation of the use and presentation of results of factor
analysis and principal component analysis as published between 1995 and 2005 in six Canadian
educational periodicals. From a corpus of 1089 articles, the authors noted 61 uses of these analyses.
Using a reading grid, they noted information on the objective of the analysis, the sample size, the
variables, the extraction method, the dimensionality criteria, the method for axes rotation, and
the results presented. They identified deficiencies both at the level of practices and in the result
presentation. Finally, the authors formulate several recommendations regarding a more rigorous
use of these types of analyses.
resumen - Evaluamos la utilizacin y la presentacin de los resultados de anlisis factoriales y
de anlisis en componentes principales dentro de seis publicaciones peridicas canadienses en
educacin publicadas entre 1995 et 2005. En 1089 artculos, notamos 61 utilizaciones de estos
anlisis. Mediante una matriz de lectura, recolectamos informaciones en cuanto al objetivo de la
utilizacin de anlisis, el tamao de la muestra, las variables, el mtodo de extraccin, el criterio
de dimensionalidad, el mtodo de rotacin de los ejes y los resultados presentados. Identificamos
unas lagunas, tanto a nivel de las prcticas como de la presentacin de los resultados. Por terminar,
formulamos algunas recomendaciones en cuanto a la utilizacin rigorosa de estos tipos de
anlisis.

Vous aimerez peut-être aussi