Vous êtes sur la page 1sur 19

Universit de Savoie. LPNC.

Informatique. L3.

STATISTICA Version 6.
FASCICULE DAIDE A LUTILISATION.
LICENCE DE PSYCHOLOGIE
ANNEE 2004 / 2005
________________________________________
STATISTICA est un logiciel de traitement et danalyse de donnes. Il existe un grand nombre
dautres logiciels du mme type, les plus connus sont SPSS (souvent utilis en psychologie
sociale), S Plus (ce logiciel comporte une interface peu attractive, il est surtout utilis par les
personnes qui effectuent leurs analyses en lignes de commande) et SAS (ce logiciel est
probablement lun des plus performant, mais il ne sutilise quasiment quen lignes de
commande et possde une interface avec menu droulant trs rduite).
Lavantage de STATISTICA rside dans la qualit de son interface menu droulant. Toutes
les analyses sont ralisables partir de cette interface. Il faut noter que, si cela est un avantage
indniable pour les personnes qui ne connaissent pas les syntaxes en lignes de commande,
cest aussi un inconvnient dans la mesure o il est ncessaire de connatre parfaitement les
calculs qui permettent darriver un rsultat particulier.
Ce fascicule a pour objectif de vous donner certaines indications qui vous permettront de
raliser une analyse de variance (ANOVA) sur STATISTICA. Bien entendu, il nest en aucun
cas exhaustif, ni reprsentatif des diffrentes possibilits quoffre STATISTICA.
Les diffrentes explications donnes dans ce fascicule sont bases sur un fichier de donnes
EXCEL, les donnes dans ce fichier doivent tre, pralablement son exportation sur
STATISTICA, organise de faon ce que vos variables inter soient en lignes et vos variables
intra en colonnes (voir exemple donn en TD ou encore lexemple ci-dessous).
Enfin, les commandes dcrites dans ce fascicule sont en langue anglaise. Il est possible que
vous possdiez une version de STATISTICA en langue franaise, cela ne change rien la
disposition des commandes. Dautre part, la traduction est trs souvent aise.
NB : laide en ligne de STATISTICA est trs performante, utilisez-la sans modration.

Universit de Savoie. LPNC.


Informatique. L3.

AIDE A LANALYSE DE VARIANCE SOUS

STATISTICA
Psychologie L3.
_______________________________

1) Comment lancer STATISTICA ?


Pour lancer STATISTICA, cliquez sur dmarrer , choisir le dossier programmes , une
liste de programmes apparat : choisir STATISTICA dans le dossier STATISTICA.

2) Ouvrir ou importer un fichier de donnes (format EXCEL)


La bote de dialogue suivante apparat lcran, vous permettant dimporter votre fichier de
donnes. Gnralement, un fichier de donnes apparat, il sagit du dernier fichier utilis.
Avant den ouvrir un nouveau vous devez fermer celui-ci.

Figure 1 : bote de dialogue permettant dimporter un fichier de donnes.

Universit de Savoie. LPNC.


Informatique. L3.

Si vous voulez ouvrir un fichier statistica existant, cliquez sur ouvrir (voir figure 1) et vous
votre fichier depuis lemplacement o il se trouve. Si vous voulez ouvrir un nouveau fichier
(fichier excel par exemple), vous cliquez sur ouvrir ; la bote de dialogue suivante apparat :

Figure 2 : bote de dialogue permettant la recherche du fichier de donnes.


Cette bote de dialogue vous permet de naviguer dans vos diffrents rpertoires et douvrir
diffrents types de fichiers. Par dfaut, Statistica recherche les fichiers ayant une extension
STATISTICA Files (du type .sta par exemple), pour rechercher des fichiers avec dautres
extensions, vous devez slectionner dans longlet Fichiers de type : loption All files
ou Data Files .
Lorsque vous avez slectionn votre fichier, vous cliquez sur Ouvrir .
Remarque : vous devez imprativement savoir o se trouve votre fichier de donnes !!
Attention : dans certains cas STATISTICA indique que limportation des donnes a chou et
quil ny a aucune donne dans le classeur Excel que vous voulez ouvrir. Dans un premier
temps recommencer lopration, si lopration choue encore, vrifiez que votre fichier est
enregistr sous le bon format EXCEL, quil ny a pas de donnes que STATISTICA ne peut
pas lire, que vous avez bien demand louverture de la bonne feuille EXCEL.

Lorsque vous cliquez sur Ouvrir , la bote de dialogue ci-dessus apparat. Vous pouvez
importer lensemble du fichier ou certaine parties uniquement. Par exemple pour un fichier

Universit de Savoie. LPNC.


Informatique. L3.

Excel comportant plusieurs feuilles, vous voulez importer uniquement la feuille sur laquelle
se trouvent les donnes que vous voulez traiter. Pour cela, cliquez sur Import selected sheet
to a Spreadsheet . Cela vous permet, comme lindique la figure suivante de choisir la feuille
que vous voulez importer.

Cliquez sur OK, la bote de dialogue suivante apparat :

Cette bote de dialogue prsente en quelque sorte un rsum de votre fichier de donnes, elle
indique le nombre de lignes et de colonnes de votre fichier. De plus, elle vous permet de
dutiliser la premire ligne du fichier de donnes comme titres de colonnes (celle qui dfinie
vos conditions).
STATISTICA autorise utiliser la premire ligne du fichier de donnes pour mettre une
lgende sur les diffrentes conditions exprimentales, et la premire colonne pour reprer les
diffrents groupes. Si cela est le cas dans votre fichier de donnes, indiquez-le en cochant
loption Get variable names from first rowe , puis cliquez sur le bouton OK .
Votre fichier apparat alors lcran (voir figure 3). Vous remarquerez que les titres des
colonnes sont en format texte, de mme que certaines donnes telles que les sujets, ainsi que
les diffrentes conditions inter ( comest , rapide , par exemple). Statistica supporte le
format texte dans la dfinition du code de vos variables, quelles soient inter ou intra sujets,
mais il possible aussi de dfinir vos variables par des codes numriques.

Universit de Savoie. LPNC.


Informatique. L3.

Figure 3 : fichier de donnes (tir dexcel) tel quil apparat sur statistica lorsquil est import.
NB : Noubliez pas denregistrer votre fichier statistica (donnez-lui un nom spcifique et
que vous reconnatrez.
STATISTICA vous propose denregistrer votre fichier de donnes sous le format.sta. Ceci
vous permet de garder intacte votre fichier dorigine pour une analyse ultrieure. Modifier le
nom du fichier si besoin est, et cliquer sur le bouton Enregistrer .

Figure 5 : Sauvegarde du fichier de donnes au format STATISTICA (.sta)

Universit de Savoie. LPNC.


Informatique. L3.
3)

Comment faire une analyse de variance (ANOVA) sur Statistica ?

Avant tout, vous devez avoir en tte que lANOVA nest pas la seule analyse statistique
applicable des donnes. Il existe un grand nombre de tests statistiques, et une grande partie
dentre eux sont ralisables sur Satistica. Nous nous intresserons pour notre part uniquement
lANOVA (cependant nhsitez pas explorer ce logiciel, laide en ligne tant trs
complte). LANOVA nest quun cas spcifique dun modle plus global danalyse de la
variance qui est le Modle Linaire Gnral (GLM). Statistica inclut donc lANOVA dans le
module GLM.
Pour raliser une analyse de variance (voir figure ci-dessous) :

Figure 6 : choix de lANOVA partir du menu


Statistics puis ANOVA.

Universit de Savoie. LPNC.


Informatique. L3.

Vous disposez de deux possibilits :


a) Si vous savez exactement quelle ANOVA vous voulez utiliser, vous pouvez
directement cliquez dans le menu Statistics puis ANOVA , la bote de dialogue
prsente dans la figure 7 apparat. Elle vous permet de choisir diffrents types
dANOVA (attention bien quelles aient le mme nom, elles sont diffrentes de celles
proposes par le GLM). Nous verrons ensuite quoi rfrent ces appellations.
b) Vous pouvez (et cela est conseill) cliquez sur Statistics , puis Advanced
linear/non linear models , puis sur General linea model . La fentre de dialogue
suivante apparat :

Cette bote de dialogue permet de dfinir quel test statistique inclus dans le GLM, vous voulez
utiliser. Vous remarquerez que plusieurs types dANOVA sont proposs.
a) One-way ANOVA : Elle permet danalyser les plans exprimentaux ne comprenant
quune seule variable indpendante catgorielle (un seul facteur plus de deux
modalits).
b) Main effects ANOVA : Elle permet danalyser les effets principaux (pas les
interactions) de diffrentes variables indpendantes catgorielles.
c) Factorial ANOVA : Elle permet de tester les effets dinteraction de plusieurs variables
catgorielles.
d) Repeated measures ANOVA : Elle permet de raliser des tests avec des plans
exprimentaux mixtes, ou intra. Lutilisation des repeated measures permet danalyser
des plans exprimentaux dans lesquels il y a une ou plusieurs variables intra et une ou
plusieurs variables inter.
Voici un exemple avec un plan mixte comprenant 2 VI inter et 2 VI intra, chacune deux
modalits. Pour raliser cette analyse nous utiliserons donc le module Repeated measures
ANOVA

Universit de Savoie. LPNC.


Informatique. L3.

Comment dclarer vos variables dans un plan mixte :

Lorsque vous cliquez sur Repeated measures ANOVA , la fentre ci-dessus apparat, elle
vous permet de dclarer vos variables et surtout lagencement de ces variables. Longlet
Variables vous permet de slectionner les variables sur lesquelles vont porter les analyses.
Lorsque vous cliquez sur cet onglet, la fentre ci-dessous apparat, avec les intituls de toutes
les variables. Les variables intra doivent tre dclares dans la partie gauche Dependant
variable list et le variables inter dans la partie de droite Categorical predictors (factors) .
une fois vos variables slectionnes, cliquez sur OK.
NB : Pour slectionner une variable dans une catgorie (les variables inter-groupes dans la
liste de droite et les variables intra-sujets dans la liste de gauche), cliquez sur la variable
laide de la souris dans la liste considre ; la variable apparat alors en sur-brillance. Pour
slectionner plusieurs variables dans la mme colonne, slectionner les variables une une
en appuyant sur la touche Ctrl du clavier et simultanment sur chacune des variables que
vous voulez slectionner.

La fentre ci-dessous apparat (voir figure 7). Cette fentre vous permet de dfinir les
diffrents niveaux de vos variables inter et intra, autrement dit, cest ici que vous indiquez le
nombre de modalit de vos facteurs.

Universit de Savoie. LPNC.


Informatique. L3.

a) Dclaration des variables intra : cliquez sur Within effects , la fentre qui se trouve
droite sur la figure 7 apparat.
Attention : Lordre dans lequel on dclare les variables intra-sujets est trs
important. La rgle consiste dclarer dabord les variables qui tournent le moins
vite, en loccurrence les variables de haut niveau. Lexemple suivant va nous
permettre de mieux comprendre cette notion.
Supposons par exemple un plan danalyse comportant 2 variables entirement rptes : une
variable A ( deux modalits : A1 et A2) et une variable B ( 3 modalits : B1, B2 et B3). Ceci
conduit dfinir les conditions exprimentales suivantes : A1B1 ; A1B2 ; A1B3 ; A2B1 ;
A2B2 ; A2B3. Dans ce cas on dit que la variable A tourne moins vite que la variable B, car
en faisant le tour de A on fait trois tours de B. Dans ce cas on dclare dabord la
variable A en indiquant ses deux niveaux, puis la variable B en indiquant ses trois niveaux
(pour notre exemple, il faut se rfrer la faon dont nous avons choisi de rentrer les
variables).
Pour chaque variable intra-sujet, il faut saisir dans le champ No of levels le nombre de
modalits de la variable, et dans le champ Factor name , le nom que lon veut assigner
la variable. On clique ensuite sur OK pour finir.

Figure 7
b) dclaration des variables inter : cliquez sur Factor codes :
La fentre suivante apparat. Si vous
cliquez sur OK, Statistica prendra en
compte toutes les modalits de tous les
facteurs inter. Vous pouvez en revanche
slectionner seulement certaines modalits
en cliquant sur Zoom et en choisissant
ensuite les modalits qui vous intressent.
NB : il est gnralement conseiller de
slectionner toutes les modalits.

Universit de Savoie. LPNC.


Informatique. L3.

Aprs avoir indiquer le statut de chaque variable du plan danalyse, cliquer sur le bouton
OK pour finir.
La bote de dialogue suivante apparat. Elle vous permet dobtenir diffrentes informations.
En cliquant sur More results vous disposerez de plus doptions (voir figure 9).

Figure 8 : bote de dialogue permettant lanalyse des donnes selon le plan dexprience que
vous avez rentr.
4) Calcul des effets et mise en forme des rsultats.

Figure 9 : fentre partir de laquelle raliser diffrentes analyses (ANOVA en mesures


rptes).

10

Universit de Savoie. LPNC.


Informatique. L3.

a) Les fonctions dcrites ci-dessous sobtiennent lorsque vous cliquez sur longlet
Summary dans la fentre prcdente (figure 9).
Cliquer sur Test all effects pour obtenir tous les effets (principaux et interactions).
Vous obtiendrez le tableau ci-dessous (la lecture de ce tableau sera dtaille en TD).

Figure 10
Cliquer sur Descriptive cell statistics pour avoir une table des moyennes et / ou une
reprsentation graphique des rsultats. Cette fonction permet dobtenir les moyennes
(Mean), les carts-types (Std. Dev.), etc.

Figure 11

11

Universit de Savoie. LPNC.


Informatique. L3.

Sur All effects/Graphs pour les effets spcifiques.

Figure 12
5) Les graphiques
Dans le menu Graphs de STATISTICA, on dispose dun ventail trs large de graphiques
pour la mise en forme des rsultats. A vous de choisir le graphique qui reprsentera le mieux
vos rsultats. Les graphiques les plus utiliss sont les courbes (que vous obtenez directement
dans longlet Summary , puis All effects/graphs ), les histogrammes ( Graphs ;
Histograms ou Graphs ; 2D graphs ; Histograms ).

Figure 13 : Comment obtenir des courbes des effets sans passer par le menu Graphique

12

Universit de Savoie. LPNC.


Informatique. L3.

Ensuite vous devez slectionner leffet que vous voulez reprsenter sous forme graphique
(voir figure ci-dessous).

Sur la figure ci-dessus, leffet pour lequel nous voulons obtenir un graphique est en
surbrillance (surlign). Pour obtenir un graphique de cet effet (ici leffet dinteraction), vous
devez cliquer sur OK, la fentre suivante apparat. Cette fentre vous permet de dcider quelle
variable vous aller disposer sur laxe des abscisses (ensuite cliquez OK).

Par dfaut, Statistica propose le graphique suivant. Vous pouvez le retoucher, c'est--dire
ajouter les valeurs, changer la couleur des traits, indiquer le nom des variables, etc.

13

Universit de Savoie. LPNC.


Informatique. L3.

NB : vous pouvez copier un graphique Statistica dans une feuille de calcul EXCEL ou sur une
page WORD. Attention, ces graphiques sont des fichiers trs lourds qui vont rapidement faire
augmenter la taille de votre fichier Word ou Excel.

14

Universit de Savoie. LPNC.


Informatique. L3.

6) Quelques exemples danalyses de donnes simples


Lanalyse de variance est un exemple de traitement de donnes qui sapplique aux plans
factoriels (plusieurs VI). Il existe bien dautres mthodes danalyse de donnes. Voici
quelques exemples danalyses couramment utilises. Vous trouverez toutes les analyses
partir du menu Statistics

1- Test de Student (t-test)


Un certain nombre danalyses de base se trouvent dans le
module Basic statistics/Tables . Cest dans ce module
que vous trouverez notamment les outils permettant de
raliser des analyses descriptives (moyenne, cart-type,
table de frquence, test de normalit, etc.).
Vous trouverez aussi des fonctions permettant de raliser un
test t de Student (attention, vous devez choisir le test
correspondant votre plan exprimentale, savoir inter ou
intra)

Lorsque vous choisissez le type de t-test que vous dsirez raliser, vous devez ensuite dclarer
(dfinir) les variables ; autrement dit ce que vous voulez comparer. Lorsque vous cliquez sur
lun des t-test possibles, une fentre apparat dans laquelle vous devez dclarer vos variables
(voir figure ci-dessous).

15

Universit de Savoie. LPNC.


Informatique. L3.

Pour dclarer les variables, cliquez sur Variables

Puis slectionner vos variables, comme indiqu dans


la figure ci-dessous et cliquez sur Summary ou
Summary T-test pour obtenir le tableau de
rsultats.

Selon que le plan dexprience est inter ou


intra, le tableau de rsultats que vous
donne Statistica na pas la mme forme.
Cependant, les informations contenues
sont les mmes, elles sont disposes
diffremment.

16

Universit de Savoie. LPNC.


Informatique. L3.

2 Corrlation
Pour obtenir une matrice de corrlation1, c'est--dire un indice qui indique de quelle faon
covarient vos variables, il existe plusieurs possibilits. La possibilit la plus simple est de
cliquer sur Statistics ; Basic Statistics/Tables ; Correlation Matrix . La fentre
suivante apparat :
A partir de cette fentre, slectionnez vos
variables (vous pouvez demander les corrlations
entre toutes vos variables = One variable list
ou deux groupes de variables = Two lists .
Puis cliquez sur Summary ou Summary :
Correlation matrix .
Le tableau de rsultats ci-dessous apparat. Par
convention, Statistica colore en rouge les
rsultats significatifs (en loccurrence ici les
corrlations). Vous remarquerez que la diagonale
est remplie de 1, a signifie tout simplement
quune condition (par exemple DA_DISS_Signe)
corrle parfaitement avec elle-mmece qui na
rien dtonnant !! Vous remarquerez aussi, que
les corrlations qui se trouvent au-dessus et audessous de la diagonale sont identiques, vous
pouvez donc vous passer dune partie des
corrlations !
Enfin, vous noterez que les corrlations sont
donnes significatives un seuil p de .05

La corrlation est un indice indpendant de la moyenne, elle permet de dterminer sil existe une relation (i.e.
une relation de linarit) entre deux variables (deux mesures par exemple). Par exemple, si lon fait passer 2
preuves 10 individus et que lon regarde si les deux preuves corrlent, cela signifie que ces deux preuves
classent les individus de la mme faon, c'est--dire quun individu qui russit lpreuve 1 russira aussi
lpreuve 2. Lindice de corrlation le plus connu est le r de Bravais Pearson, il peut prendre toutes les valeurs
entre -1 et 1.
17

Universit de Savoie. LPNC.


Informatique. L3.

Une seconde faon dobtenir exactement la mme matrice de corrlation est de cliquer dans le
menu Statistics sur Non Parametrics , puis Correlations (Spearman, Kendal tau,
gamma) ; la fentre suivante apparat. Elle permet de slectionner les variables (notez que
comme prcdemment, vous pouvez demander les corrlations entre toutes les variables
Square matrix ou pour 2 listes Matrix of two lists ou un rapport dtaill Detailed
report ). Cliquez sur Spearman R ou Spearman rank R pour obtenir le tableau de
rsultats.

18

Universit de Savoie. LPNC.


Informatique. L3.

7) Glossaire
Termes anglais

Statistica (version 5)*

2D graphs
Advanced linear/non linear models
All effects/Graphs
All files

Graphiques 2D
Modles linaires/non linaires avancs
Tous les effets/graphiques
Tous les fichiers
Variables indpendantes (prdicteurs catgoriels ou
Categorical predictors (factors)
facteurs)
Correlation Matrix
Matrice des corrlations
Data files
Fichier de donnes
Dependant variable list
Variables dpendantes
Descriptive cell statistics
Statistiques descriptives
Factor codes
Codes des facteurs intra
Factor name
Nom du facteur
Factorial ANOVA
ANOVA factorielle
General linea model
Modle linaire gnral
Get variable names from first rowe
Prendre les noms des variables de la premire ligne
Graphs
Graphiques
Histograms
Histogrammes
Import all sheets to a workbook
Importer toutes les feuilles
Import cell formating
Importer avec formatage des cellules
Import selected sheet to a Spreadsheet Slectionner une feuille importer
Main effects ANOVA
ANOVA effets principaux
Mean
Moyenne
More results
Plus de rsultats
No of levels
Nombre de niveaux
Non Parametrics
Non paramtriques (statistiques non paramtriques)
One variable list
Liste de variables
One-way ANOVA
Anova un facteur
Repeated measures ANOVA
ANOVA mesures rptes
Statistics
Statistiques
Std. Dev
Ecart-types
Summary
Rsum
Test all effects
Tous les effets
Two lists
Deux listes
Within effects
Effets intra
* Ces traductions sont tires de la version 5 de Statistica, il se peut que certaines traductions aient t
changes dans la version 6.

19