Vous êtes sur la page 1sur 724

SPSS Base 12.

0 - Guide de lutilisateur

Sommaire
1 Sommaire 1
Nouveauts de SPSS 12.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Fentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Barre d'tat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Noms de variables et tiquettes de variable dans les listes de botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Commande des botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Sous-botes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Slection de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Obtenir des informations sur les variables dans les botes de dialogue . . . . 11 Obtenir des informations sur les commandes des botes de dialogue . . . . . 12 Procdures de base dans l'analyse des donnes . . . . . . . . . . . . . . . . . . . . 13 Assistant statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 En savoir plus sur SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Obtention d'Aide

15

Utilisation du sommaire de l'aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Utilisation de l'index de l'aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Aide sur les commandes des botes de dialogue . . . . . . . . . . . . . . . . . . . . . 17 Aide sur les termes utiliss dans les rsultats . . . . . . . . . . . . . . . . . . . . . . . 18 Utilisation de l'option Etudes d'observation. . . . . . . . . . . . . . . . . . . . . . . . . 19 Copie de texte d'aide partir d'une fentre contextuelle. . . . . . . . . . . . . . . 19

ix

Fichiers de donnes

21

Ouverture d'un fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Pour ouvrir un fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Types de fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Ouvrir les options de fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Lecture de fichiers Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Lecture d'autres fichiers Excel et de fichiers d'autres tableurs avec l'diteur de donnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Lecture des fichiers dBASE avec l'diteur de donnes . . . . . . . . . . . . . . . . 25 Lire des fichiers de base de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Slectionner une source de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Procdure d'entre dans la base de donnes . . . . . . . . . . . . . . . . . . . . . . . 28 Slectionner des champs de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Crer une requte de paramtre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Dfinition de variables (Assistant de capture de base de donnes) . . . . . . . 38 Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Assistant de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Informations sur les fichiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Enregistrement des fichiers de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Pour enregistrer des fichiers de donnes modifis . . . . . . . . . . . . . . . . . . . 54 Enregistrement de fichiers de donnes au format Excel . . . . . . . . . . . . . . . 54 Enregistrement de fichiers de donnes au format SAS . . . . . . . . . . . . . . . . 55 Pour enregistrer des fichiers de donnes sous des formats diffrents. . . . . 57 Enregistrement de donnes : Types de fichier de donnes . . . . . . . . . . . . . 58 Enregistrement de sous-ensembles de variables . . . . . . . . . . . . . . . . . . . . 60 Enregistrement de fichier : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Protection des donnes d'origine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Fichier actif virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Mode d'analyse distribue

67

Comparaison de l'analyse distribue par rapport l'analyse locale. . . . . . . 68

Editeur de donnes

81

Affichage des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Affichage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Saisie de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Modification de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Aller l'observation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Etat de la slection de l'observation dans l'diteur de donnes. . . . . . . . . 104 Options d'affichage de l'diteur de donnes . . . . . . . . . . . . . . . . . . . . . . . 104 Impression de l'diteur de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

Prparation des donnes

107

Dfinition des proprits de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Copie des proprits de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Identification des observations dupliques . . . . . . . . . . . . . . . . . . . . . . . . 124 Outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Regroupement de variables en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Gnration automatique de modalits regroupes en bandes . . . . . . . . . . 135 Copie de modalits regroupes en bandes . . . . . . . . . . . . . . . . . . . . . . . . 137 Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

xi

Transformations de donnes

141

Calcul de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 Valeurs manquantes dans les fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . 145 Gnrer des nombres alatoires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Compter occurrences des valeurs par observation . . . . . . . . . . . . . . . . . . 147 Recodage de valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Recodage de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Cration de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Ordonner les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Recoder automatiquement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Transformation de donnes pour srie chronologique. . . . . . . . . . . . . . . . 161

Gestion et transformations de fichiers

169

Trier les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Transposer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Fusionner des fichiers de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Ajouter des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Ajouter des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Agrger les donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Scinder un fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 Slectionner des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Pondrer les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 Restructuration des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

xii

Utilisation du rsultat

217

Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Utilisation de rsultats dans d'autres applications . . . . . . . . . . . . . . . . . . 226 Collage d'objets dans le Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Collage spcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Collage d'objets d'une autre application dans le Viewer . . . . . . . . . . . . . . 231 Exporter rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 Impression de documents du Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 Enregistrement des rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

10 Viewer en mode brouillon

251

Pour crer un rsultat en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . 252 Contrle du format du rsultat en mode brouillon . . . . . . . . . . . . . . . . . . . 252 Attributs de polices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 Pour imprimer un rsultat en mode brouillon. . . . . . . . . . . . . . . . . . . . . . . 257 Pour enregistrer une sortie du Viewer en mode brouillon . . . . . . . . . . . . . 259

11 Tableaux pivotants

261

Manipulation d'un tableau pivotant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 Utilisation des strates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 Signets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Montrer ou masquer des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Modification des rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 Modification de l'aspect des tableaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 Proprits du tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
xiii

Pour modifier les proprits d'un tableau pivotant . . . . . . . . . . . . . . . . . . 277 Proprits de tableau : Gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Modification des proprits gnrales d'un tableau . . . . . . . . . . . . . . . . . 278 Proprits de tableau : Notes de bas de page. . . . . . . . . . . . . . . . . . . . . . 279 Modification des proprits des marques des notes de bas de page. . . . . 279 Proprits de tableau : Formats de cellule . . . . . . . . . . . . . . . . . . . . . . . . 280 Modification des formats des cellules. . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 Proprits de tableau : Bordures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 Pour modifier les bordures d'un tableau . . . . . . . . . . . . . . . . . . . . . . . . . . 282 Pour afficher des bordures masques dans un tableau pivotant . . . . . . . . 283 Proprits de tableau : Impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Pour contrler l'impression d'un tableau pivotant . . . . . . . . . . . . . . . . . . . 284 Polices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 Largeur des cellules de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Proprits de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Modification des proprits de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . 287 Proprits des cellules : Valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 Modification des formats des valeurs dans une cellule . . . . . . . . . . . . . . . 288 Pour modifier le format des valeurs dans une colonne . . . . . . . . . . . . . . . 288 Proprits des cellules : Alignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 Modification de l'alignement dans les cellules . . . . . . . . . . . . . . . . . . . . . 290 Proprits des cellules : Marges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 Modification des marges dans les cellules . . . . . . . . . . . . . . . . . . . . . . . . 290 Proprits des cellules : Ombrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Modification de l'ombrage des cellules. . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Marque de bas de page . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Slection des lignes et des colonnes dans les tableaux pivotants . . . . . . . 292 Pour slectionner une ligne ou une colonne dans un tableau pivotant. . . . 293 Modification des rsultats d'un tableau pivotant . . . . . . . . . . . . . . . . . . . . 293 Impression des tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
xiv

Pour imprimer les strates masques d'un tableau pivotant . . . . . . . . . . . . 295 Contrle des sauts de tableau pour les tableaux longs et larges . . . . . . . . 295

12 Utilisation de la syntaxe de commande

297

Rgles de syntaxe de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 Cration d'une syntaxe depuis les botes de dialogue . . . . . . . . . . . . . . . . 299 Utilisation de la syntaxe depuis le fichier de rsultat . . . . . . . . . . . . . . . . . 300 Utilisation de la syntaxe dans un fichier-journal . . . . . . . . . . . . . . . . . . . . 302 Excuter une syntaxe de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Commandes Execute multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

13 Frquences

307

Remarques sur les donnes de frquences. . . . . . . . . . . . . . . . . . . . . . . . 307 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 Pour obtenir des tableaux de frquences . . . . . . . . . . . . . . . . . . . . . . . . . 309

14 Caractristiques

315

Remarques sur les donnes de Caractristiques. . . . . . . . . . . . . . . . . . . . 315 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Pour obtenir des statistiques descriptives. . . . . . . . . . . . . . . . . . . . . . . . . 316

xv

15 Explorer

321

Remarques sur les Donnes d'Explorer. . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Pour explorer vos donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323

16 Tableaux croiss

329

Remarques sur les Donnes pour tableau crois . . . . . . . . . . . . . . . . . . . 330 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Pour obtenir des tableaux croiss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331

17 Rcapituler

341

Rcapituler les commentaires de donnes . . . . . . . . . . . . . . . . . . . . . . . . 341 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 Obtenir des rcapitulatifs des observations . . . . . . . . . . . . . . . . . . . . . . . 342

18 Moyennes

349

Remarques sur les donnes des moyennes. . . . . . . . . . . . . . . . . . . . . . . . 349 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 Pour obtenir des moyennes de sous-groupes . . . . . . . . . . . . . . . . . . . . . . 351

xvi

19 Cubes OLAP

355

Remarques sur les donnes des cubes OLAP . . . . . . . . . . . . . . . . . . . . . . 355 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Pour obtenir des cubes OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356

20 Tests T

363

Test T pour chantillons indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 Remarques sur les Donnes du Test T pour Echantillons Indpendants. . . 364 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 Obtenir un test t pour chantillons indpendants . . . . . . . . . . . . . . . . . . . 365 Test T pour chantillons apparis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 Commentaires relatifs au test T pour chantillons apparis. . . . . . . . . . . . 369 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 Obtenir un test t pour chantillons apparis . . . . . . . . . . . . . . . . . . . . . . . 369 Test T pour chantillon unique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 Commentaires sur les Donnes du Test T pour chantillon unique. . . . . . . 372 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 Obtenir un test t pour chantillon unique. . . . . . . . . . . . . . . . . . . . . . . . . . 373

21 ANOVA 1 facteur

375

Remarques sur les Donnes ANOVA 1 facteur . . . . . . . . . . . . . . . . . . . . 376 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376 Obtenir une analyse de variance un facteur . . . . . . . . . . . . . . . . . . . . . . 377

xvii

22 Analyse GLM Univari

385

Remarques sur les donnes GLM - Univari . . . . . . . . . . . . . . . . . . . . . . . 386 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 Pour obtenir des tables GLM - Univari. . . . . . . . . . . . . . . . . . . . . . . . . . . 387 Contrastes GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 Diagrammes de profils GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 Comparaisons post hoc GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

23 Corrlations bivaries

403

Remarques sur les donnes des corrlations bivaries. . . . . . . . . . . . . . . 403 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 Pour obtenir des corrlations bivaries. . . . . . . . . . . . . . . . . . . . . . . . . . . 404

24 Corrlations partielles

409

Remarques sur les donnes des corrlations partielles. . . . . . . . . . . . . . . 409 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 Obtenir des corrlations partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410

25 Distances

413

Pour obtenir des matrices de distance . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Distances : Mesures de dissimilarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 Indices : Mesures de similarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416

xviii

26 Rgression linaire

419

Rgression linaire : Remarques sur les donnes . . . . . . . . . . . . . . . . . . . 420 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 Obtenir une analyse de rgression linaire . . . . . . . . . . . . . . . . . . . . . . . . 422 Mthodes de slection des variables de rgression linaire . . . . . . . . . . . 424 Rgression linaire : Dfinir la rgle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 Diagrammes de rgression linaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 Rgression linaire : Enregistrer de nouvelles variables . . . . . . . . . . . . . . 427 Statistiques de rgression linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 Rgression linaire : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432

27 Ajustement de fonctions

435

Remarques sur les donnes de l'ajustement de fonctions . . . . . . . . . . . . . 435 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 Pour obtenir un ajustement de fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . 437

28 Analyse discriminante

441

Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443 Obtenir une analyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444

29 Analyse factorielle

453

Remarques sur les donnes d'analyse factorielle . . . . . . . . . . . . . . . . . . . 454 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
xix

Obtenir une analyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 Caractristiques d'analyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 Spcification des statistiques rcapitulatives et des coefficients de corrlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461 Spcification des options de l'extraction. . . . . . . . . . . . . . . . . . . . . . . . . . 463 Spcification des options de la rotation . . . . . . . . . . . . . . . . . . . . . . . . . . 465 Spcification des options des facteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 Spcification des options de l'analyse factorielle . . . . . . . . . . . . . . . . . . . 468

30 Choix d'une procdure de classification 31 Classification TwoStep

469 471

Remarques sur les donnes de la procdure d'analyse TwoStep Cluster. . 473 Pour effectuer une procdure d'analyse TwoStep Cluster. . . . . . . . . . . . . 474 Options de la procdure d'analyse TwoStep Cluster . . . . . . . . . . . . . . . . . 475 Diagrammes de l'analyse TwoStep Cluster . . . . . . . . . . . . . . . . . . . . . . . . 478 Rsultats de l'analyse TwoStep Cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . 479

32 Classification hirarchique

481

Remarques sur les donnes de la classification hirarchique . . . . . . . . . . 481 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482 Obtenir une classification hirarchique. . . . . . . . . . . . . . . . . . . . . . . . . . . 484 Statistiques de la classification hirarchique . . . . . . . . . . . . . . . . . . . . . . 486 Diagrammes (graphiques) de classification hirarchique . . . . . . . . . . . . . 487 Enregistrement des nouvelles variables de classification hirarchique . . . 488

xx

33 Nues dynamiques

489

Considrations de donnes sur la classification en nues dynamiques . . . 490 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490 Obtenir une analyse de nues dynamiques . . . . . . . . . . . . . . . . . . . . . . . . 492 Enregistrement des analyses de classes de nues dynamiques . . . . . . . . 495 Options d'analyses des classes de nues dynamiques . . . . . . . . . . . . . . . 495

34 Tests non paramtriques

497

Test du Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498 Test du Khi-deux : remarques sur les donnes . . . . . . . . . . . . . . . . . . . . . 498 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 Pour obtenir un test Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 Test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 Test binomial : remarques sur les donnes . . . . . . . . . . . . . . . . . . . . . . . . 503 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 Pour obtenir un test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 Suites en squences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 Suites en squences : Remarques sur les Donnes . . . . . . . . . . . . . . . . . 507 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 Pour obtenir un test de suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 Test Kolmogorov-Smirnov pour un chantillon . . . . . . . . . . . . . . . . . . . . . 510 Remarques sur les donnes du test de Kolmogorov-Smirnov pour un chantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 510 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511 Pour obtenir un test de Kolmogorov-Smirnov pour un chantillon . . . . . . . 511 Tests pour deux chantillons indpendants. . . . . . . . . . . . . . . . . . . . . . . . 513 Tests pour deux chantillons indpendants : remarques sur les donnes . 514
xxi

Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514 Pour effectuer les tests pour deux chantillons indpendants. . . . . . . . . . 515 Tests pour deux chantillons lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 Tests pour deux chantillons lis : remarques sur les donnes . . . . . . . . . 519 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 Pour obtenir des tests pour deux chantillons lis . . . . . . . . . . . . . . . . . . 520 Tests pour plusieurs chantillons indpendants . . . . . . . . . . . . . . . . . . . . 523 Tests pour Plusieurs Echantillons Indpendants : Remarques sur les Donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524 Pour obtenir des tests pour plusieurs chantillons indpendants . . . . . . . 524 Tests pour plusieurs chantillons lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528 Tests pour plusieurs chantillons lis de considrations de donnes . . . . 528 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528 Pour obtenir des tests pour plusieurs chantillons lis . . . . . . . . . . . . . . . 529

35 Analyse des rponses multiples

531

Dfinition de vecteurs multirponses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532 Pour dfinir des vecteurs de rponses multiples . . . . . . . . . . . . . . . . . . . . 533 Tableaux de frquences des rponses multiples . . . . . . . . . . . . . . . . . . . . 534 Gestion des donnes des frquences de rponses multiples. . . . . . . . . . . 535 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536 Pour obtenir des tableaux de frquences de rponses multiples . . . . . . . . 536 Tableaux croiss des rponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . 537 Remarques sur les Donnes de Tableaux croiss de rponses multiples . . 538 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 538 Pour obtenir des tableaux croiss des rponses multiples . . . . . . . . . . . . 539

xxii

36 Tableaux de Rsultats

543

Tableaux de bord en lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 Tableaux de bord en colonnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553

37 Analyse de fiabilit

561

Remarques sur les donnes de l'analyse de fiabilit . . . . . . . . . . . . . . . . . 562 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562 Obtenir une analyse de fiabilit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 Fonctionnalits supplmentaires de la commande RELIABILITY . . . . . . . . 566

38 Positionnement multidimensionnel

569

Remarques sur les donnes du positionnement multidimensionnel . . . . . . 570 Obtenir une analyse par positionnement multidimensionnel . . . . . . . . . . . 570 Positionnement multidimensionnel : crer une mesure . . . . . . . . . . . . . . . 572 Modle de positionnement multidimensionnel . . . . . . . . . . . . . . . . . . . . . 573 Positionnement multidimensionnel : Options . . . . . . . . . . . . . . . . . . . . . . . 574 Fonctions supplmentaires de la commande Positionnement multidimensionnel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575

39 Statistiques de ratio

577

Remarque sur les donnes des statistiques de ratio . . . . . . . . . . . . . . . . . 577 Pour obtenir des statistiques de ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578 Statistiques de ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 579
xxiii

40 Prsentation de l'utilitaire de diagramme

581

Cration et modification d'un diagramme . . . . . . . . . . . . . . . . . . . . . . . . . 581 Options globales de dfinition du diagramme . . . . . . . . . . . . . . . . . . . . . . 586

41 Courbes ROC

593

Remarques sur les donnes de la courbe ROC . . . . . . . . . . . . . . . . . . . . . 593 Echantillon de rsultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594 Pour obtenir une courbe ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595

42 Outils

597

Informations de la variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597 Commentaires de fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 598 Groupes de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 Dfinir des groupes de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 Utiliser les groupes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601 Rordonner Listes Variables Cible. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602

43 Options

605

Options gnrales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 606 Options Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608 Options du Viewer en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609 Options Etiquettes Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611 Options de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613
xxiv

Options diagrammes interactifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 618 Options tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 619 Options de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622 Options montaires (devises) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623 Options script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625

44 Personnalisation des menus et des barres d'outils

627

Editeur de menu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 Personnalisation des barres d'outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 628 Montrer barres d'outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 629 Pour personnaliser les barres d'outils. . . . . . . . . . . . . . . . . . . . . . . . . . . . 629

45 Systme de production

635

Utilisation de l'Utilitaire de Production . . . . . . . . . . . . . . . . . . . . . . . . . . . 636 Rgles de syntaxe pour le systme de production SPSS . . . . . . . . . . . . . . 637 Options d'exportation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 638 Invites utilisateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641 Sollicitation de macros de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643 Options de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 Contrle du format des tches de production . . . . . . . . . . . . . . . . . . . . . . 645 Excution de tches de production partir d'une ligne de commande . . . 648 Publication sur le Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 Connexion au serveur Web SmartViewer . . . . . . . . . . . . . . . . . . . . . . . . . 651

xxv

46 Utilitaire de script SPSS

653

Excution d'un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 Scripts livrs avec SPSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654 Autoscripts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Cration et modification de scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657 Modification d'un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 Fentre de script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 L'Assistant script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 Cration de scripts automatiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 Fonctionnement des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 Table des classes d'objet et conventions d'appellation . . . . . . . . . . . . . . . 669 Nouvelle procdure (Script) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674 Ajout d'une description un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677 Botes de dialogue de script personnalises . . . . . . . . . . . . . . . . . . . . . . . 677 Mise au point des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682 Fichiers de script et de syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685

47 Systme de gestion des rsultats

689

Identificateurs OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689

xxvi

Annexes A Administrateur d'accs de base de donnes B Personnalisation de documents HTML 695 697

Pour ajouter du code HTML personnalis des documents de rsultat exports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697 Contenu et format du fichier texte pour code HTML personnalis . . . . . . . 698 Pour utiliser un autre fichier ou emplacement pour le code HTML personnalis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698

Index

701

xxvii

Chapitre

Fichiers de donnes

Les fichiers de donnes se prsentent sous une grande diversit de formats et SPSS a t conu pour traiter nombre d'entre eux, dont :

les feuilles de calcul cres sous Lotus 1-2-3 et Excel les fichiers de bases de donnes crs sous dBASE et sous diffrents formats SQL fichiers texte dlimits par des tabulations et autres types de fichier ASCII les fichiers de donnes au format SPSS crs avec d'autres systmes d'exploitation Fichiers de donnes SYSTAT Fichiers de donnes SAS

Ouverture d'un fichier de donnes


Outre les fichiers sauvegards au format SPSS, vous pouvez ouvrir les fichiers Excel, Lotus 1-2-3, dBASE, ainsi que les fichiers tabuls sans avoir convertir les fichiers en un format intermdiaire ni entrer d'informations de dfinition de donnes.

Pour ouvrir un fichier de donnes


E A partir du menu, slectionnez : Fichier Ouvrir Donnes... E Dans la bote de dialogue Ouvrir un fichier, slectionnez le fichier ouvrir. E Cliquez sur Ouvrir. 21

22 Chapitre 3

Sinon, vous pouvez :


lire les noms de variables partir de la premire ligne dans le cas des feuilles de calcul et des fichiers dlimits par des tabulateurs spcifier une plage de cellules lire dans le cas de fichiers de feuilles de calcul spcifier une feuille lire dans un fichier Excel (version Excel 5 ou suprieure)

Types de fichier de donnes


SPSS : Ouvre les fichiers de donnes enregistrs en format SPSS, y compris SPSS

pour Windows, Macintosh, UNIX, et galement le produit DOS SPSS/PC+.


SPSS/PC+ : Ouvre les fichiers de donnes SPSS/PC+. SYSTAT : Ouvre les fichiers de donnes SYSTAT. SPSS portable : Ouvre les fichiers de donnes SPSS sauvegards en format portable.

Sauvegarder un fichier en format portable prend bien plus de temps que de sauvegarder le fichier en format SPSS.
Excel : Ouvre les fichiers Excel. Lotus 1-2-3 : Ouvre les fichiers de donnes enregistrs au format 1-2-3 pour les versions 3.0 et 2.0, ainsi que pour la version 1A de Lotus. SYLK : Ouvre les fichiers de donnes sauvegards en format SYLK (lien symbolique), format utilis par quelques applications de tableurs. dBASE : Ouvre des fichiers de format dBASE pour dBASE IV, dBASE III ou III

PLUS, ou pour dBASE II. Chaque observation est un enregistrement. Les tiquettes de variable et de valeurs ainsi que les spcifications de valeurs manquantes sont perdues lorsque vous sauvegardez un fichier dans ce format.
Nom de fichier SAS long : SAS version 7-8 pour Windows, extension longue. Nom de fichier SAS court : SAS version 7-8 pour Windows, extension courte. SAS version 6 pour Windows : SAS version 6.08 pour Windows et OS2. SAS version 6 pour UNIX : SAS version 6 pour UNIX (Sun, HP, IBM). SAS transfert : Fichier de transfert SAS. Texte : Fichier texte ASCII.

23 Fichiers de donnes

Ouvrir les options de fichier


Lire les noms de variables : Dans le cas des feuilles de calcul, vous pouvez lire le nom des variables partir de la premire ligne du fichier ou de la premire ligne de la plage dfinie. En fonction de vos besoins, vous pouvez convertir les valeurs pour crer des noms de variables valides, en n'oubliant pas de convertir les espaces en traits de soulignement. Feuille de calcul : Les fichiers de la version Excel 5 ou suprieure peuvent contenir

plusieurs feuilles de calcul. Par dfaut, l'diteur de donnes lit la premire feuille. Pour lire une autre feuille de calcul, slectionnez-la dans la liste droulante.
Intervalle : Pour les fichiers de donnes sous forme de feuilles de calcul, vous pouvez galement lire une plage de cellules. Utilisez la mme mthode pour spcifier des intervalles de cellules comme vous le feriez pour des applications tableur.

Lecture de fichiers Excel


Lire les noms de variables : Vous pouvez lire le nom des variables sur la premire ligne du fichier ou sur la premire ligne de la plage dfinie. Les valeurs qui ne sont pas conformes aux rgles de dnomination de variable sont converties en noms de variable valides, et les en-ttes originaux sont utiliss en tant qu'tiquettes de variable. Feuille de calcul : Les fichiers Excel peuvent contenir plusieurs feuilles de calcul.

Par dfaut, l'diteur de donnes lit la premire feuille. Pour lire une autre feuille de calcul, slectionnez-la dans la liste droulante.
Intervalle : Vous pouvez galement lire une plage de cellules. Utilisez la mme

mthode pour spcifier des plages de cellules que celle que vous utiliseriez dans Excel.

Comment l'diteur de donnes lit les fichiers Excel version 5 ou ultrieure


Les rgles suivantes s'appliquent la lecture de fichiers Excel version 5 ou ultrieure :
Type de donnes et largeur : Chaque colonne reprsente une variable. Le type de

donnes et la largeur de chaque variable sont dtermins par le type de donnes et la largeur dans le fichier Excel. Si la colonne contient plusieurs types de donnes (par

24 Chapitre 3

exemple, des dates et des valeurs numriques), le type de donnes est converti en chane et toutes les valeurs sont lues comme des valeurs de chanes valides.
Cellules blanches : En ce qui concerne les variables numriques, les cellules vides sont converties en valeurs manquantes par dfaut et identifies par un point. En ce qui concerne les variables chane, un blanc est une valeur de caractre valide, et les cellules vides sont traites comme des valeurs de chane valides. Noms des variables : Si vous lisez la premire ligne du fichier Excel (ou la premire

ligne de la plage spcifie) en tant que noms de variable, les valeurs qui ne sont pas conformes aux rgles de dnomination de variable sont converties en noms de variable valides et les noms initiaux sont utiliss comme tiquettes de variable. Si vous ne lisez pas les noms de variables partir du fichier Excel, des noms de variables par dfaut sont affects.

Lecture d'autres fichiers Excel et de fichiers d'autres tableurs avec l'diteur de donnes
Les rgles applicables la lecture de fichiers Excel antrieurs la version 5 et celle de fichiers d'autres tableurs sont les suivantes :
Type de donnes et largeur : Le type de donnes et la largeur de chaque variable sont dtermins par la largeur de la colonne et le type de donnes de la premire cellule de donnes de la colonne. Les valeurs d'autres types sont converties en valeurs manquantes par dfaut. Si, dans la colonne, la premire cellule de donnes est vide, le type gnral de donnes par dfaut pour la feuille de calcul (habituellement numrique) est utilis. Cellules blanches : En ce qui concerne les variables numriques, les cellules vides sont converties en valeurs manquantes par dfaut et identifies par un point. En ce qui concerne les variables chane, un blanc est une valeur de caractre valide, et les cellules vides sont traites comme des valeurs de chane valides. Noms des variables : Si, partir de la feuille de calcul, vous ne pouvez pas lire le nom

des variables, SPSS utilise les lettres des colonnes (A, B, C, etc.) comme noms de variable pour les fichiers Excel et Lotus. En ce qui concerne les fichiers SYLK et Excel enregistrs au format d'affichage R1C1, le programme utilise le numro de la colonne, prcd par la lettre C (C1, C2, C3, etc.).

25 Fichiers de donnes

Lecture des fichiers dBASE avec l'diteur de donnes


Les fichiers de base de donnes sont logiquement trs semblables aux fichiers de donnes au format SPSS. Les rgles gnrales suivantes s'appliquent aux fichiers dBASE :

Les noms de champ sont convertis en noms de variable valides. Les signes deux points utiliss dans les noms de champ dBASE sont convertis en traits de soulignement. purgs, sont inclus. SPSS cre une nouvelle variable chane, D_R, qui contient un astrisque pour les observations indiques comme devant tre supprimes.

Les enregistrements indiqus comme devant tre supprims, mais qui n'ont pas t

Lire des fichiers de base de donnes


Vous pouvez lire des donnes partir de n'importe quel format de base de donnes pour laquelle vous avez un pilote adapt. En mode d'analyse locale, les pilotes ncessaires doivent tre installs sur votre ordinateur local. En mode d'analyse distribue (disponible avec la version serveur), les pilotes doivent tre installs sur le serveur distant. Pour plus d'informations, reportez-vous Mode d'analyse distribue dans Chapitre 4 , page 67.

Lire des fichiers de base de donnes


E A partir du menu, slectionnez : Fichier Ouvrir la base de donnes Nouvelle requte... E Slectionnez la source des donnes. E Selon la source de donnes, vous devez peut-tre slectionner le fichier de base de

donnes et/ou entrer un nom de connexion, un mot de passe et d'autres informations.


E Slectionnez les tables et les champs. E Spcifiez toute relation existante entre vos tables.

26 Chapitre 3

Sinon, vous pouvez :


Spcifier les critres ventuels de slection de vos donnes. Ajouter une invite pour que l'utilisateur puisse y entrer un paramtre de requte. Dfinir les attributs de variable. Enregistrer la requte que vous avez construite avant de l'excuter.

Pour modifier une requte de base de donnes enregistre


E A partir du menu, slectionnez : Fichier Ouvrir la base de donnes Modifier requte... E Slectionnez le fichier requte (*.spq) modifier. E Suivez les instructions de cration d'une nouvelle requte.

Pour lire des fichiers de base de donnes avec des requtes enregistres
E A partir du menu, slectionnez : Fichier Ouvrir la base de donnes Excuter requte... E Slectionnez le fichier requte (*.spq) excuter. E Selon le fichier de base de donnes, vous aurez peut-tre entrer un nom de procdure

d'entre ou un mot de passe.


E Si la requte a une invite imbrique, vous pourrez avoir besoin d'entrer d'autres

informations (par exemple, le trimestre pour lequel vous voulez rcuprer les chiffres de ventes).

27 Fichiers de donnes

Slectionner une source de donnes


Utilisez la premire bote de dialogue pour slectionner le type de source de donnes lire dans SPSS. Aprs avoir choisi le type de fichier, l'Assistant de base de donnes vous invitera peut-tre entrer le chemin d'accs vers votre fichier de donnes. Si vous n'avez pas de sources de donnes configures ou si vous souhaitez ajouter une nouvelle source de donnes, cliquez sur Ajouter source donnes. En mode d'analyse distribue (disponible avec la version serveur), ce bouton n'est pas disponible. Pour ajouter des sources de donnes en mode d'analyse distribue, consultez votre administrateur systme.
Source de donnes : Une source de donnes est compose de deux principaux lments

d'informations : Le pilote qui sera utilis pour accder aux donnes et l'emplacement de la base de donnes laquelle vous souhaitez accder. Pour spcifier des sources de donnes, vous devez installer les pilotes appropris. En mode d'analyse locale, vous devez installer les pilotes partir du CD-ROM pour ce produit :

SPSS Data Access Pack : Installe les pilotes de diffrents formats de base de

donnes. Disponible dans le menu d'excution automatique.


Microsoft Data Access Pack : Installe les pilotes pour les produits Microsoft,

notamment Microsoft Access. Pour installer Microsoft Data Access Pack, double-cliquez sur Microsoft Data Access Pack dans le dossier Microsoft Data Access Pack qui se trouve sur le CD-ROM.

28 Chapitre 3 Figure 3-1 Bote de dialogue Assistant de base de donnes

Exemple : Supposons que vous ayez une base de donnes Microsoft Access 7.0

qui contient des donnes sur vos employs et sur les rgions dans lesquelles ils travaillent, et que vous vouliez importer ces donnes. Slectionnez l'icne MS Access 97 Database (Base de donnes MS Access 7.0), puis cliquez sur Suivant pour continuer. La bote de dialogue Select Database (Slectionner base de donnes) s'affiche. Spcifiez le chemin d'accs vers votre base de donnes et cliquez sur OK.

Procdure d'entre dans la base de donnes


Si votre base de donnes ncessite un mot de passe, l'Assistant de base de donnes vous en demandera un avant de pouvoir ouvrir la source des donnes.

29 Fichiers de donnes Figure 3-2 Bote de dialogue de la procdure d'initialisation

Slectionner des champs de donnes


La bote de dialogue de slection des donnes vrifie les tables et les champs lus dans SPSS. Les champs base de donnes (colonnes) sont lus comme des variables. Si une table comporte un ou plusieurs champs slectionns, tous ses champs seront visibles dans les fentres d'Assistant de base de donnes suivantes, mais seuls les champs slectionns dans cette bote de dialogue seront imports comme variables. Cela vous permet de crer des jointures de tables et de spcifier les critres d'utilisation des champs que vous n'importez pas.
Figure 3-3 Bote de dialogue Slectionner base de donnes

30 Chapitre 3

Affichage des noms de champs : Pour lister les champs dans une table, cliquez sur le signe plus (+) gauche du nom d'une table. Pour masquer les champs, cliquez sur le signe moins () gauche du nom d'une table. Pour ajouter un champ : Cliquez sur un champ de la liste des tables disponibles ou

faites-le glisser dans les champs Extraction de cette liste de commandes. Les champs peuvent tre rangs de nouveau en les glissant et en les laissant dans la liste des champs slectionns.
Pour retirer un champ : Double-cliquez sur n'importe quel champ Extraction de cette

liste de commandes ou faites-le glisser jusqu' la liste des tables disponibles.


Trier les noms de champs : Si vous l'avez slectionn, l'assistant de base de donnes

affiche les champs disponibles dans l'ordre alphabtique.


Exemple : Supposez que vous vouliez importer des lments partir d'une base de

donnes avec deux tables, Employs et Rgions. La table Employs contient des informations sur les employs de votre socit, y compris la rgion o ils travaillent, leur modalit d'emploi, et leurs ventes annuelles. Un code rgion (REGION) est assign chaque employ. Ceux qui ne sont pas domicilis dans une rgion obtiennent le code spcial 0. La table Rgions garde un grand nombre de donnes sur les territoires dans lesquels votre socit opre et sur les marchs de prospection. Il utilise un code rgion (REGION) pour identifier le territoire et fournit le revenu par tte moyen pour le territoire, entre autres. Pour tablir le rapport entre les ventes de chaque employ avec le revenu moyen de la rgion, slectionnez les champs suivants partir du tableau Employs : ID, REGION et VENTES. Slectionnez ensuite les champs suivants partir du tableau Rgions : REGION et REVMOY. Cliquez sur Suivant pour continuer.

Crer une relation entre des tables


La bote de dialogue Spcifier les relations vous permet de dfinir les relations existant entre des tables. Si les champs de plus d'une table sont slectionns, vous devez dfinir au moins une jointure.

31 Fichiers de donnes Figure 3-4 Bote de dialogue Spcifier relations

Etablir des relations : Pour crer une relation, faites glisser un champ de n'importe

quelle table vers le champ auquel vous souhaitez le lier. L'Assistant de base de donnes tire un trait de jointure entre les deux champs pour indiquer leur relation. Ces champs doivent tre du mme type de donnes.
Jointure automatique de tables : Essaie de joindre automatiquement deux tables d'aprs les cls primaire/trangre, ou de mettre en correspondance le nom des champs et le type de donnes. Spcifier les types de jointures : Si votre pilote prend en charge les jointures externes,

vous pouvez spcifier soit des jointures internes, soit des jointures externes gauches ou droites. Pour slectionner le type de jointure, cliquez sur la ligne de jointure entre les champs et SPSS affichera la bote de dialogue Proprits de relations. Vous pouvez galement utiliser les icnes dans le coin suprieur droit de la bote de dialogue pour choisir le type de jointure.

Proprits de la relation
Cette bote de dialogue vous permet de spcifier quels types relations lient vos tables.

32 Chapitre 3 Figure 3-5 Bote de dialogue Proprits des relations

Jointures internes : Une jointure interne n'inclut que les lignes dont les champs relis

sont gaux.
Exemple : Continuons avec nos donnes et supposons que vous vouliez importer

des donnes seulement pour les employs qui travaillent dans une rgion dfinie et seulement pour les rgions dans lesquelles votre socit opre. Dans ce cas, vous utiliserez une jointure interne qui exclura les employs en dplacement et filtrera les informations sur les rgions de prospection dans lesquelles vous n'tes pas actuellement prsent. Cela vous donnera un ensemble de donnes contenant les variables ID, REGION, VENTES95 et REVMOY pour chaque employ ayant travaill dans une rgion dfinie.

33 Fichiers de donnes Figure 3-6 Crer une jointure interne

Jointures externes : Une jointure externe gauche inclut tous les enregistrements de la

table de gauche, et seuls les enregistrements de la table de droite dont les champs relis sont gaux. Dans une jointure externe droite, cette relation est inverse si bien que SPSS importe tous les enregistrements de la table de droite, et seulement les enregistrements de la table de gauche dont les champs relis sont gaux.
Exemple : Si vous souhaitez importer des donnes uniquement pour les employs

ayant travaill dans une rgion dfinie (un sous-ensemble de la table Employs), mais que vous ayez besoin d'informations sur toutes les rgions, une jointure externe droite serait approprie. Cela gnre un ensemble de donnes qui contient les variables ID, REGION, VENTES95 et REVMOY pour chaque employ ayant travaill dans une rgion dfinie, plus les donnes sur le reste des rgions dans lesquelles votre socit n'opre pas actuellement.

34 Chapitre 3 Figure 3-7 Cration d'une jointure externe droite

Limiter les observations rcupres


La bote de dialogue Limiter les observations rcupres vous permet de spcifier les critres pour slectionner des sous-groupes d'observations (lignes). Limiter les observations consiste gnralement remplir la grille de critres avec un ou plusieurs critres. Les critres consistent en deux expressions et des relations entre elles. Ils renvoient la valeur True (vrai), False (faux) ou manquant pour chaque observation.

Si le rsultat est vrai, l'observation est slectionne. Si le rsultat est faux ou manquant, l'observation n'est pas slectionne. La plupart des critres utilisent un ou plusieurs des six oprateurs relationnels (<, >, <=, >=, = et <>). Les expressions conditionnelles peuvent inclure des noms de champs, des constantes, des oprateurs arithmtiques, des fonctions numriques et autres, des variables logiques et des oprateurs relationnels. Vous pouvez utiliser des champs que vous ne prvoyez pas d'importer comme variables.

35 Fichiers de donnes Figure 3-8 Bote de dialogue Limiter les observations rcupres

Pour tablir vos critres, vous avez besoin d'au moins deux expressions et d'une relation pour les connecter.
E Pour tablir une expression, placez votre curseur dans une cellule Expression. Vous

pouvez taper les noms de champs, constantes, oprateur arithmtiques, fonctions numriques et autres et variables logiques. Vous disposez d'autres mthodes pour mettre le champ dans une cellule de critres : double-cliquez sur le champ dans la liste Champs, faites glisser le champ partir de la liste Champs ou slectionnez un champ dans le menu droulant, qui est disponible dans les cellules d'expression actives.
E Les deux expressions sont gnralement lies par un oprateur relationnel, comme =

ou >. Pour choisir la relation, placez votre curseur dans la cellule Relation et tapez l'oprateur ou slectionnez-le dans le menu droulant. Pour modifier notre exemple prcdent et n'extraire que les donnes sur les employs qui rpondent aux modalits d'emploi 1 ou 3, crez deux critres dans la grille des critres, puis faites prcder le second critre du connecteur OU.

36 Chapitre 3

Critre 1 : 'VentesEmploys'.'CATEMP' = 1 Critre 2 : 'VentesEmploys'.'CATEMP' = 3


Fonctions : Une slection de fonctions SQL intgres (arithmtique, logique, chane,

date et heure) est fournie. Vous pouvez slectionner une fonction de la liste et la glisser dans une expression ou entrer n'importe quelle fonction SQL valide. Consultez votre documentation sur les bases de donnes pour les fonctions SQL valides.
Utiliser chantillon alatoire : Slectionne un chantillon alatoire d'observations

dans la source de donnes. Pour les sources de donnes volumineuses, vous pouvez limiter le nombre d'observations un chantillon restreint et reprsentatif. Ceci peut considrablement rduire le temps d'excution des procdures. L'chantillonnage alatoire natif, s'il est disponible pour la source de donnes, est plus rapide que l'chantillonnage alatoire de SPSS ; en effet, ce dernier doit lire la totalit de la source de donnes pour extraire un chantillon alatoire.

Environ : SPSS gnre un chantillon alatoire d'observations dont le nombre

correspond approximativement au pourcentage indiqu. Comme cette routine gnre une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage d'observations slectionnes peut seulement approcher le pourcentage spcifi. Plus il y a d'observations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

Exactement : Slectionne un chantillon alatoire du nombre d'observations

spcifi dans le nombre total d'observations indiqu. Si le nombre total d'observations spcifi est suprieur au nombre total d'observations dans le fichier de donnes, l'chantillon contiendra proportionnellement moins d'observations que le nombre demand.
Demander une valeur : Vous pouvez imbriquer une invite dans votre requte pour

crer une requte de paramtre. Lorsque les utilisateurs utilisent la requte, il leur est demand d'entrer ici les informations spcifies. Cette mthode peut s'avrer utile lorsque vous avez besoin par exemple de voir diffrents affichages des mmes donnes. Par exemple, vous voulez excuter la mme requte pour voir les chiffres de ventes des diffrents trimestres fiscaux. Placez votre curseur dans une cellule Expression et cliquez sur Demander une valeur pour crer une invite.

37 Fichiers de donnes

Crer une requte de paramtre


Utilisez la bote de dialogue Demander une valeur pour crer une bote de dialogue sollicitant des informations auprs des utilisateurs chaque fois que quelqu'un excute votre requte. Cela est utile si vous souhaitez effectuer une requte sur les mmes sources de donnes en utilisant des critres diffrents.
Figure 3-9 Bote de dialogue Demander une valeur

Pour tablir une invite, vous avez besoin d'entrer une chane d'invite et une valeur par dfaut. La chane d'invite est affiche chaque fois qu'un utilisateur excute votre requte. Elle doit spcifier le type d'information entrer et, si l'utilisateur ne slectionne rien dans une liste, elle doit indiquer la syntaxe de la saisie. Par exemple, Entrez un trimestre (T1, T2, T3, ...) .
Autoriser l'utilisateur slectionner une valeur dans la liste : Si cette option est slectionne, vous pouvez limiter l'accs de l'utilisateur aux valeurs que vous avez places dans la liste et qui sont spares par des retours chariot. Type de donnes : Spcifiez ici le type de donnes, soit nombre, chane ou date.

38 Chapitre 3

Le rsultat final ressemble ceci :


Figure 3-10 Bote de dialogue Invite dfinie par l'utilisateur

Dfinition de variables (Assistant de capture de base de donnes)


Noms de variables et tiquettes : La totalit du nom de champ de la base de donnes (colonne) est utilise en tant qu'tiquette de variable. A moins que vous ne modifiez le nom de variable, l'Assistant de base de donnes affecte des noms de variables chaque colonne partir de la base de donnes de l'une des manires suivantes :

Si le nom du champ de la base de donnes constitue un nom unique et valide de variable SPSS, il est utilis comme nom de variable. Si le nom du champ de la base de donnes ne constitue pas un champ unique et valide de variable, SPSS cre un nom unique.

Cliquez sur n'importe quelle cellule pour modifier le nom de variable.


Conversion des chanes en valeurs numriques : Cochez la case Etiquettes de valeurs

d'une variable chane pour la convertir automatiquement en variable numrique. Les valeurs de chane sont converties en valeurs entires conscutives dans l'ordre alphabtique des valeurs d'origine. Les valeurs d'origine sont conserves comme tiquettes de valeurs pour les nouvelles variables.

39 Fichiers de donnes Figure 3-11 Bote de dialogue Dfinir variables

Rsultats
La bote de dialogue Rsultats affiche l'instruction SQL Select ncessaire votre requte.
Si vous modifiez l'instruction SQL Select avant d'excuter la requte et cliquez sur le bouton Prcdent pour apporter des modifications aux tapes prcdentes, les

dernires modifications de l'instruction Select seront perdues.


Vous pouvez enregistrer la requte pour une future utilisation grce l'option Enregistrer la requte dans le fichier. Slectionnez Coller dans l'diteur de syntaxe pour coller la syntaxe complte GET DATA dans une fentre de syntaxe. Le fait de copier-coller l'instruction Select depuis la fentre Rsultats ne collera pas la syntaxe de commande ncessaire.

40 Chapitre 3

Mettre donnes en cache localement : Un cache de donnes est une copie complte du fichier de donnes, enregistre dans un espace disque temporaire. La cration d'un cache du fichier de donnes peut amliorer les performances.
Figure 3-12 Bote de dialogue Rsultats

Assistant de texte
L'Assistant de texte permet de lire des fichiers de donnes texte formats de diffrentes faons

Fichiers dlimits par des tabulations Fichiers dlimits par des espaces Fichiers dlimits par des virgules Fichiers de format fixe

41 Fichiers de donnes

Dans le cas des fichiers dlimits, vous pouvez choisir d'autres caractres en guise de sparateurs entre les valeurs et spcifier plusieurs sparateurs.

Lire des fichiers de donnes texte


E A partir du menu, slectionnez : Fichier Lire les donnes du texte E Slectionnez le fichier texte dans la bote de dialogue d'ouverture. E Suivez les tapes de l'Assistant de texte pour dfinir le mode de lecture du fichier

de donnes.

Assistant de texte - tape 1


Figure 3-13 Assistant de texte - tape 1

42 Chapitre 3

Le fichier texte est affich dans une fentre d'aperu. Vous pouvez appliquer un format prdfini (prcdemment enregistr dans l'Assistant de texte) ou suivre les tapes de l'Assistant de texte pour spcifier la faon dont les donnes doivent tre lues.

Assistant de texte - tape 2


Figure 3-14 Assistant de texte - tape 2

Cette tape offre des informations sur les variables. Dans une base de donnes, une variable est similaire un champ. Par exemple, chaque lment d'un questionnaire est une variable.
Disposition de vos variables : Pour lire correctement vos donnes, l'assistant de texte

doit dterminer o finit la valeur d'une variable et o commence la valeur de la variable suivante. La disposition des variables dfinit la mthode utilise pour diffrencier les variables entre elles.

43 Fichiers de donnes

Dlimit : Les variables sont spares l'aide d'espaces, de virgules, de tabulations

ou d'autres caractres. Les variables sont enregistres dans le mme ordre pour chacune des observations, mais pas ncessairement dans les mmes positions de colonnes.

Largeur fixe : Pour chaque observation dans le fichier de donnes, chaque variable

est enregistre dans la mme position de la colonne, sur le mme enregistrement (ligne). Aucun sparateur n'est requis entre les variables. En fait, dans la plupart des fichiers de donnes texte gnrs par des programmes informatiques, les valeurs de donnes peuvent sembler se chevaucher sans mme tre spares par des espaces. C'est la position des colonnes qui dtermine la variable lue par l'Assistant.
Les noms de variable sont-ils inclus dans la partie suprieure de votre fichier ? Si la premire ligne du fichier de donnes contient des tiquettes descriptives pour chaque variable, vous pouvez utiliser ces tiquettes comme noms de variable. Les valeurs qui ne sont pas conformes aux rgles de dnomination de variable sont converties en noms de variable valides.

44 Chapitre 3

Assistant de texte - tape 3 : fichiers dlimits


Figure 3-15 Assistant de texte - tape 3 : fichiers dlimits

Cette tape offre des informations sur les observations. Dans une base de donnes, une observation est similaire un enregistrement. Par exemple, chaque rpondant pour un questionnaire est un enregistrement.
La premire observation commence la ligne : Indique la premire ligne du fichier de donnes contenant des valeurs de donnes. Si les lignes suprieures du fichier de donnes contiennent des tiquettes descriptives ou tout autre type de texte ne correspondant pas des valeurs de donnes, elles ne seront pas considres comme la premire ligne du fichier. Reprsentation de vos observations : Contrle la faon dont l'assistant de texte

dtermine o finit chaque observation et o commence la suivante.

45 Fichiers de donnes

Chaque ligne reprsente une observation : Chaque ligne ne contient qu'une

observation. Il est assez courant que chaque observation soit contenue sur une seule ligne, mme s'il peut s'agir d'une trs longue ligne dans le cas de fichiers de donnes comportant un grand nombre de variables. Si les lignes ne contiennent pas toutes le mme nombre de valeurs, le nombre de variables pour chaque observation est dtermin par la ligne comportant le plus grand nombre de valeurs. Les observations contenant moins de valeurs recevront alors des valeurs manquantes pour les variables supplmentaires.

Un nombre spcifique de variables reprsente une observation : Le nombre spcifi

de variables pour chaque observation indique l'Assistant de texte o terminer la lecture d'une observation et o commencer la lecture de la suivante. La mme ligne peut contenir plusieurs observations ; en outre, les observations peuvent commencer au milieu d'une ligne et se poursuivre sur la ligne suivante. L'Assistant de texte dtermine la fin de chaque observation en fonction du nombre de valeurs lues, quel que soit le nombre de lignes. Chaque observation doit contenir des valeurs de donnes (ou des valeurs manquantes indiques par des sparateurs) pour toutes les variables ; dans le cas contraire, le fichier de donnes ne sera pas lu correctement.
Combien d'observations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de donnes, les n premires observations (n tant un nombre que vous avez dfini), ou encore un chantillon alatoire d'un pourcentage spcifi. Cette routine gnrant une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage d'observations slectionnes ne peut qu'approcher le pourcentage spcifi. Plus il y a d'observations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

46 Chapitre 3

Assistant de texte - tape 3 : fichiers de largeur fixe


Figure 3-16 Assistant de texte - tape 3 : fichiers de largeur fixe

Cette tape offre des informations sur les observations. Dans une base de donnes, une observation est similaire un enregistrement. Par exemple, chaque rpondant pour un questionnaire est un enregistrement.
La premire observation commence la ligne ? Indique la premire ligne du fichier de donnes contenant des valeurs de donnes. Si les lignes suprieures du fichier de donnes contiennent des tiquettes descriptives ou tout autre type de texte ne correspondant pas des valeurs de donnes, elles ne seront pas considres comme la premire ligne du fichier. Combien de lignes reprsente une observation ? Contrle la faon dont l'assistant de texte dtermine o finit chaque observation et o commence la suivante. Chaque variable est dfinie par son numro de ligne dans l'observation et par sa position de

47 Fichiers de donnes

colonne. Vous devez spcifier le nombre de lignes de chaque observation pour que vos donnes soient lues correctement.
Combien d'observations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de donnes, les n premires observations (n tant un nombre que vous avez dfini), ou encore un chantillon alatoire d'un pourcentage spcifi. Cette routine gnrant une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage d'observations slectionnes ne peut qu'approcher le pourcentage spcifi. Plus il y a d'observations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

Assistant de texte - tape 4 : fichiers dlimits


Figure 3-17 Assistant de texte - tape 4 : fichiers dlimits

Cette tape prsente la meilleure mthode dtermine par l'Assistant de texte sur la faon de lire le fichier de donnes et vous permet de modifier cette mthode.

48 Chapitre 3

Quels sparateurs s'affichent entre les variables ? Indique les caractres ou les symboles utiliss pour sparer les valeurs de donnes. Vous pouvez slectionner n'importe quelle combinaison d'espaces, de virgules, de points-virgules, de tabulations ou d'autres caractres. Plusieurs sparateurs conscutifs non spars par des valeurs de donnes sont considrs comme des valeurs manquantes. Qu'est-ce qu'un qualificateur de texte ? Il s'agit de caractres utiliss pour dlimiter

les valeurs contenant des caractres sparateur. Par exemple, si la virgule est un sparateur, les valeurs contenant des virgules ne seront lues correctement que si un qualificateur de texte dlimite la valeur ; ainsi, les virgules de la valeur ne sont pas considres comme des sparateurs de valeurs. Les fichiers de donnes au format CSV exports partir d'Excel utilisent le guillemet () comme qualificateur de texte. Le qualificateur de texte apparat au dbut et la fin de la valeur, et dlimite ainsi la valeur entire.

49 Fichiers de donnes

Assistant de texte - tape 4 : fichiers de largeur fixe


Figure 3-18 Assistant de texte - tape 4 : fichiers de largeur fixe

Cette tape prsente la meilleure mthode dtermine par l'Assistant de texte sur la faon de lire le fichier de donnes et vous permet de modifier cette mthode. Les lignes verticales prsentes dans la fentre d'aperu indiquent les positions que l'Assistant de texte estime correspondre au dbut de chaque variable dans le fichier. Insrez, dplacez et supprimez les lignes de dlimitation des variables votre convenance pour sparer les variables. Si chaque observation utilise plusieurs lignes, slectionnez chaque ligne dans la liste droulante et modifiez les lignes de dlimitation des variables en consquence. Remarque : Dans le cas de fichiers de donnes gnrs par ordinateur et prsentant un flux continu de valeurs de donnes non spares par des espaces ni par d'autres caractristiques distinctives, il peut s'avrer difficile de dterminer l'endroit o commence chaque variable. De tels fichiers de donnes sont gnralement associs

50 Chapitre 3

un fichier de dfinitions de donnes ou toute autre description crite dfinissant la position de ligne et de colonne de chaque variable.

Assistant de texte - tape 5


Figure 3-19 Assistant de texte - tape 5

Cette tape dfinit le nom de variable et le format de donnes utiliss par l'Assistant de texte pour lire chaque variable et dtermine les variables qui seront incluses dans le fichier de donnes final.
Nom de la variable : Vous pouvez remplacer les noms de variables par dfaut par

vos propres noms de variable. Si vous choisissez des noms de variable provenant du fichier de donnes, l'assistant de texte modifiera automatiquement les noms de variable qui ne sont pas conformes aux rgles de dnomination de variable. Slectionnez une variable dans la fentre d'aperu, puis entrez un nom de variable.

51 Fichiers de donnes

Format des donnes : Slectionnez une variable dans la fentre d'aperu, puis slectionnez un format dans la liste droulante. Pour slectionner plusieurs variables contigus, appuyez sur le bouton de la souris tout en maintenant la touche Maj enfonce ; pour slectionner plusieurs variables non contigus, appuyez sur le bouton de la souris tout en maintenant la touche Ctrl enfonce.

Assistant de texte : options de formatage


Les options de formatage pour la lecture des variables au moyen de l'Assistant de texte sont les suivantes :
Ne pas importer : Cette option permet d'omettre la ou les variables slectionnes dans

le fichier de donnes import.


Numrique : Les valeurs valides incluent les nombres, un signe plus ou moins en

dbut, et un indicateur de dcimale.


Chane : Les valeurs valides incluent pratiquement tous les caractres du clavier avec

des blancs imbriqus. Dans le cas des fichiers dlimits, vous pouvez spcifier le nombre de caractres de la valeur (le nombre maximal tant de 255). Par dfaut, l'Assistant de texte dtermine que ce nombre de caractres correspond celui de la valeur de chane la plus longue pour la ou les variables slectionnes. Dans le cas des fichiers de largeur fixe, le nombre de caractres des valeurs de chane est dfini par le positionnement des lignes de dlimitation des variables effectu l'tape 4.
Date/Heure : Les valeurs valides correspondent aux dates exprimes dans les formats traditionnels jj-mm-aaaa, mm/jj/aaaa, jj.mm.aaaa, aaaa/mm/jj, hh:mm:ss, et dans divers autres formats de date et d'heure. Les mois peuvent tre reprsents par des chiffres, des chiffres romains, des abrviations trois lettres, ou bien ils peuvent tre noncs en entier. Slectionnez un format de date dans la liste. Dollar : Les valeurs valides sont des nombres prcds, en option, par un signe dollar

et, galement en option, des virgules comme sparateurs de milliers.


Virgule : Les valeurs valides correspondent aux nombres utilisant un point comme

indicateur dcimal et des virgules comme sparateurs de milliers.


Point : Les valeurs valides correspondent aux nombres utilisant une virgule comme

indicateur dcimal et des points comme sparateurs de milliers.

52 Chapitre 3

Remarque : les valeurs comportant des caractres incorrects pour le format slectionn seront traites comme des valeurs manquantes. Les valeurs contenant l'un des sparateurs spcifis seront considres comme des valeurs multiples.

Assistant de texte - tape 6


Figure 3-20 Assistant de texte - tape 6

Il s'agit de la dernire tape de l'Assistant de texte. Vous pouvez enregistrer vos slections dans un fichier pour les appliquer lors de l'importation de fichiers de donnes texte similaires. Il vous est galement possible de coller la syntaxe gnre par l'Assistant de texte dans une fentre de syntaxe. Vous pouvez alors personnaliser et/ou enregistrer cette syntaxe afin de l'utiliser dans d'autres sessions ou d'autres tches de production.

53 Fichiers de donnes

Mettre donnes en cache localement : Un cache de donnes est une copie complte du fichier de donnes, enregistre dans un espace disque temporaire. La cration d'un cache du fichier de donnes peut amliorer les performances.

Informations sur les fichiers


Un fichier de donnes SPSS contient bien plus que des donnes brutes. Il contient galement toutes les informations sur la dfinition des variables, dont :

Le nom des variables Le format des variables Les tiquettes descriptives de variables et de valeurs.

Ces informations sont enregistres dans la partie dictionnaire du fichier de donnes de SPSS. L'diteur de donnes permet de voir les informations de la dfinition des variables. Vous pouvez galement afficher des informations de dictionnaire compltes pour le fichier de travail, ou tout autre fichier de donnes SPSS.

Pour obtenir des informations sur un fichier de donnes


E A partir des menus de la fentre de l'diteur de donnes, slectionnez : Fichier Afficher des informations sur un fichier de donnes E Pour le fichier de donnes en cours d'utilisation, choisissez Fichier de travail. E Pour les autres fichiers de donnes, choisissez : Fichier externe, puis slectionnez

le fichier de donnes. Les informations sur le fichier de donnes sont affiches dans le Viewer.

Enregistrement des fichiers de donnes


Toute modification effectue dans un fichier de donnes ne dure que le temps de la session en cours, moins que vous n'enregistriez ces modifications de faon explicite.

54 Chapitre 3

Pour enregistrer des fichiers de donnes modifis


E Faites en sorte que l'diteur de donnes devienne la fentre active (cliquez n'importe

o dans la fentre pour la rendre active).


E A partir du menu, slectionnez : Fichier Enregistrer

Le fichier de donnes modifi est enregistr, et crase les versions prcdentes du fichier.

Enregistrement de fichiers de donnes au format Excel


Vous pouvez enregistrer vos donnes dans un des trois formats Microsoft Excel. Le choix du format dpend de la version d'Excel qui sera utilise pour ouvrir les donnes. L'application Excel ne peut pas ouvrir de fichier cr dans une version plus rcente. Par exemple, Excel 5.0 ne peut pas ouvrir un document Excel 2000. Cependant, Excel 2000 peut facilement lire un document Excel 5.0. Le format de fichier Excel induit des contraintes qui n'existent pas dans SPSS. Ces contraintes sont les suivantes :

Les informations sur les variables, telles que les valeurs manquantes et les tiquettes de variable, ne sont pas comprises dans les fichiers Excel exports. Concernant l'exportation vers Excel 97 et les versions ultrieures, une option permet d'inclure les tiquettes de valeurs au lieu des valeurs. Du fait que tous les fichiers Excel sont limits 256 colonnes de donnes, les 256 premires variables sont comprises dans le fichier export. Les fichiers Excel 4.0 et Excel 5.0/95 sont limits 16 384 enregistrements, ou lignes de donnes. Les fichiers Excel 972000 autorisent 65 536 enregistrements. Si vos donnes excdent ces limites, un message d'avertissement apparat et les donnes sont tronques la taille maximale autorise par Excel.

Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnes SPSS d'origine et les donnes exportes dans Excel.

55 Fichiers de donnes

Type de variable SPSS Numrique Virgule Dollar Date Heure Chane

Format de donnes Excel 0.00; #,##0.00;... 0.00; #,##0.00;... $#,##0_);... j-mmm-aaaa hh:mm:ss Gnral

Enregistrement de fichiers de donnes au format SAS


Vos donnes reoivent divers traitements spciaux quand elles sont enregistres en tant que fichier SAS. Ces traitements sont les suivants :

Certains caractres autoriss dans les noms de variable SPSS ne sont pas valides dans SAS, comme @, # et $. Lors de l'exportation des donnes, ces caractres interdits sont remplacs par un trait de soulignement. Les tiquettes de variable SPSS contenant plus de 40 caractres sont tronques quand elles sont exportes vers un fichier SAS v6. Quand elles existent, les tiquettes de variable SPSS sont associes aux tiquettes de variable SAS. S'il n'existe aucune tiquette de variable dans les donnes SPSS, le nom de variable est associ l'tiquette de variable SAS. SAS n'autorise qu'une seule valeur manquante par dfaut, alors que SPSS en autorise un grand nombre. Par consquent, toutes les valeurs manquantes par dfaut de SPSS sont associes une seule de ces valeurs dans le fichier SAS.

Enregistrement des tiquettes de valeurs

Vous pouvez choisir d'enregistrer les valeurs et les tiquettes de valeurs associes votre fichier de donnes dans un fichier de syntaxe SAS. Par exemple, lorsque les tiquettes de valeurs du fichier de donnesvoitures.sav sont exportes, le fichier de syntaxe gnr contient :
libname library 'd:\spss\' ; proc format library = library ; value ORIGIN /* Pays d'origine */

56 Chapitre 3

1 = 'Amricaine' 2 = 'Europenne' 3 = 'Japonaise' ; value CYLINDER /* Nombre de cylindres */ 3 = '3 cylindres' 4 = '4 cylindres' 5 = '5 cylindres' 6 = '6 cylindres' 8 = '8 cylindres' ; value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */ 0 = 'Non slectionns' 1 = 'Slectionns' ; proc datasets library = library ; modify cars; format format format quit; ORIGIN ORIGIN.; CYLINDER CYLINDER.; FILTER__ FILTER__.;

Cette fonctionnalit n'est pas prise en charge par le fichier de transfert SAS.
Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnes SPSS d'origine et les donnes exportes dans SAS.
Type de variable SPSS Numrique Virgule Points Notation scientifique Type de variable SAS Numrique Numrique Numrique Numrique Format de donnes SAS 12 12 12 12

57 Fichiers de donnes

Type de variable SPSS Date Date (Heure) Dollar Devise personnalise Chane

Type de variable SAS Numrique Numrique Numrique Numrique Caractre

Format de donnes SAS (date) par exemple, MMJJAA10,... Time18 12 12 $8

Pour enregistrer des fichiers de donnes sous des formats diffrents


E Faites en sorte que l'diteur de donnes devienne la fentre active (cliquez n'importe

o dans la fentre pour la rendre active).


E A partir du menu, slectionnez : Fichier Enregistrer sous... E Slectionnez un type de fichier de la liste propose. E Entrez un nom de fichier pour le nouveau fichier de donnes.

Pour crire des noms de variable sur la premire ligne d'un fichier de donnes de format feuille de calcul ou dlimit par des tabulations :
E Cliquez sur Ecrire nom de var. dans tableur dans la bote de dialogue Enregistrer

Donnes sous. Pour enregistrer les tiquettes de valeurs la place des valeurs de donnes au format Excel 97 :
E Dans la bote de dialogue Enregistrer les donnes sous, cliquez sur Enregistrer les tiquettes de valeurs lorsqu'elles sont dfinies la place des valeurs de donnes.

Pour enregistrer les tiquettes de valeurs dans un fichier de syntaxe SAS (cette option n'est active que si un type de fichier SAS est slectionn) :
E Dans la bote de dialogue Enregistrer les donnes sous, cliquez sur Enregistrer les tiquettes de valeurs dans un fichier .sas.

58 Chapitre 3

Enregistrement de donnes : Types de fichier de donnes


Vous pouvez enregistrer des donnes sous les formats suivants :
SPSS (*.sav) : Format SPSS. Les fichiers de donnes enregistrs dans le format SPSS

ne peuvent tre lus avec les versions du logiciel antrieures la version 7.5. Lorsque vous utilisez des fichiers de donnes ayant des noms de plus de huit octets sous SPSS 10.x ou 11.x, des versions uniques de noms de variable huit octets sont utilises. Toutefois, les noms de variables originaux sont conservs pour la version 12.0 ou suprieure. Dans les versions SPSS antrieures la version 10, les noms longs originaux des variables sont perdus si vous enregistrez le fichier de donnes.
SPSS 7.0 (*.sav) : Format SPSS 7.0 pour Windows. Les fichiers de donnes enregistrs

au format SPSS 7.0 peuvent tre lus par SPSS 7.0 et par les versions SPSS pour Windows antrieures, mais n'incluent pas les vecteurs multirponses dfinis ni les donnes entres pour l'information de Windows.
SPSS/PC+ (*.sys) : Format SPSS/PC+. Si le fichier de donnes contient plus de

500 variables, seules les 500 premires seront sauvegardes. En ce qui concerne les variables ayant plus d'une valeur manquante par dfaut dfinie, les valeurs manquantes par dfaut supplmentaires seront ralignes sur la premire valeur manquante par dfaut.
SPSS portable (*.por) : Fichier SPSS portable qui peut tre lu par d'autres versions de SPSS sur d'autres systmes d'exploitation (par exemple, Macintosh, UNIX). Les noms de variable sont limits huit octets et sont automatiquement convertis en noms huit octets uniques si ncessaire. Tabul (*.dat) : Fichiers texte ASCII avec valeurs spares par des tabulations. ASCII fixe (*.dat) : Fichier ASCII texte en format fixe, qui utilise le format d'criture

par dfaut pour toutes les variables. Il n'y a pas de tabulations ni d'espaces entre les champs de variables.
Excel 2.1 (*.xls) : Fichier de type tableur Microsoft Excel 2.1. Le nombre maximum de

variables est de 256 et le nombre maximum de lignes est de 16 384.


Excel versions 97 et ultrieures (*.xls) : Fichier de type feuille de calcul Microsoft

Excel 97/2000/XP. Le nombre maximum de variables est de 256 et le nombre maximum de lignes est de 65 536.

59 Fichiers de donnes

1-2-3 Version 3.0 (*.wk3) : Fichier tableur Lotus 1-2-3, version 3.0. Vous pouvez

enregistrer un nombre maximum de 256 variables.


1-2-3 Version 2.0 (*.wk1) : Fichier tableur Lotus 1-2-3, version 2.0. Vous pouvez

enregistrer un nombre maximum de 256 variables.


1-2-3 Version 1.0 (*.wks) : Fichier tableur Lotus 1-2-3, version 1A. Vous pouvez enregistrer un nombre maximum de 256 variables. SYLK (*.slk) : Format de lien symbolique pour fichiers de type tableur Microsoft Excel et Multiplan. Vous pouvez enregistrer un nombre maximum de 256 variables. dBASE IV (*.dbf) : Format dBASE IV. dBASE III (*.dbf) : Format dBASE III. dBASE II (*.dbf) : Format dBASE II. SAS v6 pour Windows (*.sd2) : Format de fichier SAS v6 pour Windows/OS2. SAS v6 pour UNIX (*.ssd01) : Format de fichier SAS v6 pour UNIX (Sun, HP, IBM). SAS v6 pour Alpha/OSF (*.ssd04) : Format de fichier SAS v6 pour Alpha/OSF (DEC

UNIX).
SAS v7+ extension courte Windows (*.sd7) : SAS version 7-8 pour Windows, format de

nom de fichier court.


SAS v7+ extension longue Windows (*.sas7bdat) : SAS version 7-8 pour Windows,

format de nom de fichier long.


SAS v7+ pour UNIX (*.ssd01) : SAS v8 pour UNIX. SAS transfert (*.xpt) : Fichier de transfert SAS.

60 Chapitre 3

Enregistrement de sous-ensembles de variables


Figure 3-21 Bote de dialogue Enregistrer les donnes en tant que variables

Pour les donnes enregistres au format SPSS, la bote de dialogue Enregistrer les donnes en tant que variables vous permet de slectionner les variables enregistrer dans le nouveau fichier de donnes. Par dfaut, toutes les variables sont enregistres. Dslectionnez les variables ne pas enregistrer, ou cliquez sur Supprimer tout puis slectionnez les variables enregistrer.

Pour enregistrer un sous-groupe de variables


E Faites en sorte que l'diteur de donnes devienne la fentre active (cliquez n'importe

o dans la fentre pour la rendre active).


E A partir du menu, slectionnez : Fichier Enregistrer sous... E Slectionnez SPSS (*.sav) dans la liste des types de fichier. E Cliquez sur Variables. E Slectionnez les variables enregistrer.

61 Fichiers de donnes

Enregistrement de fichier : Options


Vous pouvez crire des noms de variables dans la premire ligne des fichiers de type tableur et des fichiers tabuls.

Protection des donnes d'origine


Pour viter de modifier/supprimer vos donnes d'origine par accident, vous pouvez paramtrer les fichiers en lecture seule.
E A partir des menus de l'diteur de donnes, slectionnez : Fichier Marquer le fichier comme tant en lecture seule

Si vous apportez d'importantes modifications aux donnes, puis que vous essayez d'enregistrer le fichier de donnes, vous pouvez uniquement l'enregistrer sous un autre nom ; les donnes d'origine sont ainsi protges. Vous pouvez redonner au fichier l'attribut de lecture/criture en slectionnant Marquer le fichier comme tant en lecture/criture dans le menu Fichier.

Fichier actif virtuel


Le fichier actif virtuel vous permet de travailler avec des fichiers de donnes volumineux sans ncessiter d'importants volumes d'espace disque temporaire. Dans le cas de la plupart des procdures d'analyse et de cration de diagrammes, la source de donnes d'origine est lue chaque fois que vous excutez une procdure diffrente. Les procdures qui modifient les donnes ncessitent un certain volume d'espace disque temporaire afin de conserver une trace de ces modifications, et certaines oprations requirent toujours un espace disque suffisant pour pouvoir effectuer au moins une copie intgrale du fichier de donnes.

62 Chapitre 3 Figure 3-22 Espace disque temporaire requis

Les oprations ne ncessitant pas d'espace disque temporaire sont les suivantes :

lecture de fichiers de donnes SPSS ; fusion de deux fichiers de donnes SPSS ou plus ; lecture de tableaux de base de donnes avec l'assistant de base de donnes ; fusion d'un fichier de donnes SPSS avec un tableau de base de donnes ; excution de procdures lisant les donnes (par exemple, Frquences, Tableaux croiss, Explorer).

Les oprations crant une ou plusieurs colonnes de donnes dans un espace disque temporaire sont les suivantes :

calcul de nouvelles variables ; recodage de variables existantes ; excution de procdures crant ou modifiant des variables (par exemple, enregistrement de prvisions dans la Rgression linaire).

Les oprations crant une copie intgrale du fichier de donnes dans un espace disque temporaire sont les suivantes :

lecture de fichiers Excel ;

63 Fichiers de donnes

excution de procdures triant les donnes (par exemple, Trier les observations, Scinder fichier) ; Lecture des donnes avec la commande GET TRANSLATE ou DATA LIST Utilisation de la fonctionnalit Donnes de mmoire cache ou de la commande
CACHE

Ouverture depuis SPSS d'autres applications lisant le fichier de donnes (par exemple, AnswerTree, DecisionTime).

Remarque : La commande GET DATA assure des fonctionnalits comparables celles de la commande DATA LIST mais sans crer de copie intgrale du fichier de donnes dans un espace disque temporaire. Dans sa syntaxe, la commande SPLIT FILE ne trie pas le fichier de donnes et n'en cre donc pas de copie. Toutefois, pour pouvoir fonctionner correctement, cette commande ncessitent des donnes tries ; l'interface de botes de dialogue de ces procdures triera donc automatiquement le fichier de donnes, aboutissant ainsi la cration d'une copie complte de ce fichier. (La syntaxe de commande n'est pas disponible dans la version Student.)
Oprations crant une copie intgrale du fichier de donnes par dfaut :

Lecture de bases de donnes avec l'Assistant de base de donnes Lecture de fichiers texte avec l'Assistant de texte

Les Assistants de base de donnes et de texte proposent un paramtre facultatif permettant de mettre automatiquement des donnes en mmoire cache. Par dfaut, cette option est slectionne. Pour dsactiver cette option, dslectionnez la case Mettre donnes en cache localement.

Cration d'un cache de donnes


Bien que le fichier actif virtuel contribue rduire considrablement le volume d'espace disque temporaire requis, l'absence d'une copie temporaire du fichier actif signifie que la source de donnes d'origine doit tre lue de nouveau pour chaque procdure. Dans le cas de fichiers de donnes volumineux provenant d'une source externe, la cration d'une copie temporaire des donnes peut amliorer les performances de lecture. Dans le cas de tableaux de donnes lus dans une base de donnes, la requte SQL qui consulte les informations de la base doit tre rexcute

64 Chapitre 3

pour toute commande ou procdure ncessitant la lecture des donnes. Ceci tant le cas de quasiment toutes les procdures d'analyse statistique et de cration de diagrammes, la requte SQL est donc rexcute pour chaque nouvelle procdure que vous lancez, ce qui risque d'entraner un allongement considrable des temps de traitement si vous devez excuter un grand nombre de procdures. Si l'ordinateur sur lequel vous effectuez l'analyse (qu'il s'agisse de votre ordinateur local ou d'un serveur distant) dispose d'un volume d'espace disque suffisant, vous pouvez liminer de nombreuses requtes SQL et rduire ainsi les temps de traitement en crant un cache de donnes du fichier actif. Le cache de donnes est une copie temporaire de la totalit des donnes. Remarque : Par dfaut, l'Assistant de base de donnes cre automatiquement un cache de donnes. Toutefois, si vous utilisez la commande GET FILE dans une syntaxe afin de lire une base de donnes, le cache de donnes n'est pas cr automatiquement. (La syntaxe de commande n'est pas disponible dans la version Student.)

Pour crer un cache de donnes


E A partir du menu, slectionnez : Fichier Donnes de mmoire cache... E Cliquez sur OK ou sur Cacher maintenant.

L'option OK crera un cache de donnes la prochaine lecture des donnes (par exemple, lorsque vous excuterez une procdure statistique). C'est l'option que vous choisirez le plus souvent puisque cette opration ne ncessite pas de passage de donnes supplmentaire. L'option Cacher maintenant cre un cache de donnes immdiatement, ce qui gnralement ne devrait pas s'avrer ncessaire. L'option Cacher maintenant est surtout utile pour deux raisons :

Une source de donnes est verrouille et ne peut tre mise jour tant que vous n'avez pas ferm la session, ouvert une autre source de donnes ou cr un cache des donnes. Pour les sources de donnes volumineuses, la consultation du contenu des donnes dans l'diteur de donnes s'avrera bien plus rapide si vous placez les donnes dans un cache.

65 Fichiers de donnes

Pour mettre automatiquement des donnes en mmoire cache


Vous pouvez paramtrer la commande SET pour qu'elle cre automatiquement un cache de donnes ds que vous avez apport un certain nombre de modifications dans le fichier de donnes actif. Par dfaut, le fichier de donnes actif est automatiquement mis en mmoire cache aprs 20 modifications.
E A partir du menu, slectionnez : Fichier Nouveau Syntaxe E Dans la fentre de syntaxe, entrez SET CACHE n. La valeur n correspond au nombre de

modifications apportes au fichier de donnes actif avant sa mise en mmoire cache.


E Dans le menu de la fentre de syntaxe, slectionnez : Excuter Tous

Remarque : Vous devez dfinir le paramtre de cache pour chaque session. A chaque nouvelle session, la valeur est paramtre par dfaut sur 20.

Chapitre

Mode d'analyse distribue

Le mode d'analyse distribue vous permet d'utiliser un autre ordinateur local que le vtre (ou de bureau) pour les tches sollicitant la mmoire de faon intensive. Les serveurs distants utiliss pour l'analyse distribue se rvlant gnralement plus puissants et plus rapides que votre ordinateur local, une utilisation approprie du mode d'analyse distribue permet de rduire considrablement les temps de traitement. L'analyse distribue effectue l'aide d'un serveur distant peut s'avrer utile si votre travail met en uvre :

des fichiers de donnes volumineux, contenant notamment des donnes provenant de bases de donnes ; des tches sollicitant la mmoire de faon intensive. Toute tche longue effectuer en mode d'analyse locale serait ainsi mieux adapte une analyse distribue.

L'analyse distribue n'affecte que les tches impliquant des donnes, telles que la lecture et la transformation de donnes ainsi que le calcul de nouvelles variables et de statistiques. Elle n'a aucun effet sur les tches associes la modification de rsultats, telles que la manipulation de tableaux pivotants ou la modification de diagrammes. Remarque : L'analyse distribue n'est disponible que si vous disposez la fois d'une version locale du programme et d'un accs une version serveur du mme logiciel install sur un serveur distant.

67

68 Chapitre 4

Comparaison de l'analyse distribue par rapport l'analyse locale


Voici quelques recommandations destines vous permettre de choisir entre le mode d'analyse locale et celui d'analyse distribue :
Accs aux bases de donnes : Il est possible que les tches effectuant des requtes dans des bases de donnes s'excutent plus rapidement en mode distribu si le serveur dispose d'un accs prioritaire ces bases de donnes ou qu'il s'excute sur le mme poste que le moteur de base de donnes. Si le logiciel d'accs la base de donnes requise n'est disponible que sur le serveur ou que votre administrateur rseau ne vous permet pas de tlcharger des tableaux de donnes de grande taille, vous ne pourrez accder la base de donnes qu'en mode distribu. Rapport entre calculs et rsultats : Les commandes effectuant un grand nombre de calculs et produisant peu de rsultats (par exemple, des tableaux pivotants en petit nombre ou peu volumineux, de brefs rsultats en format texte, ou encore des diagrammes simples ou en nombre rduit) offriront des performances optimales si elles sont excutes en mode distribu. Le gain de performances obtenu dpend dans une large mesure de la puissance de calcul du serveur distant. Tches rapides : Les tches s'excutant rapidement en mode local le feront presque

toujours plus lentement en mode distribu du fait des sollicitations systme inhrentes l'architecture client-serveur.
Diagrammes : Les diagrammes conus pour les observations, tels que les diagrammes de dispersion, les diagrammes de rsidus de rgression ou les diagrammes squentiels, ncessitent la prsence de donnes brutes sur votre ordinateur local. Dans le cas de fichiers de donnes ou de tableaux de base de donnes volumineux, cette ncessit risque d'entraner un ralentissement des performances en mode distribu puisque les donnes doivent tre envoyes par le serveur distant votre ordinateur local. En revanche, les autres diagrammes mettant en uvre des donnes rcapitulatives ou agrges seront traits de faon adquate en mode distribu puisque l'opration consistant agrger les donnes est effectue sur le serveur. Diagrammes interactifs : La possibilit (disponible en option) d'enregistrer des donnes

brutes avec des diagrammes interactifs pouvant entraner le transfert d'importantes quantits de donnes entre le serveur distant et votre ordinateur local, le temps requis pour l'enregistrement de vos rsultats risque d'en tre considrablement allong.

69 Mode d'analyse distribue

Tableaux pivotants : La cration de tableaux pivotants de grande taille peut s'avrer

plus longue en mode distribu. Ceci se vrifie plus particulirement dans le cas de la procdure Cubes OLAP et des tableaux contenant des donnes d'observations individuelles, tels que ceux disponibles dans la procdure Rcapituler.
Rsultats texte : Plus la quantit de texte gnre est importante, plus elle sera longue

s'effectuer en mode distribu, car ce texte est cr sur le serveur distant, puis copi sur votre ordinateur local pour affichage. Toutefois, les rsultats en format texte ne sollicitent que faiblement le systme et sont transmis rapidement.

Connexion au serveur SPSS


La bote de dialogue Connexion au serveur vous permet de slectionner l'ordinateur qui traite les commandes et excute les procdures. Il peut s'agir de votre ordinateur local ou d'un serveur distant.
Figure 4-1 Bote de dialogue Connexion au serveur

Vous pouvez ajouter et modifier des serveurs distants de la liste, ou en supprimer. Les serveurs distants ncessitent gnralement un ID utilisateur ainsi qu'un mot de passe, et parfois mme un nom de domaine. Pour plus d'informations sur la connexion,

70 Chapitre 4

les serveurs disponibles, les ID utilisateur, les mots de passe et noms de domaine, contactez l'administrateur systme. Vous pouvez slectionner un serveur par dfaut et enregistrer l'ID utilisateur, le nom de domaine et le mot de passe associs un serveur. Lorsque vous dmarrez une session, vous tes automatiquement connect au serveur par dfaut.

Ajout et modification des paramtres de connexion au serveur


Utilisez la bote de dialogue Paramtres de connexion au serveur pour ajouter ou modifier des informations de connexion pour les serveurs distants utiliser en mode d'analyse distribue.
Figure 4-2 Bote de dialogue Paramtres de connexion au serveur

Contactez l'administrateur systme pour obtenir la liste des serveurs disponibles et des numros de port associs aux serveurs, ainsi que des informations de connexion supplmentaires. N'utilisez le protocole SSL que si l'administrateur vous le demande.
Nom : Un nom de serveur peut tre un nom alphanumrique affect un ordinateur

(par exemple, hqdev001) ou une adresse IP unique attribue un ordinateur (par exemple, 202.123.456.78).
Numro de port : Le numro du port est le port que le logiciel du serveur utilise pour

les communications.
Description : Entrez une description facultative devant apparatre dans la liste des

serveurs.

71 Mode d'analyse distribue

Connecter avec Secure Socket Layer : Le protocole SSL (Secure Sockets Layer) code les demandes d'analyse distribue envoyes au serveur SPSS distant. Avant d'utiliser le protocole SSL, consultez l'administrateur. Pour qu'il soit activ, le protocole SSL doit tre configur sur votre ordinateur et sur le serveur.

Slection, changement ou ajout de serveurs


E A partir du menu, slectionnez : Fichier Changer serveur...

Pour slectionner un serveur par dfaut :


E Dans la liste des serveurs, cochez la case situe en regard du serveur utiliser. E Entrez l'ID utilisateur, le nom de domaine et le mot de passe fournis par

l'administrateur. Remarque : Lorsque vous dmarrez une session, vous tes automatiquement connect au serveur par dfaut.
Pour utiliser un autre serveur :
E Slectionnez un serveur dans la liste. E Entrez votre ID utilisateur, nom de domaine et mot de passe (le cas chant).

Remarque : Lorsque vous changez de serveur au cours d'une session, toutes les fentres ouvertes sont automatiquement fermes. Le systme vous demande d'enregistrer vos modifications avant la fermeture des fentres.
Pour ajouter un serveur :
E Demandez les informations de connexion du serveur l'administrateur. E Cliquez sur Ajouter pour ouvrir la bote de dialogue Paramtres de connexion au

serveur.

72 Chapitre 4 E Entrez les informations de connexion et les paramtres facultatifs, puis cliquez sur OK.

Pour modifier un serveur :


E Demandez les informations de connexion rvises l'administrateur. E Cliquez sur Edition pour ouvrir la bote de dialogue Paramtres de connexion

au serveur.
E Entrez les modifications et cliquez sur OK.

Ouverture de fichiers de donnes partir d'un serveur distant


Figure 4-3 Bote de dialogue Ouvrir fichier distant

En mode d'analyse distribue, la bote de dialogue Ouvrir fichier distant remplace la bote de dialogue Ouvrir fichier.

La liste des fichiers, dossiers et lecteurs disponibles dpend des donnes accessibles sur le serveur distant. Le nom du serveur utilis est indiqu dans la zone suprieure de la bote de dialogue.

73 Mode d'analyse distribue

En mode d'analyse distribue, vous n'aurez accs aux fichiers de donnes de votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et les dossiers contenant vos fichiers de donnes comme des dossiers partags. Si le systme d'exploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous n'aurez probablement pas accs aux fichiers de donnes locaux en mode d'analyse distribue, mme s'ils se trouvent dans des dossiers partags.

Vous ne pouvez ouvrir qu'un seul fichier de donnes la fois. Le fichier de donnes courant est automatiquement ferm quand un nouveau fichier de donnes est ouvert. Si vous souhaitez ouvrir plusieurs fichiers de donnes simultanment, dmarrez plusieurs sessions.

Pour ouvrir des fichiers de donnes partir d'un serveur distant


E Si vous n'tes pas encore connect au serveur distant, faites-le maintenant. E Selon le type de fichier de donnes ouvrir, slectionnez les options de menu

suivantes :
Fichier Ouvrir Donnes...

ou
Fichier Ouvrir la base de donnes

ou
Fichier Lire les donnes du texte...

74 Chapitre 4

Enregistrement de fichiers de donnes partir d'un serveur distant


Figure 4-4 Bote de dialogue Enregistrer fichier distant

En mode d'analyse distribue, la bote de dialogue Enregistrer fichier distant remplace la bote de dialogue Enregistrer fichier standard. La liste des dossiers et lecteurs disponibles dpend des donnes accessibles sur le serveur distant. Le nom du serveur utilis est indiqu dans la zone suprieure de la bote de dialogue. Vous n'aurez accs aux dossiers de votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et les dossiers comme des dossiers partags. Si le systme d'exploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous n'aurez probablement pas accs aux fichiers de donnes locaux en mode d'analyse distribue, mme s'ils se trouvent dans des dossiers partags. Les droits d'accs relatifs aux dossiers partags doivent inclure la possibilit d'crire dans les dossiers si vous souhaitez enregistrer les fichiers de donnes dans un dossier local.

Pour enregistrer des fichiers de donnes partir d'un serveur distant


E Activez la fentre de l'diteur de donnes.

75 Mode d'analyse distribue E A partir du menu, slectionnez : Fichier Enregistrer (ou Enregistrer sous...)

Accs aux fichiers de donnes en mode d'analyse locale ou distribue Mode :


L'affichage des fichiers de donnes, dossiers (rpertoires) et lecteurs de votre ordinateur local et du rseau dpend de l'ordinateur que vous utilisez pour traiter les commandes et excuter les procdures (qui ne correspond pas obligatoirement l'ordinateur que vous avez en face de vous).
Mode d'analyse locale : Lorsque vous utilisez votre ordinateur local comme serveur

, l'affichage des fichiers de donnes, dossiers et lecteurs dans la bote de dialogue d'accs aux fichiers (permettant d'ouvrir les fichiers de donnes) est le mme que celui fourni dans d'autres applications ou dans l'Explorateur de Windows. Vous pouvez afficher tous les fichiers de donnes et dossiers de votre ordinateur, ainsi que tous les fichiers et dossiers stocks sur les lecteurs rseau que vous obtenez en temps normal.
Mode d'analyse distribue : Lorsque vous utilisez un autre ordinateur comme serveur

distant pour excuter les commandes et procdures, l'affichage des fichiers de donnes, dossiers et lecteurs correspond celui obtenu du point de vue du serveur distant. Bien que vous puissiez obtenir des noms de dossiers familiers tels que Program Files et des lecteurs portant la lettre C, il ne s'agit pas des dossiers et lecteurs de votre ordinateur, mais des dossiers et lecteurs du serveur distant.

76 Chapitre 4 Figure 4-5 Affichages local et distant

En mode d'analyse distribue, vous n'aurez accs aux fichiers de donnes de votre ordinateur local que si vous dfinissez le lecteur correspondant comme un lecteur partag et les dossiers contenant vos fichiers de donnes comme des dossiers partags. Si le systme d'exploitation du serveur est diffrent du vtre (Windows et UNIX par exemple), vous n'aurez probablement pas accs aux fichiers de donnes locaux en mode d'analyse distribue, mme s'ils se trouvent dans des dossiers partags. L'utilisation du mode d'analyse distribue n'quivaut pas accder aux fichiers de donnes stocks sur un autre ordinateur de votre rseau. Vous pouvez accder aux fichiers de donnes situs sur d'autres disques rseau en mode d'analyse locale ou en mode d'analyse distribue. En mode local, vous accdez d'autres disques partir de votre ordinateur local. En mode distribu, vous accdez d'autres disques rseau depuis le serveur distant. Pour savoir si vous utilisez le mode local ou le mode distribu, examinez la barre de titre de la bote de dialogue permettant d'accder aux fichiers de donnes. Si le titre de la bote de dialogue contient le terme Distant (comme dans Ouvrir fichier distant) ou

77 Mode d'analyse distribue

que le libell Serveur distant : [nom_de_serveur] apparat dans la zone suprieure de la bote de dialogue, vous utilisez le mode d'analyse distribue. Remarque : Ceci ne concerne que les botes de dialogue permettant d'accder aux fichiers de donnes (telles que Ouvrir donnes, Enregistrer sous, Ouvrir base de donnes et Appliquer le dictionnaire des donnes). Pour tous les autres types de fichier (tels que les fichiers Viewer, les fichiers de syntaxe et les fichiers scripts), l'affichage local est toujours utilis.

Pour dfinir des droits d'accs de partage pour un lecteur ou un dossier


E Dans Poste de travail, cliquez sur le dossier (rpertoire) ou le lecteur partager. E Dans le menu Fichier, cliquez sur Proprits. E Cliquez sur l'onglet Partage, puis sur Nom de partage.

Pour plus d'informations sur le partage de lecteurs et de dossiers, consultez l'aide de votre systme d'exploitation.

Disponibilit des procdures en mode d'analyse distribue


En mode d'analyse distribue, seules les procdures installes la fois sur votre version locale et sur la version du serveur distant sont disponibles. Vous ne pouvez pas utiliser de procdures installes sur le serveur mais non installes sur votre version locale, et vice versa. Bien que cette dernire situation paraisse peu probable, il peut arriver que certains lments optionnels soient installs sur votre poste local et ne soient pas disponibles sur le serveur distant. Dans ce cas, le passage de l'utilisation de votre ordinateur local celle d'un serveur distant entranera la suppression des procdures concernes des menus ainsi que des erreurs dans les fichiers de commande correspondants. Vous devrez rtablir le mode local pour restaurer toutes les procdures affectes.

78 Chapitre 4

Utilisation des spcifications de chemins UNC


Avec la version serveur Windows NT de SPSS, les spcifications de chemins relatifs pour des fichiers de donnes sont relatives par rapport au serveur utilis en mode d'analyse distribue, et non par rapport votre ordinateur local. Concrtement, cela signifie qu'une spcification de chemin telle que c:\Mes_documents\Mes_donnes.sav ne dsigne pas un rpertoire et un fichier de votre disque C, mais un rpertoire et un fichier du disque dur du serveur distant. Si le rpertoire et/ou le fichier n'existent pas sur le serveur distant, vos fichiers de commande seront soumis des erreurs, comme dans l'exemple suivant :
GET FILE='c:\Mes_documents\Mes_donnes.sav'.

Avec la version serveur Windows NT de SPSS, vous pouvez utiliser des noms de chemin UNC (Universal Naming Convention = convention de dnomination universelle) pour spcifier l'emplacement des fichiers de donnes dans vos fichiers de commande. Une spcification de chemin UNC prend gnralement la forme suivante :
\\nom_serveur\nom_partage\chemin\nom_fichier

L'lment nom_serveur est le nom de l'ordinateur contenant le fichier de donnes. L'lment nom_partage dsigne le dossier (rpertoire) de l'ordinateur dfini comme dossier de partage. L'lment chemin correspond aux sous-dossiers (sous-rpertoires) du dossier partag. L'lment nom_fichier est le nom du fichier de donnes.

Par exemple :
GET FILE='\\hqdev001\public\juillet\ventes.sav'.

Si aucun nom n'a t attribu l'ordinateur, vous pouvez utiliser son adresse IP, comme dans l'exemple suivant :
GET FILE='\\204.125.125.53\public\juillet\ventes.sav'.

Mme si vous utilisez des spcifications de chemins UNC, vous ne pouvez accder qu'aux fichiers de donnes installs sur des lecteurs et des dossiers partags. Lorsque vous utilisez le mode d'analyse distribue, les fichiers de donnes de votre ordinateur local sont inclus dans le traitement.

79 Mode d'analyse distribue

Serveurs UNIX : Sur les plateformes UNIX, il n'existe aucun quivalent la dnomination UNC. Pour tous les rpertoires, vous devez indiquer un chemin d'accs absolu, commenant la racine du serveur. Les chemins relatifs ne sont pas admis. Par exemple, si le fichier de donnes se trouve dans le rpertoire /bin/spss/data et que le rpertoire actif est galement /bin/spss/data, la commande GET FILE='ventes.sav' n'est pas valide. Vous devez indiquer l'intgralit du chemin d'accs, savoir :
GET FILE='/bin/data/spss/ventes.sav'.

Chapitre

Editeur de donnes

L'diteur de donnes fournit une mthode pratique, semblable celle d'un tableur, permettant de crer et de modifier des fichiers de donnes SPSS. La fentre de l'diteur de donnes s'ouvre automatiquement lorsque vous lancez une session SPSS. L'diteur de donnes permet d'afficher les donnes de deux faons :

Affichage Donnes : Affiche les valeurs relles des donnes ou les tiquettes de

valeurs dfinies.
Affichage des variables : Affiche les informations de dfinition des variables,

savoir les tiquettes de valeurs et de variable dfinies, le type des donnes (par exemple, chane, date ou valeur numrique), le niveau de mesure (nominale, ordinale ou chelle) et les valeurs manquantes dfinies par l'utilisateur. Dans les deux affichages, vous pouvez ajouter, modifier et supprimer les informations contenues dans le fichier de donnes.

81

82 Chapitre 5

Affichage des donnes


Figure 5-1 Affichage des donnes

Un grand nombre de fonctions de l'Affichage des donnes sont similaires celles que proposent les tableurs. Il y a toutefois des diffrences importantes :

Les lignes sont des observations. Chaque ligne reprsente une observation. Par exemple, chaque rpondant d'un questionnaire est considr comme tant une observation. Les colonnes sont des variables. Chaque colonne reprsente une variable ou une caractristique tant mesure. Par exemple, chaque lment ou lment d'un questionnaire est une variable. Les cellules contiennent des valeurs. Chaque cellule contient une seule valeur pour une variable et pour une observation. La cellule est l'intersection de l'observation et de la variable. Les cellules ne contiennent que des valeurs de donnes. A la diffrence des tableurs, les cellules de l'diteur de donnes ne peuvent pas contenir de formules. Le fichier de donnes est rectangulaire. La taille du fichier de donnes est dtermine par le nombre d'observations et de variables. Vous pouvez entrer des donnes dans n'importe quelle cellule. Si vous entrez des donnes dans une cellule en dehors des limites du fichier de donnes dfini, SPSS agrandit le rectangle des donnes pour inclure toutes les lignes et/ou colonnes ncessaires entre cette cellule et les limites du fichier. Il n'y a pas de cellule vide l'intrieur des limites du fichier de donnes. En ce qui concerne les variables numriques, les

83 Editeur de donnes

cellules blanc sont converties en valeurs manquantes par dfaut. En ce qui concerne les variables chane, un blanc est considr comme une valeur valide.

Affichage des variables


Figure 5-2 Affichage des variables

L'Affichage des variables prsente les descriptions des attributs de chaque variable du fichier de donnes. Dans l'Affichage des variables :

Les lignes sont des variables. Les colonnes sont des attributs de variable.

Vous pouvez ajouter ou supprimer des variables et modifier les attributs de ces dernires, savoir :

Le nom de la variable Le type de donnes Le nombre de chiffres ou de caractres Le nombre de dcimales Les tiquettes descriptives de variables et de valeurs. Les valeurs manquantes dfinies par l'utilisateur

84 Chapitre 5

La largeur des colonnes Le niveau de mesure

Tous ces attributs sont enregistrs lorsque vous sauvegardez le fichier de donnes. Vous pouvez dfinir les proprits des variables dans l'Affichage des variables, mais vous disposez galement de deux autres mthodes pour ce faire :

L'assistant Copier des proprits de donnes permet d'utiliser un fichier de donnes SPSS externe comme modle pour dfinir les proprits de fichier et de variable dans le fichier de travail. Vous pouvez galement utiliser des variables du fichier de travail comme modles pour d'autres variables de ce mme fichier. L'option Copier des proprits de donnes est disponible dans le menu Donnes de la fentre de l'diteur de donnes. L'option Dfinir les proprits de variable (galement disponible dans le menu Donnes de la fentre de l'diteur de donnes) permet d'analyser vos donnes et de rpertorier toutes les valeurs de donnes uniques pour les variables slectionnes et d'identifier les valeurs non tiquetes, et fournit une fonction d'tiquetage automatique. Ceci est particulirement utile pour les variables qualitatives qui utilisent des codes numriques pour reprsenter les modalits. Par exemple, 0 = Masculin, 1 = Fminin.

Pour afficher ou dfinir des attributs de variable


E Activez la fentre de l'diteur de donnes. E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des donnes ou cliquez sur l'onglet Affichage des variables. E Pour dfinir de nouvelles variables, entrez un nom de variable dans une ligne vierge. E Slectionnez les attributs dfinir ou modifier.

Noms de variable
Les rgles suivantes s'appliquent pour les noms des variables :

Le nom doit commencer par une lettre. Les autres caractres peuvent tre

85 Editeur de donnes

n'importe quelle lettre, n'importe quel chiffre, un point, ou les symboles @, #, _ ou $.


Les noms de variable ne peuvent pas se terminer par un point. Les noms de variable se terminant par un blanc soulign sont viter (pour viter des conflits avec les variables cres automatiquement par certaines procdures). La longueur du nom ne doit pas excder 64 octets. Soixante-quatre octets correspondent 64 caractres dans les langues sur un octet (anglais, franais, allemand, espagnol, italien, hbreu, russe, grec, arabe et tha par exemple) et 32 caractres dans les langues sur deux octets (japonais, chinois et coren par exemple). Les espaces et les caractres spciaux ne peuvent pas tre utiliss (par exemple, !, ?, ', et *). Chaque nom de variable doit tre unique ; aucune duplication n'est admise. Les mots-cls rservs ne peuvent pas tre utiliss pour les noms de variables : Les mots-cls rservs sont les suivants : ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. Les noms de variables peuvent tre dfinis par n'importe quelle combinaison de majuscules et de minuscules. La casse est respecte pour des raisons d'affichage. Lorsque des noms longs occupent plusieurs lignes au niveau du rsultat, SPSS essaie d'insrer les sauts de ligne au niveau des traits de soulignement, des virgules et des passages de minuscule majuscule.

Niveau de mesure des variables


Vous pouvez spcifier un niveau de mesure d'chelle (donnes numriques sur un intervalle ou une chelle de rapport), ordinal ou nominal Les donnes nominales et ordinales peuvent tre des chanes de caractres (alphanumriques) ou numriques. La spcification de mesure n'est utiliser que pour :

Procdures Tableaux personnaliss et procdures de diagramme qui identifient les variables comme variables d'chelle ou variables qualitatives. Les variables nominales et ordinales sont toutes deux traites comme qualitatives. (l'option Tableaux personnaliss n'est disponible que pour les composants de l'option complmentaire Tableaux.) Les fichiers de donnes au format SPSS utiliss avec l'Arbre de rponse.

86 Chapitre 5

Vous pouvez slectionner l'un des trois niveaux de mesure suivants :


Echelle : Les valeurs de donnes sont des valeurs numriques sur une chelle

d'intervalles ou une chelle de rapport (par exemple, ge ou revenu). Les variables d'chelle doivent tre numriques.
Ordinal : Les valeurs de donnes reprsentent les modalits dans un ordre intrinsque (par exemple, faible, moyen, lev ; tout fait d'accord, plutt d'accord, plutt pas d'accord, pas du tout d'accord). Les variables ordinales peuvent tre des valeurs chane (alphanumriques) ou des valeurs numriques reprsentant des modalits distinctes (par exemple, 1 = faible, 2 = moyen, 3 = lev).

Remarque : Pour les variables chane ordinales, l'ordre alphabtique des valeurs chane est suppos reflter l'ordre des modalits. Par exemple, pour une variable chane comportant des valeurs Faible, Moyen, Elev, l'ordre des modalits est interprt comme Elev, Faible ou Moyen, ce qui ne correspond pas l'ordre correct. En rgle gnrale, il est recommand d'utiliser les codes numriques pour reprsenter les donnes ordinales.
Nominal : Les valeurs de donnes reprsentent les modalits sans ordre intrinsque

(par exemple, modalit d'emploi ou service d'entreprise). Les variables nominales peuvent tre des valeurs chane (alphanumriques) ou des valeurs numriques reprsentant des modalits distinctes (par exemple, 1 = Masculin, 2 = Fminin).

87 Editeur de donnes Figure 5-3 Variables d'chelle et qualitatives dans une procdure de diagramme

Pour les fichiers de donnes au format SPSS crs avec les anciennes versions de produits SPSS, les rgles suivantes s'appliquent :

Les variables sous forme de chane de caractres (alphanumriques) sont dfinies comme nominales. Les variables sous forme de chane de caractres ainsi que les variables numriques avec des tiquettes de valeurs dfinies sont dfinies comme ordinales. Les variables numriques sans tiquettes de valeurs dfinies mais infrieures un nombre spcifi de valeurs uniques sont dfinies comme ordinales. Les variables numriques sans tiquettes de valeurs dfinies mais suprieures un nombre spcifi de valeurs uniques sont dfinies comme variables d'chelle.

Le nombre par dfaut de valeurs uniques est 24. Pour modifier la valeur spcifie, modifiez les options de diagramme interactif (dans le menu Edition, choisissez Options, onglet Interactif).

88 Chapitre 5

Type de variable
L'option Type de variable permet de dfinir le type de donnes pour chaque variable. Par dfaut, toute nouvelle variable est numrique. Vous pouvez utiliser l'option Type de variable pour changer le type des donnes. Le contenu de la bote de dialogue Type de variable dpend du type de donnes slectionn. Pour certains types de donnes, il y a des zones de texte o sont indiqus la longueur et le nombre de dcimales. Pour d'autres types de donnes, il vous suffit de slectionner un format dans une liste droulante contenant des exemples.
Figure 5-4 Bote de dialogue Type de variable

Les types de donnes disponibles sont les suivants :


Numrique : Variable dont les valeurs sont des nombres. Les valeurs sont affiches en

format numrique standard. L'diteur de donnes accepte les valeurs numriques au format standard ou sous forme de notation scientifique.
Virgule : Variable numrique dont les valeurs sont affiches avec des virgules toutes

les trois positions, le point servant de sparateur dcimal. L'diteur de donnes accepte les valeurs numriques pour les variables de virgule avec ou sans virgule ou sous forme de notation scientifique.
Point : Variable numrique dont les valeurs sont affiches avec des points toutes les trois positions, la virgule servant de sparateur dcimal. L'diteur de donnes accepte les valeurs numriques pour les variables de point avec ou sans point ou sous forme de notation scientifique.

89 Editeur de donnes

Notation scientifique : Variable numrique dont les valeurs sont affiches avec un E intgr et un exposant de puissance dix avec signe. L'diteur de donnes accepte des valeurs numriques pour les variables de notation scientifique avec ou sans exposant. L'exposant peut tre prcd d'un E ou d'un D avec ou sans signe, ou seulement d'un signe. Par exemple, 123, 1.23E2, 1.23D2, 1.23E+2 et mme 1.23+2. Date : Variable numrique dont les valeurs sont affiches dans l'un des formats de date ou d'heure possibles. Slectionnez un format dans la liste. Vous pouvez entrer des dates avec, comme sparateur, des barres obliques, des traits d'union, des points, des virgules ou des espaces. La valeur du sicle pour les annes 2 chiffres est dtermine par les paramtres Options (accessibles depuis le menu Edition, Options, onglet Donnes). Symbole montaire : Variable numrique dont les valeurs sont affiches dans l'un des formats montaires personnaliss que vous avez dfinis dans l'onglet Devise de la bote de dialogue Options. Les caractres de symbole montaire dfinis ne sont pas utilisables lors de la saisie de donnes mais sont affichs dans l'diteur de donnes. Chane : Variable dont les valeurs ne sont pas numriques et ne sont donc pas utilises

pour les calculs. Ces variables peuvent contenir n'importe quel caractre, dans la limite de la longueur dfinie. Les majuscules et les minuscules sont diffrencies. Egalement appeles variables alphanumriques.

Pour dfinir le type de variable


E Cliquez sur le bouton de la cellule Type de la variable dfinir. E Slectionnez le type de donnes dans la bote de dialogue Type de variable.

Formats d'entre/d'affichage
Selon le format, les valeurs affiches dans l'Affichage des donnes peuvent diffrer des valeurs relles entres et enregistres en interne. Voici quelques rgles gnrales :
Pour les formats Numrique, Virgule et Point, vous pouvez entrer des valeurs avec

n'importe quel nombre de positions dcimales (maximum 16), et la valeur entire est enregistre. L'Affichage des donnes n'affiche que le nombre de dcimales dfini et arrondit les valeurs comportant plus de dcimales. Toutefois, la valeur complte est utilise dans tous les calculs.

90 Chapitre 5

Pour les variables chane, toutes les valeurs sont cadres droite au maximum de la longueur. Pour une variable chane d'une longueur de 4, une valeur de 'Non' est enregistre en tant que 'Non' et n'est pas quivalente ' Non'. Pour les formats de dates, vous pouvez utiliser des barres obliques, des tirets, des espaces, des virgules ou des points comme sparateurs entre les jours, les mois et les annes. Pour les mois, vous pouvez entrer des nombres, des abrviations trois lettres ou le nom des mois en clair. Les dates de format gnral sous la forme jj-mmm-aa sont affiches avec des tirets servant de sparateurs et des abrviations trois lettres pour le mois. Les dates de format gnral sous la forme jj/mm/aa et mm/jj/aa sont affiches avec des barres obliques comme sparateurs et des nombres pour le mois. De manire interne, les dates sont enregistres sous la forme d'un nombre de secondes partir du 14 octobre 1582. La plage de sicles pour les dates avec des annes deux chiffres est dtermine partir des paramtres Options (dans le menu Edition, choisissez Options, onglet Donnes). Pour les formats de temps, vous pouvez utiliser les deux points, des points ou des espaces comme sparateurs entre les heures, les minutes et les secondes. Les temps sont affichs avec des deux points comme sparateurs. De faon interne, les temps sont enregistrs comme tant le nombre de secondes depuis le 14 octobre 1582.

Etiquettes des variables


Vous pouvez dfinir des tiquettes descriptives des variables contenant jusqu' 256 caractres (128 caractres dans les langues sur deux octets), et elles peuvent comporter des espaces et des caractres rservs, contrairement aux noms de variables.

Pour spcifier des tiquettes de variable


E Activez la fentre de l'diteur de donnes. E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des donnes ou cliquez sur l'onglet Affichage des variables. E Entrez l'tiquette de variable descriptive dans la cellule Etiquette de la variable.

91 Editeur de donnes

Etiquettes de valeurs
Vous pouvez affecter des tiquettes descriptives de valeur pour chaque valeur d'une variable. Ceci se rvle particulirement utile si votre fichier de donnes utilise des codes numriques pour reprsenter des modalits non numriques (par exemple, les codes 1 et 2 pour homme et femme).

Les tiquettes de valeur peuvent comporter jusqu' 60 caractres. Les tiquettes de valeur ne sont pas disponibles pour les variables chane longues (variables chane de plus de 8 caractres).

Figure 5-5 Bote de dialogue Etiquettes de valeurs

Pour spcifier des tiquettes de valeur


E Cliquez sur le bouton de la cellule Valeurs de la variable dfinir. E Pour chaque valeur, entrez la valeur et une tiquette. E Cliquez sur Ajouter pour entrer l'tiquette de valeur.

Insertion de sauts de ligne dans les tiquettes


Les tiquettes de variable ou de valeur ont un retour la ligne automatique dans les tableaux pivotants et les diagrammes si la cellule ou la zone n'est pas assez large pour afficher l'tiquette sur une seule ligne ; vous pouvez galement modifier les rsultats pour insrer des sauts de ligne manuellement si vous voulez que le saut de ligne se fasse ailleurs. Vous pouvez aussi crer des tiquettes de variable ou de valeur qui

92 Chapitre 5

effectueront toujours un retour la ligne en des points dfinis et qui comporteront plusieurs lignes :
E Pour les tiquettes de variable, slectionnez la cellule Etiquette de la variable dans la

zone Affichage des variables de l'diteur de donnes.


E Pour les tiquettes de valeur, slectionnez la cellule Valeurs de la variable dans la zone

Affichage des variables de l'diteur de donnes, cliquez sur le bouton qui apparat dans la cellule, puis slectionnez l'tiquette que vous souhaitez modifier dans la bote de dialogue Etiquettes de valeur.
E Dans l'tiquette, saisissez \n l'endroit o vous voulez insrer un retour la ligne.

Le \n ne s'affiche pas dans les tableaux pivotants ou les diagrammes ; il est reconnu comme un caractre de saut de ligne.

Valeurs manquantes
L'option Valeurs manquantes permet de dfinir les valeurs de donnes spcifies comme valeurs manquantes spcifies par l'utilisateur. Il est souvent utile de savoir la raison pour laquelle une information est manquante. Par exemple, vous pouvez vouloir faire la distinction entre les donnes manquantes parce qu'une personne interroge a refus de rpondre et les donnes manquantes parce que la question ne s'appliquait pas au rpondant. Les valeurs des donnes dfinies comme valeurs utilisateur manquantes sont repres par un indicateur en vue d'un traitement spcial et sont exclues de la plupart des calculs.

93 Editeur de donnes Figure 5-6 Bote de dialogue Valeurs manquantes

Vous pouvez entrer jusqu' trois valeurs manquantes de votre choix, un intervalle de valeurs manquantes ou un intervalle plus une valeur de votre choix. Les intervalles ne peuvent tre spcifis que pour des valeurs numriques. (variables chane de plus de 8 caractres).

Vous ne pouvez pas dfinir de valeur manquante pour des variables chane longues

Valeurs manquantes pour des variables de chane : Toutes les valeurs de chane, y compris les valeurs nulles ou vides, sont considres comme des valeurs valides moins que vous ne les dfinissiez comme manquantes. Pour dfinir des valeurs nulles ou vides comme manquantes pour une variable chane, entrez un seul espace dans l'un des champs pour Valeurs manquantes discrtes.

Pour dfinir les valeurs manquantes


E Cliquez sur le bouton de la cellule Manquante de la variable dfinir. E Entrez les valeurs ou l'intervalle de valeurs reprsentant les valeurs manquantes.

94 Chapitre 5

Toutes les valeurs de chane, y compris les valeurs nulles ou vides, sont considres comme des valeurs valides moins que vous ne les dfinissiez comme manquantes. Pour dfinir des valeurs nulles ou vides comme manquantes pour une variable chane, entrez un seul espace dans l'un des champs pour Valeurs manquantes discrtes.

Largeur des colonnes


Vous pouvez spcifier le nombre de caractres dfinissant la largeur des colonnes. Vous pouvez galement modifier la largeur des colonnes dans l'Affichage des donnes en cliquant sur les bords des colonnes et en les faisant glisser. Les formats de colonnes affectent seulement l'affichage des valeurs dans l'diteur de donnes. Modifier la largeur de la colonne ne change pas la largeur dfinie d'une variable. Si la largeur relle et la largeur dfinie d'une valeur sont plus larges que la colonne, des astrisques (*) apparaissent dans l'Affichage des donnes.

Alignement de variable
L'alignement contrle l'affichage des valeurs des donnes et/ou des tiquettes de valeurs dans l'Affichage des donnes. L'alignement par dfaut est droite pour les variables numriques et gauche pour les variables chane. Ce paramtre affecte uniquement l'Affichage des donnes.

Application d'attributs de dfinition de variable plusieurs variables


Lorsque vous avez dfini les attributs de dfinition d'une variable, vous pouvez copier des attributs et les appliquer une ou plusieurs variables. L'application d'attributs de dfinition de variable s'effectue au moyen des oprations Copier et Coller de base. Vous pouvez :

Copier un seul attribut (par exemple, les tiquettes de valeurs) et le coller dans la ou les mmes cellules d'attribut d'une ou de plusieurs variables. Copier tous les attributs d'une variable et les coller dans d'autres variables. Crer plusieurs variables avec tous les attributs de la copie d'une variable.

95 Editeur de donnes

Application d'attributs de dfinition de variable d'autres variables


Pour appliquer certains attributs d'une variable dfinie, procdez comme suit :
E Dans l'Affichage des variables, slectionnez la cellule d'attribut appliquer d'autres

variables.
E A partir du menu, slectionnez : Edition Copier E Slectionnez la ou les cellules d'attribut auxquelles vous souhaitez appliquer l'attribut.

Vous pouvez slectionner plusieurs variables cible.


E A partir du menu, slectionnez : Edition Coller

Si vous collez l'attribut dans des lignes vierges, de nouvelles variables sont cres avec des valeurs d'attribut par dfaut pour tous les attributs, l'exception de celui que vous avez slectionn.
Pour appliquer tous les attributs d'une variable dfinie, procdez comme suit :
E Dans l'Affichage des variables, slectionnez le numro de ligne de la variable

prsentant les attributs utiliser. La totalit de la ligne est mise en surbrillance.


E A partir du menu, slectionnez : Edition Copier E Slectionnez le numro de ligne de la variable laquelle vous souhaitez appliquer les

attributs. Vous pouvez slectionner plusieurs variables cible.


E A partir du menu, slectionnez : Edition Coller

96 Chapitre 5

Cration de plusieurs nouvelles variables avec les mmes attributs


E Dans l'Affichage des variables, cliquez sur le numro de ligne de la variable prsentant

les attributs utiliser pour la nouvelle variable. La totalit de la ligne est mise en surbrillance.
E A partir du menu, slectionnez : Edition Copier E Cliquez sur le numro de la ligne vide qui se trouve sous la dernire variable dfinie

dans le fichier de donnes.


E A partir du menu, slectionnez : Edition Coller les variables... E Entrez le nombre de variables crer. E Entrez un prfixe et un numro de dpart pour les nouvelles variables.

Les noms des nouvelles variables seront composs du prfixe spcifi et d'un numro squentiel commenant par le numro spcifi.

Saisie de donnes
Vous pouvez entrer des donnes directement dans l'diteur de donnes au niveau de l'Affichage des donnes. Vous pouvez entrer des donnes dans n'importe quel ordre. Vous pouvez entrer des donnes par observation ou par variable, pour des zones slectionnes ou des cellules individuelles.

La cellule active est mise en surbrillance. Le nom de variable et le numro de ligne de la cellule active sont affichs dans le coin suprieur gauche de l'diteur de donnes. la valeur est affiche dans l'diteur de cellules en haut de l'diteur de donnes.

Lorsque vous slectionnez une cellule et lorsque vous entrez une valeur de donnes,

97 Editeur de donnes

Les valeurs de donnes ne sont pas enregistres tant que vous n'avez pas appuy sur Entre ou que vous n'avez pas slectionn une autre cellule. Pour entrer autre chose que des donnes numriques simples, vous devez d'abord dfinir le type de variable.

Si vous entrez une valeur dans une colonne vide, l'diteur de donnes cre automatiquement une nouvelle variable et affecte un nom de variable.
Figure 5-7 Fichier de travail dans l'Affichage des donnes

Pour entrer des donnes numriques


E Slectionnez une cellule dans l'Affichage des donnes. E Entrez la valeur des donnes. La valeur est affiche dans l'diteur de cellules en

haut de l'diteur de donnes.


E Appuyez sur Entre ou slectionnez une autre cellule pour enregistrer la valeur.

98 Chapitre 5

Pour entrer des donnes non numriques


E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des donnes ou cliquez sur l'onglet Affichage des variables. E Cliquez sur le bouton de la cellule Type de la variable. E Slectionnez le type de donnes dans la bote de dialogue Type de variable. E Cliquez sur OK. E Double-cliquez sur le numro de ligne ou cliquez sur l'onglet Affichage des donnes. E Pour la variable que vous venez de dfinir, entrez les donnes dans la colonne.

Pour utiliser des tiquettes de valeur pour l'entre de donnes


E Si les tiquettes de valeurs n'apparaissent pas dans l'Affichage des donnes, choisissez

dans les menus :


Affichage Etiquettes de valeurs E Cliquez sur la cellule dans laquelle vous souhaitez entrer la valeur. E Slectionnez une tiquette de valeur dans la liste droulante.

La valeur est saisie et l'tiquette de valeur est affiche dans la cellule. Remarque : cela ne fonctionne que si vous avez dfini des tiquettes de valeurs pour la variable.

Restrictions concernant la valeur de donnes dans l'diteur de donnes


Le type et la largeur de la variable dfinie dterminent le type de valeur que vous pouvez entrer dans la cellule de l'Affichage des donnes.

Si vous tapez un caractre qui n'est pas autoris par le type dfini de la variable, l'diteur de donnes met un signal sonore et n'accepte pas le caractre.

99 Editeur de donnes

Pour les variables chane, les caractres dpassant la largeur dfinie ne sont pas autoriss. Pour les variables numriques, des nombres entiers dpassant la valeur dfinie peuvent tre entrs mais l'diteur de donnes affichera dans la cellule une notation scientifique ou des astrisques pour indiquer que la valeur dpasse la largeur dfinie. Pour afficher la valeur dans la cellule, changez la largeur dfinie de la variable. (Remarque : changer la largeur de la colonne n'affecte pas la largeur de la variable).

Modification de donnes
Avec l'diteur de donnes, vous pouvez modifier les valeurs des donnes dans l'Affichage des donnes de plusieurs manires. Vous pouvez:

Changer les valeurs des donnes. Couper, copier et coller des valeurs de donnes. Ajouter et supprimer des observations. Ajouter et supprimer des variables. Changer l'ordre des variables.

Pour remplacer ou modifier les valeurs de donnes


Pour supprimer l'ancienne valeur et pour entrer une nouvelle valeur :
E Dans l'Affichage des donnes, double-cliquez sur la cellule. La valeur de la cellule

est affiche dans l'diteur de cellules.


E Modifiez la valeur directement dans la cellule ou dans l'diteur de cellules. E Appuyez sur Entre (ou dplacez-vous sur une autre cellule) pour enregistrer la

nouvelle valeur.

100 Chapitre 5

Couper, copier et coller des valeurs de donnes


Vous pouvez couper, copier et coller des valeurs individuelles de cellules ou des groupes de valeurs dans l'diteur de donnes. Vous pouvez:

Dplacer ou copier la valeur d'une seule cellule dans une autre cellule. Dplacer ou copier la valeur d'une seule cellule dans un groupe de cellules. Dplacer ou copier les valeurs d'une seule observation (ligne) dans plusieurs observations. Dplacer ou copier les valeurs d'une seule variable (colonne) dans plusieurs variables. Dplacer ou copier un groupe de valeurs de cellule dans un autre groupe de cellules.

Conversion de donnes de valeurs colles dans l'diteur de donnes


Si les types dfinis de variables des cellules source et cible ne sont pas les mmes, SPSS essaye de convertir la valeur. Si aucune conversion n'est possible, la valeur manquante par dfaut est insre dans la cellule cible.
Numrique ou date en caractres : Les formats numriques (par exemple, Numrique,

Dollar, Point ou Virgule) et les formats de date sont convertis en caractres s'ils sont colls dans une cellule de variables chane. La valeur d'une chane est la valeur numrique telle qu'elle est affiche dans la cellule. Par exemple, pour une variable dont le format est exprim en dollars, le signe Dollar qui est affich devient partie intgrante de la valeur de caractres. Les valeurs qui excdent la largeur dfinie de la variable chane sont tronques.
Valeurs de caractres en numrique ou de date : Les valeurs de chanes qui contiennent

des caractres acceptables pour le format numrique ou de date de la cellule cible sont converties dans la valeur quivalente numrique ou de date. Par exemple, une valeur de caractres de 25/12/91 est convertie en date valide si le type de format de la cellule cible est un des formats jour-mois-anne, mais elle est convertie en valeur manquante par dfaut si le type de format de la cellule est de type mois-jour-anne.
Date en numrique : Les valeurs de dates et de temps sont converties en un nombre

de secondes si la cellule cible est d'un format numrique (par exemple, Numrique, Dollar, Point ou Virgule). Etant donn que les dates sont enregistres en interne

101 Editeur de donnes

comme le nombre de secondes depuis le 14 octobre 1582, le fait de convertir des dates en valeurs numriques peut rsulter en des nombres trs importants. Par exemple, la date du 10/29/91 a une valeur de conversion numrique de 12.908.073.600.
Numrique en date ou temps : Les valeurs numriques sont converties en dates ou

temps si la valeur reprsente un nombre de secondes pouvant produire une date ou un temps valides. En ce qui concerne les dates, les valeurs numriques infrieures 86.400 sont converties dans la valeur manquante par dfaut.

Insrer de nouvelles observations


Le fait d'entrer des donnes dans une cellule sur une ligne blanche cre automatiquement une nouvelle observation. L'diteur de donnes insre la valeur manquante par dfaut pour toutes les autres variables de cette observation. S'il y a quelques lignes blanches entre la nouvelle observation et les observations existantes, les lignes blanches deviennent galement des nouvelles observations avec des valeurs manquantes par dfaut pour toutes les variables. Vous pouvez galement insrer de nouvelles observations entre des observations existantes

Pour insrer de nouvelles observations entre des observations existantes


E Dans l'Affichage des donnes, slectionnez n'importe quelle cellule pour l'observation

(ligne) situe sous de la position o vous souhaitez insrer la nouvelle observation.


E A partir du menu, slectionnez : Donnes Insrer les observations

Une nouvelle ligne est insre pour cette observation et toutes les variables reoivent la valeur manquante par dfaut.

Insrer de nouvelles variables


La saisie de donnes dans une colonne vide de l'Affichage des donnes ou dans une ligne vide de l'Affichage des variables cre automatiquement une nouvelle variable portant un nom par dfaut (prfixe var et numro squentiel) et un type de format de

102 Chapitre 5

donnes par dfaut (numrique). L'diteur de donnes insre la valeur manquante par dfaut pour toutes les observations concernes par la nouvelle variable. S'il existe des colonnes vides dans l'Affichage des donnes ou des lignes vides dans l'Affichage des variables entre la nouvelle variable et les variables existantes, ces colonnes ou lignes deviennent galement de nouvelles variables avec une valeur manquante par dfaut pour toutes les observations. Vous pouvez galement insrer des nouvelles variables entre les variables existantes.

Pour insrer de nouvelles variables entre des variables existantes


E Slectionnez n'importe quelle cellule de la variable situe droite (pour l'Affichage

des donnes) ou sous (pour l'Affichage des variables) de l'endroit o vous souhaitez insrer la nouvelle variable.
E A partir du menu, slectionnez : Donnes Insrer une variable

Une nouvelle variable est insre avec la valeur manquante par dfaut pour toutes les observations.

Pour dplacer des variables


E Pour slectionner la variable, cliquez sur son nom dans l'Affichage des donnes ou

sur son numro de ligne dans l'Affichage des variables.


E Faites glisser la variable jusqu' son nouvel emplacement. E Pour placer la variable entre deux autres, dposez-la sur la colonne situe droite

de son emplacement de destination, dans l'Affichage des donnes. Dans l'Affichage des variables, dposez-la sur la ligne de variables situe sous l'endroit o vous voulez la placer.

103 Editeur de donnes

Pour modifier le type de donnes


Vous pouvez tout moment modifier le type de donnes d'une variable via la bote de dialogue Type de variable dans l'Affichage des variables ; dans ce cas, l'diteur de donnes tentera de convertir les valeurs existantes dans le nouveau type. Si aucune conversion n'est possible, la valeur manquante par dfaut est affecte. Les rgles de conversion sont les mmes que celles pour coller des valeurs de donnes une variable de type de format diffrent. Si le changement du format des donnes peut avoir pour consquence la perte des spcifications de la valeur manquante par dfaut ou d'tiquettes de valeurs, SPSS affiche une bote d'alerte et vous demande si vous voulez poursuivre le changement ou si vous dsirez l'annuler.

Aller l'observation
Aller l'observation va au numro d'observation (ligne) spcifi dans l'diteur de donnes.
Figure 5-8 Bote de dialogue Aller l'observation

Pour rechercher une observation dans l'diteur de donnes


E Activez la fentre de l'diteur de donnes. E A partir du menu, slectionnez : Donnes Aller l'observation... E Entrez le numro de ligne de l'observation de l'diteur de donnes.

104 Chapitre 5

Etat de la slection de l'observation dans l'diteur de donnes


Si vous avez slectionn un sous-ensemble d'observations mais si vous n'avez pas cart les observations non slectionnes, celles-ci sont identifies dans l'diteur de donnes par une ligne verticale dans le numro de ligne.
Figure 5-9 Observations filtres dans l'diteur de donnes

Options d'affichage de l'diteur de donnes


Le menu Affichage propose plusieurs options d'affichage pour l'diteur de donnes :
Polices : Contrle les caractristiques de la police pour l'affichage des donnes. Quadrillage : Permet de basculer l'affichage du quadrillage. Etiquette de valeur : Permet de basculer entre les valeurs de donnes actuelles et

les tiquettes de valeurs descriptives dfinies par l'utilisateur. Cette option n'est disponible que dans l'Affichage des donnes.

105 Editeur de donnes

Impression de l'diteur de donnes


Un fichier de donnes s'imprime tel qu'il apparat l'cran.

Les informations de l'affichage en cours sont imprimes. Dans l'Affichage des donnes, les donnes sont imprimes. Dans l'Affichage des variables, ce sont les informations de dfinition des donnes qui sont imprimes. Le quadrillage n'est imprim que s'il apparat dans l'affichage slectionn. Les tiquettes de valeurs sont imprimes si elles apparaissent dans l'Affichage des donnes. Dans le cas contraire, ce sont les valeurs de donnes relles qui sont imprimes.

Utilisez le menu Affichage dans la fentre de l'diteur de donnes pour afficher ou masquer le quadrillage et pour activer/dsactiver l'affichage des valeurs de donnes et des tiquettes de valeurs.

Pour imprimer le contenu de l'diteur de donnes


E Activez la fentre de l'diteur de donnes. E Cliquez sur l'onglet correspondant l'affichage que vous souhaitez imprimer. E A partir du menu, slectionnez : Fichier Imprimer...

Chapitre

Prparation des donnes

Une fois que vous avez ouvert le fichier de donnes ou saisi les donnes dans l'diteur de donnes, vous pouvez crer des tableaux, des diagrammes et des analyses sans effectuer aucune autre tche prliminaire. Cependant, il existe des fonctions de prparation des donnes supplmentaires qui peuvent vous tre utiles, par exemple :

Affecter des proprits de variable qui dcrivent les donnes et dterminent le traitement devant tre appliqu certaines valeurs. Identifier les observations pouvant contenir des informations redondantes, et les exclure des analyses ou les supprimer du fichier de donnes. Crer des variables avec diffrentes modalits qui reprsentent des intervalles de valeurs provenant de variables comportant un grand nombre de valeurs possibles.

Proprits de variable

Les donnes simplement saisies dans l'diteur de donnes dans l'affichage des donnes ou lues dans SPSS partir d'un format de fichier externe (une feuille de calcul Excel ou un fichier texte par exemple) ne sont pas dotes de certaines proprits de variable que vous pourriez trouver trs utiles, comme :

Dfinition d'tiquettes de valeurs descriptives pour les codes numriques (par exemple, 0 = homme et 1 = femme). Identification des codes de valeurs manquantes (par exemple, 99 = Sans objet). Attribution de niveaux de mesure (nominal, ordinal ou chelle).

107

108 Chapitre 6

Toutes ces proprits de variable (ainsi que d'autres) peuvent tre affectes dans la vue Variable de l'diteur de donnes. Plusieurs utilitaires peuvent galement vous aider dans ce processus :

L'option Dfinir les proprits de variable peut vous aider dfinir les tiquettes de valeurs descriptives et les valeurs manquantes. Ceci est particulirement utile pour les donnes qualitatives dotes de codes numriques utiliss pour les valeurs de modalits. L'option Copier des proprits de donnes permet d'utiliser un fichier de donnes au format SPSS existant comme modle pour les proprits de fichier et de variable dans le fichier de donnes en cours. Ceci est particulirement utile si vous utilisez frquemment des fichiers de donnes au format externe ayant un contenu similaire (comme des rapports mensuels au format Excel).

Dfinition des proprits de variable


L'option Dfinir les proprits de variable vous aide dans le processus de cration d'tiquettes de valeurs descriptives pour les variables qualitatives (nominales ou ordinales). Dfinir les proprits de variable :

Analyse les valeurs relles des donnes et rpertorie toutes les valeurs de donnes uniques pour chaque variable slectionne. Identifie les valeurs non tiquetes et possde une fonction d' tiquetage automatique . Permet de copier des tiquettes de valeurs dfinies d'une autre variable vers la variable slectionne ou de la variable slectionne vers plusieurs autres variables.

Remarque : Pour utiliser l'option Dfinir les proprits de variable sans analyse pralable des observations, saisissez 0 dans le nombre d'observations analyser.

Pour dfinir les proprits de variable


E A partir du menu, slectionnez : Donnes Dfinir les proprits de variables...

109 Prparation des donnes Figure 6-1 Bote de dialogue initiale permettant de slectionner les variables dfinir

E Slectionnez les variables numriques ou les variables chane courtes pour lesquelles

vous voulez crer des tiquettes de valeurs, ou dfinir ou modifier d'autres proprits de variables, telles que les valeurs manquantes ou les tiquettes de variable descriptives. Remarque : Les variables chane longues (variables chane d'une largeur dfinie de plus de huit caractres) ne sont pas affiches dans la liste de variables. Les variables chane longues ne peuvent pas avoir d'tiquettes de valeurs dfinies ou de modalits de valeurs manquantes.
E Spcifier le nombre d'observations analyser afin de gnrer la liste de valeurs

uniques. Ceci est particulirement utile pour les fichiers de donnes comportant un grand nombre d'observations, pour lesquelles une analyse complte du fichier de donnes prendrait beaucoup de temps.
E Spcifier une limite suprieure pour le nombre de valeurs uniques afficher. Cette

opration est particulirement utile pour viter de rpertorier des centaines, des

110 Chapitre 6

milliers, voire des millions de valeurs pour les variables d'chelle (intervalle continu, rapport).
E Cliquez sur Poursuivre pour ouvrir la bote de dialogue principale de la fonction

Dfinir les proprits de variable.


E Slectionnez une variable pour laquelle vous voulez crer des tiquettes de valeurs,

ou dfinir ou modifier d'autres proprits de variable.


E Saisissez le texte de l'tiquette pour toutes les valeurs non tiquetes affiches dans la

grille Etiquette de valeur.


E Si vous souhaitez crer des tiquettes de valeurs pour des valeurs qui ne sont pas

affiches, vous pouvez saisir les valeurs dans la colonne Valeur, sous la dernire valeur analyse.
E Rptez l'opration pour chaque variable rpertorie pour laquelle vous voulez crer

des tiquettes de valeurs.


E Cliquez sur OK pour appliquer les tiquettes de valeurs et les autres proprits

de variable.

111 Prparation des donnes

Dfinition des tiquettes de valeurs et des autres proprits de variable


Figure 6-2 Dfinir les proprits de variable, bote de dialogue principale

La bote de dialogue principale de la fonction Dfinir les proprits de variable donne l'information suivante concernant les variables analyses :
Liste des variables analyses : Pour chaque variable analyse, une coche dans la

colonne Sans tiquette indique que la variable contient des valeurs qui ne possdent pas d'tiquette de valeur. Pour trier la liste de variables dans le but d'afficher en tte de liste toutes les variables non tiquetes :
E Cliquez sur le titre de colonne Sans tiquette sous la liste des variables analyses.

Vous pouvez galement faire un tri par nom de variable ou par niveau de mesure en cliquant sur le titre de colonne correspondant dans la liste des variables analyses.

112 Chapitre 6

Grille d'tiquettes de valeurs


Etiquette : Affiche toute tiquette de valeur dfinie. Dans cette colonne, vous

pouvez ajouter ou modifier des tiquettes.


Valeur : Valeurs uniques pour chaque variable slectionne. Cette liste de valeurs

uniques se fonde sur le nombre d'observations analyses. Par exemple, si vous analysez seulement les 100 premires observations du fichier de donnes, la liste refltera uniquement les valeurs uniques prsentes dans ces observations. Si le fichier de donnes a dj t tri par la variable laquelle vous voulez affecter des tiquettes de valeurs, la liste pourrait afficher beaucoup moins de valeurs uniques qu'il n'en existe dans les donnes.

Effectif : Nombre d'occurrences de chaque valeur dans les observations analyses.

Manquant : Valeurs reprsentant les donnes manquantes. Vous pouvez modifier la

dsignation des valeurs manquantes de la modalit en cochant la case. Si la case est coche, la modalit est dfinie en tant que modalit manquante spcifie par l'utilisateur. Si une variable possde dj une plage de valeurs dfinies comme manquantes par l'utilisateur (par exemple, 90-99), vous ne pouvez ni ajouter ni supprimer des modalits de valeurs manquantes pour cette variable avec la fonction Dfinir les proprits de variable. Dans l'diteur de donnes, vous pouvez utiliser l'option d'affichage des variables pour modifier les modalits de valeurs manquantes de la variable possdant des plages de valeurs manquantes. Pour plus d'informations, reportez-vous Valeurs manquantes dans Chapitre 5 , page 92.

Modifi : Indique que vous avez ajout ou modifi une tiquette de valeur.

Remarque : Dans la bote de dialogue initiale, si vous indiquez 0 comme nombre d'observations analyser, la grille Etiquette de valeur est d'abord vide, sauf pour les tiquettes de valeurs et/ou les modalits de valeurs manquantes dfinies pour la variable slectionne. En outre, le bouton Suggrer du niveau de mesure est dsactiv.
Niveau de mesure : Comme les tiquettes de valeurs sont particulirement utiles pour

les variables qualitatives (nominales et ordinales), et comme certaines procdures traitent les variables qualitatives et d'chelle diffremment, il peut tre important d'affecter le niveau de mesure correct. Toutefois, par dfaut, le niveau de mesure d'chelle est affect toutes les nouvelles variables numriques. Par consquent, de nombreuses variables normalement qualitatives peuvent tre initialement affiches en tant que variables d'chelle. En cas de doute sur le niveau de mesure affecter une variable, cliquez sur Suggrer.

113 Prparation des donnes

Copier les proprits : Vous pouvez copier les tiquettes de variable ou les autres proprits de variable partir d'une autre variable vers la variable slectionne, ou partir de la variable slectionne vers une ou plusieurs autres variables. Valeurs non tiquetes : Pour crer automatiquement des tiquettes pour les valeurs

non tiquetes, cliquez sur Etiquettes automatiques.


Etiquette de variable et Format d'affichage

Vous pouvez modifier l'tiquette de variable descriptive et le format d'affichage.


Vous ne pouvez pas modifier le type fondamental de la variable (chane ou numrique). Pour les variables chane, vous ne pouvez modifier que l'tiquette de variable, mais pas le format d'affichage. Concernant les variables numriques, vous pouvez changer le type numrique (nombres, dates, dollars ou autre devise), la largeur (nombre maximal de chiffres, dont les dcimales et/ou les indicateurs de regroupement) et le nombre de dcimales. Pour ce qui est du format numrique de date, vous pouvez slectionner un format de date spcifique (tel que jj-mm-aaaa, mm/jj/aa, aaaajjj, etc.) Pour un format numrique personnalis, vous pouvez slectionner un des cinq formats de devise personnaliss (de CCA CCE). Pour plus d'informations, reportez-vous Options montaires (devises) dans Chapitre 43 , page 623. Un astrisque est affich dans la colonne Valeur si la largeur indique est infrieure soit celle des valeurs analyses, soit celle des valeurs affiches, dans le cas des tiquettes de valeurs dfinies dj existantes ou des modalits de valeurs manquantes. Un point (.) est affich si les valeurs analyses ou les valeurs affiches (pour les tiquettes de valeurs dfinies dj existantes ou pour les modalits de valeurs manquantes) ne sont pas valides pour le type de format d'affichage slectionn. Par exemple, une valeur numrique interne de moins de 86 400 n'est pas valide pour une variable format de date.

114 Chapitre 6

Affectation du niveau de mesure


Quand vous cliquez sur Suggrer pour le niveau de mesure dans la bote de dialogue principale Dfinir les proprits de variable, la variable en cours est value en fonction des observations analyses et des tiquettes de valeurs dfinies, et un niveau de mesure est suggr dans la bote de dialogue de suggestion d'un niveau de mesure qui apparat. La zone Explication propose une brve description des critres utiliss pour dterminer le niveau de mesure suggr.
Figure 6-3 Bote de dialogue Suggestion d'un niveau de mesure

Remarque : Les valeurs dfinies comme tant manquantes ne sont pas comprises dans l'valuation pour le niveau de mesure. Par exemple, l'explication du niveau de mesure suggr peut indiquer que la suggestion est due, en partie, au fait que la variable ne contient pas de valeurs ngatives, alors qu'en ralit, elle peut en contenir, mais elles sont dj dfinies comme manquantes.
E Cliquez sur Poursuivre pour accepter le niveau de mesure suggr ou sur Annuler pour

ne pas modifier le niveau de mesure.

115 Prparation des donnes

Copie de proprits de variable


La bote de dialogue Appliquer des tiquettes et un niveau apparaissent lorsque vous cliquez sur A partir d'une autre variable ou sur Vers d'autres variables dans la bote de dialogue principale Dfinir les proprits de variable. Toutes les variables analyses correspondant au type de la variable courante (numrique ou chane) sont alors affiches. Dans le cas des variables chane, la largeur dfinie doit galement correspondre.
Figure 6-4 Bote de dialogue Appliquer les tiquettes et le niveau

E Slectionnez une seule variable dont vous allez copier les tiquettes de valeurs et les

autres proprits de variable (sauf l'tiquette de variable). ou


E Slectionnez une ou plusieurs variables qui doivent recevoir les tiquettes de valeurs

et les autres proprits de variable.


E Cliquez sur Copier pour copier les tiquettes de valeurs et le niveau de mesure.

Les tiquettes de valeurs existantes et les modalits de valeurs manquantes des variables cible ne sont pas remplaces.

116 Chapitre 6

Les tiquettes de valeurs et les modalits de valeurs manquantes des valeurs qui ne sont pas encore dfinies pour les variables cible sont ajoutes au groupe d'tiquettes de valeurs et de modalits de valeurs manquantes des variables cible. Le niveau de mesure des variables destination est toujours remplac. Si la variable source ou cible possde un intervalle dfini de valeurs manquantes, les dfinitions de valeurs manquantes ne sont pas copies.

Copie des proprits de donnes


L'assistant Copier des proprits de donnes permet d'utiliser un fichier de donnes SPSS externe comme modle pour dfinir les proprits de fichier et de variable dans le fichier de travail. Vous pouvez galement utiliser des variables du fichier de travail comme modles pour d'autres variables de ce mme fichier. Vous pouvez :

Copier des proprits partir d'un fichier de donnes externe vers le fichier de travail. Les proprits de fichier comprennent les documents, les tiquettes de fichier, les vecteurs multirponses, les groupes de variables et la pondration. Copier des proprits de variable partir d'un fichier de donnes externe vers les variables concordantes dans le fichier de travail. Les proprits de variable comprennent les tiquettes de valeurs, les valeurs manquantes, le niveau de mesure, les tiquettes de variable, le format d'impression et d'criture, l'alignement et la largeur des colonnes (dans l'diteur de donnes). Copier des proprits de variable partir d'une variable d'un fichier de donnes externe ou du fichier de travail vers plusieurs variables du fichier de travail. Crer des variables dans le fichier de travail partir de variables d'un fichier externe.

Lors de la copie de proprits de donnes, les rgles gnrales suivantes sont appliques :

Si vous utilisez un fichier de donnes externe en tant que fichier source, celui-ci doit tre au format SPSS. Si vous utilisez le fichier de travail comme fichier source, celui-ci doit contenir au moins une variable. Il n'est pas possible d'utiliser un fichier de travail vierge comme fichier de donnes source.

117 Prparation des donnes

Les proprits non dfinies (vides) du fichier de donnes source ne remplacent pas les proprits dfinies dans le fichier de travail. Les proprits de variable ne sont copies partir de la variable source que sur des variables d'un type correspondant : chane (alphanumrique) ou numrique (nombres, dates et devises).

Remarque : L'option Copier des proprits de donnes remplace l'option d'application du dictionnaire de donnes, auparavant disponible dans le menu Fichier.

Pour copier des proprits de donnes


E A partir des menus de la fentre de l'diteur de donnes, slectionnez : Donnes Copie des proprits de donnes... Figure 6-5 Assistant Copier des proprits de donnes : Etape 1

118 Chapitre 6 E Slectionnez le fichier de donnes possdant les proprits de fichier et/ou de variable

copier. Il peut s'agir d'un fichier de donnes externe au format SPSS ou du fichier de travail.
E Suivez les instructions de l'assistant Copier des proprits de donnes tape par tape.

Slection des variables source et cible


Dans cette tape, vous pouvez spcifier les variables source contenant les proprits de variable copier et les variables cible qui doivent recevoir ces proprits.
Figure 6-6 Assistant Copier des proprits de donnes : Etape 2

Application des proprits provenant de variables du fichier source des variables concordantes du fichier de travail : Les proprits de variable sont copies partir

d'une ou de plusieurs variables source sur les variables concordantes dans le fichier de travail. Les variables sont concordantes si le type (chane ou numrique) et le nom

119 Prparation des donnes

de la variable sont les mmes. En ce qui concerne les variables chane, la longueur dfinie doit galement tre la mme. Par dfaut, seules les variables concordantes sont affiches dans les deux listes de variables.

Cration de variables concordantes dans le fichier de travail si celles-ci n'existent pas : Permet de mettre jour la liste source afin d'afficher toutes les variables

dans le fichier de donnes source. Si vous slectionnez des variables source qui n'existent pas dans le fichier de travail (d'aprs le nom de variable), les nouvelles variables sont cres dans le fichier de travail avec les noms et proprits de variable du fichier source. Si le fichier de travail ne contient pas de variables (dans le cas d'un fichier vierge), toutes les variables du fichier de donnes source sont affiches et les nouvelles variables fondes sur les variables source concernes sont cres automatiquement dans le fichier de travail.
Application des proprits d'une variable source unique sur des variables de mme type d'un fichier de travail : Les proprits d'une variable de la liste source peuvent tre

appliques une ou plusieurs variables de la liste du fichier de travail. Seules des variables de mme type (numrique ou chane) que la variable choisie dans la liste source sont affiches dans la liste du fichier de travail. Dans le cas des variables de chane, seules les chanes de mme longueur que la variable source sont affiches. Cette option n'est pas disponible si le fichier de travail ne contient pas de variables. Remarque : Il n'est pas possible de crer de nouvelles variables dans le fichier de travail avec cette option.
Application des proprits d'un ensemble de donnes uniquement, sans slection de variable : Seules les proprits du fichier (par exemple, les documents, les tiquettes

de fichier et la pondration) sont appliques au fichier de travail. Aucune proprit de variable n'est applique. Cette option n'est pas disponible si le fichier de travail est galement le fichier source.

Choix des proprits de variable copier


Vous pouvez copier des proprits de variable partir des variables source vers les variables cible. Les proprits non dfinies (vides) des variables source ne remplacent pas les proprits dfinies des variables cible.

120 Chapitre 6 Figure 6-7 Assistant Copier des proprits de donnes : Etape 3

Etiquette de valeur : Les tiquettes de valeurs sont des tiquettes descriptives associes

des valeurs de donnes. Les tiquettes de valeurs sont souvent utilises quand des valeurs de donnes numriques reprsentent des modalits non numriques (par exemple, les codes 1 et 2 pour Homme et Femme). Vous pouvez remplacer ou fusionner les tiquettes de valeurs dans les variables cible.

L'option Remplacer supprime les tiquettes de valeurs dfinies dans la variable cible et les remplace par les tiquettes de valeurs dfinies de la variable source. L'option Fusionner fusionne les tiquettes de valeurs dfinies de la variable source avec toute tiquette de valeur dfinie existante de la variable cible. Si la mme valeur possde une tiquette dfinie dans les deux variables source et cible, l'tiquette de valeur de la variable cible reste inchange.

Valeurs manquantes : Les valeurs manquantes reprsentent des donnes manquantes

(par exemple, 98 pour Ne se prononce pas et 99 pour Sans objet). Ces valeurs possdent galement des tiquettes de valeurs dfinies qui dcrivent ce que

121 Prparation des donnes

reprsentent les codes de la valeur manquante. Les valeurs manquantes dfinies existant dans la variable cible sont supprimes et remplaces par les valeurs manquantes dfinies dans la variable source.
Etiquette de variable : Les tiquettes de variable descriptive peuvent contenir des

espaces et des caractres rservs qui ne sont pas autoriss dans les noms de variable. Avant de copier des proprits d'une seule variable source sur plusieurs variables cible, plusieurs lments sont prendre en compte.
Niveau de mesure : Le niveau de mesure peut tre nominal, ordinal ou d'chelle. Pour les procdures qui font une distinction entre diffrents niveaux de mesure, les niveaux nominal et ordinal sont tous deux considrs comme qualitatifs. Formats : Concernant les variables numriques, cette option contrle le type numrique (nombres, dates ou devises), la largeur (nombre total de caractres affichs, dont les caractres de dbut et de fin, et l'indicateur dcimal) et le nombre de dcimales affiches. Cette option est ignore pour les variables chane. Alignement : Cette option n'affecte que l'alignement (gauche, droite, centr) de

l'affichage des donnes de l'diteur de donnes.


Largeur des colonnes dans l'diteur de donnes : Cette option n'affecte que la largeur

des colonnes de l'affichage des donnes dans l'diteur de donnes.

Copie des proprits d'ensembles de donnes (proprits de fichier)


Vous pouvez appliquer des proprits choisies d'un ensemble de donnes global partir du fichier de donnes source vers le fichier de travail. (Cette option n'est pas disponible si le fichier de travail est le fichier source.)

122 Chapitre 6 Figure 6-8 Assistant Copier des proprits de donnes : Etape 4

Vecteurs multirponses : Applique les dfinitions de vecteur multirponses du fichier

de donnes source vers le fichier de travail. (Remarque : Les vecteurs multirponses ne sont actuellement utiliss que par l'option complmentaire Tableaux.)

Les vecteurs multirponses du fichier de donnes source contenant des variables qui n'existent pas dans le fichier de travail sont ignors, moins que ces variables ne soient cres selon les spcifications de l'tape 2 (slection des variables source et cible) avec l'assistant Copier des proprits de donnes. L'option Remplacer supprime tous les vecteurs multirponses du fichier de travail et les remplace par les vecteurs multirponses du fichier source. L'option Fusionner ajoute les vecteurs multirponses du fichier de donnes source l'ensemble de vecteurs multirponses du fichier de travail. S'il existe dans les deux fichiers un vecteur portant le mme nom, le vecteur existant dans le fichier de travail reste inchang.

123 Prparation des donnes

Groupes de variables : Les groupes de variables permettent de contrler la liste des

variables affiches dans les botes de dialogue. Les groupes de variables sont dfinis l'aide de l'option Dfinir les vecteurs du menu Utilitaires.

Les groupes du fichier de donnes source contenant des variables qui n'existent pas dans le fichier de travail sont ignors moins que ces variables ne soient cres selon les spcifications de l'tape 2 (slection des variables source et cible) avec l'assistant Copier des proprits de donnes. L'option Remplacer supprime tous les groupes de variables existant dans le fichier de travail et les remplace par les groupes de variables du fichier source. L'option Fusionner ajoute les groupes de variables du fichier de donnes source l'ensemble des groupes de variables du fichier de travail. S'il existe dans les deux fichiers un vecteur portant le mme nom, le vecteur existant dans le fichier de travail reste inchang.

Documents : Remarques ajoutes au fichier de donnes via la commande DOCUMENT.


L'option Remplacer supprime tous les documents existants du fichier de travail et les remplace par les documents du fichier source. L'option Fusionner combine les documents des fichiers source et de travail. Les documents uniques dans le fichier source et qui n'existent pas dans le fichier de travail sont ajouts ce fichier. Tous les documents sont ensuite tris par date.

Spcification de pondration : Pondre les observations l'aide de la variable de pondration actuelle s'il existe une variable concordante dans le fichier de travail. Cette opration remplace toute pondration en cours dans le fichier de travail. Etiquette de fichier : Etiquette descriptive applique un fichier de donnes via la commande FILE LABEL.

124 Chapitre 6

Rsultats
Figure 6-9 Assistant Copier des proprits de donnes : Etape 5

La dernire tape de l'assistant Copier des proprits de donnes fournit des informations sur le nombre de variables dont les proprits seront copies partir du fichier de donnes source, le nombre de nouvelles variables qui seront cres et le nombre de proprits d'ensembles de donnes (proprits de fichier) qui seront copies. Vous pouvez galement choisir de coller la syntaxe de commande gnre dans une fentre de syntaxe et de l'enregistrer pour un usage ultrieur.

Identification des observations dupliques


Vos donnes peuvent comprendre des observations dupliques pour les raisons suivantes :

La mme observation est saisie plusieurs fois par erreur.

125 Prparation des donnes

Plusieurs observations partagent la mme valeur d'ID principal, mais ont des valeurs d'ID secondaire diffrentes (par exemple, les membres d'une famille qui vivent tous dans la mme maison). Plusieurs observations reprsentent la mme observation, mais les valeurs des variables autres que celles qui identifient l'observation sont diffrentes (par exemple, plusieurs achats effectus par la mme personne ou la mme socit pour des produits diffrents ou des heures diffrentes).

L'identification des observations dupliques vous permet de dfinir la variable duplicate suivant vos besoins et de contrler la dtermination automatique des observations principales par rapport aux observations dupliques.
Pour identifier et reprer les observations dupliques :
E A partir du menu, slectionnez : Donnes Identifier les observations dupliques... E Slectionnez les variables qui identifient les observations concordantes. E Slectionnez des options dans la zone Variables crer.

Sinon, vous pouvez :


E Slectionner des variables pour trier les observations dans des groupes dfinis par les

variables des observations concordantes slectionnes. L'ordre de tri dfini par ces variables dtermine la premire et la dernire observation de chaque groupe. Sinon, l'ordre utilis est celui d'origine du fichier.
E Filtrer automatiquement les observations dupliques afin qu'elles ne soient pas

incluses dans les rapports, les graphiques ou le calcul des statistiques.

126 Chapitre 6 Figure 6-10 Bote de dialogue Identifier les observations dupliques

Dfinir les observations concordantes par : Les observations sont considres

comme tant dupliques lorsque leurs valeurs concordent avec toutes les variables slectionnes. Pour identifier uniquement les observations dont la concordance est gale 100 %, slectionnez toutes les variables.
Trier les groupes concordants par : Les observations sont automatiquement tries par les variables qui dfinissent les observations concordantes. Vous pouvez slectionner d'autres variables de tri qui dtermineront l'ordre des observations dans chaque groupe concordant.

Pour chaque variable de tri, vous pouvez effectuer le tri dans l'ordre croissant ou dcroissant. Si vous slectionnez plusieurs variables de tri, les observations sont tries pour chaque variable au sein des modalits de la variable prcdente dans la liste. Par exemple, si la premire variable de tri slectionne est date et que la deuxime est quantit, les observations sont tries en fonction de la quantit correspondant chaque date.

127 Prparation des donnes

Pour modifier l'ordre de tri des variables, utilisez les boutons flchs Haut et Bas situs droite de la liste. L'ordre de tri dtermine la premire et la dernire observation de chaque groupe concordant, qui dtermine la valeur de la variable indicatrice principale facultative. Par exemple, pour filtrer toutes les observations, l'exception de la plus rcente, dans chaque groupe concordant, vous pouvez trier les observations du groupe dans l'ordre croissant partir d'une variable de date. De cette faon, la date la plus rcente devient la dernire date du groupe.

Indicateur d'observations principales : Cre une variable dont la valeur est 1 pour toutes les observations uniques et pour l'observation identifie comme tant l'observation principale de chaque groupe d'observations concordantes, et 0 pour les observations dupliques non principales de chaque groupe.

En fonction de l'ordre de tri dtermin dans le groupe concordant, l'observation principale peut tre la dernire ou la premire observation de ce groupe. Si vous n'indiquez aucune variable de tri, l'ordre d'origine du fichier dtermine celui des observations dans chaque groupe. Vous pouvez utiliser la variable indicatrice en tant que variable de filtre pour exclure les observations dupliques non principales des rapports et des analyses sans les supprimer du fichier de donnes.

Effectif squentiel des observations concordantes de chaque groupe : Cre une variable

dont la valeur squentielle est comprise entre 1 et n pour les observations de chaque groupe concordant. La squence est base sur l'ordre en cours des observations dans chaque groupe, c'est--dire l'ordre d'origine du fichier ou celui dtermin par les variables de tri indiques.
Dplacer les observations concordantes vers le haut : Trie le fichier de donnes afin

que tous les groupes d'observations concordantes se trouvent au dbut de ce fichier. Le contrle visuel des observations concordantes est ainsi facilit dans l'diteur de donnes.
Afficher les frquences pour les variables cres : Tableaux de frquences indiquant le

nombre d'observations pour chaque valeur des variables cres. Par exemple, pour la variable indicatrice principale, le tableau indique le nombre d'observations dont la valeur est 0 pour cette variable (ce qui indique le nombre d'observations dupliques)

128 Chapitre 6

et le nombre d'observations dont la valeur est 1 pour cette variable (c'est--dire le nombre d'observations uniques et principales).
Valeurs manquantes : Pour les variables numriques, la valeur manquante par dfaut

est traite comme toute autre valeur. Les observations disposant de la valeur manquante par dfaut pour une variable d'identificateur sont traites comme si elles disposaient de valeurs concordantes pour cette variable. Pour les variables chane, les observations ne disposant d'aucune valeur pour une variable d'identificateur sont traites comme si elles disposaient de valeurs concordantes pour cette variable.

Outil visuel de regroupement en bandes


L'outil visuel de regroupement en bandes est conu pour vous aider lors de la cration de variables bases sur le regroupement des valeurs contigus de variables dans un nombre distinct de modalits. L'outil visuel de regroupement en bandes vous permet d'effectuer les oprations suivantes :

Crer des variables qualitatives partir de variables d'chelle continues. Par exemple, vous pouvez utiliser la variable d'chelle Revenu pour crer une variable qualitative contenant les tranches de revenus. Fusionner un grand nombre de modalits ordinales en un jeu de modalits plus petit. Par exemple, vous pouvez fusionner une chelle d'valuation allant jusqu' neuf pour obtenir trois modalits qui reprsenteraient les niveaux faible, moyen et lev.

Dans la premire tape de l'outil visuel de regroupement en bandes, vous pouvez effectuer les oprations suivantes :
E Slectionner l'chelle numrique et/ou les variables ordinales pour lesquelles crer

des variables qualitatives (en bandes).

129 Prparation des donnes Figure 6-11 Premire bote de dialogue permettant de slectionner les variables regrouper en bandes

Vous pouvez galement limiter le nombre d'observations analyser. Pour les fichiers de donnes contenant un grand nombre d'observations, mme si la limitation du nombre d'observations analyses peut permettre de gagner du temps, vitez si possible de procder cette opration car elle risque d'avoir une incidence sur la distribution des valeurs utilises dans les calculs effectus ultrieurement dans l'outil visuel de regroupement en bandes. Remarque : Les variables chane et les variables numriques nominales ne sont pas affiches dans la liste des variables source. L'outil visuel de regroupement en bandes requiert l'utilisation de variables numriques qui sont mesures sur une chelle ou au niveau ordinal. En effet, l'outil considre que les valeurs de donnes reprsentent un ordre logique qui peut servir regrouper les valeurs de manire significative. Vous pouvez modifier le niveau de mesure dfini d'une variable dans la vue Variable de l'diteur de donnes. Pour plus d'informations, reportez-vous Niveau de mesure des variables dans Chapitre 5 , page 85.

130 Chapitre 6

Pour regrouper les variables en bandes


E A partir des menus de la fentre de l'diteur de donnes, slectionnez : Transformer Outil visuel de regroupement en bandes : E Slectionner l'chelle numrique et/ou les variables ordinales pour lesquelles crer

des variables qualitatives (en bandes).


E Slectionnez une variable dans la zone Liste des variables analyses. E Entrez le nom de la nouvelle variable regroupe en bandes. Les noms de variable

doivent tre uniques et conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 , page 84.
E Dfinissez les critres de regroupement en bandes de la nouvelle variable. Pour plus

d'informations, reportez-vous Regroupement de variables en bandes , page 131.


E Cliquez sur OK.

131 Prparation des donnes

Regroupement de variables en bandes


Figure 6-12 Bote de dialogue principale de l'outil visuel de regroupement en bandes

La bote de dialogue principale de l'outil visuel de regroupement en bandes fournit les informations suivantes concernant les variables analyses :
Liste des variables analyses : Affiche les variables slectionnes dans la premire

bote de dialogue. Vous pouvez trier la liste par niveau de mesure (chelle ou ordinal), par tiquette de variable ou par nom. Pour ce faire, cliquez sur les titres de colonne.
Observations analyses : Indique le nombre d'observations analyses. Toutes les

observations analyses dont la variable slectionne ne prsente aucune valeur manquante par dfaut ou utilisateur sont utilises pour gnrer la distribution des valeurs servant aux calculs effectus dans l'outil visuel de regroupement en bandes, y compris l'histogramme affich dans la bote de dialogue principale et les divisions bases sur les centiles ou les carts types.

132 Chapitre 6

Valeurs manquantes : Indique le nombre d'observations analyses contenant des

valeurs manquantes par dfaut et spcifies par l'utilisateur. Les valeurs manquantes ne sont incluses dans aucune modalit regroupe en bandes. Pour plus d'informations, reportez-vous Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes , page 139.
Variable actuelle : Nom et tiquette (si disponible) de la variable slectionne, qui

seront utiliss comme base pour les nouvelles variables regroupes en bandes.
Variable regroupe en bandes : Nom et tiquette facultative de la nouvelle variable

regroupe en bandes.

Nom : Vous devez entrer le nom de la nouvelle variable. Les noms de variable

doivent tre uniques et conformes aux rgles de dnomination de variables SPSS. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 , page 84.

Etiquette : Vous pouvez entrer une tiquette de variable descriptive contenant

jusqu' 255 caractres. L'tiquette de variable par dfaut est l'tiquette (si disponible) ou le nom de la variable source, suivi de la mention (Regroup en bandes).
Minimum et Maximum : Valeurs minimales et maximales de la variable slectionne,

bases sur les observations analyses et n'incluant pas de valeurs dfinies en tant que valeurs manquantes spcifies par l'utilisateur.
Valeurs non manquantes : L'histogramme affiche la distribution des valeurs non

manquantes pour la variable slectionne, base sur les observations analyses.

Une fois que vous avez dfini les bandes de la nouvelle variable, les lignes verticales de l'histogramme apparaissent afin d'indiquer les divisions dfinissant ces bandes. Vous pouvez cliquer sur les lignes de division, puis les dplacer vers diffrents emplacements de l'histogramme, sans changer les intervalles de bandes. Vous pouvez supprimer les bandes en faisant glisser les lignes de division hors de l'histogramme.

Remarque : L'histogramme (affichant les valeurs non manquantes), et les valeurs minimales et maximales sont bass sur les valeurs analyses. Si vous n'incluez pas toutes les observations dans l'analyse, vous risquez de ne pas obtenir une distribution

133 Prparation des donnes

prcise et reprsentative, surtout si le fichier de donnes a t tri par la variable slectionne. Si vous n'analysez pas d'observations, aucune information sur la distribution des valeurs n'est disponible.
Grille : Affiche les valeurs qui dfinissent les extrema suprieurs de chaque bande et

les tiquettes de valeur facultatives de chaque bande.

Valeur : Valeurs qui dfinissent les extrema suprieurs de chaque bande. Vous

pouvez entrer des valeurs ou utiliser l'option Crer des divisions pour crer automatiquement des bandes en fonction des critres slectionns. Par dfaut, une division dont la valeur est ELEVE est automatiquement incluse. Cette bande contient alors toutes les valeurs non manquantes situes au-dessus des autres divisions. La bande dfinie par la division la moins leve inclut toutes les valeurs non manquantes infrieures ou gales cette valeur (ou simplement infrieures cette valeur, en fonction de la dfinition des extrema suprieurs).

Etiquettes : Etiquettes descriptives facultatives pour les valeurs de la nouvelle

variable regroupe en bandes. Etant donn que les valeurs de la nouvelle variable sont des valeurs entires squentielles comprises entre 1 et n, les tiquettes dcrivant les valeurs peuvent se rvler trs utiles. Vous pouvez entrer les tiquettes de valeur ou utiliser l'option Crer des tiquettes pour les crer automatiquement.
Pour supprimer une bande de la grille :
E Cliquez avec le bouton droit de la souris sur la cellule Valeur ou Etiquette de la bande. E Dans le menu contextuel, slectionnez Supprimer la ligne.

Remarque : Si vous supprimez la bande ELEVE, la valeur par dfaut manquante de la nouvelle variable est attribue toutes les observations dont les valeurs sont suprieures celle de la dernire division spcifie.
Pour supprimer toutes les tiquettes ou toutes les bandes dfinies :
E Cliquez avec le bouton droit n'importe o dans la grille. E Dans le menu contextuel, slectionnez Supprimer toutes les tiquettes ou Supprimer toutes les divisions.

134 Chapitre 6

Extrema suprieurs : Contrle le traitement des valeurs des extrema suprieurs saisies

dans la colonne Valeur de la grille.

Inclus (<=) : Les observations contenant la valeur spcifie dans la cellule Valeur

sont incluses dans la modalit regroupe en bandes. Par exemple, si vous spcifiez les valeurs 25, 50 et 75, les observations dont la valeur est 25 seront places dans la premire bande. En effet, cette bande inclut les observations dont les valeurs sont infrieures ou gales 25.

Exclu (<) : Les observations contenant la valeur spcifie dans la cellule Valeur

ne sont pas incluses dans la modalit regroupe en bandes. Elles sont incluses dans la bande suivante. Par exemple, si vous spcifiez les valeurs 25, 50 et 75, les observations dont la valeur est 25 seront places dans la seconde bande. En effet, la premire bande inclut uniquement les observations dont les valeurs sont infrieures 25.
Crer des divisions : Gnre automatiquement des modalits regroupes en bandes pour les intervalles de longueur identique, les intervalles avec le mme nombre d'observations ou les intervalles bass sur les carts types. Cette option n'est disponible que si vous analysez au moins une observation. Pour plus d'informations, reportez-vous Gnration automatique de modalits regroupes en bandes , page 135. Crer des tiquettes : Gnre des tiquettes descriptives pour les valeurs entires

squentielles de la nouvelle variable regroupe en bandes, bases sur les valeurs se trouvant dans la grille et le traitement des extrema suprieurs (inclus ou exclus).
Inverser l'chelle : Par dfaut, les valeurs de la nouvelle variable regroupe en bandes

sont des valeurs entires squentielles croissantes comprise entre 1 et n. Inversez l'chelle pour que ces valeurs deviennent des entiers squentiels dcroissants compris entre n et 1.
Copier les bandes : Vous pouvez copier les spcifications de regroupement partir

d'une variable vers la variable slectionne ou partir de la variable slectionne vers d'autres variables. Pour plus d'informations, reportez-vous Copie de modalits regroupes en bandes , page 137.

135 Prparation des donnes

Gnration automatique de modalits regroupes en bandes


La bote de dialogue Crer des divisions vous permet de gnrer automatiquement les modalits regroupes en bandes en fonction des critres slectionns.
Pour utiliser la bote de dialogue Crer des divisions :
E Dans la zone Liste des variables analyses, slectionnez une variable en cliquant

dessus.
E Cliquez sur Crer des divisions. E Slectionnez les critres de gnration des divisions, qui dfinira les modalits

regroupes en bandes.
E Cliquez sur Appliquer. Figure 6-13 Bote de dialogue Crer des divisions

136 Chapitre 6

Remarque : La bote de dialogue Crer des divisions n'est disponible que si vous avez analys des observations.
Intervalles de longueur identique : Gnre des modalits regroupes en bandes de

longueur identique (par exemple, 110, 1120, 2130, etc.) en fonction de deux des trois critres suivants :

Emplacement de la premire division : Valeur qui dfinit la limite suprieure de la

modalit regroupe en bandes la moins leve (par exemple, la valeur 10 indique un intervalle comprenant toutes les valeurs jusqu' 10).

Nombre de divisions : Le nombre de modalits regroupes en bandes correspond

au nombre de divisions, plus 1. Par exemple, 9 divisions gnrent 10 modalits regroupes en bandes.

Largeur : Longueur de chaque intervalle. Par exemple, la valeur 10 regroupe les

donnes d'ge en annes par intervalles de 10 ans.


Centiles gaux fonds sur les observations analyses : Gnre des modalits regroupes

en bandes avec un nombre d'observations identique dans chaque bande ( l'aide de l'algorithme empirique pour les centiles), en fonction de l'un des critres suivants :
Nombre de divisions : Le nombre de modalits regroupes en bandes correspond au

nombre de divisions, plus 1. Par exemple, trois divisions gnrent quatre bandes de centiles (quartiles), chacune contenant 25 % des observations.

Largeur (%) : Longueur de chaque intervalle, exprime en pourcentage du

nombre total des observations. Par exemple, la valeur 33,3 gnrerait trois modalits regroupes en bandes (deux divisions), chacune contenant 33,3 % des observations. Si la variable source comporte peu de valeurs distinctes ou de nombreuses observations ayant la mme valeur, vous risquez d'obtenir un nombre de bandes infrieur celui requis.
Divisions au niveau de la moyenne et des carts types slectionns, fondes sur les observations analyses : Gnre des modalits regroupes en bandes bases sur les

valeurs de la moyenne et de l'cart type de la distribution de la variable.

137 Prparation des donnes Si vous ne slectionnez pas les intervalles d'carts types, deux modalits regroupes

en bandes sont cres, la moyenne tant utilise comme division entre les bandes.
Vous pouvez slectionner n'importe quelle combinaison d'intervalles d'carts types

en utilisant un, deux et/ou trois carts types. Par exemple, si vous slectionnez les trois, huit modalits regroupes en bandes sont cres : six bandes dans un intervalle d'carts types, et deux bandes pour les observations suprieures ou infrieures la moyenne de plus de trois carts types. Dans une distribution normale, 68 % des observations sont comprises dans un cart type de la moyenne, 95 %, dans deux carts types et 99 % dans trois carts types. Si la cration de modalits regroupes en bandes est base sur les carts types, certaines bandes dfinies risquent de se retrouver hors de l'intervalle de donnes rel, voire hors de l'intervalle des valeurs possibles (par exemple, un intervalle de salaires ngatif). Remarque : Les calculs de centiles et d'carts types reposent sur les observations analyses. Si vous limitez le nombre d'observations analyses, les bandes obtenues risquent de ne pas contenir la proportion d'observations souhaite, en particulier si le fichier de donnes est tri par variable source. Par exemple, si vous limitez l'analyse aux 100 premires observations d'un fichier de donnes contenant 1 000 observations et que ce fichier de donnes est tri dans l'ordre croissant de l'ge des rpondants, vous n'obtiendrez pas quatre bandes d'ge en centiles contenant 25 % des observations, mais plutt trois bandes contenant chacune 3,3 % des observations et une quatrime en contenant 90 %.

Copie de modalits regroupes en bandes


Si vous souhaitez crer des modalits regroupes en bandes pour plusieurs variables, vous pouvez copier les spcifications du regroupement partir d'une variable vers la variable slectionne ou partir de la variable slectionne vers plusieurs variables.

138 Chapitre 6 Figure 6-14 Copie de bandes partir de ou vers la variable actuelle

Pour copier les spcifications de regroupement en bandes :


E Dfinissez des modalits regroupes en bandes pour une variable au moins (ne cliquez pas sur OK ni sur Coller). E Dans la zone Liste des variables analyses, cliquez sur une variable pour laquelle

vous avez dfini des modalits regroupes en bandes.


E Cliquez sur Vers d'autres variables. E Slectionnez les variables pour lesquelles crer des variables ayant les mmes

modalits regroupes en bandes.


E Cliquez sur Copier.

ou
E Dans la zone Liste des variables analyses, cliquez sur la variable vers laquelle copier

les modalits regroupes en bandes concernes.


E Cliquez sur A partir d'une autre variable.

139 Prparation des donnes E Slectionnez la variable avec les modalits regroupes en bandes dfinies copier. E Cliquez sur Copier.

Si vous avez spcifi des tiquettes de valeur pour la variable partir de laquelle vous copiez les spcifications de regroupement, ces tiquettes sont galement copies. Remarque : Une fois que vous avez cliqu sur OK dans la bote de dialogue principale de l'outil visuel de regroupement en bandes pour crer les variables regroupes en bandes (ou que vous avez ferm cette bote de dialogue d'une autre manire), vous ne pouvez pas utiliser cet outil pour copier les modalits regroupes en bandes vers d'autres variables.

Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes


Les valeurs dfinies comme valeurs manquantes spcifies par l'utilisateur (valeurs identifies comme codes pour les donnes manquantes) pour la variable source ne sont pas incluses dans les modalits regroupes en bandes de la nouvelle variable. Les valeurs manquantes utilisateur des variables source sont copies en tant que telles pour la nouvelle variable. Toutes les tiquettes de valeur dfinies pour les codes de valeur manquante sont galement copies. Si un code de valeur manquante est en conflit avec l'une des valeurs de modalit regroupe en bandes pour la nouvelle variable, le code de la valeur manquante de cette nouvelle variable est modifi : 100 est ajout la valeur la plus leve de la modalit regroupe en bandes. Par exemple, si la valeur 1 est dfinie comme valeur manquante utilisateur de la variable source et que la nouvelle variable comporte six modalits regroupes en bandes, la valeur 106 de la nouvelle variable vient remplacer la valeur 1 de la variable source pour toutes les observations. Cette valeur devient alors la nouvelle valeur manquante spcifie par l'utilisateur. Si la valeur manquante utilisateur de la variable source comporte une tiquette de valeur dfinie, cette dernire est utilise comme tiquette pour la valeur recode de la nouvelle variable. Remarque : Si la variable source comporte un intervalle dfini de valeurs manquantes utilisateur sous la forme LO-n (n tant un nombre positif), les valeurs manquantes utilisateur correspondantes de la nouvelle variable sont des nombres ngatifs.

Chapitre

Transformations de donnes

Dans une situation idale, vos donnes brutes conviennent parfaitement pour le type d'analyse que vous dsirez effectuer, et toute relation entre les variables est soit linaire soit orthogonale. Malheureusement, c'est rarement le cas. L'analyse prliminaire peut rvler des schmas de codage peu pratiques ou des erreurs de codage, ou des transformations de donnes peuvent s'avrer ncessaires pour dterminer la vritable relation entre les variables. SPSS vous permet d'effectuer des transformations de donnes simples, comme la fusion de modalits pour une analyse, ou des tches plus volues, comme la cration de nouvelles variables bases sur des quations complexes et des instructions conditionnelles.

Calcul de variables
Calculer la variable calcule les valeurs d'une variable en fonction des transformations numriques d'autres variables.

Vous pouvez calculer les valeurs de variables numriques ou sous forme de chane de caractres (alphanumrique). Vous pouvez crer de nouvelles variables ou remplacer les valeurs de variables existantes. Dans le cas de nouvelles variables, vous pouvez aussi spcifier le type et l'tiquette. Vous pouvez calculer les valeurs de manire slective pour des sous-ensembles de donnes en fonction de conditions logiques. Vous pouvez utiliser plus de 70 fonctions intgres, dont des fonctions arithmtiques, statistiques, de distribution, et de chane.

141

142 Chapitre 7 Figure 7-1 Bote de dialogue Calculer la variable

Pour calculer des variables


E A partir du menu, slectionnez : Transformer Calculer... E Entrez le nom d'une seule variable cible. Il peut s'agir d'une variable existante ou

d'une nouvelle variable ajouter au fichier de travail.


E Pour construire une expression, vous pouvez soit coller les composants dans le champ

Expression, soit les saisir directement depuis le clavier.


Collez les fonctions depuis la liste des fonctions et renseignez les paramtres indiqus par des points d'interrogation. Les constantes alphanumriques doivent tre prsentes entre guillemets ou apostrophes.

143 Transformations de donnes

Les constantes numriques doivent tre saisies en format amricain, le point (.) servant de sparateur dcimal. Pour les nouvelles variables chane, vous devez aussi slectionner Type & tiquette pour spcifier le type de donnes.

Transformations conditionnelles
La bote de dialogue Si... (Expressions conditionnelles) vous permet d'appliquer les transformations de donnes des sous-ensembles d'observations slectionnes, au moyen d'expressions conditionnelles. Une expression conditionnelle renvoie la valeur True (vrai), False (faux) ou manquant pour chaque observation.

Si le rsultat d'une expression conditionnelle est True (vrai), la transformation est applique l'observation. Si le rsultat d'une expression conditionnelle est False (faux) ou manquant, la transformation n'est pas applique l'observation. La plupart des expressions conditionnelles utilisent un ou plus des six oprateurs relationnels (<, >, <=, >=, = et ~=) du pav numrique. Ces expressions conditionnelles peuvent comprendre des noms de variable, des constantes, des oprateurs arithmtiques, des fonctions, numriques ou non, des variables logiques et des oprateurs relationnels.

144 Chapitre 7 Figure 7-2 Bote de dialogue Calculer la variable : si les observations

Calculer la variable : Type et tiquette


Par dfaut, les nouvelles variables calcules sont numriques. Pour calculer une nouvelle variable chane, vous devez spcifier le type de donnes et sa longueur.
Etiquette : Etiquette de variable facultative et descriptive jusqu' 120 caractres. Vous pouvez entrer une tiquette ou utiliser les 110 premiers caractres de l'expression de calcul comme tiquette. Type : Les variables calcules peuvent tre numriques ou alphanumriques. Les

variables chane ne peuvent tre utilises dans des calculs.

145 Transformations de donnes Figure 7-3 Bote de dialogue Calculer la variable : Type et tiquette

Fonctions
Plusieurs types de fonctions sont prises en charge, y compris :

Fonctions arithmtiques Fonctions statistiques Fonctions sur chanes les fonctions date et heure Fonctions de distribution les fonctions de variable alatoire les fonctions de valeur manquante

Recherchez les fonctions dans l'index de l'aide en ligne pour obtenir la liste complte des fonctions. Cliquez avec le bouton droit de la souris sur une fonction slectionne dans la liste pour en afficher la description.

Valeurs manquantes dans les fonctions


Les fonctions et les expressions arithmtiques simples traitent les valeurs manquantes de manire diffrente. Dans l'expression :
(var1+var2+var3)/3

le rsultat est manquant s'il manque une valeur dans l'une des trois variables d'une observation.

146 Chapitre 7

Dans l'expression :
MEAN(var1, var2, var3)

le rsultat ne manque que si les valeurs des trois variables manquent dans l'observation. Pour les fonctions statistiques, vous pouvez spcifier le nombre minimal d'arguments ne comportant pas de valeurs manquantes. Pour ce faire, tapez un point et le nombre minimal aprs le nom de la fonction, comme suit :
MEAN.2(var1, var2, var3)

Gnrer des nombres alatoires


Le gnrateur fixe une valeur spcifique le nombre alatoire utilis, pour vous permettre de reproduire une squence de nombres alatoires. Le nombre alatoire change chaque fois qu'un nombre alatoire est gnr pour tre utilis dans des transformations (comme les fonctions UNIFORM et NORMAL), un chantillonnage alatoire ou une pondration d'observation. Pour rpliquer une squence de nombres alatoires, utilisez cette bote de dialogue pour rinitialiser le gnrateur une valeur spcifique avant chaque analyse utilisant les nombres alatoires.
Figure 7-4 Bote de dialogue Gnrer des nombres alatoires

Le nombre alatoire est automatiquement rinitialis 2 000 000 chaque fois que vous dmarrez une nouvelle session SPSS.

147 Transformations de donnes

Pour dfinir la gnration de donnes alatoires


E A partir du menu, slectionnez : Transformer Gnrer des nombres alatoires... E Slectionnez Dfinir le gnrateur . E Entrez un entier positif compris entre 1 et 2.000.000.000.

Compter occurrences des valeurs par observation


Cette bote de dialogue cre une variable qui compte les occurrences des mmes valeurs dans une liste de variables pour chaque observation. Par exemple, une enqute peut comporter une liste de magazines avec des cases cocher oui/non pour indiquer les magazines lus par chaque rpondant. Vous pourriez compter le nombre de rponses oui pour chaque rpondant et crer une nouvelle variable contenant le nombre total de magazines lus.
Figure 7-5 Bote de dialogue Compter occurrences des valeurs par observation

148 Chapitre 7

Pour compter les occurrences de valeurs par observations


E A partir du menu, slectionnez : Transformer Compter... E Entrez le nom d'une variable cible. E Slectionnez deux ou plusieurs variables du mme type (numrique ou

alphanumrique).
E Cliquez sur Dfinir les valeurs et spcifiez les valeurs compter.

En option, vous pouvez dfinir un sous-ensemble d'observations dont il faut compter les occurrences de valeurs. La bote de dialogue Si... (Expression conditionnelle) pour la dfinition de sous-ensembles d'observations est la mme que celle dcrite pour Calculer la variable.

Compter les occurrences des valeurs par observations : Valeurs compter


La valeur de la variable cible (dans la bote de dialogue principale) est incrmente d'une unit chaque fois que l'une des variables slectionnes correspond une spcification dans la liste Valeurs compter. Si une observation correspond plusieurs spcifications pour une variable quelconque, la variable cible est incrmente plusieurs fois pour cette variable. Les spcifications de valeurs peuvent inclure des valeurs individuelles, des valeurs manquantes ou manquantes par dfaut, et des intervalles. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans l'intervalle.

149 Transformations de donnes Figure 7-6 Bote de dialogue Compter occurrences des valeurs par observation : Valeurs compter

Recodage de valeurs
Vous pouvez modifier les valeurs de donnes en les recodant. Ceci est particulirement utile pour fusionner des modalits ou les combiner. Vous pouvez recoder les valeurs l'intrieur de variables existantes ou crer des variables sur la base des valeurs recodes de variables existantes.

Recodage de variables
Le recodage dans les mmes variables raffecte les valeurs de variables existantes ou fusionne des intervalles de valeurs existantes dans de nouvelles valeurs. Par exemple, vous pourriez fusionner des salaires dans des modalits d'intervalles de salaires. Vous pouvez recoder des variables numriques et chane. Si vous slectionnez plusieurs variables, elles doivent toutes tre du mme type. Vous ne pouvez pas recoder ensemble des variables numriques et chane.

150 Chapitre 7 Figure 7-7 Bote de dialogue Recodage de variables

Pour recoder les valeurs d'une variable


E A partir du menu, slectionnez : Transformer Recode Recodage de variables... E Slectionnez les variables que vous dsirez recoder. Si vous slectionnez plusieurs

variables, elles doivent tre du mme type (numrique ou alphanumrique).


E Cliquez sur Anciennes et nouvelles valeurs et spcifiez comment recoder les valeurs.

En option, vous pouvez dfinir un sous-ensemble d'observations recoder. La bote de dialogue Si... (Expression conditionnelle) pour la dfinition de sous-ensembles d'observations est la mme que celle dcrite pour Calculer la variable.

Recodage de variables : Anciennes et nouvelles valeurs


Vous pouvez dfinir les valeurs recoder dans cette bote de dialogue. Toutes les spcifications de valeurs doivent tre du mme type de donnes (numrique ou alphanumrique) que les variables slectionnes dans la bote de dialogue principale.

151 Transformations de donnes

Ancienne valeur : Valeurs recoder. Vous pouvez recoder des valeurs uniques, des intervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par dfaut et les intervalles ne peuvent tre slectionns pour des variables chane, car aucun de ces concepts ne s'applique ce type de variable. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans l'intervalle.

Valeur : Les anciennes valeurs individuelles doivent tre recodes par de nouvelles

valeurs. La valeur doit tre du mme type de donnes (numrique ou chane) que la variable que vous recodez.
Manquant par dfaut : Valeurs affectes par le programme lorsque certaines valeurs

de vos donnes sont non dfinies d'aprs le type de format spcifi, lorsqu'un champ numrique est vide ou lorsqu'une valeur rsultant d'une commande de transformation n'est pas dfinie. Les valeurs manquantes par dfaut numriques sont affiches sous forme de points. Les variables chane ne peuvent pas comporter de valeurs manquantes par dfaut, puisqu'elles acceptent tous les caractres.

Manquante par dfaut ou spcifie : Observations comportant des valeurs dfinies

comme valeurs manquantes par dfaut, ou comportant des valeurs inconnues et auxquelles ont t attribues des valeurs par dfaut, comme l'indique le point (.).

Plage : Intervalle de valeurs inclusif. Non disponible pour les variables de

chane. Les valeurs manquantes spcifies comprises dans l'intervalle sont prises en compte.

Toutes les autres valeurs : Toute autre valeur non incluse dans l'une des

spcifications de la liste Ancienne-Nouvelle. Apparat sous l'intitul ELSE dans la liste Ancienne-Nouvelle.
Nouvelle valeur : Valeur unique en laquelle chaque ancienne valeur ou intervalle de

valeurs est recod. Vous pouvez entrer une valeur ou la valeur manquante par dfaut.

Valeur : Valeur dans laquelle une ou plusieurs valeurs anciennes devront tre

recodes. La valeur doit tre du mme type de donnes (numrique ou chane) que l'ancienne variable.

Manquant par dfaut : Recode les anciennes valeurs spcifies en valeurs

manquantes par dfaut. Les valeurs manquantes par dfaut ne sont pas utilises dans les calculs, et les observations avec des valeurs manquantes par dfaut sont exclues de nombreuses procdures. Non disponible pour les variables de chane.

152 Chapitre 7

Ancienne>Nouvelle : Liste les spcifications qui seront utilises pour recoder la ou les variables. Vous pouvez ajouter, modifier et supprimer des spcifications dans la liste. La liste est trie automatiquement, en fonction de la spcification de l'ancienne valeur, selon l'ordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutes les autres valeurs. Si vous changez une spcification de recodage dans la liste, SPSS trie de nouveau la liste automatiquement, si ncessaire, pour conserver cet ordre.
Figure 7-8 Bote de dialogue Anciennes et nouvelles valeurs

Cration de variables
Recoder dans des variables diffrentes (cration de variables) raffecte les valeurs des variables existantes ou fusionne les intervalles de valeurs existantes en de nouvelles valeurs pour une nouvelle variable. Par exemple, vous pourriez fusionner les salaires en une nouvelle variable contenant des modalits d'intervalles de salaires.

Vous pouvez recoder des variables numriques et chane. Vous pouvez recoder des variables numriques en variables chane et inversement. Si vous slectionnez plusieurs variables, elles doivent toutes tre du mme type. Vous ne pouvez pas recoder ensemble des variables numriques et chane.

153 Transformations de donnes Figure 7-9 Bote de dialogue Recoder et crer de nouvelles variables

Pour recoder les valeurs d'une variable dans une nouvelle variable
E A partir du menu, slectionnez : Transformer Recode Cration de variables... E Slectionnez les variables que vous dsirez recoder. Si vous slectionnez plusieurs

variables, elles doivent tre du mme type (numrique ou alphanumrique).


E Entrez un nom de variable de rsultat (nouveau) pour chaque nouvelle variable, puis cliquez sur Remplacer. E Cliquez sur Anciennes et nouvelles valeurs et spcifiez comment recoder les valeurs.

En option, vous pouvez dfinir un sous-ensemble d'observations recoder.

Recoder et crer de nouvelles variables : Anciennes et nouvelles valeurs


Vous pouvez dfinir les valeurs recoder dans cette bote de dialogue.

154 Chapitre 7

Ancienne valeur : Valeurs recoder. Vous pouvez recoder des valeurs uniques, des intervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par dfaut et les intervalles ne peuvent tre slectionns pour des variables chane, car aucun de ces concepts ne s'applique ce type de variable. Les anciennes valeurs doivent tre du mme type de donnes (numrique ou alphanumrique) que la variable d'origine. Les limites comprennent leurs extrmes et toute valeur manquante spcifie figurant dans l'intervalle.

Valeur : Les anciennes valeurs individuelles doivent tre recodes par de nouvelles

valeurs. La valeur doit tre du mme type de donnes (numrique ou chane) que la variable que vous recodez.
Manquant par dfaut : Valeurs affectes par le programme lorsque certaines valeurs

de vos donnes sont non dfinies d'aprs le type de format spcifi, lorsqu'un champ numrique est vide ou lorsqu'une valeur rsultant d'une commande de transformation n'est pas dfinie. Les valeurs manquantes par dfaut numriques sont affiches sous forme de points. Les variables chane ne peuvent pas comporter de valeurs manquantes par dfaut, puisqu'elles acceptent tous les caractres.

Manquante par dfaut ou spcifie : Observations comportant des valeurs dfinies

comme valeurs manquantes par dfaut, ou comportant des valeurs inconnues et auxquelles ont t attribues des valeurs par dfaut, comme l'indique le point (.).

Plage : Intervalle de valeurs inclusif. Non disponible pour les variables de

chane. Les valeurs manquantes spcifies comprises dans l'intervalle sont prises en compte.

Toutes les autres valeurs : Toute autre valeur non incluse dans l'une des

spcifications de la liste Ancienne-Nouvelle. Apparat sous l'intitul ELSE dans la liste Ancienne-Nouvelle.
Nouvelle valeur : Valeur unique en laquelle chaque ancienne valeur ou intervalle

de valeurs est recod. Les nouvelles valeurs peuvent tre numriques ou alphanumriques.

Valeur : Valeur dans laquelle une ou plusieurs valeurs anciennes devront tre

recodes. La valeur doit tre du mme type de donnes (numrique ou chane) que l'ancienne variable.

155 Transformations de donnes

Manquant par dfaut : Recode les anciennes valeurs spcifies en valeurs

manquantes par dfaut. Les valeurs manquantes par dfaut ne sont pas utilises dans les calculs, et les observations avec des valeurs manquantes par dfaut sont exclues de nombreuses procdures. Non disponible pour les variables de chane.

Copier les anciennes valeurs : Conserve les anciennes valeurs. Si certaines

valeurs n'ont pas besoin d'tre recodes, utilisez cette option pour inclure les anciennes valeurs. Toute ancienne valeur non spcifie n'est pas incluse dans la nouvelle variable, et les observations avec ces valeurs se verront affecter la valeur manquante par dfaut de la nouvelle variable.
Variables destination sont des chanes : Dfinit la nouvelle variable recode comme

une variable chane (alphanumrique). L'ancienne variable peut tre numrique ou chane.
Convertir les chanes numriques en nombres : Convertit les variables de chane contenant des chiffres en valeurs numriques. Les chanes de caractres contenant autre chose que des nombres et des signes (+ ou -) sont considres comme des valeurs manquantes par dfaut. Ancienne>Nouvelle : Liste les spcifications qui seront utilises pour recoder la ou

les variables. Vous pouvez ajouter, modifier et supprimer des spcifications dans la liste. La liste est trie automatiquement, en fonction de la spcification de l'ancienne valeur, selon l'ordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutes les autres valeurs. Si vous changez une spcification de recodage dans la liste, SPSS trie de nouveau la liste automatiquement, si ncessaire, pour conserver cet ordre.
Figure 7-10 Bote de dialogue Anciennes et nouvelles valeurs

156 Chapitre 7

Ordonner les observations


Ordonner les observations cre de nouvelles variables contenant des rangs, des scores normaux et de Savage et des valeurs de centiles pour les variables numriques. De nouveaux noms de variables et des tiquettes de variable descriptives sont automatiquement gnres par SPSS, en fonction du nom d'origine de la variable et des mesures slectionnes. Un tableau rcapitulatif liste les variables d'origine, les nouvelles variables et les tiquettes de variable. Sinon, vous pouvez :

Ordonner les observations en ordre croissant ou dcroissant. Sparez les rangs en sous-groupes en slectionnant des variables de regroupement pour la liste Par. Les rangs sont calculs l'intrieur de chaque groupe. Les groupes sont dfinis par combinaison des valeurs des variables de regroupement. Par exemple, si vous slectionnez sexe et minorit comme variables de regroupement, les rangs seront calculs pour chaque combinaison de sexe et minorit.

Figure 7-11 Bote de dialogue Ordonner les observations...

157 Transformations de donnes

Pour ordonner les observations


E A partir du menu, slectionnez : Transformer Ordonner les observations... E Slectionnez des variables ordonner. Vous ne pouvez ordonner que des variables

numriques. En option, vous pouvez ordonner les observations en ordre croissant ou dcroissant et sparer les rangs en sous-groupes.

Ordonner les observations : Types (de rangs)


Vous pouvez slectionner plusieurs mthodes d'ordonnancement. Une variable d'ordonnancement distincte est cre pour chaque mthode. Les mthodes d'ordonnancement comprennent les rangs simples, les scores de Savage, les rangs fractionnaires et les centiles. Vous pouvez aussi crer des ordonnancements bass sur des estimations de la proportion et des scores normaux.
Rang : Rang simple. La valeur de la nouvelle variable est gale son rang. Score de Savage : La nouvelle variable contient des scores de Savage reposant sur

une distribution exponentielle.


Rang fractionnaire : La valeur de la nouvelle variable est gale au rang divis par la somme des pondrations des observations non manquantes. Rang en pourcentage : Chaque rang est divis par le nombre d'observations ayant

des valeurs valides et multipli par 100.


Somme des poids : La valeur de la nouvelle variable est gale la somme des

pondrations d'observation. La nouvelle variable est une constante pour toutes les observations du mme groupe.
Fractiles : Les rangs sont bass sur des groupes de centiles, chaque groupe contenant peu prs le mme nombre d'observations. Par exemple, une spcification de 4 fractiles affectera une valeur de 1 aux observations infrieures au 25e centile, de 2 celles situes entre les 25e et 50e centiles, de 3 celles situes entre les 50e et 75e centiles, et de 4 celles suprieures au 75e centile.

158 Chapitre 7

Estimations de la proportion : Estimations de la proportion cumule de la distribution correspondant un rang particulier. Scores normaux : Ecarts z correspondant la proportion cumule estime. Formule d'estimation d'une proportion : Pour les estimations de la proportion et les scores normaux, vous pouvez slectionner la formule d'estimation d'une proportion : Blom, Tukey, Rankit ou Van der Waerden.

Blom : Cre une variable d'ordonnancement sur la base des estimations de la

proportion, qui utilise la formule (r-3/8) / (w+1/4), o r est le rang et w la somme des pondrations d'observation.

Tukey : Utilise la formule (r-1/3) / (w+1/3), dans laquelle r est le rang et w la

somme des pondrations d'observation.


Rankit : Utilise la formule (r-1/2) / w, w reprsentant le nombre d'observations

et r le rang, de 1 w.
Van der Waerden : Transformation de Van der Waerden, dfinie par la formule

r/(w+1), dans laquelle w est la somme des pondrations d'observation et r le rang, compris entre 1 et w.
Figure 7-12 Bote de dialogue Ordonner les observations : Types

Ordonner les observations : Ex aequo


Cette bote de dialogue dtermine la mthode d'affectation pour ordonner les observations ayant la mme valeur que la variable d'origine.

159 Transformations de donnes Figure 7-13 Bote de dialogue Ordonner les observations : Ex aequo

Le tableau suivant montre comment les diffrentes mthodes affectent des rangs des valeurs ex aequo.

Recoder automatiquement
Le recodage automatique convertit les valeurs numriques et les valeurs alphanumriques en entiers conscutifs. Lorsque les codes de modalit ne sont pas squentiels, les cellules vides qui en rsultent rduisent les performances et augmentent les besoins en mmoire de nombreuses procdures SPSS. De plus, certaines procdures ne peuvent utiliser des variables chane, et certaines ont besoin de valeurs entires conscutives pour les niveaux de facteurs.

160 Chapitre 7 Figure 7-14 Bote de dialogue Recoder automatiquement...

Les nouvelles variables cres par le Recodage automatique conservent toute variable dfinie et les tiquettes de valeurs de l'ancienne variable. Pour toute valeur sans tiquette de dfinition de valeur, la valeur d'origine est utilise comme tiquette pour la valeur recode. Un tableau affiche les anciennes et les nouvelles valeurs et les tiquettes de valeurs. Les valeurs de chane sont recodes dans l'ordre alphabtique, les majuscules prcdant leurs quivalents minuscules. Les valeurs manquantes sont recodes en valeurs manquantes suprieures toutes valeurs non manquantes, en conservant leur ordre. Par exemple, si la variable d'origine comporte 10 valeurs non manquantes, la valeur manquante la plus faible serait recode en 11 et la valeur 11 serait une valeur manquante pour la nouvelle variable.

Pour recoder des variables numriques ou alphanumriques en nombres entiers conscutifs


E A partir du menu, slectionnez : Transformer Recoder automatiquement E Slectionnez des variables recoder. E Pour chaque variable slectionne, entrez un nom pour la nouvelle variable, puis cliquez sur Nouveau nom.

161 Transformations de donnes

Transformation de donnes pour srie chronologique


Plusieurs transformations de donnes utiles pour les analyses de sries chronologiques sont fournies :

Gnration de variables de date pour tablir une priodicit, et faire la distinction entre les priodes historiques, de validation et de prvision. Cration de nouvelles variables de sries chronologiques sous forme de fonctions de variables de sries chronologiques existantes. Remplacement des valeurs manquantes spcifies et des valeurs manquantes par dfaut par des estimations bases sur une mthode parmi plusieurs.

Une srie chronologique est obtenue par mesure rgulire d'une variable (ou d'un groupe de variables) sur une certaine priode. Les transformations de donnes de sries chronologiques exigent une structure de fichier de donnes dans laquelle chaque ligne reprsente un groupe d'observations une heure diffrente, et l'intervalle de temps entre les observations est uniforme.

Dfinir des dates


La dfinition des dates gnre des variables de date pouvant tre utilises pour tablir la priodicit d'une srie chronologique et pour tiqueter le rsultat d'analyses de sries chronologiques.
Figure 7-15 Bote de dialogue Dfinir des dates...

162 Chapitre 7

Les observations sont : Dfinit l'intervalle de temps utilis pour gnrer des dates.
Non dat supprime toutes les variables de date prcdemment dfinies. Toutes les

variables portant les noms suivants sont supprimes : anne_, trimestre_, mois_, semaine_, jour_, heure_, minute_, seconde_ et date_.
Autres indique la prsence de variables de date personnalises cres avec la

syntaxe de commande (par exemple, une semaine de travail de quatre jours). Cet lment reflte simplement l'tat actuel du fichier de travail. Sa slection dans la liste est sans effet. (Consultez le manuel SPSS Command Syntax Reference pour obtenir des informations sur l'utilisation de la commande DATE pour crer des variables de date personnalises.) Les variables de date personnalises ne sont pas disponibles avec la version Student.
La premire observation est : Dfinit la valeur de la date de dpart, qui est affecte la premire observation. Des valeurs squentielles, bases sur l'intervalle de temps, sont affectes aux observations ultrieures. Priodicit au niveau suprieur : Indique une variation cyclique rptitive, telle que le nombre de mois dans une anne ou le nombre de jours de la semaine. La valeur affiche indique la valeur maximale que vous pouvez entrer.

Une nouvelle variable numrique est cre pour chaque composant utilis pour dfinir la date. Les noms des nouvelles variables se terminent par un trait de soulignement. Une variable descriptive chane, date_, est galement cre partir des composants. Par exemple, si vous avez slectionn semaines, jours, heures, quatre nouvelles variables sont cres : semaine_, jour_, heure_ et date_. Si des variables de date ont t dj dfinies, elles sont remplaces lorsque vous dfinissez de nouvelles variables de date portant le mme nom que les variables de date existantes.

Pour dfinir des dates pour des donnes de sries chronologiques


E A partir du menu, slectionnez : Donnes Dfinir des dates E Slectionnez un intervalle de temps dans la liste Les observations sont.

163 Transformations de donnes E Entrez les valeurs dfinissant la date de dpart, qui dtermine la date affecte la

premire observation.

Variables de date versus variables de format date


Les variables de date cres avec Dfinir les dates ne doivent pas tre confondues avec les variables de format date, dfinies dans l'affichage des variables de l'diteur de donnes. Les variables de date sont utilises pour crer une priodicit pour les donnes de sries chronologiques. Les variables de format date reprsentent des dates et/ou des heures affiches selon divers formats de date/heure. Les variables de date sont de simples entiers reprsentant un nombre de jours, de semaines, d'heures, etc., partir d'un point de dpart spcifi par l'utilisateur. En interne, la plupart des variables de format date sont stockes sous la forme du nombre de secondes coules depuis le 14 octobre 1582.

Crer la srie chronologique


L'option Crer la srie chronologique permet de crer des variables sur la base des fonctions de variables numriques de sries chronologiques existantes. Ces valeurs transformes sont utiles dans de nombreuses procdures d'analyse de sries chronologiques. Par dfaut, les noms de nouvelles variables reprennent les six premiers caractres de la variable existante utilise pour les crer, suivis d'un trait de soulignement et d'un numro squentiel. Par exemple, pour la variable prix, le nom de la nouvelle variable serait prix_1. Les nouvelles variables conservent toute tiquette de valeur dfinie des variables d'origine. Les fonctions disponibles, permettant de crer des variables de sries chronologiques, incluent les fonctions de diffrences, de moyennes mobiles, de mdianes mobiles, de dcalages et de dcalage ngatif.

164 Chapitre 7 Figure 7-16 Bote de dialogue Crer la srie chronologique...

Pour crer des variables chronologiques


E A partir du menu, slectionnez : Transformer Crer la srie chronologique E Slectionnez la fonction de sries chronologiques que vous dsirez utiliser pour

transformer les variables d'origine.


E Slectionnez les variables partir desquelles vous dsirez crer de nouvelles variables

de sries chronologiques. Seules des variables numriques peuvent tre utilises. Sinon, vous pouvez :

Entrer des noms de variables pour remplacer les noms des nouvelles variables par dfaut. Remplacer la fonction par une variable slectionne.

165 Transformations de donnes

Fonctions de transformation de sries chronologiques


Diffrence : Diffrence non saisonnire entre les valeurs successives dans les sries.

L'ordre est le nombre des valeurs prcdentes utilis pour calculer la diffrence. Comme une observation est perdue pour chaque ordre de diffrence, les valeurs manquantes par dfaut apparaissent au dbut des sries. Par exemple, si l'ordre de diffrence est 2, les deux premires observations contiendront la valeur manquante par dfaut pour la nouvelle variable.
Diffrence saisonnire : Diffrence entre des valeurs de sries spares par un

intervalle constant. L'intervalle est bas sur la priodicit actuellement dfinie. Pour calculer des diffrences saisonnires, vous devez disposer de variables de date dfinies (Menu Donnes, Dfinir les dates) qui incluent une composante priodique (telle que les mois de l'anne). L'ordre est le nombre de priodes saisonnires utilis pour calculer la diffrence. Le nombre d'observations avec la valeur manquante par dfaut au dbut des sries est gal la priodicit multiplie par l'ordre. Par exemple, si la priodicit courante est 12 et l'ordre 2, les 24 premires observations auront la valeur manquante par dfaut pour nouvelle variable.
Moyenne mobile centre : Moyenne d'un intervalle de valeurs de sries entourant et incluant la valeur courante. L'intervalle est le nombre de valeurs de sries utilis pour calculer la moyenne. Si l'intervalle est pair, la moyenne mobile est calcule en faisant la moyenne de chaque paire de moyennes non centres. Le nombre d'observations avec la valeur manquante par dfaut au dbut et la fin des sries pour un intervalle de n est gal n/2 pour des valeurs d'intervalles paires et impaires. Par exemple, si l'intervalle est 5, le nombre d'observations avec la valeur manquante par dfaut au dbut et la fin des sries est 2. Moyenne mobile prcdente : Moyenne de l'intervalle de valeurs des sries prcdant

la valeur courante. L'intervalle est le nombre de valeurs de sries prcdentes utilis pour calculer la moyenne. Le nombre d'observations avec la valeur manquante par dfaut au dbut des sries est gal la valeur de l'intervalle.
Mdianes mobiles : Mdiane d'un intervalle de valeurs de sries entourant et incluant la valeur courante. L'intervalle est le nombre de valeurs de sries utilis pour calculer la mdiane. Si l'intervalle est pair, la mdiane est calcule en faisant la moyenne de chaque paire de mdianes non centres. Le nombre d'observations avec la valeur manquante par dfaut au dbut et la fin des sries pour un intervalle de n est gal n/2 pour des valeurs d'intervalles paires et impaires. Par exemple, si l'intervalle

166 Chapitre 7

est 5, le nombre d'observations avec la valeur manquante par dfaut au dbut et la fin des sries est 2.
Somme cumule : Somme cumule des valeurs des sries concurrence de la valeur courante, y compris celle-ci. Dcalage positif : Valeur d'une observation prcdente, base sur l'ordre de dcalage

spcifi. L'ordre est le nombre d'observations antrieures l'observation courante partir de laquelle la valeur est obtenue. Le nombre d'observations avec la valeur manquante par dfaut au dbut des sries est gal la valeur de l'ordre.
Dcalage ngatif : Valeur d'une observation ultrieure, base sur l'ordre de dcalage

ngatif spcifi. L'ordre est le nombre d'observations aprs l'observation courante partir de laquelle la valeur est obtenue. Le nombre d'observations avec la valeur manquante par dfaut la fin des sries est gal la valeur de l'ordre.
Lissage : Nouvelles valeurs des sries bases sur un lisseur de donnes composes. Le lisseur commence avec une mdiane mobile de 4, centre par une mdiane mobile de 2. Il relisse ensuite ces valeurs en appliquant une mdiane mobile de 5, puis une de 3, et du hanning (excution de moyennes pondres). Les rsidus sont calculs par soustraction des sries lisses des sries d'origine. Tout ce processus est ensuite rpt sur les rsidus calculs. Pour finir, les rsidus lisss sont calculs par soustraction des valeurs lisses obtenues la premire fois par le processus. On parle parfois de lissage T4253H.

Remplacer les valeurs manquantes


Les observations manquantes peuvent constituer un problme dans le cadre d'analyses, et il arrive que des mesures de sries ne puissent tre calcules si des valeurs manquent dans les sries. Le remplacement des valeurs manquantes cre des variables de sries chronologiques partir de variables existantes, en remplaant les valeurs manquantes par des estimations calcules selon une mthode. Par dfaut, les noms de nouvelles variables reprennent les six premiers caractres de la variable existante utilise pour les crer, suivis d'un trait de soulignement et d'un numro squentiel. Par exemple, pour la variable prix, le nom de la nouvelle variable serait prix_1. Les nouvelles variables conservent toute tiquette de valeur dfinie des variables d'origine.

167 Transformations de donnes Figure 7-17 Bote de dialogue Remplacer les valeurs manquantes...

Pour remplacer les valeurs manquantes par des variables de sries chronologiques
E A partir du menu, slectionnez : Transformer Remplacer les valeurs manquantes... E Slectionnez la mthode d'estimation que vous dsirez utiliser pour remplacer les

valeurs manquantes.
E Slectionnez les variables dont vous voulez remplacer les valeurs manquantes.

Sinon, vous pouvez :


Entrer des noms de variables pour remplacer les noms des nouvelles variables par dfaut. Changer la mthode d'estimation pour une variable slectionne.

Mthodes d'estimation pour le remplacement de valeurs manquantes


Moyenne de la srie : Remplace les valeurs manquantes par la moyenne de toute

la srie.

168 Chapitre 7

Moyenne des points voisins : Remplace les valeurs manquantes par la moyenne des valeurs valides qui les entourent. L'intervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilise pour calculer la moyenne. Mdiane des points voisins : Remplace les valeurs manquantes par la mdiane des

valeurs valides qui les entourent. L'intervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilise pour calculer la mdiane.
Interpolation linaire : Remplace les valeurs manquantes au moyen d'une interpolation linaire. La dernire valeur valide avant la valeur manquante et la premire valeur valide aprs la valeur manquante sont utilises pour l'interpolation. Si la premire ou la dernire observation de la srie comporte une valeur manquante, celle-ci n'est pas remplace. Tendance linaire au point : Remplace les valeurs manquantes par la tendance linaire de ce point. Une rgression est effectue sur la srie existante selon une variable d'index d'une chelle de 1 n. Les valeurs manquantes sont remplaces par les prvisions correspondantes.

Chapitre

Gestion et transformations de fichiers

L'organisation des fichiers de donnes ne rpond pas toujours idalement vos besoins. Vous pouvez, par exemple, combiner des fichiers, trier des donnes dans un ordre diffrent, slectionner des sous-ensembles d'observations ou modifier l'unit d'analyse en regroupant les observations. De nombreuses possibilits de transformation de fichier sont disponibles, y compris la possibilit de :
Trier les donnes : Vous pouvez trier les observations en fonction de la valeur de

certaines variables.
Transposer des observations et des variables : Le format des fichiers de donnes SPSS

lit les lignes comme des observations et les colonnes comme des variables. Vous pouvez inverser les lignes et les colonnes et lire les donnes selon le bon format pour les fichiers qui prsentent les informations dans l'autre sens.
Fusionner des fichiers : Vous pouvez fusionner des fichiers de donnes (au moins

deux). Vous pouvez associer des fichiers disposant des mmes variables mais prsentant des observations diffrentes, ou l'inverse.
Slectionner des sous-ensembles d'observations : Vous pouvez limiter votre analyse un sous ensemble d'observations ou effectuer des analyses simultanes sur diffrents sous ensembles. Agrger les donnes : Vous pouvez modifier l'unit d'analyse en agrgeant des observations en fonction de la valeur d'une ou plusieurs variables de regroupement. Pondrer les donnes : La pondration des donnes concerne les analyses fondes

sur la valeur d'une variable pondre.

169

170 Chapitre 8

Restructurer les donnes : Vous pouvez restructurer des donnes pour crer une observation (un enregistrement) partir de plusieurs observations ou crer plusieurs observations partir d'une seule.

Trier les observations


Cette bote de dialogue permet de trier les observations (lignes) du fichier en fonction des valeurs d'une ou plusieurs variables de tri. Vous pouvez trier les observations par ordre croissant ou dcroissant.

Si vous slectionnez plusieurs variables de tri, les observations sont tries pour chaque variable au sein des modalits de la variable prcdente dans la liste Tri. Par exemple, si vous slectionnez Sexe comme premire variable de tri et Culture comme seconde variable de tri, les observations seront tries en fonction de la culture de chaque individu au sein de chaque modalit de la variable sexe. Pour les variables alphanumriques, les lettres en majuscules prcdent les minuscules dans l'ordre de tri. Par exemple, la valeur Oui prcde oui dans l'ordre de tri.

Figure 8-1 Bote de dialogue Trier les observations

Pour trier les observations


E A partir du menu, slectionnez : Donnes Trier les observations...

171 Gestion et transformations de fichiers E Slectionnez au moins une variable de tri.

Transposer
La transposition permet de crer un nouveau fichier dans lequel les lignes et les colonnes du fichier initial sont inverses pour que les observations (lignes) deviennent des variables (colonnes), et vice versa. SPSS gnre automatiquement de nouveaux noms pour les variables et affiche une liste de ces nouveaux noms.

Une nouvelle variable de type chane contenant le nom de variable d'origine, case_lbl, est automatiquement cre. Si le fichier de travail contient un ID (identifiant) ou une variable de nom dont les valeurs sont univoques, vous pouvez l'utiliser comme Variable de nom et employer ses valeurs comme noms de variable dans le fichier transpos. S'il s'agit d'une variable numrique, les noms de variables commencent par la lettre V, suivie de la valeur numrique. Les valeurs manquantes l'utilisateur sont converties en valeurs manquantes par dfaut dans le fichier transpos. Pour conserver certaines de ces valeurs, modifiez la dfinition des valeurs manquantes dans l'affichage des variables de l'diteur de donnes.

Pour transposer des variables et des observations


E A partir du menu, slectionnez : Donnes Transposer.. E Slectionnez au moins une variable transposer en observation.

172 Chapitre 8

Fusionner des fichiers de donnes


SPSS vous permet de fusionner des donnes partir de deux fichiers et de deux faons diffrentes. Vous pouvez:

Fusionner des fichiers contenant les mmes variables mais des observations diffrentes. Fusionner des fichiers contenant les mmes observations mais des variables diffrentes.

Ajouter des observations


Ajouter des observations permet de fusionner le fichier de travail actif avec un autre fichier de donnes SPSS qui contient les mmes variables mais des observations diffrentes. Par exemple, vous pouvez enregistrer la mme information sur des clients de deux secteurs de vente et grer ces donnes dans des fichiers spars pour chaque rgion.
Figure 8-2 Bote de dialogue Ajouter des observations

173 Gestion et transformations de fichiers

Variables non communes : Variables exclure du nouveau fichier fusionn. Les

variables du fichier de travail sont identifies par un astrisque (*). Les variables du fichier externe sont identifies par un signe (+). Par dfaut, la liste contient :

Des variables sans correspondance dans l'autre fichier. Vous pouvez crer des paires avec les variables non communes et les inclure dans le nouveau fichier fusionn. Des variables contenant des donnes numriques dans l'un des fichiers et des donnes alphanumriques dans l'autre. Il est impossible de fusionner des variables numriques avec des variables alphanumriques. Des variables alphanumriques de longueur diffrente. La longueur dfinie pour une variable alphanumrique doit tre la mme dans les deux fichiers.

Variables du nouveau fichier actif : Variables inclure dans le nouveau fichier actif. Par

dfaut, toutes les variables dont le nom et le type correspond sont ajoutes la liste.

Vous pouvez supprimer des variables de la liste si vous ne les souhaitez pas dans le fichier fusionn. Les variables non communes incluses dans le fichier fusionn contiendront des donnes manquantes pour les observations du fichier qui ne les contient pas.

Indiquer le fichier source dans la variable : Indique le fichier de donnes source pour

chaque observation. Cette variable a une valeur de 0 pour les observations du fichier de travail et une valeur de 1 pour les observations du fichier de donnes externe.

Pour fusionner des fichiers de donnes avec les mmes variables mais des observations diffrentes :
E Ouvrez l'un des fichiers de donnes. Les observations de ce fichier apparaissent en

premier dans le nouveau fichier fusionn.


E A partir du menu, slectionnez : Donnes Fusionner des fichiers Ajouter des observations... E Slectionnez le fichier fusionner avec le fichier ouvert. E Supprimez les variables que vous ne souhaitez pas faire apparatre dans la liste des

variables du nouveau fichier de travail.

174 Chapitre 8 E Ajouter des paires de variables de la liste des variables non communes qui

reprsentent les mmes informations mais enregistres sous des noms diffrents dans les deux fichiers. Par exemple, la date de naissance peut tre enregistre sous datenais dans un fichier et n_le dans l'autre.
Slectionner une paire de variables non communes
E Cliquez sur l'une des variables dans la liste Variables non communes. E Tout en maintenant la touche Ctrl enfonce, cliquez sur l'autre variable dans la liste.

(Appuyez sur la touche Ctrl et cliquez en mme temps sur le bouton gauche de la souris.)
E Cliquez sur Apparier pour dplacer la paire de variables dans la liste Variables du

nouveau fichier de travail. (Le nom de variable du fichier de travail est utilis comme nom de variable dans le fichier fusionn.)
Figure 8-3 Slectionner des paires de variables l'aide du Ctrl/click

175 Gestion et transformations de fichiers

Ajout d'observations : Renommer


Vous pouvez renommer les variables du fichier de travail ou du fichier externe avant de les dplacer de la liste des variables non communes dans la liste des variables ajouter au fichier fusionn. Renommer des variables vous permet de :

Utiliser le nom de la variable du fichier externe plutt que celui du fichier de travail pour les paires de variables. Inclure deux variables portant le mme nom mais de type diffrent ou de longueur diffrente. Par exemple, pour inclure la fois la variable numrique sexe du fichier de travail et la variable alphanumrique sexe du fichier externe, vous devez d'abord les renommer.

Ajout d'observations : Informations du dictionnaire


Tous les informations du dictionnaire existantes (tiquettes de variable et de valeurs, valeurs manquantes de type utilisateur, formats d'affichage) dans le fichier de travail sont appliques au fichier fusionn.

Si certaines informations du dictionnaire, relatives une variable, ne sont pas dfinies dans le fichier de travail, les informations du dictionnaire du fichier externe s'appliquent. Si le fichier de travail contient des tiquettes de valeurs non dfinies ou des valeurs manquantes de type utilisateur, toutes les autres tiquettes de valeurs ou les valeurs manquantes de type utilisateur pour cette variable dans le fichier externe sont ignores.

Ajouter des variables


Ajouter des variables permet de fusionner le fichier de travail avec un fichier de donnes SPSS externe qui contient les mmes observations mais pas les mmes variables. Par exemple, vous souhaitez fusionner un fichier de donnes contenant les rsultats d'un test pralable avec un autre fichier contenant les rsultats d'un test final.
Les observations doivent tre prsentes dans le mme ordre dans les deux fichiers.

Si une ou plusieurs cls d'appariement sont utilises pour apparier les

176 Chapitre 8

observations, les deux fichiers de donnes doivent prsenter ces cls d'appariement par ordre croissant.

Les noms de variable du second fichier, redondants avec les noms du fichier de travail, sont exclus par dfaut. En effet, SPSS part du principe que ces variables contiennent des informations redondantes.

Indiquer le fichier source dans la variable : Indique le fichier de donnes source pour

chaque observation. Cette variable a une valeur de 0 pour les observations du fichier de travail et une valeur de 1 pour les observations du fichier de donnes externe.
Figure 8-4 Bote de dialogue Ajouter des variables

Variables exclues : Variables exclure du nouveau fichier fusionn. Par dfaut, cette

liste contient tous les noms de variable du fichier externe qui sont redondants avec ceux du fichier de travail. Les variables du fichier de travail sont identifies par un astrisque (*). Les variables du fichier externe sont identifies par un signe (+). Si vous souhaitez inclure une variable exclue avec un nom redondant dans le fichier fusionn, vous pouvez le renommer puis l'ajouter la liste des variables inclure.
Variables du nouveau fichier actif : Variables inclure dans le nouveau fichier actif. Par dfaut, tous les noms de variables uniques dans les deux fichiers sont inclus dans la liste.

177 Gestion et transformations de fichiers

Cls d'appariement : Si certaines observations dans un fichier n'ont pas de concordance dans l'autre fichier (c'est--dire que certaines observations manquent dans un fichier), utilisez les cls d'appariement pour identifier et correctement apparier les observations des deux fichiers. Vous pouvez galement utiliser ces cls avec des fichiers de consultation de table.

Les cls d'appariement doivent avoir le mme nom dans les deux fichiers de donnes. Les deux fichiers de donnes doivent prsenter les variables par ordre croissant ou dcroissant et l'ordre des variables de la liste cls d'appariement doit tre le mme que l'ordre de tri. Les observations qui n'ont pas de correspondance dans les cls d'appariement sont inclus dans le fichier fusionn mais elles sont fusionnes avec les observations de l'autre fichier. Les observations sans correspondance contiennent des valeurs uniquement pour les variables du fichier duquel elles sont issues. Les variables de l'autre fichier contiennent la valeur manquante par dfaut.

Le fichier externe ou fichier actif est une table code : Une table code ou un fichier de consultation de table, est un fichier dans lequel les donnes de chaque observation peuvent s'appliquer plusieurs observations de l'autre fichier. Par exemple, si un des fichiers contient des informations sur les diffrents membres d'une famille (sexe, ge, niveau scolaire) et l'autre des informations gnrales sur la famille (revenu global, taille, habitat), vous pouvez utiliser le fichier sur la famille comme fichier de consultation et appliquer les informations gnrales chaque membre de la famille dans le fichier fusionn.

Pour fusionner des fichiers avec les mmes observations mais des variables diffrentes
E Ouvrez l'un des fichiers de donnes. E A partir du menu, slectionnez : Donnes Fusionner des fichiers Ajouter des variables... E Slectionnez le fichier fusionner avec le fichier ouvert.

178 Chapitre 8

Slectionnez des cls d'appariement :


E Slectionnez les variables du fichier externe (+) dans la liste des Variables exclues. E Slectionnez Apparier les observations sur les cls des fichiers tris. E Ajoutez des variables la liste des cls d'appariement.

Les cls d'appariement doivent exister dans les deux fichiers, de donnes de travail et externe. Les deux fichiers de donnes doivent prsenter les variables par ordre croissant ou dcroissant et l'ordre des variables de la liste cls d'appariement doit tre le mme que l'ordre de tri.

Ajouter des variables: Renommer


Vous pouvez renommer les variables du fichier de travail ou du fichier externe avant de les dplacer de la liste des variables inclure dans le fichier fusionn. Ceci est particulirement important si vous souhaitez inclure deux variables portant le mme nom mais contenant des informations diffrentes.

Agrger les donnes


Agrger les donnes permet de combiner les classes d'observations sous forme d'observations rcapitulatives et cre un nouveau fichier de donnes agrges. Les observations sont agrges en fonction de la valeur d'une ou plusieurs variables de regroupement. Le nouveau fichier de donnes contient une observation pour chaque classe. Par exemple, vous pouvez agrger les donnes de cantons par dpartement et crer un nouveau fichier dans lequel le dpartement est l'unit d'analyse.

179 Gestion et transformations de fichiers Figure 8-5 Bote de dialogue Agrger les donnes

Critre(s) d'agrgation : Les observations sont regroupes selon les valeurs des critres d'agrgation. Chaque combinaison de valeurs du critre d'agrgation dfinit une classe et gnre une observation dans le nouveau fichier agrg. Tous les critres d'agrgation sont enregistrs dans le nouveau fichier avec leurs noms et les informations du dictionnaire. Le critres d'agrgation peut tre numrique ou alphanumrique. Variable(s) agrge(s) : Les variables sont utilises avec des fonctions d'agrgation pour crer les nouvelles variables du fichier agrg. Par dfaut, SPSS cre les noms des variables d'agrgation l'aide des premiers caractres de la variable source, suivis d'un tiret de soulignement et d'un numro squentiel deux chiffres. Le nom de la variable d'agrgation est suivi ventuellement d'une tiquette de variable entre guillemets, le nom de la fonction d'agrgation et du nom de la variable source entre parenthses. Les variables source pour les fonctions d'agrgation doivent tre numriques.

180 Chapitre 8

Vous pouvez galement passer outre les noms de variables d'agrgation par dfaut, ajouter des tiquettes de variable descriptive et modifier les fonctions utilises pour calculer la valeur des donnes agrges. Vous pouvez galement crer une variable qui contienne le nombre d'observations dans chaque agrgat.

Pour agrger un fichier de donnes


E A partir du menu, slectionnez : Donnes Agrger... E Slectionnez un ou plusieurs critres d'agrgation qui dfinissent la faon dont les

observations sont groupes pour crer des donnes agrges.


E Slectionnez une ou plusieurs variables d'agrgation inclure dans le nouveau fichier

de donnes.
E Slectionnez une fonction d'agrgation pour chaque variable d'agrgation.

Agrgation de donnes : fonction d'agrgation


Cette bote de dialogue indique la fonction utiliser pour calculer la valeur des donnes agrges pour les variables slectionnes dans la liste des variables agrges de la Bote de dialogue Agrger des donnes. Les fonctions d'agrgation comprennent :

Des fonctions rcapitulatives, notamment la moyenne, la mdiane, l'cart type et la somme. Le nombre d'observations (pondres et non pondres, manquantes et non manquantes). Le pourcentage ou la proportion des valeurs infrieures ou suprieures une valeur donne. Le pourcentage ou la proportion des valeurs appartenant ou n'appartenant pas un intervalle donn.

181 Gestion et transformations de fichiers Figure 8-6 Bote de dialogue Fonction d'agrgation

Agrgation de donnes : nom et tiquette de variable


SPSS attribue par dfaut des noms aux variables agrges dans le nouveau fichier de donnes. Cette bote de dialogue vous permet de changer le nom des variables slectionnes dans la liste des variables d'agrgation et vous propose une tiquette descriptive des variables. Pour plus d'informations, reportez-vous Noms de variable dans Chapitre 5 , page 84.
Figure 8-7 Bote de dialogue Nom et tiquette de variable

182 Chapitre 8

Scinder un fichier
Scinder un fichier vous permet de scinder un fichier de donnes en plusieurs classes, en fonction des valeurs d'une ou plusieurs variables de regroupement. Si vous slectionnez plusieurs variables de regroupement, les observations sont regroupes pour chaque variable au sein des modalits de la variable prcdente dans la liste des variables de regroupement. Par exemple, si vous slectionnez sexe comme premire variable de regroupement et culture comme seconde, les observations seront classes en fonction de l'origine culturelle au sein de chaque modalit de la variable sexe.

Vous pouvez spcifier jusqu' 8 variables de regroupement. Chaque bloc de huit caractres dans une variable alphanumrique longue (plus de 8 caractres) est considr comme une variable par rapport la limite de 8 variables de regroupement. Les observations doivent tre tries en fonction des valeurs des variables de regroupement, suivant l'ordre dans lequel les variables sont prsentes dans la liste des variables de regroupement. Si le fichier de donnes n'est pas tri, slectionnez Tri suivant les variables de regroupement.

Figure 8-8 Bote de dialogue Scinder un fichier

183 Gestion et transformations de fichiers

Comparer les classes : Les classes du fichier scind sont prsentes ensemble pour

permettre la comparaison. En ce qui concerne les tableaux pivotants, un seul d'entre eux est cr et chaque variable du fichier scind peut tre dplace entre les dimensions du tableau. Quant aux diagrammes, un diagramme distinct est cr pour chaque groupe du fichier scind et ces diagrammes sont affichs ensemble dans le Viewer.
Sparer rsultats par groupes : Tous les rsultats de chaque procdure sont affichs sparment pour chaque classe du fichier scind.

Pour scinder un fichier de donnes pour analyse


E A partir du menu, slectionnez : Donnes Scinder un fichier... E Slectionnez Comparer les groupes ou Sparer rsultats par groupes. E Slectionnez une ou plusieurs variables de regroupement.

Slectionner des observations


Slectionner les observations propose une srie de mthodes pour slectionner un sous-groupe d'observations en fonction de certains critres qui incluent variables et expressions complexes. Vous pouvez galement slectionner un chantillon alatoire d'observations. Les critres utiliss pour dfinir un sous groupe comprennent :

Plages et valeurs de variables Plages de dates et d'heures Nombres d'observations (lignes) Expressions arithmtiques Expressions logiques Fonctions

184 Chapitre 8 Figure 8-9 Bote de dialogue Slectionner des observations

Toutes les observations : Dsactive le filtrage et utilise toutes les observations. Selon une condition logique : Utilisez une expression conditionnelle pour slectionner

des observations. Si le rsultat de l'expression conditionnelle est vrai, l'observation est slectionne. Si le rsultat est faux ou manquant, l'observation n'est pas slectionne.
Par chantillonnage alatoire : Slectionne un chantillon alatoire bas sur un

pourcentage approximatif ou un nombre exact d'observations.


Dans un intervalle de temps ou d'observations : Permet de slectionner des observations

partir d'un intervalle d'observations ou d'un intervalle de date/temps.


Selon une variable filtre : Utilise comme filtre la variable numrique slectionne dans

le fichier de donnes. Les observations dont la valeur de la variable filtre est autre que manquante ou nulle sont slectionnes.
Observations exclues : Vous pouvez filtrer ou supprimer les observations qui ne rpondent pas ces critres. Les observations filtres restent dans le fichier de donnes mais sont exclues de l'analyse. Slectionner les observations cre une variable de filtre, filter_$, pour indiquer l'tat du filtre. Les observations slectionnes ont la valeur 1, les autres 0. Les observations filtres sont galement indiques par une

185 Gestion et transformations de fichiers

barre oblique travers le numro de ligne dans l'diteur de donnes. Pour dsactiver le filtrage et rintgrer toutes les observations dans vos analyses, slectionnez Toutes les observations. Les observations supprimes sont retires du fichier de donnes et ne peuvent pas tre rcupres si vous enregistrez le fichier de donnes aprs cette suppression.

Slection d'un sous-groupe d'observations


E A partir du menu, slectionnez : Donnes Slectionner des observations... E Slectionnez une des mthodes de slection d'observations. E Spcifiez les critres de slection des observations.

Slectionner observations : Si
La bote de dialogue vous permet de slectionner des sous-ensembles d'observations l'aide d'expressions conditionnelles. Une expression conditionnelle renvoie la valeur True (vrai), False (faux) ou manquant pour chaque observation.
Figure 8-10 Bote de dialogue Slectionner des observations : Si

186 Chapitre 8

Si le rsultat d'une expression conditionnelle est Vrai, l'observation est slectionne. Si le rsultat d'une expression conditionnelle est Faux ou Manquant, l'observation n'est pas slectionne. La plupart des expressions conditionnelles utilisent un ou plus des six oprateurs relationnels (<, >, <=, >=, = et ~=) du pav numrique. Ces expressions conditionnelles peuvent comprendre des noms de variable, des constantes, des oprateurs arithmtiques, des fonctions, numriques ou non, des variables logiques et des oprateurs relationnels.

Slectionner observations : Echantillon alatoire


Cette bote de dialogue vous permet de slectionner un chantillon alatoire partir d'un pourcentage approximatif ou un nombre prcis d'observations. L'chantillonnage est ralis sans remplacement ; vous ne pouvez donc slectionner une mme observation qu'une seule fois.
Figure 8-11 Bote de dialogue Slectionner observations : Echantillon alatoire

Environ : SPSS gnre un chantillon alatoire d'observations dont le nombre correspond approximativement au pourcentage indiqu. Comme cette routine gnre une dcision indpendante pseudo-alatoire pour chaque observation, le pourcentage d'observations slectionnes peut seulement approcher le pourcentage spcifi. Plus il y a d'observations dans le fichier de donnes, plus le pourcentage des observations slectionnes sera proche de la valeur indique.

187 Gestion et transformations de fichiers

Exactement : Nombre d'observations spcifi par l'utilisateur. Vous devez galement

indiquer le nombre d'observations partir duquel l'chantillon sera gnr. Ce deuxime nombre doit tre infrieur ou gal au nombre total d'observations dans le fichier de donnes. Si ce nombre dpasse le nombre total d'observations dans le fichier de donnes, l'chantillon contiendra proportionnellement moins d'observations que le nombre demand.

Slectionner observations : Plage


Cette bote de dialogue vous permet de slectionner des observations partir d'un intervalle de numros d'observation ou d'un intervalle de date ou de temps.

Les intervalles d'observations sont fonds sur un numro de ligne, affich dans l'diteur de donnes. Les intervalles de dates et de temps sont valables uniquement pour les sries chronologiques disposant de variables de date (menu Donnes, Dfinir dates).

Figure 8-12 Slectionnez la bote de dialogue Intervalle d'observations pour un intervalle d'observations (aucune variable de date dfinie)

188 Chapitre 8 Figure 8-13 Slectionnez la bote de dialogue Intervalle d'observations pour les sries chronologiques (variable de date dfinie).

Pondrer les observations


Pondrer les observations permet de pondrer diffremment les observations (par rplication simule) dans le cadre de l'analyse statistique.
Les valeurs de la variable de pondration doivent indiquer le nombre d'observations

reprsentes par des observations uniques de donnes.


Les observations avec zro, une valeur ngative ainsi que les variables manquantes

pour la variable de pondration sont exclues de l'analyse.

Vous pouvez utiliser des fractions. Elles sont utilises leur juste valeur lorsque cela est significatif, et le plus souvent lorsque les observations sont tabules (tableaux croiss).

189 Gestion et transformations de fichiers Figure 8-14 Bote de dialogue Pondrer les observations

Une fois que vous avez appliqu une variable de pondration, celle-ci est effective jusqu' ce que vous slectionniez une autre variable de pondration ou que vous dsactiviez cette pondration. Si vous enregistrez un fichier de donnes pondres, les informations de pondration sont galement enregistres. Vous pouvez dsactiver la pondration n'importe quel moment, mme aprs l'enregistrement du fichier avec sa pondration.
Pondration dans des tableaux croiss : Plusieurs options de la procdure Tableaux

croiss permettent de grer la pondration des observations. Pour plus d'informations, reportez-vous Affichage de cellules (cases) de tableaux croiss dans Chapitre 16 , page 337.
Pondration des diagrammes de dispersion et histogrammes : Les diagrammes de

dispersion et les histogrammes disposent d'une option d'activation/dsactivation de la pondration des observations, mais cela n'affecte pas les observations avec des valeurs ngatives, des zros, ou une valeur manquante pour la variable de pondration. Ces observations sont toujours exclues du diagramme mme lorsque la pondration est dsactive depuis ce diagramme.

Pour pondrer des observations


E A partir du menu, slectionnez : Donnes Pondrer les observations E Slectionnez Pondrer les observations par.

190 Chapitre 8 E Slectionnez une variable de frquence.

Les valeurs de la variable de frquence servent la pondration des observations. Par exemple, une observation ayant la valeur 3 dans la table de frquence reprsente 3 observations dans le fichier des donnes pondres.

Restructuration des donnes


Utilisez l'Assistant de restructuration des donnes pour restructurer les donnes qui sont ncessaires la procdure SPSS choisie. L'Assistant remplace le fichier actuel par un nouveau fichier, restructur. L'Assistant vous permet de :

Restructurer les variables slectionnes en observations Restructurer les observations slectionnes en variables Transposer toutes les donnes

Restructuration des donnes


E A partir du menu, slectionnez : Donnes Restructurer... E Slectionnez le type de restructuration effectuer. E Slectionnez les donnes restructurer.

Sinon, vous pouvez :


Crer des variables d'identification qui vous permettent de faire correspondre une valeur du nouveau fichier avec la valeur du fichier d'origine Trier les donnes avant leur restructuration Dfinir les options du nouveau fichier Coller la syntaxe de la commande dans une fentre de syntaxe

191 Gestion et transformations de fichiers

Assistant de restructuration des donnes : Slectionner un type


Servez-vous de l'Assistant de restructuration des donnes pour restructurer vos donnes. Dans la premire bote de dialogue, slectionnez le type de restructuration effectuer.
Figure 8-15 Assistant de restructuration des donnes

Restructurer les variables slectionnes en observations : Slectionnez cette option

lorsque vos donnes comportent des groupes de colonnes apparentes que vous souhaitez faire apparatre dans des groupes de lignes du nouveau fichier de donnes.

192 Chapitre 8

Si vous choisissez cette option, l'Assistant affiche les tapes relatives l'opration de restructuration des variables en observations.

Restructurer les observations slectionnes en variables : Slectionnez cette option

lorsque vos donnes comportent des groupes de lignes apparentes que vous souhaitez faire apparatre dans des groupes de colonnes du nouveau fichier de donnes. Si vous choisissez cette option, l'Assistant affiche les tapes relatives l'opration de restructuration des observations en variables.

Transposer toutes les donnes : Choisissez cette option pour transposer vos

donnes. Dans les nouvelles donnes, toutes les lignes vont tre transformes en colonnes et les colonnes en lignes. La slection de cette option entrane la fermeture de l'Assistant de restructuration des donnes et l'ouverture de la bote de dialogue Transposer les donnes.
Choix du mode de restructuration des donnes

Une variable contient les informations analyser, comme une mesure ou un rsultat. Une observation correspond, par exemple, un individu. Dans une structure de donnes simple, chaque variable correspond une colonne de vos donnes et chaque observation une ligne. Supposez que vous mesuriez les rsultats obtenus un test par tous les tudiants d'une classe. Dans ce cas, tous les rsultats apparaissent dans une mme colonne et une ligne est associe chaque tudiant. Lors de l'analyse des donnes, vous tes souvent amen analyser la manire dont une variable volue en fonction de certaines conditions. Ces conditions peuvent correspondre un traitement exprimental prcis, une population, un moment en particulier, etc. Dans l'analyse des donnes, les conditions qui vous intressent sont souvent appeles facteurs. Lorsque vous analysez des facteurs, vous obtenez une structure de donnes complexe. Vous pouvez disposer d'informations sur une variable dans plusieurs colonnes de vos donnes (par exemple, une colonne pour chaque niveau d'un facteur) ou d'informations sur une observation dans plusieurs lignes (par exemple, une ligne pour chaque niveau d'un facteur). L'Assistant de restructuration des donnes vous aide restructurer les fichiers dont la structure de donnes est complexe. Les options que vous slectionnez dans l'Assistant dpendent de la structure du fichier actuel et de celle du nouveau fichier.

193 Gestion et transformations de fichiers

Organisation des donnes dans le fichier actuel : Vous pouvez organiser les donnes actuelles de telle sorte que les facteurs soient enregistrs dans une variable distincte (dans des groupes d'observations) ou avec la variable (dans des groupes de variables).

Groupes d'observations : Dans le fichier actuel, les variables et les conditions

sont-elles enregistres dans des colonnes distinctes ? Par exemple :


var 8 9 3 1 facteur 1 1 2 2

Dans cet exemple, les deux premires lignes constituent un groupe d'observations car elles sont apparentes. Elles contiennent des donnes relatives au mme niveau de facteur. Dans les analyses de donnes SPSS, le facteur est souvent appel variable de regroupement lorsque les donnes sont structures de cette manire.

Groupes de colonnes : Dans le fichier actuel, les variables et les conditions

sont-elles enregistres dans la mme colonne ? Par exemple :


var_1 8 9 var_2 3 1

Dans cet exemple, les deux colonnes constituent un groupe de variables car elles sont apparentes. Elles contiennent des donnes concernant la mme variable (var_1 pour le niveau de facteur 1 et var_2 pour le niveau de facteur 2). Dans les analyses de donnes SPSS, le facteur est souvent appel mesure rpte lorsque les donnes sont structures de cette manire.
Organisation des donnes dans le nouveau fichier : La procdure d'analyse des donnes

dtermine gnralement l'organisation des donnes.

Procdures ncessitant des groupes d'observations : Vous devez structurer vos

donnes en groupes d'observations pour procder des analyses qui requirent une variable de regroupement. A titre d'exemple, il est possible de citer le modle linaire gnral pour les composantes univaries, multivaries et de variance, les modles linaires gnraux, les modles mixtes, les cubes OLAP, ainsi que le test T ou les tests non paramtriques pour les chantillons indpendants. Si

194 Chapitre 8

vos donnes actuelles sont structures en groupes de variables, slectionnez Restructurer les variables slectionnes en observations pour procder ces analyses.

Procdures ncessitant des groupes de variables : Vous devez structurer vos

donnes en groupes de variables pour procder des analyses de mesures rptes. A titre d'exemple, il est possible de citer le modle linaire gnral pour les mesures rptes, l'analyse par la rgression de Cox prdicteurs chronologiques, le test T pour les chantillons apparis ou les tests non paramtriques pour les chantillons apparents. Si vos donnes actuelles sont structures en groupes d'observations, slectionnez Restructurer les observations slectionnes en variables pour procder ces analyses.

Exemple de restructuration de variables en observations


Dans cet exemple, les rsultats d'un test sont enregistrs dans des colonnes distinctes pour chacun des facteurs A et B.
Figure 8-16 Donnes actuelles utilises pour la restructuration de variables en observations

Vous voulez raliser un test t pour des chantillons indpendants. Vous disposez d'un groupe de colonnes comprenant score_a et score_b, mais pas de la variable de regroupement requise par la procdure. Slectionnez Restructurer les variables slectionnes en observations dans l'Assistant de restructuration des donnes, restructurez un groupe de variables dans une nouvelle variable intitule rsultat, puis crez un index appel groupe. Le nouveau fichier de donnes est illustr dans la figure suivante.

195 Gestion et transformations de fichiers Figure 8-17 Nouvelles donnes restructures utilises pour la restructuration de variables en observations

Lorsque vous excutez le test t pour des chantillons indpendants, vous pouvez dsormais utiliser l'index groupe en tant que variable de regroupement.

Exemple de restructuration d'observations en variables


Dans cet exemple, les rsultats du test sont enregistrs deux fois pour chaque sujet, avant et aprs le traitement.
Figure 8-18 Donnes actuelles utilises pour la restructuration d'observations en variables

Vous voulez raliser un test t pour des chantillons apparis. Vos donnes sont structures en groupes d'observations, mais vous ne disposez pas des mesures rptes des variables apparies requises par la procdure. Slectionnez Restructurer les observations slectionnes en variables dans l'Assistant de restructuration des donnes, utilisez id pour identifier les groupes de lignes dans les donnes actuelles, et temps pour crer le groupe de variables dans le nouveau fichier.

196 Chapitre 8 Figure 8-19 Nouvelles donnes restructures utilises pour la restructuration d'observations en variables

Pour l'excution du test t pour chantillons apparis, vous pouvez dsormais utiliser ava et apr comme paire de variables.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Nombre de groupes de variables
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. Lors de cette tape, vous dterminez le nombre de groupes de variables du fichier actuel restructurer dans le nouveau fichier.
Nombre de groupes de variables prsents dans le fichier actuel ? Dterminez le nombre de groupes de variables prsents dans les donnes actuelles. Un groupe de colonnes apparentes, appel groupe de variables, permet d'enregistrer les mesures rptes d'une mme variable dans des colonnes distinctes. Supposez que parmi les donnes dont vous disposez, trois colonnes, l1, l2 et l3, enregistrent la largeur. Dans ce cas, vous avez un groupe de variables. Si trois autres colonnes, h1, h2 et h3, enregistrent la hauteur, vous disposez de deux groupes de variables. Nombre de groupes de variables crer dans le nouveau fichier? Dterminez le nombre

de groupes de variables reprsenter dans le nouveau fichier. Il n'est pas ncessaire de restructurer tous les groupes de variables dans le nouveau fichier.

197 Gestion et transformations de fichiers Figure 8-20 Assistant de restructuration des donnes : Nombre de groupes de variables

Une : L'Assistant cre une variable restructure dans le nouveau fichier partir

d'un groupe de variables du fichier actuel.


Plusieurs : L'Assistant cre plusieurs variables restructures dans le nouveau

fichier. Le nombre spcifi est utilis l'tape suivante, au cours de laquelle l'Assistant cre automatiquement le nombre de variables indiqu.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Slectionnez Variables
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes.

198 Chapitre 8

A cette tape, dcrivez le mode d'utilisation des variables du fichier actuel dans le nouveau fichier. Vous pouvez galement crer une variable qui identifie les lignes du nouveau fichier.
Figure 8-21 Assistant de restructuration des donnes : Slectionnez Variables

Identification des nouvelles lignes : Vous pouvez crer une variable dans le nouveau fichier de donnes afin d'identifier la ligne du fichier actuel qui a servi crer un groupe de nouvelles lignes. L'identificateur peut tre un numro d'observation squentiel ; il peut galement s'agir des valeurs de la variable. Utilisez les contrles de l'option Identification du groupe d'observations pour dfinir la variable d'identification dans le nouveau fichier. Cliquez sur une cellule pour modifier le nom de la variable par dfaut et attribuer une tiquette descriptive la variable d'identification.

199 Gestion et transformations de fichiers

Elments restructurer dans le nouveau fichier : A l'tape prcdente, vous avez

indiqu l'Assistant le nombre de groupes de variables restructurer. L'Assistant a cr une variable pour chaque groupe. Les valeurs du groupe de variables apparatront dans cette variable, dans le nouveau fichier. Utilisez les contrles de l'option Variables transposer pour dfinir la variable restructure dans le nouveau fichier.
Pour spcifier une variable structure
E Placez dans la liste Variables transposer les variables comprenant le groupe de

variables transformer. Toutes les variables du groupe doivent tre du mme type (numrique ou alphanumrique). Vous pouvez inclure une mme variable plusieurs fois dans le groupe de variables (au lieu d'tre dplaces, les variables sont copies partir de la liste des variables source) ; ses valeurs sont rptes dans le nouveau fichier.
Pour spcifier plusieurs variables structures
E Dans la liste droulante, slectionnez la premire variable cible dfinir. E Placez dans la liste Variables transposer les variables comprenant le groupe de

variables transformer. Toutes les variables du groupe doivent tre du mme type (numrique ou alphanumrique). Vous pouvez inclure la mme variable plusieurs fois dans le groupe de variables. (Une variable est copie au lieu d'tre dplace partir de la liste des variables source et ses valeurs sont rptes dans le nouveau fichier.)
E Slectionnez la variable cible suivante dfinir et recommencez le processus de

slection de la variable pour toutes les variables cible disponibles.

Bien que vous puissiez inclure plusieurs fois une mme variable dans un groupe de variables cible, vous ne pouvez pas l'inclure dans plusieurs groupes de variables cible. Chaque liste de groupes de variables cible doit contenir le mme nombre de variables. (Les variables rpertories plusieurs fois sont comptes.)

200 Chapitre 8

Le nombre de groupes de variables cible est dtermin par le nombre de groupes de variables que vous avez indiqu l'tape prcdente. Vous pouvez modifier le nom par dfaut des variables ici, mais pour modifier le nombre de groupes de variables restructurer, vous devez retourner l'tape prcdente. source) pour chaque variable cible disponible avant de passer l'tape suivante.

Vous devez dfinir les groupes de variables (slectionnez les variables dans la liste

Elments copier dans le nouveau fichier Les variables non restructures peuvent tre copies dans le nouveau fichier. Leurs valeurs seront rpercutes dans les nouvelles lignes. Dplacez vers la liste Variable(s) fixe(s) les variables copier dans le nouveau fichier.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer des variables d'index
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. A cette tape, indiquez si vous voulez crer des variables d'index. Un index est une nouvelle variable qui identifie de manire squentielle un groupe de lignes d'aprs la variable d'origine partir de laquelle la nouvelle ligne a t cre.

201 Gestion et transformations de fichiers Figure 8-22 Assistant de restructuration des donnes : Crer des variables d'index

Nombre de variables d'index crer dans le nouveau fichier ? Vous pouvez utiliser les

variables d'index en tant que variables de regroupement dans les procdures SPSS. Dans la plupart des cas, une variable d'index suffit. Toutefois, si les groupes de variables de votre fichier actuel font apparatre plusieurs niveaux de facteur, il est recommand de crer plusieurs index.

Une : L'Assistant cre une seule variable d'index. Plusieurs : L'Assistant cre plusieurs index. Entrez le nombre d'index crer.

Le nombre spcifi est utilis l'tape suivante, au cours de laquelle l'Assistant cre automatiquement le nombre d'index indiqu.

Aucune : Slectionnez cette option pour ne crer aucune variable d'index dans le

nouveau fichier.

202 Chapitre 8

Exemple d'index unique lors de la restructuration de variables en observations


Parmi les donnes actuelles figurent un groupe de variables, largeur, et un facteur, temps. La largeur a t mesure trois fois et enregistre dans l1, l2 et l3.
Figure 8-23 Donnes actuelles utilises pour un index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et crer un index numrique. Les nouvelles donnes sont illustres dans le tableau suivant.
Figure 8-24 Nouvelles donnes restructures avec un index

La valeur Index dbute 1 et s'incrmente pour chacune des variables du groupe. Elle se rinitialise sur 1 ds qu'une nouvelle ligne est dtecte dans le fichier d'origine. Vous pouvez dsormais utiliser la valeur index dans les procdures SPSS qui requirent une variable de regroupement.

Exemple de deux index lors de la restructuration de variables en observations


Lorsqu'un groupe de variables enregistre plusieurs facteurs, vous pouvez crer plusieurs index. Toutefois, vous devez organiser les donnes utilises de faon ce que les niveaux du premier facteur correspondent un index principal qui inclut les niveaux des facteurs suivants. Les donnes actuelles comprennent un groupe de variables, largeur et deux facteurs, A et B. Les donnes sont organises de telle sorte que les niveaux du facteur B sont inclus dans les niveaux du facteur A.

203 Gestion et transformations de fichiers Figure 8-25 Donnes actuelles utilises pour deux index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et crer deux index. Les nouvelles donnes sont illustres dans le tableau suivant.
Figure 8-26 Nouvelles donnes restructures avec deux index

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer une variable d'index
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la cration d'une variable d'index. A cette tape, indiquez les valeurs affecter la variable d'index. Vous pouvez utiliser des nombres squentiels ou le nom des variables d'un groupe de variables d'origine. Vous pouvez galement attribuer un nom et une tiquette la nouvelle variable d'index.

204 Chapitre 8 Figure 8-27 Assistant de restructuration des donnes : Crer une variable d'index

Pour plus d'informations, reportez-vous Exemple d'index unique lors de la restructuration de variables en observations , page 202.

Nombres squentiels : L'Assistant affecte automatiquement des numros

squentiels en tant que valeurs d'index.


Noms des variables : L'Assistant utilise les noms du groupe de variables

slectionn en tant que valeurs d'index. Choisissez un groupe de variables dans la liste propose.
Noms et tiquettes : Cliquez sur une cellule pour modifier le nom de la variable par

dfaut et attribuer une tiquette descriptive la variable d'index.

205 Gestion et transformations de fichiers

Assistant de restructuration des donnes (Restructurer les variables en observations) : Crer plusieurs variables d'index
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la cration de plusieurs variables d'index. A cette tape, indiquez le nombre de niveaux de chaque variable d'index. Vous pouvez galement attribuer un nom et une tiquette la nouvelle variable d'index.
Figure 8-28 Assistant de restructuration des donnes : Crer plusieurs variables d'index

Pour plus d'informations, reportez-vous Exemple de deux index lors de la restructuration de variables en observations , page 202.

206 Chapitre 8

Nombre de niveaux enregistrs dans le fichier actuel ? Dterminez le nombre de

niveaux de facteur enregistrs dans les donnes actuelles. Un niveau dfinit un groupe d'observations ayant t soumis des conditions identiques. En cas de facteurs multiples, vous devez organiser les donnes actuelles de faon ce que les niveaux du premier facteur correspondent un index principal qui inclut les niveaux des facteurs suivants.
Nombre de niveaux crer dans le nouveau fichier ? Entrez le nombre de niveaux pour chaque index. Les valeurs des variables d'index multiples sont toujours des nombres squentiels. Les valeurs dbutent 1 et s'incrmentent chaque niveau. L'incrmentation du premier index est la plus lente ; celle du dernier index est la plus rapide. Niveaux combins (total) : Vous ne pouvez pas crer plus de niveaux que dans les

donnes actuelles. Etant donn que les donnes restructures vont contenir une ligne pour chaque combinaison de traitements, l'Assistant vrifie le nombre de niveaux que vous crez. Il va comparer le produit des niveaux crs au nombre de variables figurant dans vos groupes de variables. Ils doivent tre identiques.
Noms et tiquettes : Cliquez sur une cellule pour modifier le nom de la variable par

dfaut et attribuer une tiquette descriptive aux variables d'index.

Assistant de restructuration des donnes (Restructurer les variables en observations) : Options


Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes de variables en lignes. A cette tape, prcisez les options du nouveau fichier restructur.

207 Gestion et transformations de fichiers Figure 8-29 Assistant de restructuration des donnes : Options

Suppression des variables non slectionnes ? Lors de la phase de slection des

variables (tape 3), vous avez indiqu les groupes de variables restructurer, les variables copier et une variable d'identification parmi les donnes actuelles. Les donnes des variables slectionnes vont figurer dans le nouveau fichier. Si d'autres variables figurent dans les donnes actuelles, vous pouvez les supprimer ou les conserver.
Conservation des donnes manquantes ? L'Assistant recherche des valeurs nulles dans

chacune des nouvelles lignes potentielles. Une valeur nulle est une valeur manquante par dfaut ou vide. Vous pouvez conserver ou supprimer les lignes qui contiennent uniquement des valeurs nulles.

208 Chapitre 8

Cration d'une variable de dcompte ? L'Assistant peut crer une variable de dcompte dans le nouveau fichier. Elle contient le nombre de nouvelles lignes gnres par une ligne des donnes actuelles. Une variable de dcompte peut s'avrer utile lorsque vous choisissez de supprimer les valeurs nulles du nouveau fichier. Il est en effet alors possible de crer un nombre de lignes diffrent pour une ligne prcise des donnes actuelles. Cliquez sur une cellule pour modifier le nom de la variable par dfaut et attribuer une tiquette descriptive la variable de dcompte.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Slectionnez Variables
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. A cette tape, dcrivez le mode d'utilisation des variables du fichier actuel dans le nouveau fichier.

209 Gestion et transformations de fichiers Figure 8-30 Assistant de restructuration des donnes : Slectionnez Variables

Elments d'identification des groupes d'observations dans les donnes actuelles ? Un groupe d'observations est un groupe de lignes apparentes. En effet, ces dernires mesurent la mme unit d'observation, comme un individu ou une institution. L'Assistant doit pouvoir reprer les variables du fichier actuel qui identifient les groupes d'observations afin d'intgrer chacun d'entre eux dans une ligne du nouveau fichier. Dplacez vers la liste Variable(s) de l'identificateur les variables qui identifient les groupes d'observations dans le nouveau fichier. Les variables qui servent diviser le fichier de donnes actuel sont automatiquement affectes l'identification des groupes. Chaque fois que l'Assistant dtecte une nouvelle combinaison de valeurs d'identification, il cre une ligne. Vous devez par consquent trier les observations du fichier actuel sur la base des valeurs des variables d'identification, dans le mme ordre que les variables qui figurent dans la liste Variable(s) de l'identificateur. Vous pouvez trier le fichier actuel l'tape suivante.

210 Chapitre 8

Mode de cration des groupes de variables dans le nouveau fichier ? Dans les donnes d'origine, une variable apparat dans une seule colonne. Dans le nouveau fichier de donnes, cette variable apparat dans plusieurs colonnes. Les variables d'index correspondent aux variables incluses dans les donnes actuelles dont l'Assistant se sert pour crer des colonnes. Les donnes restructures contiendront une nouvelle variable pour chacune des valeurs uniques figurant dans ces colonnes. Dplacez vers la liste Variable(s) d'index les variables qui doivent servir la cration des groupes de variables. Parmi les possibilits offertes par l'Assistant, vous pouvez galement opter pour le tri des nouvelles colonnes par index. Devenir des autres colonnes ? L'Assistant dtermine automatiquement ce que vont devenir les variables qui demeurent dans la liste Fichier actuel. Il vrifie pour chaque variable si les valeurs des donnes varient au sein d'un groupe d'observations. Si tel est le cas, l'Assistant restructure, dans le nouveau fichier, les valeurs dans un groupe de variables. Dans le cas contraire, l'Assistant copie les valeurs dans le nouveau fichier.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Trier Donnes
Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. A cette tape, indiquez si vous voulez trier le fichier actuel avant de le restructurer. Chaque fois que l'Assistant dtecte une nouvelle combinaison de valeurs d'identification, il cre une ligne. Vous devez par consquent trier les donnes d'aprs les variables identifiant les groupes d'observations.

211 Gestion et transformations de fichiers Figure 8-31 Assistant de restructuration des donnes : Trier Donnes

Organisation des lignes dans le fichier actuel ? Dterminez le mode de tri des donnes actuelles et les variables qui servent identifier les groupes de variables (dfinis l'tape prcdente).

Oui : L'Assistant trie automatiquement les donnes actuelles par variable

d'identification, dans le mme ordre que les variables qui figurent dans la liste Variable(s) de l'identificateur prsente l'tape prcdente. Slectionnez cette option lorsque les donnes ne sont pas tries par variable d'identification ou lorsque vous avez des doutes ce propos. Cette option implique un passage

212 Chapitre 8

distinct des donnes, mais elle assure un tri adquat des lignes dans l'optique de la restructuration.

Non : L'Assistant ne trie pas les donnes actuelles. Slectionnez cette option

lorsque vous tes certain que les donnes actuelles sont tries sur la base des variables qui identifient les groupes d'observations.

Assistant de restructuration des donnes (Restructurer les observations en variables) : Options


Remarque : L'Assistant vous propose cette tape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. A cette tape, prcisez les options du nouveau fichier restructur.

213 Gestion et transformations de fichiers Figure 8-32 Assistant de restructuration des donnes : Options

Mode de tri des groupes de variables dans le nouveau fichier


Par variable : L'Assistant regroupe les variables cres partir d'une variable

d'origine.
Par index : L'Assistant regroupe les variables en fonction des valeurs des variables

d'index.
Exemple : Les variables restructurer sont l et h, et l'index est mois :
l h mois

Le rsultat du regroupement par variable est le suivant :


l.jan l.fv h.jan

214 Chapitre 8

Le rsultat du regroupement par index est le suivant :


l.jan h.jan l.fv

Cration d'une variable de dcompte : L'Assistant peut crer une variable de dcompte

dans le nouveau fichier. Elle contient le nombre de lignes des donnes actuelles qui a permis de crer une ligne dans le nouveau fichier de donnes.
Crer des variables indicatrices : L'assistant peut utiliser les variables d'index pour

crer des variables indicatrices dans le nouveau fichier de donnes. Il cre une variable pour chaque valeur unique de la variable d'index. Les variables indicatrices signalent la prsence ou l'absence d'une valeur pour une observation. Une variable indicatrice a la valeur 1 si l'observation a une valeur ; sinon, elle a la valeur 0.
Exemple : La variable d'index est produit. Elle enregistre les produits achets par un

client. Les donnes d'origine sont les suivantes :


client 1 1 2 3 produit poussin oeufs oeufs poussin

La cration d'une variable indicatrice entrane la cration d'une variable pour chaque valeur unique de produit. Les donnes restructures sont les suivantes :
client 1 2 3 poussin indicateur 1 0 1 oeufs indicateurs 1 1 0

Dans cet exemple, les donnes restructures pourraient tre utilises pour obtenir des effectifs des produits achets par le client.

Assistant de restructuration des donnes : Terminer


Il s'agit de la dernire tape de l'Assistant de restructuration de donnes. Dfinissez l'objet de vos spcifications.

215 Gestion et transformations de fichiers Figure 8-33 Assistant de restructuration des donnes : Terminer

Restructurer : L'assistant cre le fichier restructur. Choisissez cette option pour

remplacer immdiatement le fichier actuel. Remarque : Si les donnes d'origine sont pondres, les nouvelles donnes sont galement pondres moins que la variable qui sert de pondration ne soit restructure ou supprime du nouveau fichier.

Coller la syntaxe : L'assistant colle la syntaxe gnre dans une fentre de syntaxe.

Slectionnez cette option si vous n'tes pas prt remplacer le fichier actuel, lorsque vous voulez modifier sa syntaxe ou lorsque vous souhaitez l'enregistrer en vue d'une utilisation ultrieure.

Chapitre

Utilisation du rsultat

Lorsque vous lancez une procdure, les rsultats sont affichs dans une fentre appele le Viewer. Dans cette fentre, vous pouvez facilement naviguer vers toutes les parties du rsultat que vous voulez voir. Vous pouvez galement manipuler le rsultat et crer un document contenant prcisment le rsultat voulu, avec la disposition et le formatage appropris.

Viewer
Les rsultats sont affichs dans le Viewer. Vous pouvez utiliser le Viewer pour :

parcourir les rsultats ; afficher ou masquer les tableaux et diagrammes slectionns ; modifier l'ordre d'affichage des rsultats en dplaant les lments slectionns ; dplacer des lments entre le Viewer et d'autres applications.

217

218 Chapitre 9 Figure 9-1 Viewer

Le Viewer est divis en deux panneaux :


Le panneau de gauche du Viewer contient une lgende du contenu du rsultat. Le panneau droit contient les tableaux statistiques, les diagrammes et les textes.

Vous pouvez utiliser les barres de dfilement pour parcourir les rsultats ou cliquer sur un lment de la ligne de lgende pour aller directement au tableau ou diagramme correspondant. Vous pouvez cliquer et faire glisser le bord droit de la fentre de lgende pour modifier la largeur de la fentre.

Utilisation du Viewer en mode brouillon


Si vous prfrez les sorties en texte simple plutt que les tableaux pivotants interactifs, vous pouvez utiliser le Viewer en mode brouillon.
Pour utiliser le Viewer en mode brouillon :

219 Utilisation du rsultat E A partir du menu de n'importe quelle fentre, slectionnez : Edition Options... E Dans l'onglet Gnral, cliquez sur Viewer en mode brouillon comme type de rsultat. E Pour modifier les options de format de sortie du Viewer en mode brouillon, cliquez sur l'onglet Viewer en mode Brouillon.

Pour plus d'informations, reportez-vous Viewer en mode brouillon dans Chapitre 10 , page 251.
E A partir du menu de n'importe quelle fentre, slectionnez : Aide Rubriques E Cliquez sur l'onglet Index dans la fentre Rubriques d'aide. E Tapez Viewer en mode brouillon et double-cliquez sur l'entre d'index.

Affichage et masquage des rsultats


Dans le Viewer, vous pouvez slectionner individuellement des tableaux ou les rsultats d'une procdure pour les afficher ou les masquer. Cette option est utile si vous voulez limiter la proportion de rsultats visibles dans le panneau de contenu.

Masquage des tableaux et diagrammes


E Double-cliquez sur l'icne Livre dans le panneau de lgende du Viewer.

ou
E Cliquez sur l'lment pour le slectionner.

220 Chapitre 9 E A partir du menu, slectionnez : Affichage Masquer

ou
E Cliquez sur l'icne Livre ferm (Masquer) dans la barre d'outils Lgende.

L'icne Livre ouvert (Montrer) devient l'icne active, indiquant que l'lment est dsormais masqu.

Pour masquer les rsultats d'une procdure


E Cliquez sur la bote gauche du nom de la procdure dans le panneau de lgende.

Cela masque tous les rsultats de la procdure et rduit l'affichage de la lgende.

Dplacement, suppression et copie de rsultats


Vous pouvez rarranger les rsultats en copiant, en dplaant ou en effaant un lment ou un groupe d'lments.

Dplacement des rsultats dans le Viewer


E Cliquez sur un lment du panneau de lgende ou de contenu pour le slectionner.

(Maj-Clic pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus)
E Utilisez la souris pour cliquer et faire glisser les lments slectionns (maintenir le

bouton enfonc pendant que vous faites glisser les lments slectionns).
E Relchez le bouton de la souris lorsque le curseur se trouve sur l'lment situ juste

au-dessus de l'emplacement o vous voulez placer les lments slectionns. Vous pouvez galement dplacer les lments l'aide des commandes Couper et Coller aprs du menu Edition.

221 Utilisation du rsultat

Pour supprimer des rsultats dans le Viewer


E Cliquez sur un lment du panneau de lgende ou de contenu pour le slectionner.

(Maj-Clic pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus).
E Appuyez sur la touche Supprimer.

ou
E A partir du menu, slectionnez : Edition Supprimer

Pour copier des rsultats dans le Viewer


E Cliquez sur des lments du panneau de lgende ou de contenu pour les slectionner.

(Maj-Clic pour slectionner plusieurs lments, ou Ctrl-clic pour slectionner des lments non contigus).
E Maintenez la touche Ctrl enfonce pour cliquer et faire glisser les lments

slectionns (maintenez le bouton de la souris enfonc pendant que vous faites glisser les lments slectionns).
E Relchez le bouton de la souris pour dposer les lments l'endroit dsir.

Vous pouvez galement copier les lments l'aide des commandes Copier et Coller aprs du menu Edition ou du menu contextuel.

Modification de l'alignement
Par dfaut, tous les rsultats sont initialement aligns gauche. Vous pouvez modifier l'alignement initial (dans le menu Edition, choisissez Options, puis l'onglet Viewer), ou vous pouvez modifier l'alignement des lments slectionns tout moment.

222 Chapitre 9

Modification de l'alignement des rsultats


E Slectionnez les lments aligner (cliquez sur les lments dans le panneau de

lgende ou de contenu ; pour slectionner plusieurs lments, cliquez dessus tout en appuyant sur la touche Maj ou Ctrl).
E A partir du menu, slectionnez : Format Aligner gauche

Les autres options d'alignement incluent Centrer et Aligner droite. Remarque : Tous les rsultats sont affichs dans le Viewer avec alignement gauche. Seul l'alignement des rsultats imprims est affect par les paramtres d'alignement. Les lments centrs et aligns droite sont identifis par un symbole situ au-dessus et gauche des lments en question.

Lgende du Viewer
Le panneau de lgende fournit une table des matires du document Viewer. Vous pouvez utiliser le panneau de lgende pour naviguer dans votre rsultat et contrler l'affichage du rsultat. La plupart des actions dans le panneau de lgende ont un effet correspondant sur le panneau de contenu.

Slectionner un lment dans le panneau de lgende slectionne et affiche l'lment correspondant dans le panneau de contenu. Dplacer un lment dans le panneau de lgende dplace l'lment correspondant dans le panneau de contenu. Rduire la ligne de lgende masque le rsultat de tous les lments des niveaux rduits.

223 Utilisation du rsultat Figure 9-2 Panneau de lgende rduit et rsultats masqus

Contrler l'Affichage du Rsultat : Pour contrler l'affichage du rsultat, vous pouvez :


Maximiser et Rduire l'affichage de la ligne de lgende. Modifier le niveau de ligne de lgende pour les lments slectionns. Modifier la taille des lments dans l'affichage de la ligne de lgende. Modifier la police utilise dans l'affichage de la ligne de lgende.

Rduction et dveloppement de la vue de la ligne de lgende


E Cliquez sur la bote gauche de l'lment de ligne de lgende rduire ou tendre.

ou
E Cliquez sur l'lment dans la ligne de lgende.

224 Chapitre 9 E A partir du menu, slectionnez : Affichage Plier

ou
Affichage Dvelopper

Modification du niveau de lgende


E Cliquez sur l'lment du panneau de lgende pour le slectionner. E Cliquez sur la flche gauche de la barre d'outil de la Ligne de lgende pour

promouvoir l'lment (le dplacer vers la gauche).


E Cliquez sur la flche droit de la barre d'outil de la Ligne de lgende pour rtrograder

l'lment (dplacer l'lment vers la droite). ou A partir du menu, slectionnez :


Edition Bordure Dvelopper

ou
Edition Bordure Rduire

Modifier le niveau de lgende est particulirement utile aprs avoir dplac des lments dans un niveau de lgende. Dplacer des lments peut modifier le niveau de lgende des lments slectionns, et vous pouvez utiliser les boutons de flche gauche et de flche droite dans la barre d'outils de la Ligne de lgende pour restaurer le niveau d'origine.

225 Utilisation du rsultat

Pour modifier la taille des lments dans la lgende


E A partir du menu, slectionnez : Affichage Taille de la ligne de lgende Petit

D'autres options incluent Moyen et Grand. Les icnes et les textes associs changent de taille.

Pour modifier la police dans la lgende


E A partir du menu, slectionnez : Affichage Police de la ligne de lgende E Slectionnez une police.

Ajout d'lments au Viewer


Dans le Viewer, vous pouvez ajouter des lments tels que des titres, du nouveau texte, des diagrammes ou des donnes provenant d'autres applications.

Pour ajouter un nouveau titre ou texte


Des lments textes qui ne sont pas lis un tableau ou un diagramme peuvent tre ajouts au Viewer.
E Cliquez sur le tableau, diagramme ou autre objet qui prcdera le titre ou texte. E A partir du menu, slectionnez : Insrer Nouveau titre

ou
Insrer Nouveau texte E Double-cliquez sur le nouvel objet.

226 Chapitre 9 E Entrez le texte souhait cet emplacement.

Pour insrer un diagramme


Des graphiques de versions antrieures de SPSS peuvent tre insrs dans le Viewer. Pour insrer un diagramme :
E Cliquez sur le tableau, diagramme ou autre objet qui prcdera le diagramme. E A partir du menu, slectionnez : Insrer Ancien diagramme... E Slectionnez un fichier diagramme.

Ajout d'un fichier texte


E Dans le panneau de lgende ou de contenu du Viewer, cliquez sur le tableau,

diagramme ou autre objet qui prcdera le texte.


E A partir du menu, slectionnez : Insrer Fichier texte... E Slectionnez un fichier texte.

Pour modifier le texte, double-cliquez dessus.

Utilisation de rsultats dans d'autres applications


Les tableaux pivotants et graphiques SPSS peuvent tre copis et colls dans d'autres applications Windows telles que les traitements de texte ou les tableurs. Vous pouvez coller les tableaux pivotants ou les graphiques dans l'un des divers formats suivants :
Objet imbriqu : Pour des applications supportant les objets ActiveX, vous pouvez

imbriquer des tableaux pivotants et des diagrammes interactifs. Aprs avoir coll le tableau, vous pouvez l'activer sur place en double-cliquant dessus puis le modifier comme dans le Viewer.

227 Utilisation du rsultat

Image (mtafichier) : Vous pouvez coller des tableaux pivotants, des rsultats texte

et des diagrammes en tant qu'images (mtafichiers). Le format image peut tre redimensionn dans l'autre application, et quelquefois dit dans une mesure limite l'aide des outils de l'autre application. Les tableaux pivotants colls comme images conservent toutes leurs caractristiques de bordures et de polices.
RTF (texte enrichi) : Les tableaux pivotants peuvent tre colls dans d'autres applications au format RTF. Dans la plupart des applications, cette procdure colle le tableau pivotant en tant que tableau pouvant tre modifi dans une autre application. Bitmap : Les diagrammes peuvent tre colls dans d'autres applications en tant que

bitmaps.
BIFF : Le contenu d'un tableau peut tre coll dans une feuille de calcul et conserver sa prcision numrique. Texte : Le contenu d'un tableau peut tre copi et coll comme texte. Cette option peut tre utile pour les applications telles que le courrier lectronique, o l'application ne peut accepter ou transmettre que du texte.

Pour copier un tableau ou un diagramme


E Slectionnez le tableau ou diagramme copier. E A partir du menu, slectionnez : Edition Copier

Copie et collage des rsultats dans une autre application


E Copiez les rsultats dans le Viewer. E Dans les menus de l'application cible, choisissez : Edition Coller

ou
Edition Collage spcial...

228 Chapitre 9

Coller : Les sorties sont copies vers le Presse-papiers dans un certain nombre de formats. Chaque application dtermine le meilleur format utiliser pour Coller. Dans beaucoup d'applications, Coller collera les rsultats en tant qu'image (mtafichier). Pour les applications de traitement de texte, Coller collera les tableaux pivotants au format RTF, ce qui collera le tableau pivotant comme un tableau. Pour les tableurs, Coller colle les tableaux pivotants au format BIFF. Les diagrammes sont colls en tant que mtafichiers. Collage spcial : Les rsultats sont copis dans le Presse-papiers dans de multiples formats. Collage spcial vous permet de slectionner le format voulu dans la liste des formats disponibles pour l'application cible.

Incorporation d'un tableau dans une autre application


Vous pouvez imbriquer des tableaux pivotants et des diagrammes interactifs dans d'autres applications au format ActiveX. Un objet imbriqu peut tre activ sur place en double cliquant dessus puis en le modifiant et le faisant pivoter comme dans le Viewer. Si vous avez des applications prenant en charge les objets Active-X :
E Excutez le fichier objs-on.bat situ dans le rpertoire d'installation du programme.

(Double-cliquez sur le fichier pour l'excuter.) Ceci active l'incorporation ActiveX pour les tableaux pivotants. Le fichier objs-off.bat dsactive l'incorporation des objets ActiveX. Pour incorporer un tableau pivotant ou un diagramme interactif dans une autre application :
E Dans le Viewer, copiez le tableau. E Dans les menus de l'application cible, choisissez : Edition Collage spcial... E Dans la liste, slectionnez Objet tableau pivotant SPSSouSPSS Graphics Control Object.

229 Utilisation du rsultat

L'application cible doit prendre en charge les objets ActiveX. Voir la documentation de l'application pour plus d'informations sur la prise en charge de ActiveX. Certaines applications qui ne prennent pas en charge ActiveX pourront initialement accepter des tableaux pivotants ActiveX mais faire preuve ensuite d'instabilit. Ne vous fiez pas aux objets imbriqus jusqu' ce que vous ayez test la stabilit de votre application avec les objets Active-X imbriqus.

Collage d'un tableau pivotant ou d'un diagramme en tant qu'image (mtafichier)


E Dans le Viewer, copiez le tableau ou le diagramme. E Dans les menus de l'application cible, choisissez : Edition Collage spcial... E Dans la liste, slectionnez Image.

L'lment est coll comme mtafichier. Seule la strate et les colonnes visibles lorsque l'lment a t copi sont disponibles dans le mtafichier. Les autres strates et colonnes masques ne sont pas disponibles.

Collage d'un tableau pivotant en tant que tableau (RTF)


E Dans le Viewer, copiez le tableau pivotant. E Dans les menus de l'application cible, choisissez : Affichage Collage spcial... E Dans la liste, slectionnez Texte format (RTF) ou Texte enrichi.

Le tableau pivotant est coll en tant que tableau. Seule la strate et les colonnes visibles lorsque l'lment a t copi sont colles dans le tableau. Les autres strates et colonnes masques ne sont pas disponibles. Vous pouvez copier et coller un seul tableau pivotant la fois ce format.

230 Chapitre 9

Collage d'un tableau pivotant en tant que texte


E Dans le Viewer, copiez le tableau. E Dans les menus de l'application cible, choisissez : Affichage Collage spcial... E Dans la liste, choisissez Texte non format.

Le texte du tableau pivotant non format contient des tabulations entre les colonnes. Vous pouvez aligner des colonnes en ajustant les marques de tabulation dans l'autre application.

Copie et collage de plusieurs lments dans une autre application


E Slectionnez les tableaux et/ou graphiques copier. (Maj-clic ou Ctrl-clic pour

slectionner plusieurs lments)


E A partir du menu, slectionnez : Edition Copier les objets E Dans l'application cible, partir du menu, slectionnez : Edition Coller

Remarque : Utiliser Copier les objets pour copier plusieurs lments du Viewer vers une autre application seulement. Pour copier et coller dans SPSS (par exemple, entre deux fentres du Viewer), utilisez Copier dans le menu Edition.

Collage d'objets dans le Viewer


Des objets provenant d'autres applications peuvent tre colls dans le Viewer. Vous pouvez utiliser soit Coller aprs, soit Collage spcial. Les deux types de collage placent le nouvel objet la suite de l'objet actuellement slectionn dans le Viewer. Utilisez Collage spcial lorsque vous voulez choisir le format de l'objet coller.

231 Utilisation du rsultat

Collage spcial
Collage spcial vous permet de slectionner le format de l'objet copi coller dans le Viewer. Les types de fichier possibles pour l'objet dans le Presse-papiers sont lists. L'objet sera insr dans le Viewer la suite de l'objet actuellement slectionn.
Figure 9-3 Bote de dialogue Collage spcial

Collage d'objets d'une autre application dans le Viewer


E Copiez l'objet dans l'autre application. E Dans le panneau de lgende ou de contenu du Viewer, cliquez sur le tableau,

diagramme ou autre objet qui prcdera l'objet coller.


E A partir du menu, slectionnez : Edition Collage spcial... E Dans la liste, slectionnez le format de l'objet.

232 Chapitre 9

Exporter rsultats
L'option Exporter le rsultat enregistre les tableaux pivotants SPSS et les lments texte au format HTML, texte, Word/RTF et Excel, et enregistre les diagrammes sous divers formats communment utiliss par d'autres applications.
Document rsultat : Exporte toute combinaison de tableaux pivotants, rsultat texte et

diagrammes.

Pour les formats HTML et texte, les diagrammes sont exports dans le format d'exportation du diagramme slectionn. Pour le format document HTML, les tableaux sont intgrs par rfrence, et vous devez exporter les tableaux sous un format adapt pour permettre leur intgration dans des documents HTML. Pour le format document texte, une ligne est insre dans le fichier texte pour chaque diagramme, indiquant le nom de fichier du diagramme export. Pour le format Word/RTF, les diagrammes sont exports au format mtafichier Windows et incorpors dans le document Word. Les diagrammes ne sont pas inclus dans les documents Excel.

Document Rsultat (sans Graphiques) : Exporte les tableaux pivotants et les rsultats texte. Les diagrammes du Viewer sont ignors. Graphiques uniquement : Les formats d'exportation disponibles sont les suivants : mtafichier Windows (WMF), bitmap Windows (BMP), PostScript encapsul (EPS), JPEG, TIFF, PNG ou PICT Macintosh. Exporter quoi : Vous pouvez exporter tous les objets du Viewer, tous les objets visibles ou seulement les objets slectionns. Format d'exportation : Pour les documents de rsultat, les options disponibles sont HTML, texte, Word/RTF et Excel ; pour les formats HTML et texte, les diagrammes sont exports au format du diagramme slectionn dans la bote de dialogue Options. Pour Graphiques Seulement, slectionnez un format d'exportation de graphiques dans la liste droulante. Pour les documents de rsultat, les tableaux pivotants et le texte sont exports de la faon suivante :

Fichier HTML (*.htm) : Les tableaux pivotants sont exports comme des tableaux

HTML. Les rsultats texte sont publis au format HTML pr-format.


Fichier texte (*.txt) : Les tableaux pivotants peuvent tre exports en format tabul

ou avec espaces. Tous les rsultats texte sont exports en format avec espaces.

233 Utilisation du rsultat

Fichier Excel (*.xls) : Les lignes, colonnes et cellules des tableaux pivotants sont

exportes comme des lignes, colonnes et cellules Excel, avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs d'arrire-plan, etc.). Le rsultat texte est export avec tous les attributs de police. Chaque ligne du rsultat texte est une ligne dans le fichier Excel, avec le contenu de toute la ligne dans une seule cellule.
Fichier Word/RTF (*.doc) : Les tableaux pivotants sont exports comme des tableaux

Word avec tous les attributs de formatage (bordures de cellule, styles de police, couleurs d'arrire-plan, etc.). Le rsultat texte est export en tant que fichier RTF. Le rsultat texte dans SPSS apparat toujours dans une police espacement fixe et est export avec les mmes attributs de police. Une police espacement fixe est ncessaire pour le bon alignement des rsultats texte spars par des espaces.
Systme de gestion des rsultats : Vous pouvez galement exporter automatiquement

tous les rsultats ou tous les types de rsultat dfinis par l'utilisateur, tels que les fichiers texte et les fichiers de donnes au format HTML, XML et SPSS. Pour plus d'informations, reportez-vous Systme de gestion des rsultats dans Chapitre 47 , page 689.

Exportation des rsultats


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Exporter... E Entrez un nom de fichier (ou un prfixe pour les graphiques) et slectionnez un

format d'exportation.

234 Chapitre 9 Figure 9-4 Bote de dialogue Exporter rsultats

235 Utilisation du rsultat Figure 9-5 Rsultat export en format HTML

Options HTML, Word/RTF et Excel


Cette bote de dialogue contrle l'inclusion de notes de bas de page et de lgendes pour les documents exports aux formats HTML, Word/RTF et Excel, et les options d'exportation des diagrammes pour les documents HTML.

236 Chapitre 9

Format Image : Contrle le format d'exportation des diagrammes et les paramtres

facultatifs, comme la taille pour les documents HTML. Pour le format Word/RTF, tous les diagrammes sont exports au format mtafichier (WMF) Windows. Pour Excel, les diagrammes sont exclus.

Dfinition des options d'exportation HTML, Word/RTF et Excel


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Exporter... E Slectionnez Fichier HTML, Fichier Word/RTF ou Fichier Excel comme format

d'exportation.
E Cliquez sur Options.

Options texte
Options texte contrle les options de format des tableaux pivotants, des lments textes et des graphiques ainsi que l'insertion de notes de bas de page et de lgendes pour les documents exports en format texte.

237 Utilisation du rsultat Figure 9-6 Bote de dialogue Options texte

Les tableaux pivotants peuvent tre exports en format tabul ou avec espaces. Pour le format tabul, si une cellule n'est pas vide, son contenu et un caractre de tabulation sont imprims. Si une cellule est vide, un caractre de tabulation seul est imprim. Tous les rsultats texte sont exports en format avec espaces. Tous les rsultats avec espaces ncessitent une police point fixe (espacement unique) pour un alignement correct.
Formatage de cellule : Pour les tableaux pivotants avec espaces, par dfaut tous les

sauts de lignes sont supprims et chaque colonne est fixe la largeur de la plus longue tiquette ou valeur de la colonne. Pour limiter la largeur des colonnes et insrer des sauts de ligne dans les longues tiquettes, spcifiez un nombre de caractres pour la largeur de la colonne. Ce rglage n'affecte que les tableaux pivotants.
Sparateurs de cellules : Pour les sorties de tableaux pivotants avec espaces, vous pouvez spcifier les caractres utiliss pour crer les bordures de cellules. Format Image : Contrle le format d'exportation des graphiques et les paramtres

facultatifs, comme la taille.

238 Chapitre 9

Pour dfinir les options d'exportation de texte


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Exporter... E Slectionnez Fichier texte comme format d'exportation. E Cliquez sur Options.

Taille du diagramme
L'option Taille du diagramme contrle la taille des diagrammes exports. Les spcifications de pourcentage personnalises vous permettent de diminuer ou d'augmenter la taille du diagramme export jusqu' 200 pour cent.
Figure 9-7 Bote de dialogue Taille d'export des graphiques

Dfinition de la taille des diagrammes exports


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Exporter... E Pour les documents de rsultat, cliquez sur Options, slectionnez le format d'exportation, puis cliquez sur Taille graphique.

239 Utilisation du rsultat E Pour Diagrammes seuls, slectionnez le format d'exportation, puis cliquez sur Taille graphique.

Options d'exportation de diagrammes au format JPEG


Profondeur des couleurs : Vous pouvez exporter les graphiques JPEG en mode Couleurs vraies 24 bits ou 256 niveaux de gris. Espace de couleurs : Cette option fait rfrence au codage des couleurs dans l'image. Le modle de couleurs YUV est l'un des modes de codage des couleurs. Il est couramment utilis pour la transmission de donnes au format vido numrique ou MPEG. Les lettres de ce sigle identifient les signaux Y, U et V. Le composant Y dtermine le niveau de gris ou luminance. Les composants U et V dfinissent la chrominance (informations de couleur).

Les ratios correspondent au taux d'chantillonnage de chaque composant. Si vous rduisez les taux d'chantillonnage U et V, vous rduisez la taille du fichier (mais galement sa qualit). L'option Espace de couleurs dtermine le degr de perte des couleurs dans l'image exporte. Si le paramtrage YUV 4:4:4 n'entrane aucune perte, les configurations YUV 4:2:2 et YUV 4:1:1 constituent un compromis entre la rduction de la taille du fichier (espace disque) et la baisse de la qualit des couleurs affiches.
Encodage progressif : Permet le chargement progressif de l'image. L'image apparat

tout d'abord dans une faible rsolution, puis sa qualit augmente au fur et mesure de son chargement.
Paramtre de qualit de compression : Contrle le taux de compression en fonction

de la qualit de l'image. Plus la qualit de l'image est leve, plus le fichier export est volumineux.
Oprations de couleur : Les oprations suivantes sont disponibles :

Inverser : Chaque pixel est enregistr dans la couleur inverse de sa

couleur d'origine.
Correction Gamma : Ajuste l'intensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs d'intensit. Cette option permet principalement d'claircir ou d'assombrir l'image bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).

240 Chapitre 9

Options d'exportation de diagrammes aux formats BMP et PICT


Profondeur des couleurs : Dtermine le nombre de couleurs du diagramme export.

Quelle que soit la profondeur de couleur utilise lors de l'enregistrement d'un diagramme, le nombre de couleurs du diagramme est compris entre le nombre de couleurs rellement utilises et le nombre maximal de couleurs autoris par la profondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs (rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses trois couleurs.

Lorsque le nombre de couleurs du diagramme est suprieur au nombre prvu pour cette profondeur, les couleurs sont converties de manire reproduire celles du diagramme. L'option Profondeur d'cran actuelle correspond au nombre de couleurs affiches sur votre cran.

Oprations de couleur : Les oprations suivantes sont disponibles :


Inverser : Chaque pixel est enregistr dans la couleur inverse de sa

couleur d'origine.
Correction Gamma : Ajuste l'intensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs d'intensit. Cette option permet principalement d'claircir ou d'assombrir l'image bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).
Utiliser la compression RLE : (BMP uniquement). Il s'agit d'une technique de compression sans perte qui est prise en charge par les formats de fichiers Windows standard. L'expression compression sans perte signifie que la rduction de la taille des fichiers n'est pas effectue aux dpens de la qualit de l'image.

Options d'exportation de diagrammes aux formats PNG et TIFF


Profondeur des couleurs : Dtermine le nombre de couleurs du diagramme export.

Quelle que soit la profondeur de couleur utilise lors de l'enregistrement d'un diagramme, le nombre de couleurs du diagramme est compris entre le nombre de couleurs rellement utilises et le nombre maximal de couleurs autoris par la profondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs (rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses trois couleurs.

241 Utilisation du rsultat

Lorsque le nombre de couleurs du diagramme est suprieur au nombre prvu pour cette profondeur, les couleurs sont converties de manire reproduire celles du diagramme. L'option Profondeur d'cran actuelle correspond au nombre de couleurs affiches sur votre cran.

Oprations de couleur : Les oprations suivantes sont disponibles :


Inverser : Chaque pixel est enregistr dans la couleur inverse de sa

couleur d'origine.
Correction Gamma : Ajuste l'intensit des couleurs dans le diagramme export

en modifiant la constante gamma utilise pour faire correspondre les valeurs d'intensit. Cette option permet principalement d'claircir ou d'assombrir l'image bitmap. Sa valeur peut tre comprise entre 0,10 (le plus fonc) et 6,5 (le plus clair).
Transparence : Permet de slectionner la couleur qui sera transparente dans le

diagramme export. Cette option est disponible uniquement pour les exportations en mode Couleurs vraies 32 bits. Entrez une valeur entire comprise entre 0 et 255 pour chacune des couleurs. La valeur par dfaut de chaque couleur est 255. De ce fait, la couleur de transparence par dfaut est le blanc.
Format : (TIFF uniquement) Permet de dfinir l'espace de couleurs et de compresser le diagramme export. Vous disposez de toutes les profondeurs de couleur en mode RVB. Seuls les modes Couleurs vraies 24 et 32 bits sont disponibles avec les couleurs CMJN. Avec l'option YCbCr, seul le mode Couleurs vraies 24 bits est disponible.

Options d'exportation de diagrammes au format EPS


Aperu de l'image : Permet d'enregistrer l'aperu d'une image dans l'image EPS. Un aperu sert principalement en cas d'insertion d'un fichier EPS dans un autre document. Si de nombreuses applications ne peuvent pas afficher une image EPS, elles peuvent en revanche afficher l'aperu enregistr avec l'image. L'aperu de l'image peut tre au format WMF (plus petit et plus facilement redimensionnable) ou TIFF (plus souple et pris en charge par un plus grand nombre de plateformes). Vrifiez dans l'application de destination du graphique EPS les formats d'aperu pris en charge.

242 Chapitre 9

Polices TrueType : Permet l'utilisateur d'indiquer le mode d'enregistrement des

polices TrueType dans l'image EPS.

Incorporer en tant que TrueType natif (niveau 3) : Incorpore la plupart des donnes

de police dans le fichier EPS, notamment les informations de lissage des polices (utiles par exemple pour la mise l'chelle de petites tailles). La police PostScript rsultante est appele police Type 42. Remarque : Toutes les imprimantes PostScript ne disposent pas d'un pilote de niveau 3 pouvant lire les polices Type 42).

Convertir en polices PostScript : Convertit les polices TrueType en polices

PostScript (Type 1) en fonction de la famille de polices. Par exemple, la police Times New Roman est convertie en Times et Arial est convertie en Helvetica. Remarque : Ce format est dconseill pour les graphiques interactifs qui utilisent la police SPSS Marker (comme les diagrammes de dispersion) car il n'existe aucun quivalent PostScript significatif aux marques SPSS TrueType.

Remplacer les polices TrueType en courbes : Transforme les polices TrueType

en donnes de courbe PostScript. Vous ne pouvez plus modifier le texte en tant que tel dans les applications de retouche des graphiques EPS. La qualit est galement amoindrie. Cette option s'avre toutefois utile lorsque votre imprimante PostScript ne prend pas en charge les polices Type 42, mais qu'il vous faut conserver des symboles spciaux TrueType, comme des marques dans des diagrammes de dispersion interactifs.

Options d'exportation de diagrammes au format WMF


Aldus placeable : Fournit un degr d'indpendance par rapport au priphrique (taille physique identique en cas d'ouverture 96 ou 120 ppp) ; ce format n'est pas pris en charge par certaines applications. Windows standard : Option prise en charge par la plupart des applications pouvant afficher des mtafichiers Windows.

Dfinir des options d'exportation des diagrammes


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre).

243 Utilisation du rsultat E A partir du menu, slectionnez : Fichier Exporter... E Pour les documents de rsultat, cliquez sur Options, slectionnez le format d'exportation, puis cliquez sur Options de diagramme. E Pour Diagrammes seuls, slectionnez le format d'exportation, puis cliquez sur Options.

Impression de documents du Viewer


Il existe plusieurs moyens de contrler les lments du Viewer imprimer:
Tous les rsultats affichs : Seuls s'impriment les lments affichs dans le panneau de

contenu. Les lments masqus (lments accompagns d'une icne reprsentant un livre ferm dans le panneau de ligne de lgende ou masqus dans les strates rduites des lignes de lgende) ne s'impriment pas.
Tous les rsultats : Tous les rsultats, y compris les lments masqus, s'impriment. Slection : Seuls s'impriment les lments slectionns dans les panneaux de ligne

de lgende et/ou de contenu.


Figure 9-8 Bote de dialogue d'impression du Viewer

244 Chapitre 9

Impression de rsultat et de diagrammes


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Imprimer... E Choisissez les paramtres d'impression voulus. E Cliquez sur OK pour imprimer.

Aperu avant impression


L'Aperu avant impression vous montre ce qui va s'imprimer sur chaque page des documents du Viewer. Il est conseill d'utiliser l'Aperu avant impression avant d'imprimer un document du Viewer car cela permet de voir les lments qui ne sont peut tre pas visibles en regardant tout simplement le panneau de contenu du Viewer, notamment :

Les sauts de page Les strates masques des tableaux pivotants Les ruptures dans les tableaux de grande largeur Les rsultats complets des grands tableaux Les en-ttes et pieds de page imprims sur chaque page

245 Utilisation du rsultat Figure 9-9 Aperu avant impression

Si des rsultats sont slectionns dans le Viewer, l'aperu n'affiche que les rsultats slectionns. Pour avoir un aperu de tous les rsultats, vrifiez que rien n'est slectionn dans le Viewer.

Pour afficher un aperu avant impression


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre). E A partir du menu, slectionnez : Fichier Aperu avant impression

246 Chapitre 9

Mise en page
La Mise en page vous permet de contrler :

La taille et l'orientation du papier Les marges Les en-ttes et pieds de page La numrotation des pages La taille imprime pour les graphiques

Figure 9-10 Bote de dialogue Mise en page

Les paramtres de mise en page sont enregistrs dans le document du Viewer. La Mise en page affecte uniquement les paramtres des documents du Viewer. Ces paramtres n'ont aucun effet sur l'impression des donnes de l'diteur de donnes ou de la syntaxe d'une fentre de syntaxe.

Pour modifier la mise en page


E Activez la fentre du Viewer (cliquez n'importe o dans la fentre).

247 Utilisation du rsultat E A partir du menu, slectionnez : Fichier Mise en page... E Modifiez les paramtres et cliquez sur OK.

Mise en page : En-ttes et pieds de page


Les en-ttes et pieds de page sont les informations qui s'impriment en haut et en bas de chaque page. Vous pouvez saisir le texte afficher dans les en-ttes et les pieds de page. Vous pouvez galement utiliser la barre d'outils qui se trouve au milieu de la bote de dialogue pour insrer :

La date et l'heure Des numros de page Le nom du fichier du Viewer Les tiquettes des en-ttes de lignes de lgende Les titres et les sous-titres

Figure 9-11 Options Mise en page onglet En-tte/pied de page

248 Chapitre 9

Les tiquettes d'en-tte des lignes de lgende indiquent l'en-tte de ligne de lgende de premier, deuxime, troisime et/ou quatrime niveau pour le premier lment de chaque page. Les titres et sous-titres de page impriment les titres et sous-titres de la page courante. Les titres et sous-titres sont crs avec les options Insrer titre de page et Insrer sous-titre de page du menu Insrer du Viewer ou avec les commandes TITRE et SOUS-TITRE de la syntaxe de commande. Si vous n'avez indiqu aucun titre ou sous-titre de page, ce paramtre est ignor. Remarque : Les caractristiques de police des nouveaux titres de page et des sous-titres sont vrifies dans l'onglet Viewer de la bote de dialogue Options (Menu Edition). Les caractristiques de police des titres de page et des sous-titres existants peuvent tre modifies en changeant les titres l'aide du Viewer. Slectionnez Aperu avant impression dans le menu Fichier pour voir comment apparatront vos en-ttes et pieds de page sur la page imprime.

Mise en page : Options


Cette bote de dialogue contrle la taille du diagramme imprim, l'espace entre les lments de rsultat imprims, ainsi que la numrotation des pages.
Taille imprime diagramme : Contrle la taille du diagramme imprim par rapport la

taille dfinie pour la page. Le rapport hauteur/largeur du diagramme n'est pas affect par la taille du diagramme imprim. La taille globale d'un diagramme imprim est limite par sa hauteur et par sa largeur. Lorsque les bordures extrieures d'un tableau atteignent les bordures de gauche et de droite de la page, la taille du diagramme ne peut plus augmenter pour occuper plus de hauteur.
Espace entre items : Contrle l'espace entre des lments imprims. Chaque tableau pivotant, diagramme et objet de texte constitue un lment distinct. Ce paramtre n'affecte pas l'affichage des lments dans le Viewer. Commencer page : Numros de page conscutifs commenant partir d'un numro

spcifi.

249 Utilisation du rsultat Figure 9-12 Mise en page onglet Options

Enregistrement des rsultats


Le contenu du Viewer peut tre enregistr comme un document du Viewer. Le document enregistr contient les deux panneaux du Viewer (lgende et contenu).

Enregistrement d'un document du Viewer


E A partir du menu du Viewer, slectionnez : Fichier Enregistrer E Entrez le nom du document et cliquez sur Enregistrer.

Pour enregistrer le rsultat dans un format externe (par exemple HTML ou texte), utilisez Exporter dans le menu Fichier. (Non disponible dans la version autonome du SmartViewer).

250 Chapitre 9

Option Publier
L'option Enregistrer avec mot de passe vous permet de protger par mot de passe vos fichiers Viewer.
Mot de passe : Le mot de passe respecte la casse et peut comporter jusqu' 16 caractres. Si vous dcidez d'affecter un mot de passe, le fichier ne peut pas tre ouvert sans. Code OEM : Laissez ce champ vide moins que vous n'ayez un accord contractuel

avec SPSS Inc. pour distribuer le Smart Viewer. Le code de licence OEM est fourni avec le contrat.

Pour enregistrer les fichiers du Viewer avec un mot de passe


E A partir du menu du Viewer, slectionnez : Fichier Enregistrer avec mot de passe... E Saisissez le mot de passe. E Entrez de nouveau le mot de passe pour le confirmer et cliquez sur OK. E Entrez un nom de fichier dans la bote de dialogue Enregistrer sous. E Cliquez sur Enregistrer.

Remarque : Laissez le code OEM vide moins que vous n'ayez un accord contractuel avec SPSS Inc. pour distribuer le Smart Viewer.

Viewer en mode brouillon

10

Chapitre

Le Viewer en mode brouillon fournit des rsultats sous forme de brouillons , avec :

un rsultat texte simple (au lieu de tableaux pivotants) ; des diagrammes comme images mtafichiers (au lieu d'objets diagramme).

Vous pouvez modifier les rsultats texte du Viewer en mode brouillon, redimensionner les diagrammes, et coller les rsultats texte et les diagrammes dans d'autres applications. Cependant, vous ne pouvez pas modifier les diagrammes, et les fonctionnalits interactives des tableaux pivotants et des diagrammes ne sont pas disponibles.
Figure 10-1 Fentre du Viewer en mode brouillon

251

252 Chapitre 10

Pour crer un rsultat en mode brouillon


E A partir du menu, slectionnez : Fichier Nouveau Rsultat mode brouillon E Pour faire du rsultat en mode brouillon le type de rsultat par dfaut partir du

menu, slectionnez :
Affichage Options... E Cliquez sur l'onglet Gnral. E Slectionnez Brouillon sous Type de navigateur au dmarrage.

Remarque : Le nouveau rsultat est toujours affich dans la fentre de Viewer dsign. Si vous avez ouvert une fentre de Viewer ou de Viewer en mode brouillon, la fentre dsigne est celle qui a t la dernire ouverte ou celle dsigne l'aide de l'outil Fentre dsigne (le point d'exclamation) dans la barre d'outils.

Contrle du format du rsultat en mode brouillon


La sortie qui serait affiche sous forme de tableaux pivotants dans le Viewer est convertie en sortie texte pour le Viewer en mode brouillon. Les paramtres par dfaut pour une sortie de tableaux pivotants convertie sont dfinis comme suit :

Chaque colonne est ajuste en fonction de la largeur de l'tiquette de colonne et les tiquettes ne s'talent pas sur plusieurs lignes. L'alignement est contrl par des espaces ( la place des tabulations). Les caractres de la zone de la police SPSS Marker Set sont utiliss comme des sparateurs de lignes et de colonnes. Si les caractres de cette zone sont dsactivs, les caractres verticaux (|) sont utiliss comme sparateurs de colonnes et les tirets () comme sparateurs de lignes.

Vous pouvez contrler le format du nouveau rsultat en mode brouillon en utilisant les options du Viewer en mode brouillon (menu Edition, Options, onglet Viewer en mode brouillon).

253 Viewer en mode brouillon Figure 10-2 Options du Viewer en mode brouillon

Largeur de colonne : Pour rduire la largeur des tableaux contenant des tiquettes

longues, slectionnez Maximum caractres sous Largeur de colonne. Les tiquettes plus longues que la largeur spcifie sont adaptes pour s'ajuster la largeur maximale.

254 Chapitre 10 Figure 10-3 Rsultat en mode brouillon avant et aprs le paramtrage de la largeur de colonne maximale

Sparateurs de lignes et de colonnes : Comme autre choix de caractres de la bote pour les bordures de lignes et de colonnes, vous pouvez utiliser les paramtres des sparateurs de cellules pour vrifier que les sparateurs de lignes et de colonnes s'affichent dans le nouveau rsultat en mode brouillon. Vous pouvez spcifier diffrents sparateurs de cellules ou entrer des espaces vides si vous ne voulez utiliser aucun caractre pour reprer les lignes et colonnes. Vous devez dslectionner la case Afficher les caractres pour indiquer les sparateurs de cellules.

255 Viewer en mode brouillon Figure 10-4 Rsultat en mode brouillon avant et aprs le paramtrage des sparateurs de cellules

Sparer colonnes avec Espaces / Tabulations : Le Viewer en mode brouillon est conu pour afficher une sortie dans laquelle les sparations sont des espaces dans une police espacement fixe (non proportionnelle). Si vous souhaitez coller un rsultat en mode brouillon dans une autre application, vous devez utiliser une police espacement fixe pour aligner correctement les colonnes avec un espace de sparation. Si vous slectionnez les tabulations comme sparateurs de colonnes, vous pouvez utiliser la police de votre choix dans l'autre application et dfinir les tabulations pour aligner le rsultat correctement. Cependant, la sortie avec des tabulations de sparation ne s'alignera pas correctement dans le Viewer en mode brouillon.

256 Chapitre 10 Figure 10-5 Rsultat avec des tabulations de sparation dans le Viewer en mode brouillon puis formate dans un traitement de texte

Dfinition des options du Viewer en mode brouillon


E A partir du menu, slectionnez : Affichage Options... E Cliquez sur l'onglet Viewer en mode brouillon. E Slectionnez les paramtres souhaits. E Cliquez sur OK ou sur Appliquer.

257 Viewer en mode brouillon

Les options d'affichage des rsultats dans le Viewer affectent seulement le nouveau rsultat produit aprs modification des paramtres Un rsultat dj affich dans le Viewer n'est pas affect par les changements de ces paramtres.

Attributs de polices
Vous pouvez modifier les attributs de polices (police, taille, style) du rsultat texte dans le Viewer en mode brouillon. Cependant, si vous utilisez les caractres de la bote pour les bordures de lignes et de colonnes, l'alignement appropri de la colonne pour du texte spar par des espaces ncessite l'utilisation d'une police espacement fixe (monoespace), telle que Courier. De plus, d'autres modifications de police, comme la taille et le style (par exemple gras, italique), appliques une partie seulement d'un tableau peuvent affecter l'alignement de colonne.
Bordures de lignes et de colonnes : Les bordures de lignes et de colonnes pleines par dfaut utilisent la police SPSS Marker Set. Les caractres de traage de lignes utiliss pour tracer les bordures ne sont pas pris en charge par d'autres polices.

Pour modifier les polices dans le Viewer en mode brouillon


E Slectionnez le texte auquel vous voulez appliquer la modification de police. E A partir des menus du Viewer en mode brouillon, slectionnez : Format Police... E Slectionnez les attributs de police appliquer au texte slectionn.

Pour imprimer un rsultat en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Imprimer... E Pour imprimer uniquement la partie slectionne du rsultat en mode brouillon,

slectionnez le rsultat imprimer.

258 Chapitre 10 E A partir du menu, slectionnez : Fichier Imprimer... E Choisissez Slection.

Aperu avant impression


L'Aperu avant impression vous montre ce qui va s'imprimer sur chaque page pour les documents brouillons. Nous vous conseillons d'utiliser l'Aperu avant impression avant d'imprimer rellement un document du Viewer car cela vous permet de visualiser les lments qui peuvent ne pas avoir t ajusts pour tenir sur une page, comme :

les tableaux longs les tableaux larges produits par la conversion d'une sortie d'un tableau pivotant sans contrle de largeur de colonne en mode brouillon) sur une imprimante dfinie en mode Portrait.

les rsultats texte cres avec l'option de largeur de page Large (options du Viewer

Une sortie trop large pour la page est alors tronque et ne s'imprimera pas sur une autre page. Il existe plusieurs mthodes permettant d'viter qu'un rsultat trop volumineux soit tronqu :

Utilisez une taille de police plus petite (menu Format, Polices). Slectionnez Paysage pour l'orientation de page (menu Fichier, Mise en page). Pour une nouvelle sortie, spcifiez une largeur de colonne maximum troite (menu Edition, Options, onglet Viewer en mode brouillon).

Pour les tableaux longs, utilisez les sauts de page (menu Insertion, Saut de Page) pour contrler les endroits o le tableau passe sur une autre page.

Pour visualiser un aperu avant impression du Viewer en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Aperu avant impression

259 Viewer en mode brouillon

Pour enregistrer une sortie du Viewer en mode brouillon


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Enregistrer

La sortie du Viewer en mode brouillon est enregistre au format RTF (texte enrichi).

Pour enregistrer le rsultat en mode brouillon en tant que texte


E A partir des menus du Viewer en mode brouillon, slectionnez : Fichier Exporter...

Vous pouvez exporter tout le texte ou juste le texte slectionn Seul le rsultat texte (sortie de tableau pivotant convertie et sortie texte) est enregistre dans les fichiers exports. Les diagrammes ne sont pas inclus.

Tableaux pivotants

11

Chapitre

Beaucoup de rsultats sont prsents dans le Viewer sous forme de tableaux pouvant tre pivots de manire interactive. Cela signifie que vous pouvez rarranger les lignes, colonnes et strates.

Manipulation d'un tableau pivotant


Les options de manipulation des tableaux pivotants comprennent les lments suivants :

Transposer des lignes et des colonnes. Dplacer des lignes et des colonnes. Crer des strates multidimensionnelles. Grouper et sparer des lignes et des colonnes. Montrer et masquer des cellules. Faire pivoter des tiquettes de lignes et de colonnes. Trouver des dfinitions de termes.

Pour modifier un tableau pivotant


E Double-cliquez sur le tableau.

Cela active l'diteur de tableaux pivotants.

Edition de deux tableaux pivotants ou plus en une fois


E Cliquez sur le tableau pivotant avec le bouton de droite.

261

262 Chapitre 11 E A partir du menu contextuel, slectionnez : Objet tableau pivotant SPSS Ouvrir E Rptez l'opration pour chaque tableau pivotant que vous voulez modifier.

Chaque tableau pivotant est prt tre dit dans sa propre fentre.

Pour faire pivoter un tableau l'aide d'icnes


E Activez le tableau pivotant. E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Structure pivotante E Dplacez le pointeur de la souris au dessus de chaque icne pour faire apparatre une

Note d'aide qui vous indique quelle dimension du tableau cette icne reprsente.
E Faites glisser une icne d'une dimension l'autre. Figure 11-1 Structure pivotante

Cette action modifie la disposition du tableau. Par exemple, supposez que l'icne reprsente une variable possdant les modalits Oui et Non et que vous faites glisser l'icne du plateau Ligne vers le plateau Colonne. Avant le dplacement, Oui et Non taient des tiquettes de ligne. Aprs le dplacement, ce sont des tiquettes de colonne.

263 Tableaux pivotants

Pour identifier des dimensions dans un tableau pivotant


E Activez le tableau pivotant. E Si la structure pivotante n'est pas dj active, partir des menus du tableau pivotant,

choisissez :
Tableau pivotant Structure pivotante E Cliquez sur une icne et maintenez le bouton enfonc.

Cette action met en surbrillance les tiquettes de dimension dans le tableau pivotant.

Transposition des lignes et des colonnes


E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Transposer lignes et colonnes

Cette action a le mme effet que faire glisser toutes les icnes de lignes dans la dimension Colonne et les icnes de colonnes dans la dimension Lignes.

Pour modifier l'ordre d'affichage


L'ordre des icnes de rotation dans un plateau de dimension reflte l'ordre d'affichage des lments dans le tableau pivotant. Pour modifier l'ordre d'affichage des lments dans une dimension :
E Activez le tableau pivotant. E Si la structure pivotante n'est pas dj active, partir des menus du tableau pivotant,

choisissez :
Tableau pivotant Structure pivotante E Faites glisser les icnes de chaque plateau pour les placer dans l'ordre dsir (de

gauche droite ou de haut en bas).

264 Chapitre 11

Pour dplacer des lignes et des colonnes dans un tableau pivotant


E Activez le tableau pivotant. E Cliquez sur l'tiquette de la ligne ou colonne que vous voulez dplacer. E Cliquez et faites glisser l'tiquette vers sa nouvelle position. E Dans le menu contextuel, choisissez Insrer Avant ou Permuter.

Remarque : Assurez-vous que l'option Faire glisser pour Copier du menu Edition n'est pas active (coche). Si l'option Faire glisser pour Copier est active, dsactivez-la.

Pour grouper des lignes ou des colonnes et insrer des tiquettes de groupe
E Activez le tableau pivotant. E Slectionnez les tiquettes des lignes ou des colonnes que vous voulez grouper

(cliquez et faites glisser ou Maj-Clic pour slectionner plusieurs tiquettes).


E A partir du menu, slectionnez : Affichage Group

Une tiquette de groupe est insre automatiquement. Double-cliquez sur l'tiquette de groupe pour modifier le texte de l'tiquette.
Figure 11-2 Groupes et tiquettes de lignes et de colonnes
Etiquette de groupe de colonnes

Femmes Etiquette de groupe de lignes Employ de bureau Agent de scurit Manager 206 10

Hommes 157 27 74

Total 363 27 84

Remarque : Pour ajouter des lignes ou des colonnes un groupe existant, vous devez d'abord dissocier les lments du groupe, puis crer un nouveau groupe incluant les lments supplmentaires.

265 Tableaux pivotants

Pour dissocier des lignes ou des colonnes et supprimer des tiquettes de groupe
E Activez le tableau pivotant. E Slectionnez l'tiquette de groupe (cliquez n'importe o dans l'tiquette) des lignes ou

des colonnes que vous voulez dissocier.


E A partir du menu, slectionnez : Affichage Ungroup

Dissocier supprime automatiquement l'tiquette de groupe.

Pour faire pivoter des tiquettes de tableaux pivotants


E Activez le tableau pivotant. E A partir du menu, slectionnez : Format Pivoter Etiquettes de colonnes internes

ou
Pivoter Etiquettes de lignes externes

266 Chapitre 11 Figure 11-3 Etiquettes de colonnes pivotes

Seules les tiquettes des colonnes les plus internes et les tiquettes des lignes les plus externes peuvent tre pivotes.

Rtablissement des pivots aux valeurs par dfaut


Aprs avoir excut une ou plusieurs oprations de pivot, vous pouvez rtablir la disposition d'origine du tableau pivotant.
E A partir du menu Tableau pivotant, choisissez Remettre pivots leur valeur par dfaut.

Cette action ne rtablit que les changements rsultant d'une rotation des lments de lignes, de colonnes ou de strates entre les dimensions. Elle n'affecte pas les changements tels que grouper, dissocier ou dplacer des lignes ou des colonnes.

Pour rechercher la dfinition d'une tiquette dans un tableau pivotant


Vous pouvez obtenir de l'Aide contextuelle sur les tiquettes de cellules dans les tableaux pivotants. Par exemple, si Moyenne apparat comme une tiquette, vous pouvez obtenir une dfinition de la moyenne.

267 Tableaux pivotants E Cliquez sur une cellule d'tiquette avec le bouton droit de la souris. E A partir du menu contextuel, slectionnez Qu'est-ce que c'est ?

Vous devez cliquer avec le bouton droit de la souris sur la cellule d'tiquette elle-mme plutt que sur les cellules de donnes de la ligne ou de la colonne. L'aide contextuelle n'est pas disponible pour les tiquettes dfinies par l'utilisateur telles que les noms de variable ou les tiquettes de valeurs.

Utilisation des strates


Vous pouvez afficher un tableau bidimensionnel spar pour chaque modalit ou combinaison de modalits. Le tableau peut tre imagin comme un empilement de strates, dont seule la strate suprieure est visible.

Pour crer et afficher des strates


E Activez le tableau pivotant et slectionnez Structure pivotante dans le menu Tableau

pivotant si vous ne l'avez pas encore fait.


E Faites glisser une icne du plateau Ligne ou du plateau Colonne vers le plateau Strate.

268 Chapitre 11 Figure 11-4 Dplacer des modalits dans des strates

Chaque icne de strate possde des flches gauche et droite. Le tableau visible est celui de la strate suprieure.
Figure 11-5 Modalits en strates spares

Classification minoritaire : oui Classification minoritaire : non Total Catgorie Employ de bureau d'emploi Agent de scurit Manager Total 194 176 Sexe Homme Femme Total 40 87 47 13 13 4 4 64 40 104

269 Tableaux pivotants

Pour modifier des strates


E Cliquez sur l'une des flches de l'icne de strate.

ou
E Slectionnez une modalit partir de la liste droulante de strates. Figure 11-6 Slectionnez des strates partir des listes droulantes.

Atteindre la modalit de la strate


Aller Modalit de Strate vous permet de modifier les strates d'un tableau pivotant. Cette bote de dialogue est particulirement utile lorsqu'il existe un grand nombre de strates ou lorsqu'une strate possde de nombreuses modalits.

Pour aller une strate d'un tableau


E A partir des menus du tableau pivotant, choisissez : Tableau pivotant Aller la strate...

270 Chapitre 11 Figure 11-7 Bote de dialogue Atteindre la modalit de la strate

E Slectionnez une dimension de strate dans la liste Modalit visible. La liste Modalits

de Strates affiche toutes les modalits de la dimension slectionne.


E Slectionnez la modalit souhaite dans la liste Modalits de Strates et cliquez sur OK.

Cette action change la strate et ferme la bote de dialogue. Pour afficher une autre strate sans fermer la bote de dialogue :
E Slectionnez la modalit et cliquez sur Appliquer.

Pour dplacer des strates vers des lignes ou des colonnes


Si le tableau que vous affichez est empil en strates dont seule la strate suprieure est visible, vous pouvez afficher toutes les strates en mme temps, soit de haut en bas (lignes), soit de gauche droite (colonnes). Il doit y avoir au moins une icne dans le plateau Strate.
E Dans le menu Tableau pivotant, choisissez Dplacer Strates vers Lignes.

ou
E Dans le menu Tableau pivotant, choisissez Dplacer Strates vers Colonnes.

271 Tableaux pivotants

Vous pouvez galement dplacer les strates vers les lignes ou les colonnes en faisant glisser leurs icnes dans la structure pivotante Strate, Ligne et Colonne.

Signets
Les signets vous permettent d'enregistrer diffrents affichages d'un tableau pivotant. Les signets incluent :

le positionnement des lments dans les dimensions de ligne, colonne et strate l'ordre d'affichage des lments dans chaque dimension la strate affiche pour chaque lment de strate

Pour dfinir un signet pour un affichage de tableau pivotant


E Activez le tableau pivotant. E Faites pivoter le tableau vers l'affichage pour lequel vous voulez dfinir un signet. E A partir du menu, slectionnez : Tableau pivotant Signets E Entrez un nom pour le signet. Les noms de signets ne font pas la distinction

majuscules-minuscules.
E Cliquez sur Ajouter.

Chaque tableau pivotant a son propre jeu de signets. A l'intrieur d'un tableau pivotant, chaque nom de signet doit tre unique, mais vous pouvez utiliser des noms de signets en double dans des tableaux pivotants diffrents.

Pour obtenir un affichage de tableau pivotant pour lequel un signet a t dfini auparavant
E Activez le tableau pivotant.

272 Chapitre 11 E A partir du menu, slectionnez : Tableau pivotant Signets E Cliquez sur le nom du signet dans la liste. E Cliquez sur Atteindre.

Pour renommer un signet de tableau pivotant


E Activez le tableau pivotant. E A partir du menu, slectionnez : Tableau pivotant Signets E Cliquez sur le nom du signet dans la liste. E Cliquez sur Renommer. E Entrez le nouveau nom de signet. E Cliquez sur OK.

Montrer ou masquer des cellules


Il est possible de masquer de nombreux types de cellules :

Etiquettes de dimension. Modalits, y compris la cellule d'tiquette et les cellules de donnes d'une ligne ou d'une colonne. Etiquettes de modalit (sans masquer les cellules de donnes). Notes de bas de page, titres et lgendes.

Pour masquer des lignes et des colonnes dans un tableau


E Ctrl-Alt-Clic sur l'tiquette de modalit de la ligne ou de la colonne masquer.

273 Tableaux pivotants E A partir des menus du tableau pivotant, choisissez : Affichage Masquer

ou
E Cliquez avec le bouton de droite de la souris sur la ligne ou la colonne mise en

surbrillance pour afficher le menu contextuel.


E Dans le menu contextuel, choisissez Masquer modalit.

Pour afficher des colonnes et des lignes masques dans un tableau


E Slectionnez une autre tiquette dans la mme dimension que la ligne ou la colonne

masque. Par exemple, si la modalit Femme de la dimension Sexe est masque, cliquez sur la modalit Homme.
E A partir des menus du tableau pivotant, choisissez : Affichage Montrer toutes les modalits dans le nom de la dimension

Par exemple, choisissez Montrer Toutes les Modalits dans Sexe. ou


E A partir des menus du tableau pivotant, choisissez : Affichage Montrer Tout

Cette action affiche toutes les cellules masques du tableau. (Si l'option Masquer les Lignes et Colonnes vides est slectionne dans les proprits de ce tableau, une ligne ou une colonne totalement vide reste masque).

Pour masquer ou afficher une tiquette de dimension


E Activez le tableau pivotant. E Slectionnez l'tiquette de dimension ou toute tiquette de modalit dans la dimension.

274 Chapitre 11 E A partir du menu, slectionnez : Affichage Masquer (ou montrer) Etiquette de dimension.

Pour masquer ou afficher une note de bas de page dans un tableau


E Slectionnez une note de bas de page. E A partir du menu, slectionnez : Affichage Masquer (ou montrer)

Pour afficher ou masquer une lgende ou un titre dans un tableau


E Slectionnez une lgende ou un titre. E A partir du menu, slectionnez : Affichage Masquer (ou montrer)

Modification des rsultats


L'aspect et le contenu de chaque lment texte ou tableau du rsultat peuvent tre dits. Vous pouvez :

Appliquer un modle de tableau. Modifier les proprits du tableau actuel. Modifier les proprits des cellules dans le tableau. Modifier du texte. Ajouter des notes de bas de page et des lgendes aux tableaux. Ajouter des lments au Viewer. Copier et Coller le rsultat dans d'autres applications.

275 Tableaux pivotants

Modification de l'aspect des tableaux


Vous pouvez modifier l'aspect d'un tableau soit en ditant les proprits du tableau, soit en appliquant un modle de tableau. Chaque modle de tableau comprend un regroupement de proprits de tableau, y compris sur l'aspect gnral, les proprits des notes de bas de page, les proprits des cellules et les bordures. Vous pouvez slectionner l'un des Aspects de tableau prdfinis ou crer et enregistrer un modle de tableau personnalis.

Modles de tableaux
Un modle de tableau est un ensemble de proprits dfinissant l'aspect d'un tableau. Vous pouvez slectionner un modle de tableau prdfini ou crer votre propre modle de tableau. Avant ou aprs avoir appliqu un modle de tableau, vous pouvez modifier les formats de cellules pour des cellules individuelles ou des groupes de cellules l'aide des proprits de cellule. Les formats de cellule dits demeurent, mme lorsque vous appliquez un nouveau modle de tableau. Par exemple, vous pouvez commencer par appliquer le modle de tableau 9POINT, puis slectionner une colonne de donnes et utiliser la bote de dialogue Formats des cellules pour appliquer une police en caractres gras cette colonne. Vous modifiez ensuite le modle de tableau et appliquez l'option BOXED. La colonne prcdemment slectionne reste en caractres gras tandis que le reste des caractristiques du modle BOXED est appliqu. En option, vous pouvez restaurer pour toutes les cellules les formats dfinis par le modle de tableau actuel. Cette action restaure toutes les cellules qui ont t dites. Si l'option Comme Affich est slectionne dans la liste de fichiers de modle de tableau, toutes les cellules modifies reprennent les proprits actuelles du tableau.

Pour appliquer ou enregistrer un modle de tableau


E Activez un tableau pivotant. E A partir du menu, slectionnez : Format Modles de tableaux...

276 Chapitre 11 Figure 11-8 Bote de dialogue Aspects de tableau

E Slectionnez un modle de tableau dans la liste de fichiers. Pour slectionner un fichier dans un autre rpertoire, cliquez sur Parcourir. E Cliquez sur OK pour appliquer le modle de tableau au tableau pivotant slectionn.

Pour modifier ou crer un Modle de tableau


E Slectionnez un modle de tableau dans la liste de fichiers. E Cliquez sur Modifier modle. E Modifiez les proprits de tableau pour obtenir les attributs souhaits et cliquez sur OK. E Cliquez sur Enregistrer aspect pour enregistrer le modle de tableau modifi ou sur Enregistrer sous pour l'enregistrer comme nouveau modle.

Modifier un modle de tableau n'affecte que le tableau pivotant slectionn. Un modle de tableau modifi n'est pas appliqu d'autres tableaux utilisant cet Aspect, sauf si vous slectionnez ces tableaux et appliquez nouveau le modle de tableau.

277 Tableaux pivotants

Proprits du tableau
La bote de dialogue Proprits de tableau vous permet de fixer les proprits gnrales d'un tableau et les styles de cellules pour diverses parties d'un tableau ainsi que d'enregistrer un ensemble de proprit en tant que modle de tableau. A l'aide des onglets de cette bote de dialogue, vous pouvez :

Contrler les proprits gnrales, telles que masquer les lignes ou les colonnes vides et ajuster les proprits d'impression. Contrler le format et la position des marques de notes de bas de page. Dterminer des formats spcifiques pour les cellules de donnes, pour les tiquettes de ligne et de colonne et pour les autres zones du tableau. Contrler la largeur et la couleur des lignes formant les bordures de chaque zone du tableau. Contrler les proprits d'impression.

Pour modifier les proprits d'un tableau pivotant


E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E A partir des menus du tableau pivotant, choisissez : Format Proprits du tableau... E Slectionnez un onglet (Gnral, Notes de bas de page, Formats de cellule, Bordures ou Impression). E Slectionnez les options souhaites. E Cliquez sur OK ou sur Appliquer.

Les nouvelles proprits sont appliques au tableau pivotant slectionn. Pour appliquer de nouvelles proprits de tableau un modle de tableau au lieu du tableau slectionn seulement, modifiez le modle de tableau (menu Format, Modle de tableau).

278 Chapitre 11

Proprits de tableau : Gnral


Plusieurs proprits s'appliquent au tableau dans son ensemble. Vous pouvez :

Afficher ou masquer des lignes et des colonnes. (Une ligne ou colonne vide ne possde rien dans aucune des cellules de donnes) Contrler l'emplacement des tiquettes de ligne. Elles peuvent se placer dans le coin suprieur gauche ou tre embotes. Contrler la largeur maximum et minimum de colonne (exprime en points).

Figure 11-9 Proprits de tableau Onglet Gnral

Modification des proprits gnrales d'un tableau


E Slectionnez l'onglet Gnral. E Slectionnez les options souhaites. E Cliquez sur OK ou sur Appliquer.

279 Tableaux pivotants

Proprits de tableau : Notes de bas de page


Les proprits des marques de notes de bas de page comprennent le style et la position par rapport au texte.

Le style des marques de notes de bas de page est soit numrique (1, 2, 3...), soit alphabtique (a, b, c...). Les marques des notes de bas de page peuvent tre attaches au texte en indices ou en exposants.

Figure 11-10 Proprits de tableau Onglet Notes de bas de page

Modification des proprits des marques des notes de bas de page


E Slectionnez l'onglet Notes de bas de page. E Slectionnez un format pour les marques des notes de bas de page.

280 Chapitre 11 E Slectionnez une position pour les marques. E Cliquez sur OK ou sur Appliquer.

Proprits de tableau : Formats de cellule


Pour le formatage, un tableau est divis en zones : Titre, Strates, Etiquettes de coin, Etiquettes de ligne, Etiquettes de colonne, Donnes, Lgende et Notes de bas de page. Pour chaque zone d'un tableau, vous pouvez modifier les formats des cellules associes. Les formats de cellule comprennent les lments suivants : caractristiques de texte (police, taille, couleur, style), alignement horizontal et vertical, ombrage des cellules, couleurs de premier plan et d'arrire-plan, et marges intrieures des cellules.
Figure 11-11 Zones d'un tableau

Les formats des cellules sont appliqus aux zones (modalits d'informations). Ce ne sont pas des caractristiques des cellules individuelles. Cette distinction est importante lorsqu'on fait pivoter un tableau. Par exemple :

Si vous spcifiez une police en caractres gras pour un format de cellules dans les tiquettes de colonnes, celles-ci apparatront en caractres gras quelles que soient les informations affiches dans la dimension de la colonneet si vous dplacez

281 Tableaux pivotants

un lment de la dimension de colonne vers une autre dimension, il ne conserve pas les caractres gras des tiquettes de colonnes.

Si vous appliquez les caractres gras sur les tiquettes de colonne simplement en mettant en surbrillance les cellules dans un tableau pivotant actif et en cliquant sur le bouton Gras de la barre d'outils, le contenu de ces cellules demeurera en caractres gras quelle que soit la dimension dans laquelle vous les dplacez, et les tiquettes de colonne ne resteront pas en caractres gras pour d'autres lments dplacs dans la dimension de colonne.

Figure 11-12 Proprits de tableau Onglet Formats de cellule

Modification des formats des cellules


E Slectionnez l'onglet Formats de cellule. E Slectionnez une zone dans la liste droulante ou cliquez sur une zone de l'chantillon.

282 Chapitre 11 E Slectionnez des caractristiques pour la zone. Vos slections se refltent dans

l'chantillon.
E Cliquez sur OK ou sur Appliquer.

Proprits de tableau : Bordures


Pour chaque emplacement de bordure dans un tableau, vous pouvez slectionner un style et une couleur de ligne. Si vous slectionnez Aucun comme style, il n'y aura aucune ligne l'emplacement slectionn.
Figure 11-13 Proprits de tableau Onglet Bordures

Pour modifier les bordures d'un tableau


E Cliquez sur l'onglet Bordures.

283 Tableaux pivotants E Slectionnez un emplacement de bordure, soit en cliquant sur son nom dans la liste,

soit en cliquant sur une ligne dans la zone d'chantillon. (Maj-clic pour slectionner plusieurs noms, Ctrl-Clic pour slectionner plusieurs noms non contigus)
E Slectionnez un style de ligne ou Aucun. E Slectionnez une couleur. E Cliquez sur OK ou sur Appliquer.

Pour afficher des bordures masques dans un tableau pivotant


Pour les tableaux possdant peu de bordures visibles, vous pouvez afficher les bordures masques. Cela peut faciliter des tches telles que modifier la largeur des colonnes. Les bordures masques (quadrillage) sont affiches dans le Viewer mais ne sont pas imprimes.
E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E A partir du menu, slectionnez : Affichage Quadrillage

Proprits de tableau : Impression


Pour les tableaux pivotants imprims, vous pouvez contrler les proprits suivantes :

Imprimer toutes les strates ou seulement la strate suprieure du tableau, et imprimer chaque strate sur une page spare. (Ceci n'affecte que l'impression, pas l'affichage des strates dans le Viewer) Rtrcir un tableau horizontalement ou verticalement pour qu'il tienne dans la page lors de l'impression. Contrler les lignes veuves et orphelines le nombre minimal de lignes et de colonnes qui seront contenues dans une section imprime d'un tableau si le tableau est trop large et/ou trop long pour la taille dfinie de la page. (Remarque : Si un tableau est trop long pour tenir sur le restant de la page actuelle car il y a un autre rsultat au-dessus dans la page, mais qu'il tient dans la longueur de page

284 Chapitre 11

dfinie, il est automatiquement imprim sur une nouvelle page, quel que soit le paramtrage des lignes veuves/orphelines)
Inclure du texte de suite pour des tableaux qui ne peuvent s'ajuster une seule page.

Vous pouvez afficher du texte de suite au bas de chaque page et en haut de chaque page. Si aucune option est slectionne, le texte de suite de sera pas affich.

Pour contrler l'impression d'un tableau pivotant


E Cliquez sur l'onglet Impression. E Slectionnez les options d'impressions souhaites. E Cliquez sur OK ou sur Appliquer.

Polices
Un modle de tableau vous permet de spcifier des caractristiques de police pour diffrentes zones du tableau. Vous pouvez galement changer la police de toute cellule individuellement. Les options de police dans une cellule comprennent le type de police, le style et la taille. Vous pouvez galement masquer le texte ou le souligner. Si vous spcifiez des proprits de police dans une cellule, ces proprits s'appliquent dans toutes les strates du tableau possdant la mme cellule.

285 Tableaux pivotants Figure 11-14 Bote de dialogue Police

Modification de la police d'une cellule


E Activez le tableau pivotant et slectionnez le texte que vous voulez modifier. E A partir des menus du tableau pivotant, choisissez : Format Police...

En option, vous pouvez slectionner une police, un style de police et une taille, spcifier si vous voulez masquer ou souligner le texte ou slectionner une couleur et un style d'criture.

Largeur des cellules de donnes


Fixer la Largeur des Cellules de Donnes est utilis pour fixer une mme largeur toutes les cellules de donnes.

286 Chapitre 11 Figure 11-15 Bote de dialogue Fixer la Largeur des Cellules de Donnes

Modification de la largeur des cellules de donnes


E Activez le tableau pivotant. E A partir du menu, slectionnez : Format Largeur des cellules... E Entrez une valeur pour la largeur des cellules.

Modification de la largeur d'une colonne de tableau pivotant


E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E Dplacez le pointeur de la souris dans les tiquettes de modalit jusqu' ce qu'il soit

sur la bordure droite de la colonne que vous voulez modifier. Le pointeur se change en flche deux pointes.
E Maintenez le bouton de la souris enfonc pendant que vous faites glisser la bordure

vers sa nouvelle position.

287 Tableaux pivotants Figure 11-16 Modifier la largeur d'une colonne

Vous pouvez modifier les bordures verticales de modalit et de dimension dans la zone des tiquettes de ligne, qu'elles soient masques ou non.
E Dplacez le pointeur de la souris travers les tiquettes de ligne jusqu' voir apparatre

la flche deux pointes.


E Faites-la glisser jusqu' la nouvelle largeur.

Proprits de la cellule
Les proprits de cellules s'appliquent une cellule slectionne. Vous pouvez changer le format des valeurs, l'alignement, les marges et de l'ombrage. Les Proprits des cellules supplantent les proprits de tableau ; donc, si vous changez les proprits de tableau, vous ne modifierez pas les proprits de cellules appliques individuellement.

Modification des proprits de la cellule


E Activez un tableau et slectionnez une cellule du tableau. E A partir du menu, slectionnez : Format Proprits de la cellule...

288 Chapitre 11

Proprits des cellules : Valeur


Cet onglet de bote de dialogue contrle le format des valeurs d'une cellule. Vous pouvez slectionner des formats pour les nombres, les dates, les heures ou les monnaies et ajuster le nombre de dcimales affiches.
Figure 11-17 Proprits des Cellules Onglet Valeur

Modification des formats des valeurs dans une cellule


E Cliquez sur l'onglet Valeur. E Slectionnez une modalit et un format. E Slectionnez le nombre de dcimales.

Pour modifier le format des valeurs dans une colonne


E Ctrl-Alt-clic sur l'tiquette de colonne. E Cliquez avec le bouton droit de la souris sur la colonne en surbrillance. E A partir du menu contextuel, slectionnez Proprits de la cellule.

289 Tableaux pivotants E Cliquez sur l'onglet Valeur. E Slectionnez le format que vous voulez appliquer la colonne.

Vous pouvez utiliser cette mthode pour supprimer ou ajouter des symboles pourcentage ou dollar, modifier le nombre de dcimales affiches et passer de la notation numrique normale la notation scientifique.

Proprits des cellules : Alignement


Cet onglet de bote de dialogue fixe l'alignement vertical et horizontal et la direction du texte pour une cellule. Si vous choisissez Mixte, le contenu de la cellule est align selon son type (nombre, date ou texte).
Figure 11-18 Proprits des Cellules Onglet Alignement

290 Chapitre 11

Modification de l'alignement dans les cellules


E Slectionnez une cellule dans le tableau. E A partir des menus du tableau pivotant, choisissez : Format Proprits de la cellule E Cliquez sur l'onglet Alignement.

Lorsque vous slectionnez les proprits d'alignement des cellules, elles s'illustrent dans la zone d'chantillon.

Proprits des cellules : Marges


Cet onglet de bote de dialogue spcifie la marge chaque bord d'une cellule.
Figure 11-19 Proprits des Cellules Onglet Marges

Modification des marges dans les cellules


E Cliquez sur l'onglet Marges.

291 Tableaux pivotants E Slectionnez la valeur de chacune des quatre marges.

Proprits des cellules : Ombrage


Cet onglet de bote de dialogue spcifie le pourcentage d'ombrage ou un contour de cellule ainsi que les couleurs de premier plan et d'arrire-plan pour une zone de cellules spcifie. Cela n'affecte pas la couleur du texte. Le contour de cellule est slectionn dans la liste Surbrillances.
Figure 11-20 Proprits des cellules onglet Ombrage

Modification de l'ombrage des cellules


E Cliquez sur l'onglet Ombrage. E Slectionnez les surbrillances et les couleurs de la cellule.

Marque de bas de page


La Marque de note de bas de page modifie le ou les caractres utiliss pour marquer une note de bas de page.

292 Chapitre 11 Figure 11-21 Bote de dialogue Marque de Note de bas de page

Modification des caractres des marques des notes de bas de page


E Slectionnez une note de bas de page. E A partir des menus du tableau pivotant, choisissez : Format Marque de note de bas de page... E Entrez un ou deux caractres.

Renumrotation des notes de bas de page


Lorsque vous avez fait pivoter un tableau en changeant des lignes, des colonnes et des strates, les notes de bas de page peuvent tre dsactives. Pour renumroter les notes de bas de page :
E Activez le tableau pivotant. E A partir du menu, slectionnez : Format Renumroter notes de bas de page

Slection des lignes et des colonnes dans les tableaux pivotants


La flexibilit des tableaux pivotants place certaines contraintes sur la manire dont vous slectionnez des lignes et des colonnes, et la surbrillance qui indique la ligne ou la colonne slectionne peut s'tendre sur des zones non contigus du tableau.

293 Tableaux pivotants

Pour slectionner une ligne ou une colonne dans un tableau pivotant


E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E Cliquez sur une tiquette de ligne ou de colonne. E A partir du menu, slectionnez : Affichage Slectionnez Cellules de donnes et d'tiquettes

ou
E Ctrl-Alt-clic sur l'tiquette de ligne ou de colonne.

Si le tableau contient plusieurs dimensions dans la zone des lignes ou des colonnes, la slection en surbrillance peut s'tendre sur plusieurs cellules non contigus.

Modification des rsultats d'un tableau pivotant


Le texte qui s'affiche dans le Viewer peut apparatre dans beaucoup d'lments. Vous pouvez modifier le texte ou ajouter de nouveaux textes. Les tableaux pivotants peuvent tre dits en :

Editant du texte dans les cellules du tableau pivotant. Ajoutant des lgendes et des notes de bas de page.

Pour modifier le texte d'une cellule


E Activez le tableau pivotant. E Double-cliquez sur la cellule ou appuyez sur F2. E Editez le texte. E Appuyez sur la touche Entre pour enregistrer vos changements ou appuyez sur la

touche Echap pour restaurer le contenu prcdent de la cellule.

294 Chapitre 11

Ajout de lgendes un tableau


E A partir des menus du tableau pivotant, choisissez : Insrer Lgende

Les mots Lgende du tableau s'affichent au bas du tableau.


E Slectionnez les mots Lgende du tableau et entrez votre texte par-dessus.

Ajout d'une note de bas de page un tableau


Une note de bas de page peut tre attache tout lment d'un tableau.
E Cliquez sur un titre, une cellule ou une lgende dans le tableau pivotant activ. E A partir des menus du tableau pivotant, choisissez : Insrer Note de bas de page... E Slectionnez les mots Note de bas de page et tapez le texte de la note en crasant

le texte prsent.

Impression des tableaux pivotants


Divers facteurs peuvent affecter l'aspect des diagrammes imprims partir de tableaux pivotants et ces facteurs peuvent tre contrls en modifiant les attributs du tableau pivotant.

Pour des tableaux pivotants multidimensionnels (tableaux avec strates), vous pouvez soit imprimer toutes les strates, soit simplement imprimer la strate suprieure (visible). Pour des tableaux pivotants longs ou larges, vous pouvez automatiquement redimensionner le tableau pour ajuster la page ou contrler la position des sauts de tableaux ou des sauts de page.

Utilisez l'Aperu avant impression du menu Fichier pour voir quoi ressembleront les tableaux pivotants imprims.

295 Tableaux pivotants

Pour imprimer les strates masques d'un tableau pivotant


E Activez le tableau pivotant (double-cliquez un endroit quelconque du tableau). E A partir du menu, slectionnez : Format Proprits du tableau E Dans l'onglet Impression, slectionnez Imprimer toutes les strates.

Vous pouvez aussi imprimer chaque strate d'un tableau pivotant sur une page distincte.

Contrle des sauts de tableau pour les tableaux longs et larges


Les tableaux pivotants qui sont soit trop larges soit trop longs pour tre imprims dans la taille de page dfinie sont automatiquement diviss et sont imprims en plusieurs sections. (Pour les tableaux larges, les diffrentes sections s'impriment sur la mme page s'il y a de la place). Vous pouvez:

Contrler la position laquelle les lignes et les colonnes sont diviss les grands tableaux Indiquer les lignes et colonnes qui doivent tre conservs ensemble lors de la division de tableaux

Redimensionner les grands tableaux pour les ajuster la taille dfinie pour la page

Pour spcifier des sauts de ligne et de colonne dans les tableaux pivotants imprims
E Activez le tableau pivotant. E Cliquez sur l'tiquette de colonne gauche de l'endroit o vous souhaitez insrer le

saut ou sur l'tiquette de ligne au-dessus de l'endroit o vous souhaitez insrer le saut.
E A partir du menu, slectionnez : Format Sparer ici...

296 Chapitre 11

Spcification des lignes ou colonnes conserver ensemble


E Activez le tableau pivotant. E Slectionnez les tiquettes des lignes ou colonnes que vous souhaitez conserver

ensemble. (Cliquez-glissez ou Maj+cliquez pour slectionner plusieurs tiquettes de ligne ou de colonne.)


E A partir du menu, slectionnez : Format Insrer Conserver ensemble

Pour redimensionner un tableau pivotant afin de l'ajuster la page


E Activez le tableau pivotant. E A partir du menu, slectionnez : Format Proprits du tableau E Cliquez sur l'onglet Impression. E Cliquez sur Redimensionner largeur de tableau.

et/ou
E Cliquez sur Redimensionner longueur de tableau.

Utilisation de la syntaxe de commande

12

Chapitre

SPSS fournit un puissant langage de commande qui vous permet d'enregistrer et d'automatiser de nombreuses tches. Il fournit galement des fonctionnalits qui ne se trouvent ni dans les menus ni dans les botes de dialogue. La plupart des commandes sont accessibles depuis les menus et botes de dialogue. Cependant, certaines options et commandes ne sont disponibles qu'en utilisant le langage de commande. Celui-ci vous permet d'enregistrer vos travaux dans un fichier de syntaxe afin de vous permettre de relancer votre analyse une date ultrieure ou de l'excuter dans une opration automatise l'aide du systme de production. Un fichier de syntaxe de commande est un fichier texte simple contenant des commandes. Il est possible d'ouvrir une fentre de syntaxe et de taper des commandes, mais il est plus simple de laisser SPSS construire le fichier de syntaxe selon l'une des mthodes suivantes :

Copie de la syntaxe de commande partir des botes de dialogue, Copie de la syntaxe partir du fichier de rsultat, Copie de la syntaxe partir du fichier-journal.

Dans l'aide en ligne d'une procdure donne, cliquez sur le lien de syntaxe de commande dans la liste des rubriques apparentes pour accder au diagramme de syntaxe de la commande correspondante. Pour obtenir une documentation complte sur le langage de commande, reportez-vous au manuel SPSS Command Syntax Reference.

297

298 Chapitre 12

Lors de l'installation de SPSS, la documentation complte sur la syntaxe des commandes est automatiquement installe. Pour accder la documentation sur la syntaxe:
E A partir du menu, slectionnez : Aide Command Syntax Reference.

Rgles de syntaxe de commande


N'oubliez pas les rgles suivantes lorsque vous modifiez et crivez la syntaxe de commande :

Chaque commande doit commencer sur une nouvelle ligne et se terminer par un point. La plupart des sous-commandes sont spares par des barres obliques (/). La barre oblique figurant avant la premire sous-commande de la commande est souvent facultative. Le nom des variables doit tre crit en en toute lettre. Le texte inclus dans les apostrophes ou les guillemets doit tenir sur une seule ligne. Chaque ligne de la syntaxe de commande ne peut dpasser 80 caractres. Un point (.) doit tre utilis pour indiquer les dcimales, indpendamment des paramtres rgionaux dfinis dans Windows. Le nom des variables finissant par un point peut engendrer des erreurs dans les commandes cres par les botes de dialogue. Vous ne pouvez pas crer de tels noms de variable dans les botes de dialogue ; vous devez donc viter d'indiquer ces noms.

La syntaxe de commande respectant la casse, une abrviation de trois lettres peut tre utilise pour spcifier ces commandes. Vous pouvez utiliser autant de lignes voulues pour spcifier une commande unique. Il vous est possible d'ajouter des espaces ou des sauts de ligne presque tous les points d'insertion d'un espace vide, tels que des barres obliques, des parenthses, des oprateurs arithmtique, ou les ajouter entre le nom des variables. Par exemple,
FREQUENCIES

299 Utilisation de la syntaxe de commande VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART.

et
freq var=jobcat gender /percent=25 50 75 /bar.

sont deux choix possibles qui gnrent les mmes rsultats.


Fichiers de syntaxe Systme de production et fichiers INCLUDE : Pour des fichiers de commande excuts l'aide du systme de production ou de la commande INCLUDE, les rgles de syntaxe diffrent lgrement :

Chaque commande doit commencer sur la premire colonne d'une nouvelle ligne. Les lignes suites doivent tre en retrait d'un espace au moins. Le point la fin de la commande est optionnel.

Si vous gnrez une syntaxe de commande en collant les slections d'une bote de dialogue dans une fentre de syntaxe, le format des commandes convient tout mode de production.

Cration d'une syntaxe depuis les botes de dialogue


La mthode la plus simple pour construire un fichier de syntaxe de commande consiste effectuer des slections dans les botes de dialogue et coller la syntaxe dans la fentre correspondante. En collant la syntaxe chaque tape d'une longue analyse, vous pouvez construire un fichier de travail vous permettant de relancer l'analyse ultrieurement ou d'excuter une opration automatise l'aide du systme de production. Dans la fentre de syntaxe, vous pouvez excuter la syntaxe qui a t colle, la modifier et l'enregistrer dans un fichier de syntaxe.

Collage d'une syntaxe depuis les botes de dialogue


E Ouvrez la bote de dialogue et faites vos slections. E Cliquez sur Coller.

300 Chapitre 12

La syntaxe de commande est alors colle dans la fentre correspondante. Si vous n'avez pas ouvert de fentre, une nouvelle fentre s'ouvre automatiquement pour pouvoir y coller la syntaxe.
Figure 12-1 Syntaxe de commande colle depuis une bote de dialogue

Remarque : Si vous ouvrez une bote de dialogue partir des menus d'une fentre de script, le code permettant d'excuter la syntaxe depuis un script est alors coll dans la fentre correspondante.

Utilisation de la syntaxe depuis le fichier de rsultat


Vous pouvez construire un fichier de syntaxe en copiant la syntaxe depuis le fichier apparaissant dans le Viewer. Pour ce faire, slectionnez Afficher commandes dans la bote de dialogue du Viewer avant de lancer l'analyse. Chaque commande apparat donc dans le Viewer accompagn du rsultat de l'analyse. Dans la fentre de syntaxe, vous pouvez excuter la syntaxe qui a t colle, la modifier et l'enregistrer dans un fichier de syntaxe.

301 Utilisation de la syntaxe de commande Figure 12-2 Syntaxe de commande dans le fichier

Copier la syntaxe depuis le fichier de rsultats


E Avant de lancer l'analyse, partir du menu, slectionnez : Affichage Options... E Dans l'onglet Viewer, slectionnez Afficher commandes.

Au cours de l'analyse, les commandes des slections faites dans votre bote de dialogue sont enregistres dans le fichier.
E Ouvrez un fichier de syntaxe prcdemment enregistr ou crez-en un nouveau. Pour

ce faire, partir du menu, slectionnez :


Fichier Nouveau Syntaxe E Dans le Viewer, double-cliquez sur un lment du fichier pour le mettre

302 Chapitre 12

en surbrillance.
E Cliquez et faites glisser la souris pour slectionner la syntaxe copier. E A partir du menu du Viewer, slectionnez : Edition Copier E Dans la fentre de syntaxe, partir du menu, slectionnez : Edition Coller

Utilisation de la syntaxe dans un fichier-journal


Par dfaut, toutes les commandes excutes au cours d'une session sont enregistres dans un fichier-journal nomm spss.jnl (configur dans le menu Edition, commande Options). Vous pouvez modifier le fichier-journal et l'enregistrer en tant que fichier de syntaxe que vous pouvez utiliser pour relancer une analyse, ou l'excuter dans une opration automatise l'aide du systme de production. Le fichier-journal est un fichier texte pouvant tre modifi comme tout autre fichier. Des messages d'erreur et des avertissements tant galement enregistrs dans le fichier-journal avec la syntaxe de commande, vous devez modifier les messages d'erreur et les avertissements gnrs avant d'enregistrer le fichier de syntaxe. Notez toutefois que les erreurs doivent tre rsolues pour que l'analyse puisse s'effectuer correctement. Enregistrez le fichier-journal modifi sous un autre nom. Le fichier-journal tant automatiquement ajout ou cras chaque session, la tentative d'utilisation du mme nom de fichier pour les fichiers de syntaxe et journaux peut gnrer des rsultats inattendus.

303 Utilisation de la syntaxe de commande Figure 12-3 Edition du fichier-journal

Modification de la syntaxe dans un fichier-journal


E Pour ouvrir le fichier-journal, slectionnez partir du menu : Fichier Ouvrir Autre E Ouvrez le fichier-journal (par dfaut, spss.jnl se trouve dans le rpertoire temp).

Slectionnez Tous les fichiers (*.*) dans la liste des types de fichiers ou entrez *.jnl dans la zone de texte Nom de fichier pour afficher les fichiers-journaux dans la liste. Si vous ne parvenez pas trouver le fichier, utilisez Options du menu Edition pour connatre l'emplacement du journal sur votre systme.
E Modifiez le fichier afin de supprimer tout message d'erreur ou avertissement indiqu

par un signe >.


E Enregistrez le fichier-journal modifi sous un autre nom. (Nous vous conseillons

d'utiliser un nom avec une extension .sps. C'est l'extension par dfaut des fichiers de syntaxe.)

304 Chapitre 12

Excuter une syntaxe de commande


E Mettez en surbrillance les commandes excuter dans la fentre de syntaxe. E Cliquez sur le bouton Excuter (en forme de triangle) dans la barre d'outils de la

fentre de l'diteur de syntaxe. ou


E Slectionnez l'une des options du menu Excuter.

Tout : Excute toutes les commandes dans la fentre de syntaxe. Slection : Excute les commandes slectionnes, y compris les commandes

partiellement slectionnes.
Courant : Excute la commande l'endroit o le curseur est situ.
Jusqu' la fin : Excute toutes les commandes partir de l'emplacement du curseur

jusqu' la fin du fichier de syntaxe de commande. Le bouton Excuter dans la barre d'outils de l'diteur de syntaxe excute les commandes slectionnes ou la commande slectionne l'endroit o le curseur est situ si aucun lment n'est slectionn.
Figure 12-4 Barre d'outils Editeur de syntaxe

Commandes Execute multiples


La syntaxe colle depuis des botes de dialogue ou copie depuis le journal peut contenir des commandes EXECUTE. Lorsque vous excutez plusieurs commandes partir d'une fentre de syntaxe, il est inutile de faire appel plusieurs commandes EXECUTE. Vous risquez mme de ralentir les performances car cette commande lit l'intgralit du fichier de donnes.

305 Utilisation de la syntaxe de commande

Si la dernire commande du fichier de syntaxe lit le fichier de donnes (comme une procdure statistique ou graphique), aucune commande EXECUTE n'est ncessaire ; vous pouvez donc supprimer ces commandes. Si vous n'tes pas sr que la dernire commande lise le fichier de donnes, vous pouvez gnralement supprimer toutes les commandes EXECUTE du fichier de syntaxe, l'exception de la dernire.

Fonctions Dcalage positif

Cette exception concerne les commandes de transformation qui contiennent des fonctions Dcalage positif. Dans une srie de commandes de transformation ne contenant aucune commande EXECUTE ni aucune autre commande lisant les donnes, les fonctions Dcalage positif sont calcules une fois toutes les autres transformations effectues, sans tenir compte de l'ordre des commandes. Par exemple :
COMPUTE lagvar=LAG(var1) COMPUTE var1=var1*2

et
COMPUTE lagvar=LAG(var1) EXECUTE COMPUTE var1=var1*2

gnre diffrents rsultats pour la valeur lagvar car la premire valeur utilise la valeur transforme var1 alors que la deuxime utilise la valeur d'origine.

Frquences

13

Chapitre

La procdure Frquences permet d'obtenir des affichages statistiques et graphiques qui servent dcrire de nombreux types de variables. Ds que vous prenez connaissance de vos donnes, la procdure Frquences peut jouer un rle. Pour obtenir un rapport des frquences et un diagramme en btons, vous pouvez trier les diffrentes valeurs par ordre croissant ou dcroissant, ou bien classer les modalits en fonction de leurs frquences. Le rapport de frquences peut tre supprim lorsqu'une variable a plusieurs valeurs distinctes. Vous pouvez tiqueter les diagrammes avec des frquences (par dfaut) ou des pourcentages.
Exemple : Quelle est la rpartition de la clientle d'une socit selon le type d'industrie dont elle fait partie ? Le rsultat pourrait vous apprendre que votre clientle est compose 37,5 % d'organismes d'tat, 24,9 % de socits commerciales, 28,1 % d'tablissements universitaires et 9,4 % du secteur de la sant. Pour des donnes continues et quantitatives, comme par exemple les revenus des ventes, vous pourriez constater que la moyenne de vente par produit est de 3.576 $ avec un cart type de 1.078 $. Diagrammes et statistiques : Effectifs de frquence, pourcentages, pourcentages cumuls, moyenne, mdiane, mode, somme, cart type, variance, intervalle, valeurs minimale et maximale, erreur standard de la moyenne, asymtrie et aplatissement (avec leurs erreurs standard), quartiles, centiles choisis par l'utilisateur, diagrammes en btons, diagrammes en secteurs et histogrammes.

Remarques sur les donnes de frquences


Donnes : Utilisez des codes numriques ou alphanumriques courts pour coder les

variables qualitatives (mesures de niveau nominal ou ordinal).

307

308 Chapitre 13

Hypothses : Les tabulations et les pourcentages fournissent une description utile sur

les donnes de n'importe quelle distribution, particulirement pour les variables disposant de modalits tries ou non. Certaines des statistiques rcapitulatives facultatives, telles que la moyenne et l'cart type, sont fondes sur la thorie de normalit et sont appropries pour des variables quantitatives avec une distribution symtrique. Les statistiques de base, telles que la mdiane, les quartiles et les centiles, sont appropries pour les variables quantitatives, qu'elles rpondent ou non au critre de normalit.

Echantillon de rsultat
Figure 13-1 Rsultat de frquences

309 Frquences

Pour obtenir des tableaux de frquences


E A partir du menu, slectionnez : Analyse Statistiques descriptives Frquences... Figure 13-2 Bote de dialogue Frquences

E Slectionnez une ou plusieurs variables qualitatives ou quantitatives.

Sinon, vous pouvez :


Cliquer sur Statistiques pour obtenir des statistiques descriptives pour des variables quantitatives. Cliquer sur Diagrammes pour obtenir des diagrammes en btons, des diagrammes en secteurs ou des histogrammes. Cliquer sur Format pour dfinir l'ordre de prsentation des rsultats.

310 Chapitre 13

Statistiques des frquences


Figure 13-3 Bote de dialogue Frquences : Statistiques

Fractiles : Valeurs d'une variable quantitative qui divisent les donnes tries en

classes par centime. Les quartiles (25ime, 50ime et 75ime centiles) divisent les observations en quatre classes de taille gale. Si vous souhaitez un nombre gal de classes diffrent de quatre, slectionnez Partition en n classes gales. Vous pouvez galement spcifier des centiles particuliers (par exemple, le 95ime centile, valeur au-dessus de 95 % des observations).
Tendance centrale : Les statistiques dcrivant la position de la distribution

comprennent la Moyenne, la Mdiane, le Mode et la Somme de toutes les valeurs.


Moyenne : Mesure de la tendance centrale. Moyenne arithmtique ; somme

divise par le nombre d'observations.


Mdiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.

Mode : Valeur qui revient le plus frquemment. Si plusieurs valeurs partagent

la plus grande frquence d'occurrence, chacune d'elles constitue un mode. La procdure Frquences ne rend compte que du plus petit mode.

Somme : Somme ou total des valeurs, pour toutes les observations n'ayant pas

de valeur manquante.

311 Frquences

Dispersion : Les statistiques mesurant la variance ou la dispersion dans les donnes, comprennent l'cart type, la variance, l'intervalle, le minimum, le maximum et l'erreur standard (ES) de la moyenne.

Ecart type : Mesure de la dispersion des valeurs autour de la moyenne. Dans

une rpartition normale, 68 % des observations se situent un cart type de la moyenne et 95 % deux carts types. Par exemple, si la moyenne d'ge est de 45 avec un cart type gal 10, une distribution normale verra 95 % des observations se situer entre 25 et 65.

Variance : Mesure de la dispersion des valeurs autour de la moyenne, gale la

somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

Plage : Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).
Minimum : Valeur la plus petite d'une variable numrique. Maximum : Plus grande valeur d'une variable numrique. ES Moyenne : Mesure du taux de variation de la valeur de la moyenne sur

des chantillons provenant de la mme distribution. Cette mesure permet de comparer approximativement la moyenne observe avec une valeur hypothtique (autrement dit, vous pouvez conclure que ces deux valeurs sont diffrentes si le rapport de la diffrence avec l'erreur standard est infrieur -2 ou suprieur +2).
Distribution : L'Asymtrie et l'Aplatissement sont des statistiques qui dcrivent la

forme et la symtrie de la distribution. Ces statistiques sont prsentes avec leurs erreurs standard.

Skewness : Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et a une valeur d'asymtrie gale zro. Une distribution caractrise par une importante asymtrie positive prsente une partie droite plus allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.

Kurtosis : Mesure de l'tendue du regroupement des observations autour

d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale 0. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que

312 Chapitre 13

dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes.
Valeurs sont des centres de classes : Si les valeurs dans vos donnes reprsentent des

centres de classes (par exemple, les ges des individus trentenaires sont reprsents par le code 35), slectionnez cette option pour estimer la mdiane et les centiles des donnes originales, non regroupes.

Diagrammes des frquences


Figure 13-4 Bote de dialogue Frquences : Diagrammes

Type de diagramme : Un diagramme en secteurs montre la participation de chaque partie l'ensemble. Chaque secteur du diagramme correspond un groupe dfini par une simple variable de regroupement. Un diagramme en btons montre l'effectif de chaque valeur ou de chaque modalit sous la forme d'un bton distinct, ce qui vous permet de comparer les modalits visuellement. Un histogramme est galement constitu de btons mais ils sont rpartis intervalles gaux. La hauteur de chaque bton reprsente l'effectif des valeurs d'une variable quantitative appartenant l'intervalle. Un histogramme montre la forme, le centre et la dispersion de la distribution. Si vous superposez une courbe normale sur l'histogramme, vous pouvez dterminer si les donnes sont distribues normalement. Valeurs du diagramme : Dans les diagrammes en btons, l'axe peut tre tiquet par

frquences ou pourcentages de frquence.

313 Frquences

Format des frquences


Figure 13-5 Bote de dialogue Frquences: Format

Ordre d'affichage : Le tableau de frquences peut tre affich en fonction des valeurs

relles des donnes ou de l'effectif (frquence d'occurrence) de ces valeurs, par Valeurs croissantes ou Valeurs dcroissantes. Cependant, si vous demandez un histogramme ou des centiles, SPSS part du principe que la variable est quantitative et affiche ses valeurs par ordre croissant.
Variables multiples : Si vous crez des tableaux statistiques pour des variables multiples, vous pouvez afficher toutes les variables dans un tableau unique (Comparer variables) ou bien afficher un tableau statistique spar pour chaque variable (Sparer rsultats par variables). Supprimer les tableaux avec plus de n modalits : Cette option vite l'affichage des

tableaux ayant plus que le nombre spcifi de valeurs.

Caractristiques

14

Chapitre

La procdure Descriptive affiche les rsums de statistiques univaries pour plusieurs variables en un seul tableau et calcule les valeurs standardises (scores z). Les variables peuvent tre ordonnes en fonction de la taille de leurs moyennes (en ordre ascendant ou descendant), alphabtiquement ou selon l'ordre dans lequel vous avez slectionn les variables (par dfaut). Lorsque les scores z sont enregistrs, ils sont ajouts aux donnes dans l'diteur de donnes et sont disponibles pour les diagrammes SPSS, les listes de donnes et les analyses. Lorsque les variables sont enregistres avec des units diffrentes (par exemple, produit domestique brut par personne et pourcentage de la population sachant lire et crire), une transformation en score z place les variables sur une chelle commune pour que la comparaison soit plus facile.
Exemple : Si chaque observation dans vos donnes contient les totaux des ventes

quotidiennes pour chacun des membres du personnel commercial (par exemple, une entre pour Bob, une pour Kim, une pour Brian, etc.) rapports chaque jour pendant plusieurs mois, la procdure Caractristiques peut calculer les ventes quotidiennes moyennes pour chacun des membres du personnel et ordonner les rsultats de la moyenne des ventes la plus leve la plus basse.
Statistiques : Taille de l'chantillon, moyenne, minimum, maximum, cart type,

variance, intervalle, somme, erreur standard de la moyenne, et aplatissement et asymtrie avec leurs erreurs standards (ES).

Remarques sur les donnes de Caractristiques


Donnes : Utilisez des variables numriques aprs les avoir visualises graphiquement

en cherchant des erreurs d'enregistrement, les valeurs loignes et les anomalies de distribution. La procdure Caractristiques est trs efficace pour les gros fichiers (milliers d'observations).
315

316 Chapitre 14

Hypothses : La plupart des statistiques disponibles (y compris les carts z) sont

bases sur une thorie normale et conviennent pour des variables quantitatives (mesures de niveau d'intervalle ou de rapport) avec distribution symtrique (vitez les variables avec des modalits dsordonnes ou des distributions asymtriques). La distribution des carts z a la mme forme que celle des donnes d'origine. Ainsi, le calcul des carts z n'est pas une solution aux donnes posant des problmes.

Echantillon de rsultat
Figure 14-1 Rsultats de la procdure Caractristiques
Statistiques descriptives N Minimum 42.00 10 10 10 10 10 10 10 23.00 45.00 34.00 28.00 23.00 25.00 Maximum 86.00 85.00 71.00 83.00 89.00 73.00 85.00 Moyenne 59.2000 56.2000 56.0000 52.9000 52.9000 52.1000 50.5000 Ecarttype 14.2657 17.6623 8.8819 16.6029 21.8858 16.4617 21.1305

Ventes de Jean Ventes de Nathalie Ventes de Pierre Ventes de Monique Ventes de Michel Ventes de Karine Ventes de Thomas

N valide (observation 10 incomplte)

Pour obtenir des statistiques descriptives


E A partir du menu, slectionnez : Analyse Statistiques descriptives Descriptives...

317 Caractristiques Figure 14-2 Bote de dialogue Caractristiques

E Slectionnez une ou plusieurs variables.

Sinon, vous pouvez :


Cliquez sur Enregistrer des valeurs standardises dans des variables pour enregistrer

les carts z comme nouvelles variables.

Cliquer sur Options pour les statistiques optionnelles et l'ordre d'affichage.

318 Chapitre 14

Options Caractristiques
Figure 14-3 Bote de dialogue Caractristiques : Options

Moyenne et somme : La moyenne ou moyenne arithmtique s'affiche par dfaut. Dispersion : Les statistiques qui mesurent l'tendue ou les variations dans les donnes comprennent l'cart type, la variance, l'intervalle, le minimum, le maximum, et l'erreur standard (ES) de la moyenne.

Ecart type : Mesure de la dispersion des valeurs autour de la moyenne. Dans

une rpartition normale, 68 % des observations se situent un cart type de la moyenne et 95 % deux carts types. Par exemple, si la moyenne d'ge est de 45 avec un cart type gal 10, une distribution normale verra 95 % des observations se situer entre 25 et 65.

Variance : Mesure de la dispersion des valeurs autour de la moyenne, gale la

somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

Plage : Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).

319 Caractristiques

Minimum : Valeur la plus petite d'une variable numrique. Maximum : Plus grande valeur d'une variable numrique. Erreur standard de la moyenne : Mesure du taux de variation de la valeur de la

moyenne sur des chantillons provenant de la mme distribution. Cette mesure permet de comparer approximativement la moyenne observe avec une valeur hypothtique (autrement dit, vous pouvez conclure que ces deux valeurs sont diffrentes si le rapport de la diffrence avec l'erreur standard est infrieur -2 ou suprieur +2).
Distribution : L'aplatissement et l'asymtrie sont des statistiques qui caractrisent la forme et la symtrie de la distribution. Elles sont affiches avec leurs erreurs standards.

Kurtosis : Mesure de l'tendue du regroupement des observations autour

d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale 0. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes.

Skewness : Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et a une valeur d'asymtrie gale zro. Une distribution caractrise par une importante asymtrie positive prsente une partie droite plus allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Ordre d'affichage : Par dfaut, les variables s'affichent dans l'ordre dans lequel vous les

avez slectionnes. En option, vous pouvez afficher les variables alphabtiquement, par moyennes croissantes ou par moyennes dcroissantes.

Explorer

15

Chapitre

La procdure Explorer produit des rsums statistiques et des affichages graphiques pour toutes vos observations ou sparment pour des groupes d'observations. Il existe plusieurs raisons pour utiliser la procdure Explorer : le filtrage de donnes, l'identification des valeurs loignes, la description, la vrification d'hypothses et la caractrisation des diffrences parmi les sous populations (groupes d'observations). Le filtrage de donnes peut vous indiquer les valeurs inhabituelles, les valeurs extrmes, les trous dans les donnes ou d'autres particularits. L'exploration des donnes peut vous aider dterminer si les techniques statistiques que vous envisagez d'utiliser pour l'analyse de vos donnes sont appropries. L'exploration peut indiquer que vous avez besoin de transformer les donnes si la technique ncessite une rpartition gaussienne. Vous pouvez galement choisir d'utiliser des tests non paramtriques.
Exemple : Examiner la distribution des temps d'apprentissage pour les souris dans un

labyrinthe avec quatre programmes de renforcement. Pour chacun des quatre groupes, vous pouvez voir si la rpartition des temps est approximativement gaussienne et si les quatre variances sont gales. Vous pouvez aussi identifier les observations avec les cinq plus grands et les cinq plus petits temps. Les botes moustaches et les diagrammes tige et feuille rsument graphiquement la rpartition des temps d'apprentissage pour chacun des groupes.
Diagrammes et statistiques : Moyenne, mdiane, moyenne tronque 5 %, erreur

standard, variance, cart type, minimum, maximum, intervalle, intervalle interquartile, asymtrie et aplatissement avec leurs erreurs standard, intervalle de confiance pour la moyenne (et niveaux de confiance spcifis), centiles, M-estimateur de Huber, Andrews, Hampel, Tukey, les cinq plus grandes et cinq plus petites valeurs, le Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour tester la normalit, et la statistique Shapiro-Wilk. Botes moustaches, diagrammes tige et feuille, histogrammes, diagrammes de rpartition gaussienne, et dispersion/niveaux avec le test de Levene et les transformations.

321

322 Chapitre 15

Remarques sur les Donnes d'Explorer


Donnes : La procdure d'Explorer peut tre utilise pour les variables quantitatives

(Mesures de niveaux d'intervalle ou de rapport). Une variable active (utilise pour rpartir les donnes en groupes d'observations) doit avoir un nombre raisonnable de valeurs distinctes (modalits). Ces valeurs peuvent tre des chanes de caractres courtes ou numriques. La variable d'tiquette par observation, utilise pour tiqueter les valeurs extrmes dans les botes moustache, peut tre de courtes chanes de caractres, de longues chanes de caractres (15 premiers caractres) ou numriques.
Hypothses : La distribution de vos donnes ne doit pas obligatoirement tre

symtrique ou gaussienne.

Echantillon de rsultat
Figure 15-1 Rsultats d'Explorer
Descriptifs Temps Planning Moyenne Intervale de confiance Limite infrieure pour la moyenne 95,0 % Limite suprieure Moyenne tronque 5 % Mdiane Variance Ecart-type Minimum Maximum Plage Intervalle interquartile Asymtrie Kurtosis Statistique Erreur std. Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Erreur std. Statistique Erreur std. 1 2.760 .165 2.387 3.133 2.761 2.850 .272 .521 2.0 3.5 1.5 .925 -.116 .687 -1.210 1.334 2 4.850 .422 3.895 5.805 4.889 4.900 1.783 1.335 2.3 6.7 4.4 2.250 -.559 .687 -.104 1.334 3 6.900 .445 5.893 7.907 6.911 7.050 1.982 1.408 4.5 9.1 4.6 2.400 -.197 .687 -.606 1.334 4 9.010 .289 8.357 9.663 8.994 9.000 .834 .913 7.8 10.5 2.7 1.650 .219 .687 -1.350 1.334

323 Explorer
Valeurs extrmes
Nombre d'observations Chane Temps Plus lev Valeur

Plus bas

1 2 3 4 5 1 2 3 4 5

31 33 39 32 36 2 7 1 11 3

4 4 4 4 4 1 1 1 2 1

10.5 9.9 9.8 9.5 9.3 2.0 2.1 2.3 2.3 2.5

Time Stem-and-Leaf Plot Diagramme Tige et feuille (dans le temps) 7.00 6.00 3.00 5.00 4.00 3.00 6.00 5.00 1.00 2 . 0133589 3 . 014577 4 . 568 5 . 05779 6 . 1379 7 . 268 8 . 012237 9 . 13589 10 . 5

Largeur de tige 1.0 Chaque feuille 1 observation(s)

Pour explorer vos donnes


E A partir du menu, slectionnez : Analyse Statistiques descriptives Explorer...

324 Chapitre 15 Figure 15-2 Bote de dialogue Explorer

E Slectionnez au moins une variable dpendante.

Sinon, vous pouvez :


Slectionner une ou plusieurs variables actives, dont les valeurs dfiniront les groupes d'observations. Slectionner une variable d'identification pour tiqueter les observations. Cliquer sur Statistiques pour les M-estimateurs, les Valeurs loignes, les Centiles et les tableaux de frquences. Cliquez sur Diagrammes pour les histogrammes, les diagrammes de rpartition gaussiens avec tests et la dispersion/niveau avec test de Levene. Cliquez sur Options pour le traitement des valeurs manquantes.

325 Explorer

Statistiques d'Explorer
Figure 15-3 Bote de dialogue Statistiques Explorer

Descriptives : Ces mesures de tendance centrale et de dispersion s'affichent par dfaut.

Les mesures de tendance centrale indiquent la position de la rpartition. On y trouve la moyenne, la mdiane et la moyenne tronque 5 %. Les mesures de dispersion montrent la dissimilarit des valeurs ; on y trouve l'erreur standard, la variance, l'cart type, le minimum, le maximum, l'intervalle, et l'intervalle interquartile. Les statistiques descriptives comprennent aussi les mesures de la forme des rpartitions. L'asymtrie et l'aplatissement s'affichent avec leurs erreurs standard. L'intervalle du niveau de confiance 95 % pour la moyenne s'affiche aussi. Vous pouvez spcifier un niveau de confiance diffrent.
Moyennes pondres : Estimations de la moyenne et de la mdiane de l'chantillon

pour estimer une localisation du centre. Les estimateurs calculs diffrent selon les pondrations qu'ils appliquent aux observations. M-estimateur de Huber, Andrew, Hampel, et Tukey apparaissent.
Valeurs loignes : Affiche les cinq plus grandes et cinq plus petites valeurs, avec

les tiquettes d'observations.


Centiles : Affiche les valeurs pour le 5ime, 10ime, 25ime, 50ime, 75ime, 90ime, et 95ime centiles.

326 Chapitre 15

Diagrammes d'Explorer
Figure 15-4 Bote de dialogue Explorer : Diagrammes

Botes moustaches : Ces alternatives contrlent l'affichage de botes moustaches

quand vous avez plus d'une variable dpendante. Niveaux de critre gnre un affichage spar pour chaque variable dpendante. Dans un affichage, les botes moustache sont donnes pour chacun des groupes dfinis par une variable active. Dpendantes gnre un affichage spar pour chaque groupe dfini par une variable active. Dans un affichage, les botes moustaches s'affichent cte cte pour chaque variable dpendante. Cet affichage est particulirement utile lorsque les diffrentes variables reprsentent une seule caractristique mesure des moments diffrents.
Caractristique : Le groupe caractristiques vous permet de choisir les diagrammes

tige et feuille et les histogrammes.


Graphes de rpartition gaussiens avec tests : Affiche les diagrammes de rpartition gaussiens et les rsidus. La statistique de Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour le test de normalit s'affiche. Si des pondrations non entires sont spcifies, la statistique Shapiro-Wilk est calcule lorsque la taille d'chantillon pondre est comprise entre 3 et 50. En cas de pondrations entires ou en l'absence de pondration, le calcul est effectu lorsque la taille d'chantillon pondre est comprise entre 3 et 5 000.

327 Explorer

Dispersion/niveau avec test de Levene : Contrle les transformations de donnes pour

les diagrammes de dispersion par niveau. Pour tous les diagrammes de dispersion par niveau, la pente de la ligne de rgression et les tests de Levene portant sur l'homognit de la variance s'affichent. Si vous slectionnez une transformation, les tests de Levene sont bass sur les donnes transformes. Si aucune variable active n'est slectionne, les diagrammes de dispersion par niveau ne sont pas produits. Estimation d'exposants produit un diagramme des logs naturels des intervalles interquartile opposs au logs naturels des mdianes pour toutes les cellules, en mme temps qu'une estimation de la transformation de l'exposant pour arriver des variances gales dans les cellules. Un diagramme de dispersion par niveau aide dterminer l'exposant pour qu'une transformation stabilise (rende plus gales) les variances entre groupes. Transformation Exposant vous permet de slectionner une des alternatives de l'exposant, en suivant ventuellement les recommandations de l'estimation de l'exposant et de produire les diagrammes des donnes transformes. L'intervalle interquartile et la mdiane des donnes transformes sont dessins. Sans transformation produit des diagrammes de donnes brutes. Ceci est quivalent une transformation avec une puissance de 1.

Transformations de l'exposant d'Explorer


Voici les transformations de l'exposant pour les diagrammes de dispersion par niveau. Pour transformer les donnes, vous devez slectionner un exposant pour la transformation. Vous avez le choix entre les options suivantes :

Log nprien : Transformation par log naturel. Il s'agit de la valeur par dfaut. 1/racine carre : La rciproque de la racine carre est calcule pour chaque

valeur des donnes.


Rciproque : La rciproque de chaque valeur des donnes est calcule. Racine carre : La racine carre de chaque valeur des donnes est calcule. Carr : Chaque valeur des donnes est leve au carr. Cube : Chaque valeur des donnes est leve au cube.

328 Chapitre 15

Options d'Explorer
Figure 15-5 Bote de dialogue Explorer : Options

Valeurs manquantes : Contrle le traitement des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre des variables dpendantes ou actives sont exclues de toutes les analyses. Il s'agit de la valeur par dfaut.

Exclure seulement les composantes non valides : Les observations sans valeur

manquante pour une variable dans un groupe (cellule) sont inclues dans l'analyse de ce groupe. L'observation peut avoir des valeurs manquantes pour les variables utilises dans d'autres groupes.
Signaler les valeurs manquantes : Les valeurs manquantes pour les variables actives

sont traites comme une modalit spare. Tout rsultat est produit pour cette modalit supplmentaire. Les tableaux de frquences contiennent les modalits pour les valeurs manquantes. Les valeurs manquantes pour une variable active sont inclues, mais tiquetes comme manquantes.

Tableaux croiss

16

Chapitre

La procdure de tableaux croiss tablit des tableaux deux entres ou entres multiples et permet 22 tests et mesures d'associations pour les tableaux deux entres. La structure du tableau et l'ordre des modalits dterminent quels test ou mesures effectuer. Les statistiques et les mesures d'association de tableaux croiss ne sont calcules que pour les tableaux deux entres. Si vous spcifiez une ligne, une colonne et une strate de facteur (variable de contrle), SPSS forme un tableau de statistiques et de mesures pour chaque valeur de la strate de facteur (ou une combinaison de valeurs pour deux variables de contrle ou plus). Par exemple, si le sexe est un facteur de strate pour un tableau mari (oui, non) face la vie (est excitante, routinire ou ennuyeuse), les rsultats d'un tableau deux entres pour les femmes sont calculs sparment de ceux des hommes et affichs sous forme de tableaux conscutifs.
Exemple : Les clients de PME ont-ils plus de probabilits d'tre rentables en ventes de

services (par exemple, formation et conseil) que ceux de grandes socits ? A partir d'une tabulation croise, vous pourriez apprendre que la majorit des PME (moins de 500 salaris) gnrent des bnfices de services levs, alors que la majorit des grandes socits (plus de 2 500 salaris) rapportent des bnfices de services bas.
Statistiques et mesures d'association : Khi-deux de Pearson, Khi-deux du rapport de

vraisemblance, test d'association linaire par linaire, test exact de Fisher, Khi-deux corrig de Yates, r de Pearson, rho de Spearman, coefficient de contingence, phi, V de Cramer, lambdas symtriques et asymtriques, tau de Goodman et Kruskal, coefficient d'incertitude, gamma, d de Somer, tau-b de Kendall, tau-c de Kendall, coefficient ta, Kappa de Cohen, estimation de risque relatif, odds ratio, test de McNemar, et statistiques de Cochran et Mantel-Haenszel.

329

330 Chapitre 16

Remarques sur les Donnes pour tableau crois


Donnes : Pour dfinir les modalits de chaque variable du tableau, utilisez des

variables numriques ou des variables sous forme de chanes de caractres courtes (huit caractres ou moins). Par exemple, pour sexe, vous pouvez codifier les donnes avec 1 et 2, ou avec homme et femme.
Hypothses : Des statistiques et des mesures partent du principe de modalits

ordonnes (donnes ordinales) ou de valeurs quantitatives (donnes d'intervalle ou donnes de type ratio), tel que dcrit dans la section sur les statistiques. D'autres sont valides lorsque les variables du tableau ont des modalits dsordonnes (donnes nominales). Pour les statistiques bases sur le test Khi-deux (phi, V de Cramer, coefficient de contingence), les donnes doivent provenir d'un chantillon alatoire avec une rpartition multinomiale. Remarque : Les variables ordinales peuvent tre des codes numriques reprsentant des modalits (par exemple, 1 = faible, 2 = moyen, 3 = lev) ou des valeurs de chane. Toutefois, l'ordre alphabtique des valeurs de chane est suppos reflter l'ordre rel des modalits. Par exemple, pour une variable chane comportant des valeurs Faible, Moyen, Elev, l'ordre des modalits est interprt comme Elev, Faible ou Moyen, ce qui ne correspond pas l'ordre correct. En rgle gnrale, il est recommand d'utiliser les codes numriques pour reprsenter les donnes ordinales.

331 Tableaux croiss

Echantillon de rsultat
Figure 16-1 Rsultats de tableau crois
Rentabilit du service * Tabulation croise de l'entreprise Rentabilit du service Bas Elev Taille de l'entreprise

Tests du Khi-deux Signification asymptotique (bilatrale)

Valeur Chi-deux de Pearson Rapport de vraissemblance Association linaire par linaire N d'observations valides

Pour obtenir des tableaux croiss


E A partir du menu, slectionnez : Analyse Statistiques descriptives Tableaux croiss...

332 Chapitre 16 Figure 16-2 Bote de dialogue Tableaux croiss

E Slectionnez des lignes de variables et des colonnes de variables.

Sinon, vous pouvez :

Slectionner des variables de contrle. deux entres ou les sous-tableaux.

Cliquer sur Statistiques pour les tests et les mesures d'association pour les tableaux

Cliquez sur Cellules pour les valeurs observes et thoriques, les pourcentages et les rsidus. Cliquez sur Format pour contrler l'ordre des modalits.

Strates de tableaux croiss


Si vous slectionnez des variables de strate, un tableau crois spar est produit pour chacune des modalits de variable de strate (variable de contrle). Par exemple, si vous avez une variable de ligne, une variable de colonne, et une variable de strate avec deux modalits, vous obtenez un tableau deux entres pour chacune des modalits de la variable de strate. Pour crer une autre strate de variables de contrle, cliquez sur Suivant. Les sous-tableaux sont produits pour chaque combinaison de modalits

333 Tableaux croiss

pour chaque variable de premier niveau avec chaque variable de second niveau et ainsi de suite. Si les statistiques et les mesures d'association sont requises, elles ne s'appliquent qu'aux sous-tableaux deux entres.

Diagrammes en btons juxtaposs de tableaux croiss


Affichage de diagrammes en btons juxtaposs : Un diagramme en btons juxtaposs

vous permet de rsumer vos donnes pour des groupes d'observations. Il y a un regroupement de btons pour chaque valeur de la variable que vous avez spcifie dans Ligne(s). La variable qui dfinit les btons dans chaque regroupement est la variable que vous avez spcifie dans Colonne(s). Il y a un ensemble de btons de couleurs ou de motifs diffrents pour chaque valeur de cette variable. Si vous spcifiez plus d'une variable dans Colonnes ou Lignes, un diagramme en btons juxtaposs est produit pour chaque combinaison de deux variables.

Statistiques de tableaux croiss


Figure 16-3 Bote de dialogue Tableaux crois : Statistiques

Khi-deux : Pour les tableaux avec deux lignes et deux colonnes, slectionnez Khi-deux

pour calculer le Khi-deux de Pearson, le Khi-deux du rapport de vraisemblance, le test exact de Fisher et le test du Khi-deux de Yates corrig (correction de continuit).

334 Chapitre 16

Pour les tableaux 2 2, le test exact de Fisher est calcul lorsqu'un tableau qui ne provient pas de lignes ou de colonnes manquantes dans un tableau plus grand prsente une cellule avec une frquence attendue infrieure 5. Le Khi-deux corrig de Yates est calcul pour tous les autres tableaux 2 2. Pour les tableaux avec n'importe quel nombre de lignes ou de colonnes, slectionnez Khi-deux pour calculer le Khi-deux de Pearson et le rapport de vraisemblance du Khi-deux. Lorsque les deux variables du tableau sont quantitatives, le Khi-deux donne le test d'association linaire par linaire.
Corrlations : Pour les tableaux dans lesquels les lignes et les colonnes contiennent des valeurs ordonnes, les corrlations donnent le coefficient de corrlation de Spearman, rho (donnes numriques seulement). Le Spearman rho est une mesure d'association entre les ordres de rang. Lorsque les deux variables (facteurs) du tableau sont quantitatives, les corrlations donnent le coefficient de corrlation de Pearson, r, une mesure de l'association linaire entre les variables. Nominal : Pour les donnes nominales (sans ordre intrinsque, comme Catholique,

Protestant, Juif), vous pouvez slectionner le coefficient Phi et V de Cramr, le coefficient de contingence, Lambda (lambdas symtriques et asymtriques, et tau de Goodman et Kruskal) et le coefficient d'incertitude.

Coefficient de contingence : Mesure d'association base sur le Khi-deux. Les

valeurs sont toujours comprises entre 0 et 1, zro indiquant l'absence d'association entre les variables de ligne et de colonne, et les valeurs proches de 1 indiquant un degr d'association lev entre les variables. La valeur maximale possible dpend du nombre de lignes et de colonnes dans le tableau.

Phi et V de Cramer : Mesure d'association calcule partir du Khi-deux. Elle est

obtenue en divisant la statistique du Khi-deux par la taille de l'chantillon, puis en prenant la racine carre du rsultat. Le V de Cramer est galement une mesure d'association base sur le Khi-deux.

Lambda : Mesure d'association refltant la rduction proportionnelle de l'erreur

lorsque les valeurs de la variable indpendante sont utilises pour prvoir la variable dpendante. La valeur 1 signifie que la variable indpendante prvoit parfaitement la variable dpendante. La valeur 0 signifie que la variable indpendante ne prvoit pas du tout la variable dpendante.

Coefficient d'incertitude : Mesure d'association qui indique la rduction

proportionnelle de l'erreur lorsque les valeurs d'une variable sont utilises pour prvoir celles d'une autre. Par exemple, la valeur 0,83 indique que la connaissance d'une variable rduit de 83 % l'erreur dans les prvisions de

335 Tableaux croiss

l'autre variable. Le programme calcule la fois des versions symtriques et asymtriques de ce coefficient.
Ordinal : Pour les tableaux dont les lignes et les colonnes contiennent des valeurs

ordonnes, slectionnez Gamma (ordre zro pour les tableaux 2 entres et conditionnel pour les tableaux de 3 10 entres), le tau-b de Kendall et le tau-c de Kendall. Pour prvoir les modalits de colonnes partir des modalits de lignes, slectionnez le d de Somers.

Gamma : Mesure d'association symtrique entre deux variables ordinales. Cette

mesure est situe entre -1 et 1. Les valeurs proches d'une valeur absolue de 1 indiquent une relation forte entre les deux variables. Les valeurs proches de zro indiquent une relation faible ou inexistante. Pour les tableaux d'ordre 2, les gammas d'ordre 0 (zro) apparaissent. Pour les tableaux d'ordre 3 et les tableaux d'ordre n, les gammas conditionnels apparaissent.

D de Somers : Mesure d'intensit de la relation entre deux variables ordinales,

qui s'tend de -1 1. Les valeurs proches de 1 indiquent une forte relation entre les deux variables, et celles proches de zro indiquent une relation faible ou inexistante entre les variables. Le d de Somer est une extension asymtrique du gamma, qui ne diffre de celui-ci que par l'inclusion du nombre de paires non lies la variable indpendante. Le programme calcule galement une version symtrique de cette statistique.
Tau-b de Kendall : Mesure de corrlation non paramtrique pour variables ordinales

ou classes qui prend en considration les ex aequo. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force, les valeurs absolues les plus grandes indiquant les relations les plus fortes. Les valeurs peuvent varier de -1 +1 mais une valeur de -1 ou de +1 ne peut toutefois tre obtenue que dans des tableaux carrs.

Tau-c de Kendall : Mesure d'association non paramtrique pour variables ordinales

qui ne prend pas en considration les ex aequo. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force, les valeurs absolues les plus grandes indiquant les relations les plus fortes. Les valeurs peuvent varier de -1 +1 mais une valeur de -1 ou de +1 ne peut toutefois tre obtenue que dans des tableaux carrs.

336 Chapitre 16

Donnes nominales x intervalle : Lorsqu'une variable est qualitative et l'autre

quantitative, slectionnez Eta. La variable qualitative doit tre code numriquement.

Eta : Mesure d'association dont les valeurs sont comprises entre 0 et 1, 0 indiquant

l'absence d'association entre les variables de ligne et de colonne, et les valeurs proches de 1 indiquant un degr d'association lev. Eta convient une variable dpendante continue mesure sur une chelle d'intervalle (par exemple, le revenu) et une variable indpendante ayant un nombre limit de modalits (par exemple, le sexe). Deux valeurs eta sont calcules L'une traite la variable de ligne comme variable d'intervalle et l'autre traite la variable de colonne comme variable d'intervalle.
Kappa : Le Kappa de Cohen mesure la concordance entre deux indicateurs lorsque les

deux servent valuer le mme objet. La valeur 1 indique une concordance parfaite. La valeur 0 indique que la concordance ne dpasse pas celle due au hasard. Le Kappa n'est disponible que pour les tableaux dans lesquels les deux variables utilisent les mmes valeurs de modalit et possdent le mme nombre de modalits.
Risque : Pour les tableaux 2 x 2, mesure de la force de l'association entre la prsence

d'un facteur et la ralisation d'un vnement. Si l'intervalle de confiance de la statistique inclut une valeur de 1, il n'existe aucune association entre le facteur et l'vnement. L'odds ratio peut tre utilis comme estimation du risque relatif dans le cas o la ralisation du facteur est rare.
McNemar : Test non paramtrique pour deux variables dichotomiques lies. Il recherche les changements de rponse en utilisant la rpartition Khi-deux. Ce test est utile pour dtecter les changements avant-aprs dans les rponses dus une intervention exprimentale dans les plans. Pour les tableaux carrs plus volumineux, le test McNemar-Bowker de symtrie est report. Statistiques de Cochran et de Mantel-Haenszel : Les statistiques de Cochran et de Mantel-Haenszel peuvent tre utilises pour tester l'indpendance prsente entre une variable active dichotomique et une variable de rponse dichotomique, conditionnelle des modles covaris dfinis par une ou plusieurs variables de strate (de contrle). Remarque alors que les autres statistiques sont calcules strate par strate, les statistiques de Cochran et de Mantel-Haenszel sont calcules une seule fois pour toutes les strates.

337 Tableaux croiss

Affichage de cellules (cases) de tableaux croiss


Figure 16-4 Bote de dialogue Tableaux croiss : Contenu des cases (cellules)

Pour vous aider dcouvrir des types dans les donnes qui contribuent un test du Khi-deux significatif, la procdure de Tableaux croiss affiche les frquences attendues et trois types de rsidus (dviations) qui mesurent la diffrence entre les frquences observes et les frquences attendues. Chaque cellule du tableau peut contenir toute combinaison d'effectifs, de pourcentages et de rsidus slectionns.
Effectif : Nombre d'observations effectivement observes et nombre d'observations attendues si les variables de ligne et de colonne sont indpendantes l'une de l'autre. Pourcentages : Les pourcentages peuvent s'additionner par ligne ou par colonne. Les pourcentages du nombre total d'observations reprsentes dans le tableau (une strate) sont galement disponibles. Rsidus : Les rsidus non standardiss donnent la diffrence entre les valeurs observes et les valeurs thoriques. Les rsidus standardiss et standardiss ajusts sont galement disponibles.

Non standardiss : Diffrence entre une valeur observe et la valeur thorique.

La valeur thorique correspond au nombre d'observations attendues dans la cellule quand il n'existe pas de relation entre les deux variables. Un rsidu positif indique que la cellule contient plus d'observations que si les variables de ligne et de colonne taient indpendantes.

338 Chapitre 16

Standardiss : Rsidu divis par une estimation de son cart type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart type de 1.

Standardiss ajusts : Rsidu d'une cellule (valeur observe moins valeur

thorique) divis par une estimation de son erreur standard. Le rsidu standardis qui en rsulte est exprim en carts par rapport la moyenne.
Pondrations non entires : En gnral, les effectifs de cellules sont des valeurs entires, car ils reprsentent le nombre d'observations figurant dans chaque cellule. Toutefois, si le fichier de donnes est pondr par une variable de pondration avec des fractions (par exemple, 1,25), les effectifs de cellules peuvent galement tre des fractions. Vous pouvez tronquer ou arrondir les valeurs avant ou aprs le calcul des effectifs de cellules, ou utiliser des effectifs de cellules non entiers pour l'affichage des tableaux et les calculs statistiques.

Effectifs de cellules arrondis : Les pondrations d'observation sont utilises telles

quelles, mais les pondrations cumules dans les cellules sont arrondies avant le calcul de toute statistique.

Effectifs de cellules tronqus : Les pondrations d'observation sont utilises telles

quelles, mais les pondrations cumules dans les cellules sont tronques avant le calcul de toute statistique.

Poids des observations arrondis : Les pondrations sont arrondies avant utilisation. Aucun ajustement : Les pondrations d'observation sont utilises telles quelles ;

Poids des observations tronqus : Les pondrations sont tronques avant utilisation.

des effectifs de cellules non entiers sont galement utiliss. Toutefois, lorsque des statistiques exactes (disponibles uniquement avec l'option Tests exacts) sont demandes, les pondrations cumules dans les cellules sont tronques ou arrondies avant le calcul des statistiques du test exact.

339 Tableaux croiss

Format de tableau crois


Figure 16-5 Bote de dialogue Tableaux croiss : Format

Vous pouvez arranger les lignes par ordre croissant ou dcroissant de valeur de la variable de ligne.

Rcapituler

17

Chapitre

La procdure Rcapituler calcule les statistiques de sous-groupes pour les variables l'intrieur des modalits de variables de regroupement. Tous les niveaux de variables de regroupement sont tabulation croise. Vous pouvez choisir l'ordre dans lequel les statistiques sont affiches. Les statistiques Rcapituler sont affiches pour chaque variable travers toutes les modalits. Les valeurs des donnes dans chaque modalit peuvent tre listes ou supprimes. Avec d'importants groupes de donnes, vous pouvez choisir de lister seulement les premires observations n.
Exemple : Quel est le montant moyen de ventes de produits par rgion et par

secteur de clientle ? Vous pouvez dcouvrir que le montant moyen des ventes est lgrement plus lev dans la rgion Ouest que dans les autres rgions, avec des socits commerciales dans la rgion Ouest apportant le montant moyen de ventes le plus lev.
Statistiques : Somme, nombre d'observations, moyenne, mdiane, mdiane groupe,

erreur standard pour la moyenne, minimum, maximum, plage, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart type, variance, aplatissement, erreur standard d'aplatissement, asymtrie, erreur standard d'asymtrie, pourcentage de la somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyennes gomtrique et harmonique.

Rcapituler les commentaires de donnes


Donnes : Les variables de regroupement sont des variables qualitatives dont les valeurs peuvent tre numriques ou alphanumriques. Le nombre de modalits doit tre raisonnablement limit. Les autres variables doivent pouvoir tre classes.

341

342 Chapitre 17

Hypothses : Certains des sous-groupes statistiques optionnels, tels que la moyenne et l'cart type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes telles que la mdiane et l'intervalle, conviennent aux variables quantitatives qui confirment ou infirment l'hypothse de normalit.

Echantillon de rsultat
Figure 17-1 Rcapituler Rsultat

Rsums d'observations Moyenne des ventes de produit par rgion et industrie Industrie Rgion Est Centre Ouest Gouvernement Finance Education Sant Total

Obtenir des rcapitulatifs des observations


E A partir du menu, slectionnez : Analyse Rapports Rcapitulatif des observations...

343 Rcapituler Figure 17-2 Bote de dialogue Rapport rcapitulatif

E Slectionnez une ou plusieurs variables.

Sinon, vous pouvez :


Slectionner au moins une variable de regroupement afin de diviser vos donnes en sous-groupes. Cliquer sur Options afin de modifier le titre du rsultat, ajouter une lgende au-dessous du rsultat, ou exclure les observations ayant des valeurs manquantes. Cliquer sur Statistiques pour obtenir des statistiques facultatives. Slectionner Afficher les observations afin de rpertorier les observations dans chaque sous-groupe. Par dfaut, le systme ne liste que les 100 premires observations de votre fichier. Vous pouvez augmenter ou diminuer la valeur de l'option Limiter les observations aux n premires ou dslectionner cet lment pour rpertorier toutes les observations.

344 Chapitre 17

Options de Rcapituler
Figure 17-3 Bote de Dialogue Options de Rapport rcapitulatif

SPSS vous permet de modifier le titre de votre rsultat ou d'ajouter une lgende qui apparatra en dessous du tableau de sortie. Vous pouvez contrler les sauts de ligne dans les titres et lgendes en tapant \n tous les endroits o vous voulez insrer un saut de ligne dans le texte. Vous pouvez galement choisir d'afficher ou de supprimer les sous-en-ttes des totaux et d'inclure ou d'exclure les observations ayant des valeurs manquantes pour toute variable prise en compte dans toute analyse. Il est souvent souhaitable de marquer les observations manquantes dans le rsultat par un point ou un astrisque. Saisir un caractre, une phrase, ou un code que vous souhaitez voir apparatre lorsqu'une valeur manque, sinon, aucun traitement spcial ne s'applique aux observations manquantes dans le rsultat.

345 Rcapituler

Rcapituler les statistiques


Figure 17-4 Bote de Dialogue Rapport rcapitulatif

Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables l'intrieur de chaque modalit de chacune des variables de regroupement : Somme, nombre d'observations, moyenne, mdiane, mdiane groupe, erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart type, variance, aplatissement, erreur standard d'aplatissement, asymtrie, erreur standard d'asymtrie, pourcentage de somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyenne gomtrique, moyenne harmonique. L'ordre dans lequel les statistiques apparaissent dans la liste Variables correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire : Affiche la premire valeur rencontre dans le fichier de donnes. Moyenne gomtrique : Racine nime du produit des valeurs de donnes, n

reprsentant le nombre d'observations.

346 Chapitre 17

Mdiane de groupes : Mdiane calcule pour les donnes codes en groupes. Par exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes. Moyenne harmonique : Fonction utilise pour estimer la taille moyenne d'un

groupe lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis : Mesure de l'tendue du regroupement des observations autour d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale 0. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes. Dernire : Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum : Plus grande valeur d'une variable numrique. Moyenne : Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum : Valeur la plus petite d'une variable numrique. N : Nombre d'observations (ou d'enregistrements). Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de la somme totale : Pourcentage de la somme totale dans chaque

modalit.
Plage : Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).

347 Rcapituler

Skewness : Mesure de l'asymtrie d'une distribution. La distribution normale est symtrique et a une valeur d'asymtrie gale zro. Une distribution caractrise par une importante asymtrie positive prsente une partie droite plus allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie. Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard

pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes).
Erreur standard du Skewness : Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme : Somme ou total des valeurs, pour toutes les observations n'ayant pas de valeur manquante. Variance : Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

Moyennes

18

Chapitre

La procdure des moyennes calcule les moyennes de sous-groupes et les statistiques univaries correspondantes pour des variables dpendantes au sein des modalits d'une ou de plusieurs variables indpendantes. Vous pouvez galement obtenir une analyse un facteur de la variance, un coefficient ta et des tests de linarit.
Exemple : Mesurez la quantit moyenne de lipides absorbe par trois diffrents types

d'huile alimentaire et effectuez une analyse un facteur de la variance pour voir si les moyennes divergent.
Statistiques : Somme, nombre d'observations, moyenne, mdiane, mdiane groupe,

erreur standard pour la moyenne, minimum, maximum, plage, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart type, variance, aplatissement, erreur standard d'aplatissement, asymtrie, erreur standard d'asymtrie, pourcentage de la somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyennes gomtrique et harmonique. Les options comportent une analyse de la variance, un coefficient ta, un coefficient ta-carr, ainsi que des tests de linarit R et R2.

Remarques sur les donnes des moyennes


Donnes : Les variables dpendantes sont quantitatives et les variables indpendantes sont qualitatives. Les valeurs des variables qualitatives peuvent tre soit numriques, soit des chanes courtes. Hypothses : Certains des sous-groupes statistiques optionnels, tels que la moyenne et

l'cart type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes telles que la mdiane et l'intervalle, conviennent aux variables quantitatives qui confirment ou infirment
349

350 Chapitre 18

l'hypothse de normalit. L'analyse de la variance rsiste aux carts par rapport la normalit, condition que les donnes de chaque cellule soient symtriques. L'analyse de la variance part galement du principe que les groupes sont issus de populations ayant la mme variance. Pour vrifier cette hypothse, utilisez le test d'homognit de la variance de Levene, disponible dans la procdure ANOVA un facteur.

Echantillon de rsultat
Figure 18-1 Rsultat des moyennes
Rapport Grammes de graisse absorbe Type d'huile Huile d'arachide Moyenne N Ecart-type Saindoux Moyenne N Ecart-type Huile de mas Moyenne N Ecart-type Total Moyenne N Ecart-type 72.00 6 13.34 85.00 6 7.77 62.00 6 8.22 73.00 18 13.56

Tableau ANOVA Somme des carrs 1596.000 1530.000 3126.000 Carr moyen 2 15 17 798.000 102.000

df

Grammes de graisse absorbe * Type d'huile

Entre groupes Combin Dans les groupes Total

F 7.824

Sig. .005

351 Moyennes

Pour obtenir des moyennes de sous-groupes


E A partir du menu, slectionnez : Analyse Comparer les moyennes Moyennes... Figure 18-2 Bote de dialogue Moyennes

E Slectionnez au moins une variable dpendante. E Pour slectionner les variables indpendantes qualitatives, vous disposez de deux

mthodes :

Slectionnez une ou plusieurs variables indpendantes. Des rsultats distincts sont prsents pour chaque variable indpendante. Slectionnez une ou plusieurs strates des variables indpendantes. Chaque strate divise une nouvelle fois l'chantillon. Si vous avez une variable indpendante dans la strate 1 et une dans la strate 2, les rsultats sont prsents dans un tableau crois, par opposition aux tableaux spars pour chaque variable indpendante.

E Sinon, vous pouvez :

Cliquez sur Options pour obtenir des statistiques facultatives, telles que la table d'analyse de la variance, ta, ta-carr, R et R2.

352 Chapitre 18

Moyennes : Options
Figure 18-3 Bote de dialogue Moyennes : Options

Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables l'intrieur de chaque modalit de chacune des variables de regroupement : Somme, nombre d'observations, moyenne, mdiane, mdiane groupe, erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart type, variance, aplatissement, erreur standard d'aplatissement, asymtrie, erreur standard d'asymtrie, pourcentage de somme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage de N dans, moyenne gomtrique, moyenne harmonique. Vous pouvez changer l'ordre de prsentation des statistiques des sous-groupes. L'ordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire : Affiche la premire valeur rencontre dans le fichier de donnes. Moyenne gomtrique : Racine nime du produit des valeurs de donnes, n

reprsentant le nombre d'observations.

353 Moyennes

Mdiane de groupes : Mdiane calcule pour les donnes codes en groupes. Par exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes. Moyenne harmonique : Fonction utilise pour estimer la taille moyenne d'un

groupe lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis : Mesure de l'tendue du regroupement des observations autour d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale 0. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes. Dernire : Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum : Plus grande valeur d'une variable numrique. Moyenne : Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum : Valeur la plus petite d'une variable numrique. N : Nombre d'observations (ou d'enregistrements). Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de somme totale : Pourcentage de la somme totale dans chaque modalit. Plage : Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).

354 Chapitre 18

Skewness : Mesure de l'asymtrie d'une distribution. La distribution normale est symtrique et a une valeur d'asymtrie gale zro. Une distribution caractrise par une importante asymtrie positive prsente une partie droite plus allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie. Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard

pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes).
Erreur standard du Skewness : Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme : Somme ou total des valeurs, pour toutes les observations n'ayant pas de valeur manquante. Variance : Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable. Statistiques pour premire strate Tableau ANOVA et ta : Affiche un tableau d'analyse unifactorielle de la variance et calcule ta et ta carr (mesures de l'association) pour chaque variable indpendante de la premire strate. Test de linarit : Calcule la somme des carrs, les degrs de libert et le carr moyen

associs aux composants linaires et non linaires, ainsi que le rapport F, le R et le R-deux. La linarit n'est pas calcule si la variable indpendante est une chane courte.

Cubes OLAP

19

Chapitre

La procdure de Cubes OLAP (Online Analytical Processing) calcule les totaux, les moyennes et autres statistiques univaries pour des variables rcapitulatives continues l'intrieur de modalits d'une ou plusieurs variables de regroupement qualitatives. Une strate spare dans le tableau est cre pour chaque modalit de chaque variable de regroupement.
Exemple : Ventes totales et moyennes pour diffrentes rgions et lignes de produits

l'intrieur de chaque rgion.


Statistiques : Somme, nombre d'observations, moyenne, mdiane, mdiane groupe,

erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de la variable pour la premire modalit de la variable de regroupement, valeur de la variable pour la dernire modalit de la variable de regroupement, cart type, variance, aplatissement, erreur standard d'aplatissement, asymtrie, erreur standard d'asymtrie, pourcentage des observations totales, pourcentage de somme totale, pourcentage des observations totales dans les variables de regroupement, pourcentage de la somme totale dans les variables de regroupement, moyenne gomtrique et moyenne harmonique.

Remarques sur les donnes des cubes OLAP


Donnes : Les variables rcapitulatives sont quantitatives (variables continues mesures sur une chelle d'intervalle ou de rapport) et les variables de regroupement sont qualitatives. Les valeurs des variables qualitatives peuvent tre soit numriques, soit des chanes courtes. Hypothses : Certains des sous-groupes statistiques optionnels, tels que la moyenne

et l'cart type sont bass sur la thorie normale et conviennent aux variables quantitatives ayant une distribution symtrique. Les statistiques robustes telles que
355

356 Chapitre 19

la mdiane et l'intervalle, conviennent aux variables quantitatives qui confirment ou infirment l'hypothse de normalit.

Echantillon de rsultat
Figure 19-1 Rsultat des cubes OLAP
Ventes pour 1996 par division et rgion

Division : total Rgion : total Somme Moyenne Mdiane Ecart-type

$145,038,250 $371,893 $307,500 $171,311

Ventes pour 1996 par division et rgion

Division : produits de consommation Rgion : est Somme $18,548,100 Moyenne $289,814.06 Mdiane $273,600.00 Ecart-type $80,674.66

Pour obtenir des cubes OLAP


E A partir du menu, slectionnez : Analyse Rapports Cubes OLAP...

357 Cubes OLAP Figure 19-2 Bote de dialogue Cubes OLAP

E Slectionnez une ou plusieurs variables rcapitulatives continues. E Slectionnez une ou plusieurs variables qualitatives.

Sinon, vous pouvez :

Slectionner d'autres statistiques rcapitulatives (cliquez sur Statistiques...). Vous devez slectionner un ou plusieurs critres de regroupement pour pouvoir slectionner les statistiques rcapitulatives. Calculer les diffrences existant entre des paires de variables et des paires de groupes dfinies par une variable de regroupement (cliquez sur Diffrences). Crer des titres de tableaux personnaliss (cliquez sur Titre).

358 Chapitre 19

Cubes OLAP : Statistiques


Figure 19-3 Bote de dialogue Cubes OLAP : Statistiques

Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables rcapitulatives l'intrieur de chaque modalit de chacune des variables de regroupement : Somme, Nombre d'observations, Moyenne, Mdiane, Mdiane de groupes, Erreur std de la moyenne, Minimum, Maximum, Intervalle, Premier (valeur de la variable pour la premire modalit de la variable de regroupement), Dernier (valeur de la variable pour la dernire modalit de la variable de regroupement), Ecart type, Variance, Aplatissement, Erreur standard de l'aplatissement, Asymtrie, Erreur std d'asymtrie, Pourcentage de N (observations) totales, Pourcentage de somme tot., Pourcentage des observations totales dans les variables de regroupement, Pourcentage de la somme totale dans les variables de regroupement, Moyenne gomtrique et Moyenne harmonique. Vous pouvez changer l'ordre de prsentation des statistiques des sous-groupes. L'ordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond celui dans lequel elles seront affiches dans le rsultat. Les statistiques rcapitulatives sont aussi affiches pour chaque variable travers toutes les modalits.
Premire : Affiche la premire valeur rencontre dans le fichier de donnes. Moyenne gomtrique : Racine nime du produit des valeurs de donnes, n

reprsentant le nombre d'observations.

359 Cubes OLAP

Mdiane de groupes : Mdiane calcule pour les donnes codes en groupes. Par exemple, pour les donnes d'ge, si chaque valeur de la trentaine est code 35, chaque valeur de la quarantaine est code 45, etc., la mdiane de groupes est la mdiane calcule partir des donnes codes. Moyenne harmonique : Fonction utilise pour estimer la taille moyenne d'un

groupe lorsque la taille des chantillons diffre d'un groupe l'autre. La moyenne harmonique correspond au nombre total d'chantillons divis par la somme des rciproques des tailles de l'chantillon.
Kurtosis : Mesure de l'tendue du regroupement des observations autour d'un point central. Dans le cas d'une distribution normale, la valeur de la statistique d'aplatissement est gale 0. Un aplatissement positif indique que les observations sont plus regroupes et prsentent des extrmits plus longues que dans le cas d'une distribution normale. Un aplatissement ngatif signifie que les observations sont moins regroupes et prsentent des extrmits plus courtes. Dernire : Affiche la dernire valeur rencontre dans le fichier de donnes. Maximum : Plus grande valeur d'une variable numrique. Moyenne : Mesure de la tendance centrale. Moyenne arithmtique ; somme divise

par le nombre d'observations.


Mdiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moiti des

observations ; 50e centile. Si le nombre d'observations est pair, la mdiane correspond la moyenne des deux observations du milieu lorsqu'elles sont tries dans l'ordre croissant ou dcroissant. La mdiane est une mesure de tendance centrale et elle n'est pas, l'inverse de la moyenne, sensible aux valeurs loignes.
Minimum : Valeur la plus petite d'une variable numrique. N : Nombre d'observations (ou d'enregistrements). Pourcentage de N dans : Pourcentage du nombre d'observations pour le critre de

regroupement spcifi dans les modalits des autres critres de regroupement. Si vous n'avez qu'un seul critre de regroupement, cette valeur est identique au pourcentage du nombre total d'observations.

360 Chapitre 19

Pourcentage de la somme dans : Pourcentage de la somme pour le critre de

regroupement spcifi dans les modalits des autres critres de regroupement. Si vous n'avez qu'un seul critre de regroupement, cette valeur est identique au pourcentage de la somme totale.
Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque

modalit.
Pourcentage de la somme totale : Pourcentage de la somme totale dans chaque

modalit.
Plage : Diffrence entre la valeur maximale et la valeur minimale d'une variable

numrique (maximumminimum).
Skewness : Mesure de l'asymtrie d'une distribution. La distribution normale est

symtrique et a une valeur d'asymtrie gale zro. Une distribution caractrise par une importante asymtrie positive prsente une partie droite plus allonge. Une distribution caractrise par une importante asymtrie ngative prsente une extrmit gauche plus allonge. Pour simplifier, une valeur d'asymtrie deux fois suprieure l'erreur standard correspond une absence de symtrie.
Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard

pouvant tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'aplatissement positive importante indique que les extrmits de la distribution sont plus allonges que celles d'une distribution normale ; une valeur d'aplatissement ngative prsente des extrmits plus courtes (semblables celles d'une distribution uniforme sous forme de botes).
Erreur standard du Skewness : Rapport de l'asymtrie avec son erreur standard pouvant

tre utilis comme test de normalit (autrement dit, vous pouvez conclure une anormalit si ce rapport est infrieur -2 ou suprieur +2). Une valeur d'asymtrie positive importante indique une extrmit allonge vers la droite ; une valeur ngative extrme produit une extrmit allonge vers la gauche.
Somme : Somme ou total des valeurs, pour toutes les observations n'ayant pas de

valeur manquante.

361 Cubes OLAP

Variance : Mesure de la dispersion des valeurs autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre d'observations moins un. La variance se mesure en units, qui sont gales au carr des units de la variable.

Cubes OLAP : Diffrences


Figure 19-4 Bote de dialogue Cubes OLAP : Diffrences

Cette bote de dialogue vous permet de calculer les diffrences arithmtiques et de pourcentage qui existent entre des variables rcapitulatives ou entre des groupes dfinis par une variable de regroupement. Les diffrences sont calcules pour toutes les mesures slectionnes dans la bote de dialogue Cubes OLAP : Statistiques.
Diffrences entre les variables : Calcule les diffrences existant entre des paires de

variables. Les valeurs des statistiques rcapitulatives de la seconde variable (variable moins) de chaque paire sont soustraites des valeurs des statistiques rcapitulatives de la premire variable de la paire. Pour les diffrences de pourcentage, la valeur de la

362 Chapitre 19

caractristique de la variable moins est utilise en tant que dnominateur. Vous devez slectionner plusieurs variables rcapitulatives dans la bote de dialogue principale avant d'indiquer les diffrences entre les variables.
Diffrences entre les groupes d'observations : Calcule les diffrences existant entre

les paires de groupes dfinies par une variable de regroupement. Les valeurs des statistiques rcapitulatives de la seconde modalit (modalit moins) dans chaque paire sont soustraites des valeurs des statistiques rcapitulatives de la premire modalit de la paire. Les diffrences de pourcentage utilisent la valeur de la statistique rcapitulative pour la modalit moins en tant que dnominateur. Vous devez slectionner au moins une variable de regroupement dans la bote de dialogue principale avant d'indiquer les diffrences entre groupes.

Cubes OLAP : Titre


Figure 19-5 Bote de dialogue Cubes OLAP : Titre

SPSS vous permet de modifier le titre de votre sortie ou d'ajouter une lgende qui apparatra au dessous du tableau de sortie. Vous pouvez galement contrler la rpartition des titres et lgendes sur plusieurs lignes en tapant \n partout o vous souhaitez insrer un saut de ligne dans le texte.

Tests T

20

Chapitre

Il existe trois types de test t :


Test T pour chantillons indpendants (test t pour deux chantillons) : Permet de

comparer la moyenne d'une variable de deux groupes d'observations. Les statistiques descriptives pour chaque groupe et le test de Levene permettant d'obtenir l'galit des variances sont disponibles ainsi que les valeurs t de variance gale et ingale, et qu'un intervalle de confiance de 95 % pour la diffrence des moyennes.
Test T pour chantillons apparis (test t dpendant) : Permet de comparer la moyenne

de deux variables pour un seul groupe. Ce test sert aussi pour les plans d'tudes apparies ou de contrle d'observation. Le rsultat inclut les statistiques descriptives pour les variables tests, la corrlation entre elles, les statistiques descriptives pour les diffrences, apparies, le test t et un intervalle de confiance de 95 %.
Test T pour chantillon unique : Permet de comparer la moyenne d'une variable avec

une valeur connue ou suppose. Les statistiques descriptives des variables tests sont affiches avec le test t. Un intervalle de confiance de 95 % pour la diffrence entre la moyenne de la variable test et la valeur test suppose fait partie du rsultat par dfaut.

Test T pour chantillons indpendants


La procdure du Test T pour chantillons indpendants permet de comparer la moyenne de deux groupes d'observations. Idalement, pour ce test, les sujets doivent tre attribus de manire alatoire deux groupes, de manire ce que toute diffrence dans la rponse soit due au traitement (ou un manque de traitement) et non pas d'autres facteurs. Ceci n'est pas le cas si l'on compare un revenu moyen pour les hommes et les femmes. Une personne n'est pas alatoirement dsigne comme devant tre un homme ou une femme. Dans de telles situations, il faut s'assurer que les diffrences dans les autres facteurs ne cachent pas ou n'augmentent de diffrence
363

364 Chapitre 20

significative dans les moyennes. Les diffrences de revenu moyen peuvent tre influences par des facteurs tels que l'ducation et non par le sexe seul.
Exemple : Les patients souffrant d'hypertension se voient assigns de faon alatoire un groupe placebo et un groupe auquel on donne un traitement. Les sujets du groupe placebo reoivent une pilule inactive et les sujets du groupe auquel on donne un traitement reoivent un nouveau mdicament suppos rduire l'hypertension. Aprs que les sujets aient suivi le traitement pendant deux mois, le test t pour deux chantillons est utilis pour comparer la tension artrielle moyenne du groupe placebo celle du groupe qui suit le traitement. Chaque patient est examin une fois et appartient un groupe. Statistiques : Pour chaque variable, on a les lments suivants : taille de l'chantillon,

moyenne, cart type, et erreur standard de la moyenne. Pour la diffrence de la moyenne: moyenne, erreur standard, et intervalle de confiance (vous pouvez spcifier le niveau de confiance). Tests : Test de Levene sur l'galit des variances, et tests t des variances combines et spares pour l'galit des moyennes.

Remarques sur les Donnes du Test T pour Echantillons Indpendants


Donnes : Les valeurs de la variable quantitative qui vous intresse se trouvent dans

une seule colonne du fichier de donnes. SPSS utilise une variable de regroupement deux valeurs pour sparer les observations en deux groupes. La variable de regroupement peut tre numrique (on peut avoir des valeurs telles que 1 et 2, ou 6,25 et 12,5) ou alphanumriques (telles que oui et non). Vous pouvez utiliser galement une variable quantitative, telle que l'ge, pour sparer les observations en deux groupes en prcisant une csure (la csure 21 provoque un groupe dont l'ge est infrieur 21 ans et un groupe dont l'ge est suprieur 21 ans).
Hypothses : Pour le test t de variance gale, les observations doivent tre indpendantes, et les chantillons alatoires de distribution normale doivent avoir la mme variance de population. Pour le test t de variance gale, les observations doivent tre indpendantes, et les chantillons alatoires doivent avoir une distribution normale. Le test t pour deux chantillons est assez robuste pour se dpartir de la normalit. Lors de la vrification graphique des distributions, vrifiez qu'elles sont symtriques et n'ont pas de valeurs loignes.

365 Tests T

Echantillon de rsultat
Figure 20-1 Rsultat Test T pour chantillons indpendants
Statistiques de groupe Moyenne des Erreurs Standard 5.39 4.31

Tension Artrielle

Traitement

placebo Nouveau_ Mdicament

N 10 10

Moyenne 142.50 116.40

Ecart type 17.04 13.62

Test pour chantillons indpendants Test de Levene sur l'galit des variances

Test-t pour galit des moyennes Signification (Bilatrale) 18 .001 Diffrence Diffrence de des erreurs Moyennes Standard 26.10 6.90 Intervalle de confiance de la moyenne 95 % Infrieur 11.61 Suprieur 40.59

F Tension Artrielle

Signification .719

t 3.783

df

Hypothse de variances gales Hypothse de variances Ingales

.134

3.783

17.163

.001

26.10

6.90

11.56

40.64

Obtenir un test t pour chantillons indpendants


E A partir du menu, slectionnez : Analyse Comparer les moyennes Test T pour chantillons indpendants...

366 Chapitre 20 Figure 20-2 Bote de Dialogue Test T pour chantillons indpendants

E Slectionnez au moins une variable test quantitative. Un test t distinct est alors calcul

pour chaque variable.


E Slectionnez une seule variable de regroupement et cliquez sur Dfinir groupes pour

spcifier deux codes pour les groupes comparer. Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes manquantes et le niveau de l'intervalle de confiance.

Dfinir Groupes Test T pour Echantillons Indpendants


Figure 20-3 Bote de dialogue Dfinir groupes pour variables numriques

367 Tests T

Pour les critres de regroupement numrique, dfinissez les deux groupes du test t en spcifiant deux valeurs ou un point de sparation :

Utiliser les valeurs spcifies : Saisissez une valeur pour le Groupe 1 et une

autre pour le Groupe 2. Les observations qui ont une autre valeur sont exclues de l'analyse. Il n'est pas ncessaire que les nombres soient des entiers (par exemple, 6,25 et 12,5 sont valides).

Csure : Vous avez galement la possibilit de saisir un nombre qui spare les

valeurs de la variable de regroupement en deux groupes. Toutes les observations ayant des valeurs infrieures la csure constituent un groupe, et les observations ayant des valeurs suprieures ou gales la csure constituent l'autre groupe.
Figure 20-4 Dfinir la bote de dialogue Groupes pour les variables caractres

Pour des variables courtes de groupement et de type chane, entrez une chane pour le Groupe 1 et une autre pour le Groupe 2, par exemple oui et non. Les observations avec d'autres chanes sont exclues de l'analyse.

Options Test T pour Echantillons Indpendants


Figure 20-5 Bote de dialogue Test T pour chantillons indpendants : Options

368 Chapitre 20

Intervalle de confiance : Par dfaut, un intervalle de confiance de 95 % pour la diffrence dans les moyennes est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes : Quand vous testez plusieurs variables et que des donnes

sont manquantes pour au moins une variable, vous pouvez indiquer SPSS les observations inclure (ou exclure) :

Exclure les donnes manquantes analyse par analyse : Chaque test t utilise toutes

les observations qui ont des donnes valides pour les variables testes. La taille des chantillons peut varier d'un test l'autre.

Exclure toute observation incomplte : Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les variables utilises dans les tests t requis. La taille des chantillons est constante durant les tests.

Test T pour chantillons apparis


La procdure du Test T pour Echantillons Apparis compare la moyenne de deux variables pour un seul groupe. Elle permet de calculer la diffrence de valeurs entre les deux variables pour chaque observation et de tester si la moyenne diffre de 0.
Exemple : Dans le cadre d'une tude sur l'hypertension, des mesures sont prises sur tous les patients au dbut de l'tude, un traitement est administr, puis on procde une nouvelle mesure. Par consquent, chaque sujet est l'objet de deux mesures, souvent nommes mesures avant et aprs. Il existe une alternative ce test, il s'agit d'une tude apparie ou de contrle d'observation. Ici, chaque dclaration dans le fichier de donnes contient la rponse du patient ainsi que celle de son sujet de contrle appari. Dans le cadre d'une tude sur la tension artrielle, les patients et les contrles peuvent tre apparis selon l'ge (un patient g de 75 ans avec un membre du groupe de contrle g de 75 ans). Statistiques : Pour chaque variable, on a les lments suivants : moyenne, taille

d'chantillon, cart type, et erreur standard de la moyenne. Pour chaque paire de variables, on a les lments suivants : Corrlation, diffrence moyenne de moyennes, test t et intervalle de confiance pour la diffrence moyenne (vous pouvez prciser le niveau de confiance). Ecart-type et erreur standard de la diffrence moyenne.

369 Tests T

Commentaires relatifs au test T pour chantillons apparis


Donnes : Pour chaque test appari, prcisez deux variables quantitatives (niveau d'intervalle de mesure ou niveau de ratio de mesure). Dans le cadre d'une tude apparie ou de contrle d'observation, la rponse pour chaque sujet test et son sujet de contrle appari doit tre dans la mme observation du fichier de donnes. Hypothses : Les observations pour chaque paire devraient tre ralises dans les

mmes conditions. Les diffrences moyennes devraient suivre une distribution normale. Les variances de chaque variable peuvent tre gales ou ingales.

Echantillon de rsultat
Figure 20-6 Test T pour chantillons apparis
Statistiques des chantillons apparis Ecart Type 13.62 17.04 Moyenne des erreurs Standard 4.31 5.39

Moyenne Paire 1 Aprs Traitement Avant Traitement 116.40 142.50

N 10 10

Test d'exemples apparis

Diffrences apparies Intervale de confiance de 95 % de la diffrence Infrieur Suprieur t df

Moyenne Paire 1 Aprs traitement Avant traitement

Ecart-type

Moyenne d'erreur std.

Signification (bilatrale)

-26.10

19.59

6.19

-40.11

-12.09

-4.214

.002

Obtenir un test t pour chantillons apparis


E A partir du menu, slectionnez : Analyse Comparer les moyennes Test T pour chantillons apparis...

370 Chapitre 20 Figure 20-7 Bote de dialogue Test T pour chantillons apparis

E Slectionnez une paire de variables, comme suit :

Cliquez sur chacune des deux variables. La premire variable apparat dans le groupe Choix courants comme Variable 1 et la seconde apparat comme Variable 2. Aprs avoir slectionn une paire de variables, cliquez sur la flche pour dplacer la paire dans la liste des Variables Apparies. Vous pouvez slectionner d'autres paires de variables. Pour retirer une paire de variables de l'analyse, slectionnez une paire dans la liste des Variables Apparies et cliquez sur la flche.

Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes manquantes et le niveau de l'intervalle de confiance.

371 Tests T

Options test T pour chantillons apparis


Figure 20-8 Bote de dialogue Test T pour chantillons apparis

Intervalle de confiance : Par dfaut, un intervalle de confiance de 95 % pour la diffrence dans les moyennes est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes : Quand vous testez plusieurs variables et que des donnes

sont manquantes pour au moins une variable, vous pouvez indiquer SPSS les observations inclure (ou exclure) :

Exclure les observations analyse par analyse : Chaque test t utilise toutes les

observations qui ont des donnes valides pour la paire de variables testes. La taille des chantillons peut varier d'un test l'autre.

Exclure toute observation incomplte :Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les paires de variables testes. La taille des chantillons est constante durant les tests.

Test T pour chantillon unique


La procdure du Test T pour chantillon unique permet de tester si la moyenne d'une seule variable diffre d'une constante spcifie.
Exemples : Un chercheur souhaite tester si le QI moyen d'un groupe d'tudiants

diffre de 100. Un fabricant cralier prlve un chantillon de botes partir d'une chane de production et vrifie si le poids moyen des chantillons diffre de 1,3 livres l'intervalle de confiance 95 %.
Statistiques : Pour chaque variable test : moyenne, cart type, et erreur standard

de la moyenne. Diffrence moyenne entre chaque valeur de donne et la valeur test suppose, le test t vrifie que cette diffrence est gale 0 et vrifie galement

372 Chapitre 20

l'intervalle de confiance pour cette diffrence (vous pouvez prciser le niveau de confiance).

Commentaires sur les Donnes du Test T pour chantillon unique


Donnes : Afin de tester les valeurs d'une variable quantitative par rapport une valeur test suppose, choisissez une variable quantitative et saisissez une valeur test suppose. Hypothses : Ce test suppose que les donnes sont distribues normalement ;

cependant, ce test rsiste convenablement la normalit.

Echantillon de rsultat
Figure 20-9 Rsultat Test T pour chantillon unique Statistiques pour chantillon unique

QI N Moyenne Ecart type Moyenne des erreurs standard 15 109.33 12.03 3.11

Les lignes et les colonnes ont t transposes.


Test pour chantillon unique Valeur de test = 100 Signification Diffrence (Bilatrale) de moyennes .009 9.33 Intervalle de confiance de la diffrence 95 % Infrieur 2.67 Suprieur 15.99

QI

t 3.005

df 14

373 Tests T

Obtenir un test t pour chantillon unique


E A partir du menu, slectionnez : Analyse Comparer les moyennes Test T pour chantillon unique Figure 20-10 Bote de dialogue Test T pour chantillon unique

E Slectionnez au moins une variable tester par rapport la mme valeur suppose. E Entrez une valeur test numrique laquelle vous souhaitez comparer chaque moyenne

d'chantillon. Vous pouvez galement cliquer sur Options pour contrler le traitement des donnes manquantes et le niveau de l'intervalle de confiance.

374 Chapitre 20

Options Test T pour chantillon unique


Figure 20-11 Bote de Dialogue Options Test T pour chantillon unique

Intervalle de confiance : Par dfaut, un intervalle de confiance de 95 % pour la diffrence entre la moyenne et la valeur de test suppose est affich. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance diffrent. Valeurs manquantes : Quand vous testez plusieurs variables et que des donnes

manquent pour ou une ou plusieurs de ces variables, vous pouvez indiquer SPSS les observations inclure (ou exclure).

Exclure les observations analyse par analyse : Chaque test t utilise toutes les

observations qui ont des donnes valides pour la variable teste. La taille des chantillons peut varier d'un test l'autre.

Exclure toute observation incomplte : Chaque test t utilise seulement les

observations qui ont des donnes valides pour toutes les variables utilises dans n'importe lequel des tests t requis. La taille des chantillons est constante durant les tests.

ANOVA 1 facteur

21

Chapitre

La procdure de l'analyse de variance ANOVA 1 facteur permet d'effectuer une analyse de variance univarie sur une variable quantitative dpendante par une variable critre simple (indpendant). L'analyse de variance sert tester l'hypothse d'galit des moyennes. Cette technique est une extension du test t pour deux chantillons. Dterminer que des diffrences existent parmi les moyennes ne vous suffit peut-tre pas. Vous voulez ventuellement savoir quelles sont les moyennes qui diffrent. Il existe deux types de tests pour comparer les moyennes : les contrastes a priori et les tests post hoc. Les contrastes sont des tests dfinis avant l'exprience, et les tests post hoc sont effectus aprs l'exprience. Vous pouvez aussi tester les tendances travers les modalits.
Exemple : Les beignets absorbent la graisse dans des proportions varies lorsqu'ils

sont cuisins. Une exprience est conduite partir de l'utilisation de trois types de graisse : huile d'arachide, huile de mas, et saindoux. L'huile d'arachide et l'huile de mas sont des graisses non satures, et le saindoux une graisse sature. Non seulement vous dterminez si la quantit de graisse absorbe dpend du type de graisse utilise, mais vous pouvez galement crer un contraste a priori afin de dterminer si le degr d'absorption de graisse diffre pour les graisses satures et non satures.
Statistiques : Pour chaque groupe : nombre d'observations, moyenne, cart type,

erreur standard pour la moyenne, minimum, maximum et intervalle de confiance 95 % pour la moyenne. Test de Levene pour l'homognit de la variance, tableau d'analyse de la variance et tests d'galit des moyennes pour chaque variable dpendante, contrastes a priori spcifis par l'utilisateur et tests d'intervalle et comparaisons multiples post hoc : Bonferroni, Sidak, test de Tukey, GT2 de Hochberg, Gabriel, Dunnett, test F de Ryan-Einot-Gabriel-Welsch (R-E-G-W F), test d'intervalle de Ryan-Einot-Gabriel-Welsch (R-E-G-W Q), T2 de Tamhane, T3 de Dunnett, Games-Howell, test C de Dunnett, test de Duncan, Student-Newman-Keuls (S-N-K), B de Tukey, Waller-Duncan, Scheff et diffrence la moins significative.

375

376 Chapitre 21

Remarques sur les Donnes ANOVA 1 facteur


Donnes : Les valeurs de la variable active devraient tre des nombres entiers, et la variable dpendante devrait tre quantitative (niveau d'intervalle de mesures). Hypothses : Chaque groupe est un chantillon alatoire indpendant extrait d'une

population normale. L'analyse de la variance supporte les carts la normalit, bien que les donnes doivent tre symtriques. Les groupes devraient tre composs de populations variance gale. Pour tester cette hypothse, utiliser le test d'homognit de variance de Levene.

Echantillon de rsultat
Figure 21-1 Rsultat ANOVA 1 facteur
ANOVA Somme des carrs Grammes de graisse absorbe Entre groupes Dans les groupes Total 1596.00

df 2

Carr moyen 798.00

F 7.824

Signification .005

1530.00 3126.00

15 17

102.00

Descriptions Intervale de confiance de 95 % pour la moyenne N Grammes graisse de absorbe Type d'huile Huile d'arachide Saindoux Huile de mas Total 6 6 6 18 Moyenne 72.00 85.00 62.00 73.00 Ecart-type 13.34 7.77 8.22 13.56 Erreur std. 5.45 3.17 3.36 3.20 Limite infrieure 58.00 76.84 53.37 66.26 Limite suprieure 86.00 93.16 70.63 79.74 Minimum 56 77 49 49 Maximum 95 97 70 97

Coefficients de contraste Type d'huile Huile d'arachide Contraste 1 -.5 Saindoux 1 Huile de mas -.5

377 ANOVA 1 facteur


Tests de contraste Valeur de contraste Grammes de graisse absorbe Suppose des variances gales Ne suppose pas des variances gales Contraste Contraste 1 1 18.00 18.00 Signification [bilatrale) 15 12.542 .003 .002

Erreur std. 5.05 4.51

t 3.565 3.995

df

Test d'homognit des variances Statistique de Levene Grammes de graisse absorbe .534

df1 2

df2 15

Signification .597

Obtenir une analyse de variance un facteur


E A partir du menu, slectionnez : Analyse Comparer les moyennes ANOVA 1 facteur... Figure 21-2 Bote de dialogue ANOVA 1 facteur

E Slectionnez au moins une variable dpendante. E Slectionnez une variable active indpendante simple.

378 Chapitre 21

Contrastes ANOVA 1 facteur


Figure 21-3 Bote de dialogue ANOVA 1 facteur : Contrastes

Vous pouvez diviser les sommes des carrs inter-groupes en tendances composants ou spcifier les contrastes a priori.
Modle polynomial : Diviser les sommes des carrs inter-groupes en tendances composants. Vous pouvez tester la tendance d'une variable dpendante travers les niveaux ordonns de la variable active. Par exemple, vous pourriez tester la tendance linaire (croissante ou dcroissante) des salaires perus les plus levs travers les niveaux ordonns.

Degr : Vous pouvez choisir un polynme de premier, deuxime, troisime,

quatrime ou cinquime degr.


Coefficients : Contrastes a priori spcifis tester par la statistique t. Saisissez un

coefficient pour chaque groupe (modalit) de la variable active et cliquez sur Ajouter aprs chaque saisie. Chaque nouvelle valeur s'ajoute au bas de la liste des coefficients. Pour spcifier des groupes de contrastes supplmentaires, cliquez sur Suivant. Utilisez Suivant et Prcdent pour vous dplacer entre les groupes de contrastes. L'ordre des coefficients est important car il correspond l'ordre croissant des valeurs de modalit de la variable active. Le premier coefficient de la liste correspond la valeur la plus petite de la variable active, et le dernier coefficient correspond la valeur la plus leve. Par exemple, s'il y a six modalits de variables actives, les coefficients 1, 0, 0, 0, 0,5 et 0,5 mettent en contraste le premier groupe avec les

379 ANOVA 1 facteur

cinquime et sixime groupes. Pour la plupart des applications, les coefficients devraient s'lever 0. Les groupes qui n'atteignent pas 0 peuvent aussi tre utiliss, mais un message d'avertissement s'affiche.

Tests Post Hoc ANOVA 1 facteur


Figure 21-4 ANOVA 1 facteur : Comparaisons multiples a posteriori

Lorsque vous avez dtermin qu'il existe des diffrences parmi les moyennes, les tests d'intervalles post hoc et de comparaisons multiples par paire peuvent dterminer les moyennes qui diffrent. Les tests d'intervalle identifient les sous-groupes homognes de moyennes qui ne diffrent pas les uns des autres. Les comparaisons multiples apparies testent la diffrence entre les moyennes apparies et engendrent une matrice pour laquelle les astrisques indiquent les moyennes de groupes significativement diffrentes au niveau alpha 0,05.
Hypothse de variances gales :

Le test de Tukey, le GT2 de Hochberg, le test de Gabriel et le test de Scheff sont des tests de comparaisons multiples et d'intervalle. Il existe d'autres tests d'intervalle, tels que le test B de Tukey, le S-N-K (Student-Newman-Keuls), le Duncan, le R-E-G-W F (F de Ryan-Einot-Gabriel-Welsch), le R-E-G-W Q (test d'intervalle de

380 Chapitre 21

Ryan-Einot-Gabriel-Welsch) et le Waller-Duncan. Les tests de comparaison multiple disponibles sont les suivants : Bonferroni, test de diffrence significative de Tukey, Sidak, Gabriel, Hochberg, Dunnett, Scheff et LSD (diffrence la moins significative).

LSD : Utilisation de tests t pour effectuer toutes les comparaisons par paire

entre des moyennes de groupe. Le taux d'erreur n'est pas corrig dans le cas de comparaisons multiples.

Bonferroni : Utilise des tests t pour effectuer des comparaisons par paire entre

les moyennes de groupes, mais contrle le taux d'erreur global en spcifiant comme taux d'erreur pour chaque test le taux d'erreur empirique divis par le nombre total de tests. Le seuil de signification observ est ainsi ajust en raison des comparaisons multiples ralises.

Sidak : Test de comparaisons multiples par paire reposant sur la statistique t. Le

test Sidak ajuste le seuil de signification en fonction des comparaisons multiples et fournit des bornes plus troites que le test Bonferroni.

Scheff : Excute des comparaisons par paire simultanes pour toutes les paires

de moyennes possibles. Utilise la distribution d'chantillonnage F. Peut servir examiner toutes les combinaisons linaires possibles de moyennes de groupe, et pas seulement des comparaisons par paire.

F de R-E-G-W (Ryan-Einot-Gabriel-Welsch) : Procdure multiple descendante de

Ryan-Einot-Gabriel-Welsch base sur un test F.


Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch) : Procdure multiple descendante de

Ryan-Einot-Gabriel-Welsch base sur un intervalle de Student.


S-N-K : Ce test effectue toutes les comparaisons de moyennes par paire, l'aide

de la distribution des intervalles de Student. Lorsque la taille des chantillons est gale, il compare aussi les moyennes par paire dans les sous-ensembles homognes, en utilisant une procdure pas pas. Les moyennes sont tries dans l'ordre dcroissant et les diffrences extrmes sont testes en premier.

Tukey : Utilise les statistiques des intervalles studentises pour effectuer des

comparaisons de classes deux deux. Fixe le taux d'erreur exprimental au niveau du taux d'erreur de l'ensemble pour toutes des comparaisons par paire.

B de Tukey : Utilise la distribution des intervalles studentise pour effectuer des

comparaisons de classes deux deux. La valeur critique est la moyenne de la valeur correspondante du test de Tukey et du test de Student-Newman-Keuls.

381 ANOVA 1 facteur

Duncan : Ralise des comparaisons par paires en suivant un ordre pas pas

identique celui utilis dans le test de Student-Newman-Keuls, mais tablit un niveau de protection du taux d'erreur pour l'ensemble des tests, plutt que pour chaque test en particulier. Utilise la statistique d'intervalle de Student.

GT2 de Hochberg : Test de multiples comparaisons et intervalles apparis utilisant

le modulus maximum de Student. Similaire au test de Tukey.


Gabriel : Test de comparaison par paire qui utilise le modulus maximum de

Student. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont ingales. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup.

Waller-Duncan : Test de comparaisons multiples bas sur une statistique t et

utilisant une approche baysienne.


Dunnett : Test T de comparaisons multiples par paires comparant un ensemble

de traitements une moyenne de contrle unique. La dernire modalit est la modalit de contrle par dfaut. Vous pouvez galement choisir la premire modalit. L'option Bilatral teste que la moyenne un certain niveau (hormis la modalit de contrle) du facteur n'est pas gale celle de la modalit de contrle. L'option <Contrle permet de tester si la moyenne est infrieure, un certain niveau du facteur, celle de la modalit de contrle. L'option >Contrle permet de tester si la moyenne est suprieure, un certain niveau du facteur, celle de la modalit de contrle.
Hypothse de variances ingales :

Les tests de comparaison multiple qui ne supposent pas de variances gales sont le T2 de Tamhane, le T3 de Dunnett, Games-Howell et le C de Dunnett.

T2 de Tamhane : Test des comparaisons apparies bas sur le test T. Ce test est

opportun lorsque les variances sont ingales.


T3 de Dunnett : Test des comparaisons par paires bas sur le module maximal de

Student. Ce test est opportun lorsque les variances sont ingales.


Games-Howell : Test des comparaisons apparies qui peut parfois tre souple. Ce

test est opportun lorsque les variances sont ingales.


C de Dunnett : Test des comparaisons par paires bas sur l'intervalle de Student. Ce

test est opportun lorsque les variances sont ingales.

382 Chapitre 21

Remarque : Il peut vous paratre plus facile d'interprter le rsultat partir de tests post hoc si vous dsactivez l'option Masquer les lignes et les colonnes vides dans la bote de dialogue Proprits du tableau (dans le tableau pivotant activ, choisissez Proprits du tableau dans le menu Format).

Options ANOVA 1 facteur


Figure 21-5 Bote de dialogue ANOVA 1 facteur : Options

Statistiques : Choisissez une ou plusieurs des options suivantes :


Caractristique : La procdure calcule le nombre d'observations, la moyenne, l'cart

type, l'erreur standard de la moyenne, le minimum, le maximum, et les intervalles de confiance 95 % pour chaque variable dpendante de chaque groupe.

Effets fixes et alatoires : La procdure affiche l'cart type, l'erreur standard

et l'intervalle de confiance 95 % pour le modle effets fixes, ainsi que l'erreur standard, l'intervalle de confiance 95 % et l'estimation de la variance inter-composants pour le modle effets alatoires.

Test d'homognit de variance : La procdure calcule la statistique de Levene

pour tester l'galit des variances de groupe. Ce test ne dpend pas de l'hypothse de normalit.

383 ANOVA 1 facteur

Brown-Forsythe : La procdure calcule la statistique de Brown-Forsythe pour

tester l'galit des moyennes de groupe. Il est prfrable d'utiliser cette statistique (au lieu de la statistique F) lorsque l'hypothse d'galit des variances n'est pas satisfaite.

Welch : Calcule la statistique de Welch pour tester l'galit des moyennes de

groupe. Il est prfrable d'utiliser cette statistique (au lieu de la statistique F) lorsque l'hypothse d'galit des variances n'est pas satisfaite.
Diagramme des moyennes : Affiche un diagramme qui reprsente les moyennes de

sous-groupes (les moyennes de chaque groupe dfinies par les valeurs de la variable active).
Valeurs manquantes : Contrle le traitement des valeurs manquantes.

Exclure les observations analyse par analyse : Aucune observation avec valeur

manquante n'est utilise, que ce soit pour la variable dpendante ou pour la variable active d'une analyse donne. De mme, on n'utilise pas d'observation en dehors de l'intervalle spcifi pour la variable active.

Exclure toute observation incomplte : Les observations ayant des valeurs

manquantes pour la variable active ou pour toute variable dpendante contenue dans la liste dpendante de la bote de dialogue principale sont exclues de toutes les analyses. Si vous n'avez pas spcifi de variables multiples dpendantes, cela est sans effet.

Analyse GLM Univari

22

Chapitre

GLM Univari fournit un modle de rgression et une analyse de la variance pour plusieurs variables dpendantes par un ou plusieurs facteurs ou variables. Les variables actives divisent la population en groupes. Cette procdure de rgression linaire gnralise vous permet de tester les hypothses nulles propos des effets des autres variables sur la moyenne de diffrents regroupements de la variable dpendante. Vous pouvez rechercher les interactions entre les facteurs ainsi que les effets des diffrents facteurs, certains d'entre eux tant alatoires. En outre, les effets et les interactions des covariables avec les facteurs peuvent tre inclus. Pour l'analyse de la rgression, les variables indpendantes (explicatives) sont spcifies comme covariables. Vous pouvez tester les modles quilibrs comme dsquilibrs. Un modle est quilibr si chaque cellule de ce modle contient le mme nombre d'observations. L'analyse GLM Univari teste non seulement les hypothses mais elle produit galement des estimations. Vous disposez de contrastes a priori communs pour effectuer les tests d'hypothse. En outre, lorsqu'un test F global se rvle significatif, vous pouvez utiliser les tests post hoc pour valuer les diffrences entre les moyennes spcifiques. Les moyennes marginales estimes fournissent des estimations des valeurs moyennes estimes pour les cellules dans le modle et les diagrammes des profils (diagrammes d'interaction) de ces moyennes vous permettent de visualiser plus facilement certaines des relations. Les rsidus, les prvisions, la distance de Cook et les valeurs influentes peuvent tre enregistres sous forme de nouvelles variables dans votre fichier de donnes pour vrifier les hypothses. Poids WLS. Vous permet de spcifier une variable utilise pour pondrer les observations pour une analyse pondre (WLS) des moindres carrs, peut-tre pour compenser les diffrents niveaux de prcision des mesures.

385

386 Chapitre 22

Exemple : Des donnes sont collectes sur les diffrents participants au Marathon de Paris sur plusieurs annes. Le temps effectu par chaque participant est la variable dpendante. Les autres facteurs comprennent le temps (froid, modr, chaud), le nombre de mois d'entranement, le nombre de marathons prcdemment effectus et le sexe. L'ge est considr comme co-variable. Vous devez trouver que le sexe a un effet significatif et que l'interaction du sexe avec le temps est significatif. Mthodes : Les sommes des carrs de type I, II, III et IV peuvent servir valuer les diffrentes hypothses. Le type III est la valeur par dfaut. Statistiques : Tests d'intervalle post hoc et comparaisons multiples : La

diffrence la moins significative, Bonferroni, Sidak, Scheff, F multiple de Ryan-Einot-Gabriel-Welsch, l'intervalle multiple de Ryan-Einot-Gabriel-Welsch, Student-Newman-Keuls, le test de Tukey, b de Tukey, Duncan, GT2 de Hochberg, Gabriel, le test t de Waller Duncan, Dunnett (unilatral, bilatral), T2 de Tamhane, T3 de Dunnett, Games-Howell et C de Dunnett. Statistiques descriptives : moyenne observe, cart type et effectifs pour toutes les variables dpendantes dans toutes les cellules. Le test de Levene pour l'homognit de la variance.
Diagrammes : Dispersion par niveau, rsiduels et profils (interaction).

Remarques sur les donnes GLM - Univari


Donnes : La variable dpendante est quantitative. Les facteurs sont qualitatifs. Il peut

s'agir de valeurs numriques ou alphanumriques de 8 caractres au maximum. Les covariables sont des variables quantitatives lies la variable dpendante.
Hypothses : Les donnes forment un chantillon alatoire d'une population normale

ou gaussienne. Dans cette population, toutes les variances de cellule sont gales. L'analyse de la variance supporte les carts la normalit, bien que les donnes doivent tre symtriques. Pour vrifier les hypothses, vous pouvez utiliser les tests d'homognit de la variance et les diagrammes de dispersion par niveau. Vous pouvez galement tudier les rsidus et les diagrammes de rsidus.

387 Analyse GLM Univari

Echantillon de rsultat
Figure 22-1 Rsultat GLM - Univari
Tests des effets inter-sujets Variable dpendante : SPVOL Somme des carrs de type III Carr moyen

Source Modle corrig Constante Farine Graisse Prcipit Graisse*Prcipit

df 11 1 3 2 2 4 14 26 25

F 12.376 6147.938 17.513 30.583 3.014 8.522

Sig. .000 .000 .000 .000 .082 .001

22.520 1016.981 8.691 10.118 .997 5.639 2.316 1112.960 24.835

2.047 1016.981 2.897 5.059 .499 1.410 .165

Erreur Total
Total corrig

1. R carr = .907 (R carr ajust = .833)


Graisse * prcipit Variable dpendante : SPVOL

Intervale de confiance de 95 %
Graisse prcipit Moyenne

Erreur std. Limite infrieure Limite suprieure .240 .239 .241 .241 .301 .203 .301 .203 .300 5.021 5.378 5.605 6.505 6.064 5.564 5.984 6.764 7.945 6.052 6.404 6.641 7.541 7.353 6.436 7.274 7.636 9.233

1 2 3

5.536 5.891 6.123 7.023 6.708 6.000 6.629 7.200 8.589

1 2 3

1 2 3

Pour obtenir des tables GLM - Univari


E A partir du menu, slectionnez : Analyse Modle linaire gnral Univari...

388 Chapitre 22 Figure 22-2 Bote de dialogue Univari

E Slectionnez une variable dpendante. E Slectionnez les variables pour Facteur(s) fix(s), Facteur(s) alatoire(s) et

Covariable(s), en fonction de vos donnes.


E En option, vous pouvez utiliser WLS Weight pour prciser une variable de pondration

pour l'analyse des moindres carrs pondrs. Si la valeur de la variable de pondration est nulle, ngative ou manquante, l'observation est exclue de l'analyse. Une variable dj utilise dans le modle ne peut pas servir de variable de pondration.

389 Analyse GLM Univari

Modle GLM
Figure 22-3 Bote de dialogue Modle univari

Spcifier le modle : Un modle factoriel gnral contient tous les effets principaux des

facteurs, des covariables et toutes les interactions facteur/facteur. Il ne contient pas de d'interactions de covariable. Slectionnez Autre pour indiquer un sous-ensemble d'interactions ou des interactions variable active/covariable. Vous devez indiquer tous les termes inclure dans le modle.
Critres et covariables : Les covariables et facteurs sont numrs en indiquant (F)

pour facteur fix et (C) pour covariable. Dans une analyse univarie, (R) indique un facteur alatoire.
Modle : Le modle dpend de la nature de vos donnes. Aprs avoir slectionn
Autre, vous pouvez choisir les effets principaux et les interactions qui prsentent un intrt pour votre analyse.

Somme des carrs : Mthode de calcul des sommes des carrs. Pour les modles quilibrs ou non, auxquels aucune cellule ne manque, le type III est la mthode le plus frquemment utilise. Inclure une constante au modle : L'ordonne est gnralement incluse dans le modle. Si vous partez du principe que les donnes passent par l'origine, vous pouvez exclure la constante.

390 Chapitre 22

Termes construits
Pour les facteurs et covariables slectionns :
Interaction : Cre le terme d'interaction du plus haut niveau de toutes les variables slectionnes. Il s'agit de la valeur par dfaut. Effets principaux : Cre un terme d'effet principal pour chaque variable slectionne. Toutes d'ordre 2 : Cre toutes les interactions d'ordre 2 possibles des variables

slectionnes.
Toutes d'ordre 3 : Cre toutes les interactions d'ordre 3 possibles des variables

slectionnes.
Toutes d'ordre 4 : Cre toutes les interactions d'ordre 4 possibles des variables

slectionnes.
Toutes d'ordre 5 : Cre toutes les interactions d'ordre 5 possibles des variables

slectionnes.

Somme des carrs


Pour ce modle, vous pouvez choisir un type de sommes des carrs. Le type III est le plus courant et c'est la valeur par dfaut.
Type I : Cette mthode est galement appele dcomposition hirarchique de la somme

des carrs. Chaque terme est ajust uniquement pour le terme qui le prcde dans le modle. La somme des carrs de type I est gnralement utilise pour :

Une analyse de la variance quilibre dans laquelle tout effet principal est spcifi avant les effets d'interaction de premier ordre, et chaque effet de premier ordre spcifi avant ceux de second ordre, et ainsi de suite. Un modle de rgression polynomial dans lequel les termes d'ordre infrieur sont spcifis avant ceux d'ordre suprieur. Un modle par imbrication pur dans lequel le premier effet spcifi est imbriqu dans le second et le second spcifi dans le troisime, etc. (Cette forme d'imbrication peut tre spcifie par la syntaxe uniquement.)

391 Analyse GLM Univari

Type II : Cette mthode calcule les sommes des carrs d'un effet dans le modle ajust pour tous les autres effets appropris . Un effet appropri est un effet qui correspond tous les effets qui ne contiennent pas l'effet tudier. La mthode des sommes des carrs de type II sert gnralement pour :

Une analyse de la variance quilibre. Tout modle qui contient un effet principal uniquement. Tout modle de rgression. Un modle par imbrication pur. (Cette forme d'imbrication peut tre spcifie par la syntaxe.)

Type III : Valeur par dfaut. Cette mthode calcule les sommes des carrs d'un effet

dans le modle comme les sommes des carrs ajuste pour tout autre effet qui ne le contient pas et orthogonal chaque effet qui le contient. Les sommes de carrs de type III prsentent l'avantage essentiel qu'elles ne varient pas avec les frquences de cellule tant que la forme gnrale d'estimabilit reste constante. Ce type de somme des carrs est donc souvent considr comme utile pour les modles dsquilibrs auxquels aucune cellule ne manque. Dans le modle factoriel sans cellule manquante, cette mthode est quivalente la technique de Yates des carrs moyens pondrs. La mthode des sommes des carrs de type III sert gnralement pour :

Tous les modles numrs dans les types I et II. Tous les modles quilibrs ou non qui ne contiennent pas de cellules vides.

Type IV : Cette mthode est conue pour une situation dans laquelle il manque des cellules. Pour chaque effet F dans le modle, si F n'est inclus dans aucun autre effet, Type IV = Type III = Type II. Si F est inclus dans d'autres effets, le Type IV distribue les contrastes effectuer parmi les paramtres dans F sur tous les effets de niveau suprieur de faon quitable. La mthode des sommes des carrs de type IV sert gnralement pour :

Tous les modles numrs dans les types I et II. Tous les modles quilibrs ou non qui contiennent des cellules vides.

392 Chapitre 22

Contrastes GLM
Figure 22-4 Bote de dialogue GLM Univari : Contrastes

Les contrastes servent tester les diffrences entre les niveaux d'un facteur. Vous pouvez spcifier un contraste pour chaque facteur du modle (dans un modle de mesures rptes, pour chaque facteur inter-sujets). Les contrastes reprsentent des combinaisons linaires des paramtres. Le test des hypothses est fond sur l'hypothse nulle LB =0, L tant la matrice des coefficients de contraste et B le vecteur de paramtre. Si un contraste est spcifi, SPSS cre une matrice L de telle sorte que les colonnes correspondant au facteur correspondent aux contrastes. Les colonnes restantes sont ajustes de telle sorte que la matrice L puisse tre estime. Le rsultat reprend une statistique F pour chaque ensemble de contrastes. Pour les diffrences de contraste, le systme affiche galement les intervalles de confiance simultans de type Bonferroni fonds sur la distribution t de Student.
Contrastes possibles

Les contrastes fournis sont cart, simple, diffrence, Helmert, rpte et modle polynomial. Pour les contrastes d'cart et simple, vous pouvez choisir si la modalit de rfrence est la premire ou la dernire.

393 Analyse GLM Univari

Types de contraste
Ecart : Compare la moyenne de chaque niveau (hormis une modalit de rfrence) la moyenne de tous les niveaux (grande moyenne). Les niveaux du facteur peuvent tre de n'importe quel ordre. Simple : Compare la moyenne de chaque niveau celle d'un niveau donn. Ce type

de contraste est utile lorsqu'il y a un groupe de contrle. Vous pouvez prendre la premire ou la dernire modalit en rfrence.
Diffrence : Compare la moyenne de chaque niveau (hormis le premier) la moyenne des niveaux prcdents. (Parfois appel contrastes d'Helmert invers.) Helmert : Compare la moyenne de chaque niveau de facteur (hormis le dernier) la

moyenne des niveaux suivants.


Rpt : Compare la moyenne de chaque niveau (hormis le premier) la moyenne

du niveau suivant.
Modle polynomial : Compare l'effet linaire, l'effet quadratique, l'effet cubique etc. Le premier degr de libert contient l'effet linaire sur toutes les modalits, le second degr l'effet quadratique, etc. Ces contrastes servent souvent estimer les tendances polynomiales.

394 Chapitre 22

Diagrammes de profils GLM


Figure 22-5 Bote de dialogue GLM Univari : Diagrammes des protocoles

Les diagrammes des profils (diagrammes d'interaction) sont utiles pour comparer les moyennes marginales dans votre modle. Un diagramme des profils est une courbe dont chaque point indique la moyenne marginale estime d'une variable dpendante (ajuste pour les covariables) un niveau du facteur. Les niveaux d'un second facteur peuvent servir dessiner des courbes distinctes. Chaque niveau dans un troisime facteur peut servir crer un diagramme distinct. Tous les facteurs fixs et alatoire sont disponibles pour les diagrammes. Pour les analyses multivaries, les diagrammes des profils sont crs pour chaque variable dpendante. Dans une analyse mesures rptes, la fois les facteurs inter-sujets et intra-sujets peuvent tre utiliss dans les diagrammes des profils. GLM Multivari et GLM Mesures rptes sont disponibles uniquement si vous avez l'option Statistiques avances installe. Un diagramme des profils pour un facteur montre si la moyenne marginale estime est croissante ou dcroissante sur les niveaux. Pour au moins deux facteurs, des courbes parallles indiquent qu'il n'y a pas d'interaction entre les facteurs, ce qui signifie que vous rechercher les niveaux d'un seul facteur. Les courbes non parallles indiquent une interaction.

395 Analyse GLM Univari Figure 22-6 Diagramme non parallle (gauche) et diagramme parallle (droite)

Aprs avoir slectionn des facteurs pour l'axe horizontal pour spcifier un diagramme et, ventuellement, des facteurs pour des courbes ou des diagrammes distincts, le diagramme doit tre ajout dans la liste Diagrammes.

Comparaisons post hoc GLM


Figure 22-7 Bote de dialogue GLM Univari : Comparaisons multiples post hoc pour les moyennes observes

Test de comparaison multiple post hoc : Lorsque vous avez dtermin qu'il existe des diffrences parmi les moyennes, les tests d'intervalles post hoc et de comparaisons multiples par paire peuvent dterminer les moyennes qui diffrent. Les comparaisons sont effectues sur des valeurs non-ajustes. Ces tests servent aux facteurs inter-sujets

396 Chapitre 22

fixs seulement. Dans GLM - Mesures rptes, ces tests ne sont pas disponibles s'il n'y a pas de facteurs inter-sujets. Les tests de comparaisons multiples post hoc sont effectus pour la moyenne de tous les niveaux des facteurs intra-sujets. Pour GLM - Multivari, les tests post hoc sont effectus sparment pour chaque variable dpendante. GLM Multivari et GLM Mesures rptes sont disponibles uniquement si vous avez l'option Statistiques avances installe. Les tests de diffrence significative de Bonferroni et Tukey servent gnralement comme tests de comparaison multiples. Le test de Bonferroni, fond sur la statistique t de Student, ajuste le niveau de signification observ en fonction du nombre des comparaisons multiples qui sont effectues. Le test t de Sidak ajuste galement le niveau de signification et fournit des limites plus strictes que le test de Bonferroni. Le test de Tukey utilise la statistique d'intervalle selon Student pour effectuer des comparaisons par paire entre les groupes et fixe le taux d'erreur empirique au taux d'erreur du regroupement de toutes les comparaisons par paire. Lorsque vous tester un grand nombre de paire de moyennes, le test de Tukey est plus efficace que celui de Bonferroni. Lorsqu'il y a peu de paire, Bonferroni est plus efficace. Le GT2 de Hochberg est similaire au test de Tukey mais il utilise un modulus maximum selon Student. Le test de Tukey est gnralement plus efficace. Le test de comparaison par paire de Gabriel utilise galement le modulus maximum selon Student. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont ingales. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup. Le test de comparaison multiple de Dunnet compare un ensemble de traitements une simple moyenne de contrle. La dernire modalit est la modalit de contrle par dfaut. Vous pouvez galement choisir la premire modalit. Vous pouvez galement choisir un test unilatral ou bilatral. Pour tester que la moyenne un certain niveau (hormis la modalit de contrle) du facteur n'est pas gale celle de la modalit de contrle, utilisez le test double-face. Pour tester si la moyenne est infrieure, un certain niveau du facteur, celle de la modalit de contrle, slectionnez < Contrle. En outre, pour vrifier si la moyenne est suprieure, un certain niveau du facteur, celle de la modalit de contrle, slectionnez > Contrle. Ryan, Einot, Gabriel et Welsch (R-E-G-W) ont dvelopp deux tests d'intervalles multiples descendants. Les procdures multiples descendantes test d'abord que toutes les moyennes sont gales. Si toutes les moyennes ne sont pas gales, l'galit est teste sur des sous-ensembles de moyennes. Le F de R-E-G-W est fond sur le test F et le Q de R-E-G-W est fond sur l'intervalle selon Student. Ces tests sont plus efficaces que le test d'intervalle multiple de Duncan et Student-Newman-Keuls

397 Analyse GLM Univari

(procdures multiples descendantes), mais ils sont conseills lorsque les cellules sont de taille ingale. Lorsque les variances sont ingales, utilisez le T2 de Tamhane (test de comparaisons par paire conservatif fond sur un test t), le T3 de Dunnett (comparaison par paire fonde sur le modulus maximal selon Student), le test de comparaison par pairedeGames-Howell (parfois flexible) ou le C de Dunnett (test de comparaison par paire fond sur l'intervalle selon Student). Le test d'intervalle multiple de Duncan, Student-Newman-Keuls (S-N-K) et le b de Tukey sont des tests d'intervalle qui classifient les moyennes de groupe et calculent une valeur d'intervalle. Ces tests ne sont pas utiliss aussi souvent que les tests voqus prcdemment. Le test t de Waller-Duncan utilise une approche de Bayes. Ce test d'intervalle utilise la moyenne harmonique de la taille de l'chantillon lorsque les chantillons sont de diffrentes tailles. Le niveau de signification du test de Scheff est conu pour permettre toutes les combinaisons linaires possibles des moyennes de groupe tester, pas seulement par paire, disponibles dans cette fonction. Il en rsulte que le test de Scheff est souvent plus strict que les autres tests, ce qui signifie qu'une plus grande diffrence de moyenne est ncessaire pour tre significative. Le test de comparaison multiple par paire de diffrence la moins significative (LSD) est quivalent aux divers tests t individuels entre toutes les paires des groupes. L'inconvnient de ce test est qu'il n'essaie pas d'ajuster le niveau d'importante observe pour les comparaisons multiples.
Tests affichs : Les comparaisons par paire sont proposes pour LSD, Sidak,

Bonferroni, Games et Howell, T2 et T3 de Tamhane, C et T3 de Dunnett. Des sous-ensembles homognes pour les tests d'intervalle sont proposs pour S-N-K, b de Tukey, Duncan, F et Q de R-E-G-W et Waller. Le test de Tukey, le GT2 de Hochberg, le test de Gabriel et le test de Scheff sont la fois des tests de comparaison multiple et des tests d'intervalle.

398 Chapitre 22

Enregistrement GLM
Figure 22-8 Bote de dialogue GLM Univari : Enregistrement

Vous pouvez enregistrer les prvisions par le modle, les rsidus et les mesures associes sous forme de nouvelles variables dans l'diteur de donnes. La plupart de ces variables peuvent servir tudier les hypothses relatives aux donnes. Pour enregistrer les valeurs afin de les utiliser dans une autre session SPSS, vous devez enregistrer le fichier de donnes en cours.
Prvisions : Valeurs que le modle estime pour chaque observation.

Non standardiss : Valeur prvue par le modle pour la variable dpendante. Pondr : Valeurs estimes non standardises pondres. Disponibles uniquement

lorsqu'une variable WLS a t pralablement slectionne.


Erreur standard : Estimation de l'cart type de la valeur moyenne de la variable

dpendante, pour les observations ayant la mme valeur pour les variables indpendantes.
Diagnostics : Mesures permettant d'identifier les observations avec des combinaisons

inhabituelles de valeurs pour les variables indpendantes et les observations qui peuvent avoir un impact important sur le modle.

399 Analyse GLM Univari

Distance de Cook : Mesure permettant de savoir de combien les rsidus de toutes

les observations seraient modifis si une observation donne tait exclue du calcul des coefficients de rgression. Si la distance de Cook est leve, l'exclusion d'une observation changerait substantiellement la valeur des coefficients.

Valeurs influentes : Valeurs influentes non centres. Influence relative de chaque

observation sur la qualit d'ajustement du modle.


Rsidus : Un rsidu non standardis correspond la valeur relle de la variable

dpendante moins la valeur estime par le modle. Les rsidus standardiss, selon Student et supprims sont galement disponibles. Si vous avez choisi une variable de pondration, les rsidus standardiss pondrs sont disponibles.

Non standardiss : Diffrence entre la valeur observe et la valeur prvue par

le modle.
Pondr : Rsidus estims non standardiss pondrs. Disponibles uniquement

lorsqu'une variable WLS a t pralablement slectionne.


Standardiss : Rsidu divis par une estimation de son cart type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart type de 1.

Studentiss : Rsidu, divis par une estimation de son cart type, qui varie d'une

observation une autre, selon la distance entre les valeurs et la moyenne des variables indpendantes pour chaque observation.

Supprimes : Rsidu d'une observation lorsque celle-ci est exclue du calcul des

coefficients de rgression. Il s'agit de la diffrence entre la valeur de la variable dpendante et la prvision ajuste.
Enregistrer dans nouveau fichier : Ecrit un fichier de donnes SPSS qui contient une

matrice variance-covariance des estimations dans le modle. D'autre part, pour chaque variable dpendante, il y aura une ligne d'estimations, une ligne de valeurs de signification pour les statistiques t correspondant aux estimations et une ligne de degrs de libert rsiduels. Pour un modle multivari, il y a les mmes lignes pour chaque variable dpendante. Vous pouvez utiliser ce fichier de matrice dans les autres procdures qui lisent un fichier de matrice SPSS.

400 Chapitre 22

Options GLM
Figure 22-9 Bote de dialogue GLM- Univari : Options

Des statistiques facultatives sont disponibles partir de cette bote de dialogue. Ces statistiques sont calcules l'aide de modle effets fixes.
Moyenne marginale estime : Slectionnez les facteurs et les interactions pour lesquels

vous souhaitez obtenir des estimations de la moyenne marginale de la population dans les cellules. Ces moyennes sont ajustes pour les covariables, si elles existent.

Comparer les effets principaux : Propose des comparaisons par paire non corriges

des moyennes marginales estimes pour tout effet principal dans le modle, la fois pour les facteurs inter-sujets et intra-sujets. Ceci n'est valable que si les effets principaux sont slectionns dans la liste Afficher les moyennes.

Ajustement intervalle de confiance : Slectionnez l'ajustement aux intervalles

et la significativit des intervalles en adoptant l'une des mthodes suivantes : la diffrence de moindre signification (LSD), l'ajustement Bonferroni ou l'ajustement de Sidak. Cet lment est disponible uniquement si Comparer les effets principaux est slectionn.

401 Analyse GLM Univari

Afficher : Slectionnez Statistiques descriptives pour produire des moyennes, des carts

types et des effectifs pour toutes les variables dpendantes de toutes les cellules. L'option Estimation d'effet de taille fournit une valeur partielle de Eta carr pour chaque effet et chaque estimation. La statistique d'Eta carr dcrit la proportion de la variabilit totale imputable au facteur. Slectionnez Puissance observe pour obtenir la puissance du test lorsque l'autre hypothse est dfinie sur la base de la valeur observe. Slectionnez Estimation des paramtres pour produire des estimations de paramtres, des erreurs standard, des tests t, des intervalles de confiance et la puissance observe de chaque test. Slectionnez Matrice des coefficients de contraste pour obtenir la matrice L. L'option des tests d'homognit produit le test de Levene d'homognit de la variance pour chaque variable dpendante sur toutes les combinaisons de niveaux des facteurs inter-sujets, uniquement pour les facteurs inter-sujets. Les options des diagrammes de dispersion par niveau et de rsidus sont utiles pour vrifier les hypothses sur les donnes. Ceci n'est pas valable s'il n'y a pas de facteurs. Slectionnez Diagrammes rsiduels pour produire un diagramme rsiduel observ/estim/standardis pour chaque variable dpendante. Ces diagrammes sont utiles pour vrifier l'hypothse de variance gale. Slectionnez Manque d'ajustement pour vrifier si la relation entre la variable dpendante et les variables indpendantes peut tre convenablement dcrite par le modle. Fonction gnrale estime vous permet de construire des tests d'hypothses personnaliss bass sur la fonction gnrale estime. Les lignes de n'importe quelle matrice des coefficients de contraste sont des combinaisons linaires de la fonction gnrale estime.
Niveau de signification : Vous souhaitez peut-tre ajuster le niveau de signification utilis dans les tests post hoc et le niveau de confiance utilis pour construire des intervalles de confiance. La valeur spcifie est galement utilise pour calculer l'intensit observe pour le test. Lorsque vous spcifiez un niveau de signification, le niveau associ des intervalles de confiance est affich dans la bote de dialogue.

Fonctionnalits supplmentaires de la commande UNIANOVA


Le langage de commande SPSS vous permet aussi de :

Spcifier les effets en cascade dans un modle ( l'aide de la sous-commande DESIGN).

402 Chapitre 22

Spcifier les tests d'effets par rapport une combinaison linaire d'effets ou une valeur ( l'aide de la sous-commande TEST). Spcifier de multiples contrastes ( l'aide de la sous-commande CONTRAST). Inclure les valeurs manquantes pour l'utilisateur ( l'aide de la sous-commande MISSING). Spcifier les critres EPS ( l'aide de la sous-commande CRITERIA). Construisez une matrice L personnalise, une matrice M ou une matrice K ( l'aide des sous-commandes LMATRIX, MMATRIX et KMATRIX). Pour les contrastes simples ou d'cart, spcifier une modalit de rfrence intermdiaire ( l'aide de la sous-commande CONTRAST). Spcifier les mesures pour les contrastes polynomiaux ( l'aide de la sous-commande CONTRAST). Spcifier des termes d'erreur pour les comparaisons post hoc ( l'aide de la sous-commande POSTHOC). Calculer les moyennes marginales estimes pour chaque facteur ou interaction de facteurs parmi les facteurs de la liste ( l'aide de la sous-commande EMMEANS). Attribuer des noms aux variables temporaires ( l'aide de la sous-commande SAVE). Construire un fichier de matrice de corrlation ( l'aide de la sous-commande OUTFILE). Construire un fichier de type matrice de donnes qui contient les statistiques provenant de la table ANOVA inter-sujets ( l'aide de la sous-commande OUTFILE). Enregistrer la matrice du plan dans un nouveau fichier de donnes ( l'aide de la sous-commande OUTFILE).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Corrlations bivaries

23

Chapitre

La procdure de corrlations bivaries calcule le coefficient de corrlation de Pearson, le rho de Spearman et le tau-b de Kendall avec leurs seuils de signification. Les corrlations mesurent comment les variables ou les ordres de rang sont lis. Avant de calculer un coefficient de corrlation, parcourez vos donnes pour rechercher les valeurs loignes (qui peuvent provoquer des rsultats errons) et les traces d'une relation linaire. Le coefficient de corrlation de Pearson est une mesure d'association linaire. Deux variables peuvent tre parfaitement lies, mais si la relation n'est pas linaire, le coefficient de corrlation de Pearson n'est pas une statistique approprie pour mesurer leur association.
Exemple : Le nombre de matchs de basket-ball remports par une quipe est-il li au nombre moyen de points marqus par match ? Un diagramme de dispersion indique qu'il existe une relation linaire. L'analyse des donnes de la saison NBA 19941995 dmontre que le coefficient de corrlation de Pearson (0,581) est significatif au niveau 0,01. On peut penser que plus on a gagn de matchs dans une saison, moins l'adversaire a marqu de points. Ces variables sont lies ngativement (0,401) et la corrlation est significative au niveau 0,05. Statistiques : Pour chaque variable, on a les lments suivants : nombre d'observations avec des valeurs non manquantes, moyenne, et cart type. Pour chaque paire de variables, on a les lments suivants : coefficient de corrlation de Pearson, rho de Spearman, tau-b de Kendall, produits des carts et covariance.

Remarques sur les donnes des corrlations bivaries


Donnes : Utilisez des variables quantitatives symtriques pour le coefficient de

corrlation de Pearson, et des variables quantitatives ou des variables avec des modalits ordonnes pour le rho de Spearman et le tau-b de Kendall.

403

404 Chapitre 23

Hypothses : Le coefficient de corrlation de Pearson part du principe que chaque

paire de variables est gaussienne bivarie.

Echantillon de rsultat
Figure 23-1 Rsultats des corrlations bivaries
Corrlations Correlations Nombre de matchs gagns Corrlation de Pearson Nombre de matchs gagns Points marqus par match Points en dfense par match Signification (bilatrale) Nombre de matchs gagns Points marqus par match Points en dfense par match N Nombre de matchs gagns Points marqus par match Points en dfense par match **. Corrlation 0.01(bilatrale) : *. Corrlation 0.05(bilatrale) : 1.000 Points marqus par match .581** Points en dfense par match -.401*

.581**

1.000

.457*

-.401*

.457*

1.000

.001

.038

.001

.017

.038

.017

27

27

27

27

27

27

27

27

27

Pour obtenir des corrlations bivaries


A partir du menu, slectionnez :
Analyse Corrlation Bivarie...

405 Corrlations bivaries Figure 23-2 Bote de dialogue Corrlations bivaries

E Slectionnez plusieurs variables numriques.

Les options suivantes sont galement disponibles :

Coefficients de corrlation : Pour des variables quantitatives, normalement

distribues, choisissez le coefficient de corrlation de Pearson. Si vos donnes ne sont pas distribues normalement ou si elles comportent des modalits ordonnes, choisissez le Tau-b de Kendall ou la corrlation de Spearman, qui mesure l'association entre les ordres de rangs. Les coefficients de corrlation vont de la valeur 1 (relation ngative parfaite) +1 (relation positive parfaite). La valeur 0 indique l'absence de relation linaire. Lors de l'interprtation de vos rsultats, vous ne pouvez pas, partir de l'existence d'une corrlation significative, conclure en l'existence d'une relation de cause effet.

Test de signification : Vous pouvez choisir des probabilits bilatrales ou

unilatrales. Si la direction de l'association est connue l'avance, choisissez Unilatral. Sinon, slectionnez Bilatral.

Reprer les corrlations significatives : Les coefficients de corrlation significatifs

au niveau 0,05 sont identifis par un seul astrisque et ceux qui sont significatifs au niveau 0,01 sont identifis par deux astrisques.

406 Chapitre 23

Options de corrlations bivaries


Figure 23-3 Bote de dialogue Corrlations bivaries : Options

Statistiques : Pour les corrlations de Pearson, vous pouvez choisir l'une des options

suivantes (ou les deux) :

Moyennes et carts types : Affichs pour chaque variable. Le nombre

d'observations avec valeurs non manquantes est galement affich. Les valeurs manquantes sont examines variable par variable quel que soit votre rglage des valeurs manquantes.

Produits des carts et covariances : Indiqus pour chaque paire de variables. Le

produit des carts est gal la somme des produits des variables moyennes corriges. Ceci est le numrateur du coefficient de corrlation de Pearson. La covariance est une mesure non standardise de la relation entre deux variables, gale au produit des carts divis par N1.
Valeurs manquantes : Vous pouvez choisir l'un des lments suivants :

Exclure seulement les composantes non valides : Les observations avec des valeurs

manquantes pour l'une ou les deux variables d'une paire pour un coefficient de corrlation sont exclues de l'analyse. Etant donn que chaque coefficient est bas sur toutes les observations ayant des codes valides pour cette paire particulire de variables, la quantit maximale d'informations disponibles est utilise dans chaque calcul. Ceci peut aboutir un jeu de coefficients bas sur un nombre variable d'observations.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour une variable sont exclues de toutes les analyses.

407 Corrlations bivaries

Proprits supplmentaires des commandes CORRELATIONS et NONPAR CORR


Le langage de commande SPSS vous permet aussi de :

Ecrire une f pour les corrlations de Pearson qui peut tre utilise la place de donnes brutes pour obtenir d'autres analyses comme une analyse factorielle (avec la sous-commande MATRIX). Obtenir des corrlations de chaque variable dans une liste avec chaque variable d'une seconde liste (en utilisant le mot cl WITH avec la sous-commande VARIABLES).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Corrlations partielles

24

Chapitre

La procdure des corrlations partielles calcule les coefficients de corrlation partielle qui dcrivent le rapport linaire entre deux variables tout en contrlant les effets d'une ou plusieurs autres variables. Les corrlations sont des mesures d'association linaire. Deux variables peuvent tre parfaitement lies mais, si leur rapport n'est pas linaire, un coefficient de corrlation n'est pas une statistique adapte pour mesurer leur association.
Exemple : Existe-t-il une relation entre le financement associ aux soins de sant

et les taux d'attaque ? Contre toute attente, une tude fait tat d'une corrlation positive : Lorsque le financement associ aux soins de sant augmente, les taux d'attaque augmentent. Cependant, le contrle du taux de visite aux fournisseurs de soins de sant supprime presque la corrlation positive observe. Le financement li aux soins de sant et les taux d'attaque sont associs de manire positive car le nombre de personnes ayant accs aux soins de sant augmente en mme temps que le financement. De ce fait, le nombre de maladies dclares par les docteurs et les hpitaux augmente galement.
Statistiques : Pour chaque variable, on a les lments suivants : nombre d'observations avec des valeurs non manquantes, moyenne, et cart type. Matrices de corrlation partielle et simple, avec degrs de libert et seuils de signification.

Remarques sur les donnes des corrlations partielles


Donnes : Utiliser des variables quantitatives et symtriques. Hypothses : La procdure des Corrlations Partielles suppose que chaque paire de

variables prsente une corrlation normale.

409

410 Chapitre 24

Echantillon de rsultat
Figure 24-1 Rsultats de Corrlations Partielles

Obtenir des corrlations partielles


E A partir du menu, slectionnez : Analyse Corrlation Partielle...

411 Corrlations partielles Figure 24-2 Bote de dialogue Corrlations partielles

E Slectionnez au moins deux variables numriques pour lesquelles vous voulez

calculer des corrlations partielles.


E Slectionnez une ou plusieurs variables numriques de contrle.

Les options suivantes sont galement disponibles :

Test de signification : Vous pouvez choisir des probabilits bilatrales ou

unilatrales. Si la direction de l'association est connue l'avance, choisissez Unilatral. Sinon, slectionnez Bilatral.

Afficher le seuil exact de signification : La probabilit et les degrs de libert sont

affichs par dfaut pour chaque coefficient de corrlation. Si vous dslectionnez cette option, les coefficients significatifs au seuil 0,05 sont identifis par une astrisque, les coefficients significatifs au seuil de 0,01 par deux astrisques, et les degrs de libert sont supprims. Cette configuration affecte aussi bien les matrices de corrlation partielle que simple.

412 Chapitre 24

Options Corrlations partielles


Figure 24-3 Bote de dialogue Corrlations partielles : Options

Statistiques : Vous avez le choix entre les deux options suivantes :


Moyennes et carts types : Affichs pour chaque variable. Le nombre d'observations

avec valeurs non manquantes est galement affich.

Corrlations simples : Une matrice de corrlations simples entre toutes les

variables, y compris les variables de contrle, s'affiche.


Valeurs manquantes : Vous avez le choix entre les options suivantes :

Exclure toute observation incomplte : Les observations ayant des valeurs

manquantes pour une variable quelconque, y compris une variable de contrle, sont exclues de tous les calculs.

Exclure seulement les composantes non valides : Pour le calcul des corrlations

simples sur lesquelles se basent les corrlations partielles, une observation ayant des valeurs manquantes pour une composante ou les deux composantes d'une paire de variables ne sera pas utilise. La suppression des composantes non valides seulement utilise autant de donnes que possible. Le nombre d'observations peut toutefois diffrer selon les coefficients. Lorsque la suppression des composantes non valides seulement est slectionne, les degrs de libert d'un coefficient partiel donn sont bass sur le plus petit nombre d'observations utilises dans le calcul de l'une quelconque des corrlations d'ordre zro.

Distances

25

Chapitre

Cette procdure permet de calculer de trs nombreuses statistiques mesurant les similitudes ou les diffrences (distances) entre des paires de variables ou d'observations. Vous pourrez ensuite utiliser ces mesures de similarit ou de dissimilarit avec d'autres procdures, comme l'analyse factorielle, la classification ou le positionnement multidimensionnel, afin de simplifier l'analyse des ensembles de donnes complexes.
Exemple : Est-il possible de mesurer les similarits entre des paires de voitures

en fonction de certaines caractristiques, comme le nombre de cylindres, la consommation et la puissance ? En calculant les similarits existant entre des voitures, vous pouvez dterminer les voitures qui sont semblables et celles qui sont diffrentes. Dans l'optique d'une analyse plus formelle, vous pouvez appliquer une classification hirarchique ou un positionnement multidimensionnel aux similarits afin d'examiner la structure sous-jacente.
Statistiques : Pour les donnes d'intervalle, les mesures de dissimilarit sont la

distance Euclidienne, le carr de la distance Euclidienne, la distance de Tchebycheff, la distance de Manhattan (bloc), la distance de Minkowski ou une mesure personnalise. Pour les donnes d'effectif, les mesures sont khi-deux et phi-deux. Pour les donnes binaires, les mesures de dissimilarit sont la distance Euclidienne, le carr de la distance Euclidienne, l'cart de taille, la diffrence de motif, la variance, la forme, ou la mesure de Lance et Williams. Pour les donnes d'intervalles, les mesures de similarit sont la corrlation de Pearson ou cosinus. Pour les donnes binaires, il s'agit des mesures suivantes : Russel et Rao, indice de Sokal et Michener, Jaccard, Dice, Rogers et Tanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Kulczynski 1, Kulczynski 2, Sokal et Sneath 4, Hamann, lambda, D d'Anderberg, Y de Yule, Q de Yule, Ochiai, Sokal et Sneath 5, corrlation phi ttrachorique ou dispersion.

413

414 Chapitre 25

Pour obtenir des matrices de distance


E A partir du menu, slectionnez : Analyse Corrlation Indices Figure 25-1 Bote de dialogue Distances

E Slectionnez au minimum une ou deux variables numriques pour calculer

respectivement les distances existant entre des observations ou des variables.


E Slectionnez une possibilit dans le groupe Calculer les distances pour calculer les

proximits existant entre des observations ou des variables.

415 Distances

Distances : Mesures de dissimilarit


Figure 25-2 Bote de dialogue Indices : Mesures de dissimilarit

Dans le groupe Mesure, slectionnez la possibilit qui correspond au type de vos donnes (intervalle, effectif ou binaire). Ensuite, dans la liste droulante, slectionnez l'une des mesures correspondant ce type de donnes. Les mesures disponibles sont, par type de donnes :

Intervalle : Distance Euclidienne, Carr de la distance Euclidienne, Distance de

Tchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.


Effectifs : Distance du Khi-deux ou Distance du phi-deux. Binaire : Distance Euclidienne, Carr de la distance Euclidienne, Ecart de taille,

Diffrence de motif, Variance, Forme, ou Lance et Williams. (Entrez des valeurs dans les champs Prsent et Absent pour indiquer les deux valeurs significatives. Aucune autre valeur ne sera prise en compte dans Distances.) Le groupe Transformer les valeurs vous permet de standardiser les valeurs des donnes pour les observations ou les variables avant le calcul des proximits. Ces transformations ne s'appliquent pas aux donnes binaires. Les mthodes de

416 Chapitre 25

standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 et Ecart type = 1. Le groupe Transformer les mesures vous permet de transformer les valeurs gnres par la mesure de distance. Elles sont appliques aprs le calcul de la mesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Indices : Mesures de similarit


Figure 25-3 Bote de dialogue Indices : Mesures de similarit

Dans le groupe Mesure, slectionnez la possibilit qui correspond au type de vos donnes (intervalle ou binaire). Ensuite, dans la liste droulante, slectionnez l'une des mesures correspondant ce type de donnes. Les mesures disponibles sont, par type de donnes :

Intervalle : Corrlation de Pearson ou Cosinus. Binaire : Russel et Rao, Indice de Sokal et Michener, Jaccard, Dice, Rogers et

Tanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Kulczynski 1, Kulczynski 2, Sokal et Sneath 4, Hamann, Lambda, D d'Anderberg, Y de Yule, Q de Yule, Ochiai, Sokal et Sneath 5, Corrlation phi ttrachorique ou Dispersion. (Entrez des valeurs dans les champs Prsent et Absent pour indiquer les deux valeurs significatives. Aucune autre valeur ne sera prise en compte dans Distances.)

417 Distances

Le groupe Transformer les valeurs vous permet de standardiser les valeurs des donnes pour les observations ou les variables avant le calcul des proximits. Ces transformations ne s'appliquent pas aux donnes binaires. Les mthodes de standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 ou Ecart type = 1. Le groupe Transformer les mesures vous permet de transformer les valeurs gnres par la mesure de distance. Elles sont appliques aprs le calcul de la mesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Rgression linaire

26

Chapitre

La rgression linaire estime les coefficients de l'quation linaire, impliquant une ou plusieurs variables indpendantes, qui estiment le mieux la valeur de la variable dpendante. Par exemple, vous pouvez essayer d'estimer les ventes annuelles globales d'un commercial (la variable dpendante) partir de variables indpendantes telles que l'ge, l'ducation et les annes d'exprience.
Exemple : Le nombre de matches gagns par une quipe de basket-ball au cours d'une

saison est-il li au nombre moyen de points marqus par l'quipe chaque match ? Un diagramme de dispersion indique que ces variables ont un lien linaire. Le nombre de matches gagns et le nombre moyen de points marqu par l'quipe adverse ont galement un lien linaire. Ces variables ont une relation ngative. Lorsque le nombre de matches gagns augmente, le nombre moyen de points marqus par les adversaires diminue. A l'aide de la rgression linaire, vous pouvez modliser la relation entre ces variables. Un bon modle peut tre utilis pour prvoir combien de matches les quipes vont gagner.
Statistiques : Pour chaque variable, on a les lments suivants : nombre d'observations valides, moyenne et cart type. Pour chaque modle : coefficients de rgression, matrice de corrlations, mesures et corrlations partielles, R multiple, R2, R2 ajust, variation de R2, erreur standard de l'estimation, tableau d'analyse de la variance, prvisions et rsidus. En plus, intervalles de confiance 95 % pour chaque coefficient de rgression, matrice variances-covariances, facteur d'inflation de la variance, tolrance, test de Durbin-Watson, mesures de distances (Mahalanobis, Cook, et valeurs influentes), DfBta, diffrence de prvision, intervalles d'estimation et diagnostics des observations. Diagrammes : dispersion, diagrammes partiels, histogrammes et diagrammes de rpartition gaussiens.

419

420 Chapitre 26

Rgression linaire : Remarques sur les donnes


Donnes : Les variables dpendantes et indpendantes doivent tre quantitatives. Les variables qualitatives, comme la religion, la qualification, la zone de rsidence, doivent tre enregistres sous forme de variables binaires (muettes) ou sous de tout autre type de variables de contraste. Hypothses : Pour chaque valeur de la variable indpendante, la distribution de la

variable dpendante doit tre normale. La variance de la distribution de la variable dpendante doit tre constante pour toutes les valeurs de la variable indpendante. La relation entre la variable dpendante et chaque variable indpendante doit tre linaire et toutes les observations doivent tre indpendantes.

Echantillon de rsultat
Figure 26-1 Rsultat de rgression linaire

421 Rgression linaire

Rsum de modle

3,4

Variables Entres Modle 1 Points en dfense par match, points marqus par 1,2 match Supprimes R R carr

Erreur std. R carr ajust de l'estimation

.947

.898

.889

4.40

1. Variables indp. : (constante) points en dfense par match, points marqus par match 2. Toutes les variables requises entres. 3. Variable dpendante : nombre de matchs gagns 4. Mthode : introduction simultane

ANOVA 2 Somme des carrs Modle 1 Rgression Rsidus Total 4080.533 465.467 4546.000

df 2 24 26

Carr moyen 2040.266 19.394

F 105.198

Significatif .0001

1. Variables indp. : (constante) points en dfense par match, points marqus par match 2. Variable dpendante : nombre de matchs gagns

422 Chapitre 26

Coefficients non standardiss Modle (constante) Points marqus par match Points en dfense par match Erreur std.

Coefficients standardiss Bta

Variable dpendante : nombre de matchs gagns

Obtenir une analyse de rgression linaire


E A partir du menu, slectionnez : Analyse Rgression Linaire...

423 Rgression linaire Figure 26-2 Bote de dialogue Rgression linaire

E Dans la bote de dialogue Rgression linaire, slectionnez une variable numrique

dpendante.
E Slectionnez une ou plusieurs variables indpendantes.

Sinon, vous pouvez :


Grouper des variables indpendantes en blocs et spcifier diffrentes mthodes d'entre pour diffrents sous-groupes de variables. Choisir une variable de slection pour limiter l'analyse un sous-groupe d'observations ayant une ou des valeurs particulires pour cette variable. Slectionner une variable d'identification d'observations pour identifier des points sur les diagrammes. Slectionnez une variable de pondration WLS numrique pour une analyse des moindres carrs pondrs.

424 Chapitre 26

WLS : Permet d'obtenir un modle des moindres carrs pondr. Les points de

donnes sont pondrs par l'inverse de leur variance. Ainsi, les observations dont la variance est leve ont moins d'impact sur l'analyse que celles dont la variance est faible. Si la valeur de la variable de pondration est nulle, ngative ou manquante, l'observation est exclue de l'analyse.

Mthodes de slection des variables de rgression linaire


La slection d'une mthode vous permet de spcifier la manire dont les variables indpendantes sont entres dans l'analyse. En utilisant diffrentes mthodes, vous pouvez construire divers modles de rgression partir du mme groupe de variables.

Introduire (rgression) : Procdure de slection de variables au cours de laquelle

toutes les variables d'un bloc sont introduites en une seule opration.
Pas pas : A chaque tape, le programme saisit la variable indpendante exclue

de l'quation ayant la plus petite probabilit de F, si cette probabilit est suffisamment faible. Les variables dj comprises dans l'quation de rgression sont limines si leur probabilit de F devient trop grande. Le processus s'arrte lorsqu'aucune variable ne peut plus tre introduite ou limine.

Eliminer bloc : Procdure de slection de variables dans laquelle toutes les

variables d'un bloc sont supprimes en une seule tape.


Elimination descendante : Procdure de slection de variables au cours de laquelle

toutes les variables sont entres dans l'quation, puis limines une une. La variable ayant la plus petite corrlation partielle avec la variable dpendante est la variable dont l'limination est tudie en premier. Si elle rpond aux critres d'limination, elle est supprime. Une fois la premire variable limine, l'limination de la variable suivante restant dans l'quation et ayant le plus petit coefficient de corrlation partielle est tudie. La procdure prend fin quand plus aucune variable de l'quation ne satisfait aux critres d'limination.

Introduction ascendante : Procdure de slection pas pas de variables, dans

laquelle les variables sont introduites squentiellement dans le modle. La premire variable considre est celle qui a la plus forte corrlation positive ou ngative avec la variable dpendante. Cette variable n'est introduite dans l'quation que si elle satisfait le critre d'introduction. Si la premire variable est introduite dans l'quation, la variable indpendante externe l'quation et qui prsente la plus forte corrlation partielle est considre ensuite. La

425 Rgression linaire

procdure s'interrompt lorsqu'il ne reste plus de variables satisfaisant au critre d'introduction. Les valeurs de significativit dans vos rsultats sont bases sur l'adquation un modle unique. Par consquent, les valeurs de significativit ne sont gnralement pas valables lorsqu'on utilise une mthode progressive (Pas pas, Ascendante ou Descendante). Toutes les variables doivent respecter le critre de tolrance pour tre entres dans l'quation, quelle que soit la mthode d'entre spcifie. Le niveau de tolrance par dfaut est 0,0001. Une variable n'est pas entre si elle fait passer la tolrance d'une autre variable dj entre dans le modle en dessous du seuil de tolrance. Toutes les variables indpendantes slectionnes sont ajoutes dans un seul modle de rgression. Cependant, vous pouvez spcifier diffrentes mthodes d'entre pour les sous-groupes de variables. Par exemple, vous pouvez entrer un bloc de variables dans le modle de rgression en utilisant la slection pas pas, et un second bloc en utilisant la slection ascendante. Pour ajouter un second bloc de variables au modle de rgression, cliquez sur Suivant.

Rgression linaire : Dfinir la rgle


Figure 26-3 Bote de dialogue Rgression linaire : Dfinir loi

Les observations dfinies par la rgle de slection sont incluses dans l'analyse. Par exemple, si vous slectionnez une variable, gale, et 5 pour la valeur, alors seules les observations pour lesquelles la variable slectionne a une valeur gale 5 seront incluses dans l'analyse. Une valeur chane est galement permise.

426 Chapitre 26

Diagrammes de rgression linaire


Figure 26-4 Bote de dialogue Rgression linaire : Graphiques (diagrammes)

Les diagrammes peuvent aider valider les hypothses de normalit, linarit et d'galit des variances. Les diagrammes sont galement utiles pour dtecter les valeurs loignes, les observations loignes et les observations influentes. Aprs avoir t enregistrs comme variables nouvelles, les prvisions, rsidus et autres diagnostics sont disponibles dans l'diteur de donnes pour construire des diagrammes avec les variables indpendantes. Les diagrammes suivants sont disponibles :
Diagrammes de dispersion : Vous pouvez afficher deux des lments suivants : la variable dpendante, les prvisions standardises, les rsidus standardiss, les rsidus supprims, les prvisions ajustes, les rsidus standardiss et les rsidus supprims de Student. Affichez les rsidus standardiss par rapport aux prvisions standardises pour vrifier la linarit et l'galit des variances. Liste des variables sources : Rpertorie la variable dpendante (DEPENDNT), ainsi

que les variables prvues et les rsidus suivants prvisions standardises (*ZPRED), rsidus standardiss (*ZRESID), rsidus supprims (*DRESID), prvisions ajustes (*ADJPRED), rsidus de Student (*SRESID), rsidus supprims de Student (*SDRESID).

427 Rgression linaire

Gnrer tous les graphiques partiels : Affiche des diagrammes de dispersion des rsidus de chaque variable indpendante et les rsidus de la variable dpendante lorsque les deux variables sont rgresses sparment par rapport au reste des variables indpendantes. Au moins deux variables indpendantes doivent tre dans l'quation pour produire un diagramme partiel. Diagrammes des rsidus standardiss : Vous pouvez obtenir des histogrammes des rsidus standardiss et des diagrammes de rpartition gaussiens en comparant la rpartition des rsidus standardiss une rpartition gaussienne.

Si vous demandez des diagrammes, des statistiques rcapitulatives sont affiches pour les prvisions standardises et les rsidus standardiss (*ZPRED et *ZRESID).

Rgression linaire : Enregistrer de nouvelles variables


Figure 26-5 Bote de dialogue Rgression linaire : Enregistrer les nouvelles variables

428 Chapitre 26

Vous pouvez enregistrer les prvisions, les rsidus et autres statistiques utiles pour les diagnostics. Chaque slection ajoute une ou plusieurs variables votre fichier de donnes actif.
Prvisions : Valeurs prvues par le modle de rgression pour chaque observation.

Non standardiss : Valeur prvue par le modle pour la variable dpendante. Standardiss : Transformation de chaque prvision en sa forme standardise. La

prvision moyenne est soustraite de la prvision, et la diffrence est divise par l'cart type des prvisions. Les prvisions standardises ont une moyenne de 0 et un cart type de 1.

Ajustes : Prvision pour une observation exclue du calcul des coefficients de

rgression.
Erreur standard prvision moyenne : Erreurs standard des prvisions. Estimation de

l'cart type de la valeur moyenne de la variable dpendante, pour les observations ayant la mme valeur pour les variables indpendantes.
Distances : Mesures permettant d'identifier les observations avec des combinaisons

inhabituelles de valeurs pour les variables indpendantes et les observations qui peuvent avoir un impact important sur le modle.

Mahalanobis : Mesure de la distance entre les valeurs d'une observation et la

moyenne de toutes les observations sur les variables indpendantes. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrmes pour des variables indpendantes.

Cook : Mesure permettant de savoir de combien les rsidus de toutes les

observations seraient modifis si une observation donne tait exclue du calcul des coefficients de rgression. Si la distance de Cook est leve, l'exclusion d'une observation changerait substantiellement la valeur des coefficients.

Valeurs influentes : Mesures de l'influence d'un point sur l'ajustement de la

rgression. La valeur influente centre varie de 0 (aucune influence sur la qualit de l'ajustement) (N-1)/N.
Intervalles de la prvision : Les limites suprieure et infrieure pour les intervalles de la prvision moyenne et individuelle.

Moyenne : Limites infrieure et suprieure (deux variables) de l'intervalle de

prvision de la rponse moyenne prvue.

429 Rgression linaire

Individuelle : Limites infrieure et suprieure (deux variables) de l'intervalle de

prvision de la variable dpendante pour une observation particulire.


Intervalle de confiance : Entrez une valeur comprise entre 1 et 99,99 pour spcifier

le seuil de confiance pour les deux intervalles de la prvision. Vous devez slectionner Moyenne ou Individuelle avant d'entrer cette valeur. Les seuils d'intervalle de confiance typiques sont 90, 95 et 99.
Rsidus : La valeur relle de la variable indpendante moins la valeur prvue par l'quation de rgression.

Non standardiss : Diffrence entre la valeur observe et la valeur prvue par

le modle.
Standardiss : Rsidu divis par une estimation de son cart type. Egalement

appels rsidus de Pearson, les rsidus standardiss ont une moyenne de 0 et un cart type de 1.

Studentiss : Rsidu, divis par une estimation de son cart type, qui varie d'une

observation une autre, selon la distance entre les valeurs et la moyenne des variables indpendantes pour chaque observation.

Supprimes : Rsidu d'une observation lorsque celle-ci est exclue du calcul des

coefficients de rgression. Il s'agit de la diffrence entre la valeur de la variable dpendante et la prvision ajuste.

Supprims studentiss : Rsidu supprim d'une observation, divis par son

erreur standard. La diffrence entre le rsidu supprim de Student et le rsidu de Student associ indique l'impact de l'limination d'une observation sur sa propre prdiction.
Influences individuelles : La modification des coefficients de rgression (DfBta(s)) et des prvisions (diffrence de prvision) qui rsulte de l'exclusion d'une observation particulire. Les valeurs DfBtas et de diffrence de prvision standardises sont galement disponibles ainsi que le rapport de covariance.

DfBta(s) : La diffrence de bta correspond au changement des coefficients de

rgression qui rsulte du retrait d'une observation particulire. Une valeur est calcule pour chaque terme du modle, y compris la constante.

DfBta(s) standardise : Diffrence standardise de la valeur bta. Modification

du coefficient de rgression, rsultant de l'exclusion d'une observation donne. Vous pouvez par exemple examiner les observations ayant des valeurs absolues suprieures 2, divises par la racine carre de N, N reprsentant le nombre

430 Chapitre 26

d'observations. Une valeur est calcule pour chaque terme du modle, y compris la constante.

Diffrence de prvision : La diffrence de prvision est le changement de la

prvision rsultant de l'exclusion d'une observation donne.


Dfprvision standardise : Diffrence standardise de la valeur ajuste.

Modification de la prvision qui rsulte de l'exclusion d'une observation donne. Vous pouvez par exemple examiner les valeurs standardises dont la valeur absolue est suprieure 2 fois la racine carre de p/N, p correspondant au nombre de paramtres du modle et N, au nombre d'observations.

Rapport de covariance : Rapport entre le dterminant de la matrice de

variance-covariance si une observation donne a t exclue du calcul des coefficients de rgression et le dterminant de la matrice de covariance avec toutes les observations incluses. Si le rapport est proche de 1, l'observation modifie peu la matrice de covariance.
Enregistrer dans nouveau fichier : Enregistre les coefficients de rgression dans un

fichier que vous spcifiez.


Exporter les informations du modle dans un fichier XML: Exporte les informations du modle dans le fichier spcifi. SmartScore et les versions ultrieures de WhatIf? pourront utiliser ce fichier.

431 Rgression linaire

Statistiques de rgression linaire


Figure 26-6 Bote de dialogue Rgression linaire : Statistiques

Les statistiques suivantes sont disponibles :


Coefficients de rgression : L'option Estimations affiche le coefficient de rgression B, l'erreur standard de B, le coefficient bta standardis, la valeur t de B et le niveau de signification bilatral de t. L'option Intervalles de confiance affiche les intervalles de confiance 95 % pour chaque coefficient de rgression ou une matrice de covariance. L'option Matrice de covariance affiche la matrice de variance-covariance des coefficients de rgression avec les covariances hors de la diagonale et les variances dans la diagonale. Une matrice de corrlation est galement affiche. Qualit de l'ajustement : Les variables entres et supprimes du modle sont listes et

les statistiques de la qualit de l'ajustement suivantes sont affiches : R multiple, R2 et R2 ajust, erreur standard de l'estimation et un tableau d'analyse de variance.
Variation de R-deux : Variation de la statistique du R2 obtenue en ajoutant ou en

enlevant une variable indpendante. Si la variation du R2 associe une variable est importante, cela signifie que la variable est une bonne explication de la variable dpendante.

432 Chapitre 26

Descriptives : Fournit le nombre d'observations valides, la moyenne et l'cart type de chaque variable de l'analyse. Une matrice de corrlations avec le seuil de signification unilatral et le nombre d'observations pour chaque corrlation sont galement affichs. Mesure et corrlations partielles : Affiche les corrlations simples et partielles. Les

valeurs du coefficient de corrlation varient entre 1 et +1. Le signe du coefficient indique la direction de la relation et sa valeur absolue en indique la force : plus la valeur absolue est grande, plus forte est la relation.
Tests de colinarit : La colinarit (ou multicolinarit) est la situation indsirable o une variable indpendante est une fonction linaire d'autres variables indpendantes. Les valeurs propres de la matrice des produits croiss dimensionns et non centrs, les indices de conditionnement et les proportions de dcomposition de variance sont affichs ainsi que les facteurs d'inflation de la variance (VIF) et les tolrances pour les variables individuelles. Rsidus : Affiche le test de Durbin-Watson de corrlation srielle des rsidus et le diagnostic des observations correspondant au critre de slection (valeurs loignes de n carts types).

Rgression linaire : Options


Figure 26-7 Bote de dialogue Rgression linaire : Options

433 Rgression linaire

Les options suivantes sont disponibles :


Paramtres des mthodes progressives : Ces options sont valables lorsque la mthode de slection ascendante, descendante ou progressive a t slectionne. Des variables peuvent tre entres ou supprimes du modle soit en fonction de la signification (probabilit) de la valeur F, soit en fonction de la valeur F elle-mme.

Choisir la probabilit de F : Une variable est entre dans le modle si le seuil

de signification de la valeur F est suprieur la valeur Entre ; la variable est limine si ce seuil est suprieur la valeur Elimination. La valeur Entre doit tre infrieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, diminuez la valeur Entre. Pour liminer davantage de variables du modle, rduisez la valeur Elimination.

Choisir la valeur de F : Une variable est introduite dans un modle si sa valeur F est

suprieure la valeur Entre et elle est limine si la valeur F est infrieure la valeur Elimination. La valeur Entre doit tre suprieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, rduisez la valeur du champ Entre. Pour liminer davantage de variables dans le modle, augmentez la valeur du champ Elimination.
Inclure terme constant dans l'quation : Par dfaut, le modle de rgression inclut un terme constant. Dslectionner cette option force la rgression jusqu' l'origine, ce qui est rarement utilis. Certains rsultats de la rgression jusqu' l'origine ne sont pas comparables aux rsultats de la rgression incluant une constante. Par exemple, R2 ne peut pas tre interprt de la manire habituelle. Valeurs manquantes : Vous pouvez choisir l'un des lments suivants :

Exclure toute observation incomplte : Seules les observations dont les valeurs sont

valides pour toutes les variables sont incluses dans les analyses.
Exclure seulement les composantes non valides : Les observations pour lesquelles

les donnes sont compltes pour la paire de variables corrles sont utilises pour calculer le coefficient de corrlation sur lequel l'analyse de rgression est base. Les degrs de libert sont bass sur le minimum N par paire.

Remplacer par la moyenne : Toutes les observations sont utilises pour les calculs,

en substituant la moyenne de la variable aux observations manquantes.

Ajustement de fonctions

27

Chapitre

La procdure d'ajustement de fonctions produit des statistiques de rgression d'ajustement de fonctions et les diagrammes relatifs pour 11 modles diffrents de rgression d'ajustement de fonctions. Un modle diffrent est produit pour chaque variable dpendante. Vous pouvez aussi enregistrer les prvisions, les rsidus et les intervalles de la prvision comme nouvelles variables.
Exemple : Une compagnie d'assurance contre l'incendie effectue une tude pour tablir un lien entre l'importance des dommages lors d'incendies domestiques importants et la distance entre la caserne de pompiers la plus proche et la rsidence. Un diagramme de dispersion tablit que la relation entre les dommages provoqus par un incendie et la distance jusqu' la caserne de pompiers est linaire. Vous pouvez ajuster un modle linaire en fonction des donnes, vrifier la validit des hypothses et le bon ajustement au modle. Statistiques : Pour chaque modle : Coefficients de rgression, R multiples, R2, R2

ajust, erreur standard de la prvision, tableau d'analyse de la variance, prvisions, rsidus et intervalles de prvision. Modles : linaire, logarithmique, inverse, quadratique, cubique, de puissance, compos, en S, logistique, de croissance et exponentiel.

Remarques sur les donnes de l'ajustement de fonctions


Donnes : Les variables dpendantes et indpendantes doivent tre quantitatives. Si

vous slectionnez temps la place d'une variable provenant du fichier de travail comme variable indpendante, la procdure Ajustement de fonctions gnre une variable temps o la dure entre les observations est uniforme. Si Temps est slectionn, la variable dpendante doit tre une mesure de sries chronologiques. L'analyse des sries chronologiques ncessite une structure de fichier de donnes

435

436 Chapitre 27

dans lequel chaque observation (range) reprsente un ensemble d'observations des moments diffrents et o la dure entre les observations est uniforme.
Hypothses : Vrifiez vos donnes graphiquement pour dterminer comment

sont relies les variables indpendantes et dpendantes (de manire linaire ou exponentielle, etc.). Les rsidus d'un bon modle doivent tre rpartis alatoirement et doivent tre normaux. Si vous utilisez un modle linaire, les hypothses suivantes doivent tre vrifies. pour chaque valeur de la variable indpendante, la distribution de la variable dpendante doit tre normale. La variance de la distribution de la variable dpendante doit tre constante pour toutes les valeurs de la variable indpendante. La relation entre la variable dpendante et la variable indpendante doit tre linaire, et toutes les observations doivent tre indpendantes.

Echantillon de rsultat
Figure 27-1 Exemple d'ajustement de fonctions
MODELE : MOD_1.

Variable dpendante.. DOMMAGES Mthode.. LINEAIRE Suppression des observations incompltes des donnes manquantes R multiple R carr R carr ajust Erreur standard .96098 .92348 .91759 2.31635 Analyse de la variance : DF Rgression Rsidus F = 1 13 Somme des carrs 841.76636 69.75098 Carr moyen 841.76636 5.36546 .0000

156.88616

Signification de F =

-------------------- Variables de l'quation -------------------Variable DISTANCE (Constante) B 4.919331 10.277929 SE B .392748 1.420278 Beta .960978 T Sig T

12.525 .0000 7.237 .0000

Les nouvelles variables suivantes sont cres : Nom Etiquette

Erreur pour DOMMAGES avec DISTANCE de CURVEFIT, MOD_1 LINEAIRE

437 Ajustement de fonctions

Pour obtenir un ajustement de fonctions


E A partir du menu, slectionnez : Analyse Rgression Ajustement de fonctions... Figure 27-2 Bote de dialogue Ajustement de fonctions

E Slectionnez au moins une variable dpendante. Un modle diffrent est produit pour

chaque variable dpendante.

438 Chapitre 27 E Slectionnez une variable indpendante (une variable dans le fichier de travail ou Temps).

Sinon, vous pouvez :

Slectionner une variable pour tiqueter des observations dans les diagrammes de dispersion. Pour chaque point du diagramme de dispersion, utilisez l'outil de slection de points pour afficher la valeur de la variable avec Etiquette d'observation. Cliquez sur Enregistrer pour enregistrer les prvisions, les rsidus et les intervalles de prvision comme nouvelles variables.

Les options suivantes sont galement disponibles :


Inclure terme constant dans l'quation : Evalue un terme constant dans l'quation

de rgression. La constante est incluse par dfaut.


Reprsenter sous forme graphique : Reprsente graphiquement les valeurs de la

variable dpendante et chaque modle slectionn face la variable indpendante. Un diagramme spar est produit pour chaque variable dpendante.

Afficher le tableau ANOVA : Affiche un tableau rcapitulatif de l'analyse de la

variance pour chaque modle slectionn.

Modles d'ajustement de fonctions


Vous pouvez choisir des modles de rgression d'ajustement de fonctions. Pour dterminer quel modle utiliser, reprsentez vos donnes sous forme graphique. Si vos variables semblent tre lies linairement, utilisez un modle de rgression linaire simple. Lorsque vos variables ne sont pas lies linairement, essayez de transformer vos donnes. Lorsque la transformation n'amliore pas les choses, vous devrez peut-tre utiliser un modle plus labor. Observez un diagramme de dispersion de vos donnes. Si le diagramme ressemble une fonction mathmatique que vous reconnaissez, ajustez vos donnes en fonction de ce type de modle. Par exemple, si vos donnes ressemblent une fonction exponentielle, utilisez un modle exponentiel.
Linaire : Modle dont l'quation est Y = b0 + (b1 * t). Les valeurs de la srie sont

modlises comme fonction linaire du temps.


Logarithmique : Modle dont l'quation est Y = b0 + (b1 * ln(t)). Inverse : Modle dont l'quation est Y = b0 + (b1 / t).

439 Ajustement de fonctions

Quadratique : Modle dont l'quation est Y = b0 + (b1 * t) + (b2 * t**2). Le modle

quadratique peut tre utilis pour modliser une srie qui dcolle ou qui s'amortit de manire oscillatoire.
Cubique : Modle dfini par l'quation Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). De puissance : Modle dont l'quation est Y = b0 * (t**b1) ou ln(Y) = ln(b0) +

(b1 * ln(t)).
Compos : Modle dont l'quation est la suivante Y = b0 * (b1**t) ou ln(Y) = ln(b0) +

(ln(b1) * t).
En S : Modle dont l'quation est Y = e**(b0 + (b1/t)) ou ln(Y) = b0 + (b1/t). Logistique : Modle dont l'quation est Y = 1 / (1/u + (b0 * (b1**t))) ou ln(1/y-1/u)= ln (b0) + (ln(b1)*t), u tant la valeur de la borne suprieure. Aprs avoir slectionn la logistique, prcisez la valeur de la borne suprieure utiliser dans l'quation de rgression. La valeur doit tre un nombre positif suprieur la plus grande valeur de la variable dpendante. De croissance : Modle dont l'quation est Y = e**(b0 + (b1 * t)) ou ln(Y) = b0 +

(b1 * t).
Exponentielle : Modle dont l'quation est Y = b0 * (e**(b1 * t)) ou ln(Y) = ln(b0) +

(b1 * t).

Enregistrement de l'ajustement de fonctions


Figure 27-3 Bote de dialogue Ajustement de fonctions : Enregistrer

440 Chapitre 27

Enregistrer les variables : Pour chaque modle slectionn, vous pouvez enregistrer les prvisions, les rsidus (valeur observe de la variable dpendante moins la prvision du modle) et les intervalles de prvision (limites suprieure et infrieure). Les nouveaux noms de variable et les tiquettes descriptives s'affichent dans un tableau dans la fentre de rsultats. Calculer une prvision : Si vous slectionnez Temps la place d'une variable dans le

fichier de travail comme variable indpendante, vous pouvez spcifier une priode de prvision au-del de la fin de la srie chronologique. Vous avez le choix entre les options suivantes :

A partir d'une estimation limite une priode : Prvoit les valeurs pour toutes les

observations du fichier, partir des observations de la priode d'estimation. La priode d'estimation qui s'affiche en bas de la bote de dialogue est dfinie avec la bote de sous dialogue Intervalle de l'option Slectionner des observations du menu Donnes. Si aucune priode d'estimation n'a t dfinie, toutes les observations sont utilises pour prvoir les valeurs.

Jusqu' : Prvoit les valeurs jusqu' la date, l'heure ou le numro de l'observation

spcifi, partir des observations de la priode d'estimation. Ceci peut tre utilis pour prvoir les valeurs au-del de la dernire observation de la srie chronologique. Les zones de texte disponibles pour la spcification de la fin de la priode de prvision dpendent des variables courantes de date dfinies. Si aucune variable de date n'est dfinie, vous pouvez spcifier le numro de l'observation finale. Utilisez l'option Dfinir des dates... dans le menu Donnes pour crer des variables de date.

Analyse discriminante

28

Chapitre

L'analyse discriminante est utile pour les cas o vous voulez construire un modle de prvision de groupe d'affectation bas sur les caractristiques observes de chaque observation. La procdure gnre une fonction discriminante (ou, pour plus de deux groupes, un ensemble de fonctions discriminantes) base sur les combinaisons linaires des variables explicatives qui donnent la meilleure discrimination entre groupes. Les fonctions sont gnres partir d'un chantillon d'observations pour lesquelles le groupe d'affectation est connu. Les fonctions peuvent alors tre appliques aux nouvelles observations avec des mesures de variables explicatives, mais de groupe d'affectation inconnu. Remarque : la variable de groupe peut avoir plus de deux valeurs. Les codes de la variable de regroupement doivent cependant tre des nombres entiers, et vous devez spcifier leur valeur minimale et maximale. Les observations dont les valeurs se situent hors des limites sont exclues de l'analyse.
Exemple : En moyenne, les habitants des pays des zones tempres consomment

plus de calories par jour que ceux des tropiques, et une plus grande proportion de ces habitants vit en ville. Un chercheur veut combiner cette information en une fonction pour dterminer comment un individu peut tre diffrenci selon les deux groupes de pays. Le chercheur pense que la taille de la population et des informations conomiques peuvent aussi tre importantes. L'analyse discriminante vous permet d'estimer les coefficients de la fonction discriminante linaire, qui ressemble la partie droite d'une quation de rgression linaire multiple. Ainsi, en utilisant les coefficients a, b, c et d, la fonction est :
D = a * climat + b * urbain + c * population + d * Produit National Brut par habitant

441

442 Chapitre 28

Si ces variables sont utiles pour tablir la diffrence entre les deux zones climatiques, les valeurs de D seront diffrentes pour les pays temprs et les pays tropicaux. Si vous utilisez une mthode de slection des variables pas pas, vous pouvez dcouvrir que vous n'avez pas forcment besoin d'inclure les quatre variables dans la fonction.
Statistiques : Pour chaque variable, on a les lments suivants : moyenne, carts types,

ANOVA un facteur. Pour chaque analyse : Test de Box, matrice de corrlation intra-classe, matrice de covariance intra-classe, matrice de covariance de chaque classe, matrice de covariance totale. Pour chaque fonction discriminante canonique : valeur propre, pourcentage de la variance, corrlation canonique, lambda de Wilks, Khi-deux. Pour chaque pas : probabilits priori, coefficients de fonction de Fisher, coefficients de fonction non standardiss, lambda de Wilks pour chaque fonction canonique.
Donnes : La variable de regroupement doit avoir un nombre limit de modalits distinctes, codifies sous forme de nombres entiers. Les variables indpendantes nominales doivent tre recodes en variables muettes ou de contraste. Hypothses : Les observations doivent tre indpendantes. Les variables

explicatives doivent avoir une distribution gaussienne multivarie, et les matrices de variance-covariance intra-groupes doivent tre gales entre groupes. On part de l'hypothse que les groupes d'affectation sont mutuellement exclusifs (c'est--dire qu'aucune observation n'est affecte plus d'un groupe) et collectivement exhaustifs (c'est--dire que toutes les observations sont affectes un groupe). La procdure est la plus efficace lorsque l'affectation un groupe est une variable rellement qualitative. Si l'affectation un groupe est base sur les valeurs d'une variable continue (par exemple, QI lev contre QI bas), vous devez envisager d'utiliser la rgression linaire pour exploiter les informations plus riches donnes par la variable continue elle-mme.

443 Analyse discriminante

Echantillon de rsultat
Figure 28-1 Rsultats d'analyse discriminante
Valeurs propres % de variance 100.0 Corrlation canonique .707

Fonction 1

Valeur propre 1.002

% cumul 100.0

Lambda de Wilks

Test de fonction(s) 1

Lambda de Wilks .499

Khi-deux 31.934

Df 4

Sig. .000

Matrice de structure Fonction 1 CALORIES LOG_GDP URBAIN (%) LOG_POP .986 .790 .488 .082

444 Chapitre 28

Obtenir une analyse discriminante


E A partir du menu, slectionnez : Analyse Classification Analyse discriminante... Figure 28-2 Bote de dialogue Analyse discriminante : Classement

E Slectionnez une variable de regroupement valeur entire et cliquez sur Dfinir intervalle pour spcifier les modalits considrer. E Slectionnez les variables indpendantes (ou explicatives). (Si votre variable de

regroupement n'a pas de valeurs entires, la procdure de recodification automatique du menu Transformer permettra d'en crer un avec des valeurs entires.)
E Slectionnez la mthode de saisie des variables indpendantes.

Entrer les variables simultanment : Mthode d'introduction force : Toutes les

variables indpendantes qui satisfont aux critres de tolrance sont entres simultanment.

Utiliser la mthode pas pas : Utilise la mthode pas pas pour contrler l'entre

et la suppression de variables. En option, vous pouvez slectionner les observations avec une variable de slection.

445 Analyse discriminante

Dfinition d'intervalles pour l'analyse discriminante


Figure 28-3 Bote de dialogue Analyse discriminante : Dfinir intervalle

Spcifiez la valeur minimum et maximum de la valeur de la variable de regroupement pour l'analyse. Les observations avec des valeurs hors de cet intervalle ne sont pas utilises dans l'analyse discriminante mais elles sont classes dans un des groupes existants en fonction des rsultats de l'analyse. Le Minimum et le Maximum doivent tre des entiers.

Slection des observations pour l'analyse discriminante


Figure 28-4 Bote de dialogue Analyse discriminante : Enregistrer

Pour slectionner les observations pour votre analyse, cliquez sur Slectionner dans la bote de dialogue principale, choisissez une variable de slection et cliquez sur Valeur pour entrer un nombre entier comme valeur de slection. Seules les observations avec cette valeur pour la variable de slection sont utilises pour driver les fonctions discriminantes. Les rsultats des statistiques et de classification sont gnrs pour les observations slectionnes et celles qui ne le sont pas. Ces rsultats fournissent une mthode de classification des nouvelles observations reposant sur des donnes existantes ou de

446 Chapitre 28

partitionnement de vos donnes dans un sous-ensemble de test ou de formation en vue d'effectuer une validation sur le modle cr.

Statistiques de l'analyse discriminante


Figure 28-5 Bote de dialogue Analyse discriminante: Statistiques

Descriptives : Les options disponibles sont Moyennes (y compris carts types),

ANOVA 1 facteur et Test de Box.

Moyennes : Affichage du total et de la moyenne de chaque groupe, ainsi que des

carts types des variables indpendantes.


ANOVA 1 facteur : Effectue pour chacune des variables indpendantes une analyse

de variance 1 facteur pour tester l'galit des moyennes de groupe.

Test de Box : Test d'galit des matrices de covariance des classes. Pour les

chantillons de taille suffisamment importante, une valeur p non significative indique qu'il n'est pas dmontr que les matrices diffrent. Ce test est sensible aux dviations par rapport la distribution gaussienne multivarie.
Coefficients de la fonction : Les options disponibles sont les coefficients de la

classification de Fisher et les coefficients non standardiss.

447 Analyse discriminante

Fisher : Affiche les coefficients de la fonction de classification de Fisher qui

peuvent tre directement utiliss pour la classification. Un groupe de coefficients est obtenu pour chaque groupe et une observation est affecte au groupe qui a le plus grand score discriminant.

Non standardiss : Affiche les coefficients non standardiss de la fonction

discriminante.
Matrices : Les matrices de coefficients pour variables indpendantes disponibles sont la matrice de corrlation intra-classe, la matrice de covariance intra-classe, la matrice de covariance de chaque classe et la matrice de covariance totale.

Corrlations intra-classe : Affiche une matrice de corrlations intra-classe globale,

en calculant la moyenne des matrices de covariance distinctes pour tous les groupes avant de calculer les corrlations.

Covariance intra-classe : Affiche une matrice de covariances intra-classe globale,

qui peut diffrer de la matrice de covariance totale. Cette matrice est obtenue en calculant la moyenne des matrices de covariances distinctes de tous les groupes.

Covariance de chaque classe : Affiche des matrices de covariances distinctes

pour chaque groupe.


Covariance totale : Affiche la matrice de covariance de toutes les observations

comme si elles provenaient d'un seul chantillon.

Mthode pas pas de l'analyse discriminante


Figure 28-6 Bote de dialogue Analyse discriminante : Mthode pas pas

448 Chapitre 28

Mthode : Slectionnez la statistique utiliser pour ajouter ou supprimer de nouvelles

variables. Les options possibles sont le lambda de Wilks, la variance rsiduelle, la distance de Mahalanobis, le plus petit rapport F et le V de Rao. Avec le V de Rao, vous pouvez spcifier l'augmentation minimum de V pour entrer une variable.

Lambda de Wilks : Mthode de slection des variables pour une analyse

discriminante pas pas qui slectionne les variables entrer dans l'quation d'aprs leur capacit faire baisser le lambda de Wilks. A chaque tape, les variables sont entres dans l'analyse d'aprs leur capacit faire baisser le lambda de Wilks.

Variance rsiduelle : A chaque tape, la variable qui minimise la somme des

variations rsiduelles entre les groupes est saisie.


Distance de Mahalanobis : Mesure de la distance entre les valeurs d'une observation

et la moyenne de toutes les observations sur les variables indpendantes. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrmes pour des variables indpendantes.

Plus petit rapport F : Mthode de slection des variables en analyse pas pas,

fonde sur la maximisation d'un rapport F calcul partir de la distance de Mahalanobis entre des groupes.

V de Rao : Mesure des diffrences entre des moyennes de groupes. Egalement

appele trace de Lawley-Hotelling. A chaque tape, la variable qui maximise l'augmentation du V de RAO est entre. Aprs avoir slectionn cette option, entrez la valeur minimale que doit avoir une variable pour entrer dans l'analyse.
Critres : Les options disponibles sont Choisir la valeur de F et Choisir la probabilit de
F. Entrez des valeurs pour ajouter et supprimer des variables.

Choisir la valeur de F : Une variable est introduite dans un modle si sa valeur F est

suprieure la valeur Entre et elle est limine si la valeur F est infrieure la valeur Elimination. La valeur Entre doit tre suprieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, rduisez la valeur du champ Entre. Pour liminer davantage de variables dans le modle, augmentez la valeur du champ Elimination.

Choisir la probabilit de F : Une variable est entre dans le modle si le seuil

de signification de la valeur F est suprieur la valeur Entre ; la variable est limine si ce seuil est suprieur la valeur Elimination. La valeur Entre doit tre infrieure la valeur Elimination et toutes deux doivent tre positives. Pour introduire davantage de variables dans le modle, diminuez la valeur Entre. Pour liminer davantage de variables du modle, rduisez la valeur Elimination.

449 Analyse discriminante

Afficher : L'option Rcapitulation des tapes affiche les statistiques de toutes les

variables aprs chaque tape. L'option Test F des distances entre couples affiche une matrice de rapports F apparis pour chaque paire de groupes.

Analyse discriminante : Classement


Figure 28-7 Bote de dialogue Analyse discriminante : Classement

Probabilits priori : Ces valeurs sont utilises pour le classement. Vous pouvez

spcifier des probabilits priori gales pour toutes les classes. Vous pouvez galement laisser les effectifs de classes observs dans votre chantillon calculer les probabilits d'affectation une classe.
Afficher : Les options d'affichage disponibles sont les rsultats par observation, le

rcapitulatif et la classification par limination.

Rsultats par observation : Les codes du groupe actuel, du groupe prvu, des

probabilits a posteriori et des scores discriminants sont affichs pour chaque observation.

Rcapitulatif : Nombre d'observations correctement et incorrectement affectes

chacune des classes sur la base de l'analyse discriminante. Parfois appels matrice de confusion .

Classification par limination : Classement de chaque observation de l'analyse par

les fonctions drives de l'ensemble des observations autres que cette observation. Cette classification est galement appele mthode U .

450 Chapitre 28

Remplacer les valeurs manquantes par la moyenne : Slectionnez cette option pour

remplacer la valeur manquante d'une variable indpendante par la moyenne de cette variable, mais seulement durant la phase de classification.
Utiliser la matrice d'inertie : Vous pouvez choisir de classer les observations en utilisant une matrice de covariance intra-classe ou une matrice de covariance pour chaque classe.

Intra-classe : La matrice de covariances intra-classes globale est utilise pour

classifier les observations.


Classe par classe : Les matrices de covariances de chaque groupe sont utilises

pour la classification. Comme la classification repose sur les fonctions discriminantes et pas sur les variables d'origine, cette option n'est pas toujours quivalente la discrimination quadratique.
Diagrammes : Les options de diagramme disponibles sont toutes classes combines,

classe par classe, et carte des rgions d'affectation.

Toutes classes combines : Cre un diagramme de dispersion de tous les groupes,

des valeurs des deux premires fonctions discriminantes. S'il n'y a qu'une seule fonction, un histogramme est trac la place.

Classe par classe : Cre des diagrammes de dispersion classe par classe pour les

deux premires valeurs de fonction discriminante. Lorsqu'il n'y a qu'une seule fonction, des histogrammes sont affichs la place.

Carte des rgions d'affectation : Diagramme des limites servant classifier les

observations en fonction de valeurs de fonction. Les numros correspondent aux groupes auxquels les observations ont t affectes. La moyenne de chaque groupe est indique par un astrisque l'intrieur de ses limites. La carte n'est pas affiche s'il n'existe qu'une seule fonction discriminante.

451 Analyse discriminante

Enregistrement de l'analyse discriminante


Figure 28-8 Bote de dialogue Analyse discriminante : Enregistrer

Vous pouvez ajouter de nouvelles variables votre fichier de donnes actif. Les options disponibles sont classe(s) d'affectation (une seule variable), valeurs du facteur discriminant (une variable pour chaque fonction discriminante dans la solution), et probabilits d'affectation un groupe en fonction des valeurs du facteur discriminant (une variable pour chaque groupe). Vous pouvez galement exporter des informations de modle dans le fichier spcifi. SmartScore et les versions ultrieures de WhatIf? pourront utiliser ce fichier.

Analyse factorielle

29

Chapitre

L'analyse factorielle essaie d'identifier des variables sous-jacentes, ou facteurs, qui permettent d'expliquer le patron des corrlations l'intrieur d'un ensemble de variables observes. L'analyse factorielle est souvent utilise pour rduire un ensemble de donnes. L'analyse factorielle est souvent utilise dans la factorisation, en identifiant un petit nombre de facteurs qui expliquent la plupart des variances observes dans le plus grand nombre de variables manifestes. On peut galement utiliser l'analyse factorielle pour gnrer des hypothses concernant des mcanismes de causalit ou pour afficher des variables pour une analyse ultrieure (par exemple, pour identifier la colinarit avant une analyse de rgression linaire). La procdure d'analyse factorielle offre une trs grande flexibilit :

Il existe sept mthodes d'extraction de facteur. Il existe cinq mthodes de rotation, dont directe Oblimin et Promax pour les rotations non orthogonales. Il existe trois mthodes pour calculer les facteurs, et ces facteurs peuvent tre enregistrs en tant que variables pour des analyses ultrieures.

Exemple : Quelle est l'attitude sous-jacente qui pousse les personnes rpondre d'une certaine manire aux questions concernant un sondage politique ? L'examen des corrlations parmi les lments d'un sondage rvle qu'il y a des recouvrements significatifs parmi divers sous-groupes d'lments. Les questions sur les impts ont tendance tre en corrlation, de mme que les questions thmes militaires, etc. Avec l'analyse factorielle, vous pouvez enquter sur le nombre de facteurs sous-jacents, et, dans de nombreux cas, vous pouvez identifier le concept reprsent par ces facteurs. De plus, vous pouvez calculer les facteurs pour chaque rpondant, facteurs que vous pouvez utiliser pour des analyses ultrieures. Par exemple, sur la base des facteurs, vous pouvez dvelopper un modle logistique de rgression pour prvoir le comportement de vote.

453

454 Chapitre 29

Statistiques : Pour chaque variable, on a les lments suivants : nombre d'observations valides, moyenne et cart type. Pour chaque analyse factorielle : matrice de corrlation des variables, incluant des seuils de signification, dterminant, inverse ; les matrices des corrlations reconstitues, incluant l'anti-image ; les solutions initiales (qualits de reprsentation, valeurs propres et pourcentage de variance expliqu) ; mesure d'adquation d'chantillonnage de Kaiser-Meyer-Olkin et le test de sphricit de Bartlett ; structure avant rotation, incluant les saturations sur les facteurs, la qualit de reprsentation, et les valeurs propres ; structure aprs rotation, incluant une matrice de forme aprs rotation et une matrice de transformation pour des rotations obliques : type et matrices de structure aprs rotation ; matrice factorielle de coefficient de facteur et matrice factorielle de facteur de covariance. Diagrammes : Diagramme de valeurs propres et carte factorielle du premier, du deuxime et du troisime facteur.

Remarques sur les donnes d'analyse factorielle


Donnes : Les variables doivent tre quantitatives au niveau de l' intervalle ou du rapport. Les donnes qualitatives (comme la religion ou le pays d'origine) ne conviennent pas pour l'analyse factorielle. Les donnes pour lesquelles la corrlation de Pearson calcule a un sens conviennent pour l'analyse factorielle. Hypothses : Les donnes doivent possder une distribution gaussienne bivarie pour

chaque paire de variables et les observations doivent tre indpendantes. Le modle d'analyse factorielle spcifie que les variables sont dtermines par des facteurs communs (les facteurs estims par le modle) et des facteurs uniques (qui ne sont pas corrls entre les variables observes); les estimations calcules se basent sur l'hypothse que tous les facteurs uniques ne sont pas en corrlation entre eux ainsi qu'avec les facteurs communs.

455 Analyse factorielle

Echantillon de rsultat
Figure 29-1 Sortie d'analyse factorielle
Statistiques descriptives Moyenne Esprance de vie moyenne des femmes 72.833
Mortalit infantile (nombre de dcs sur 1 000 naissances vivantes) Personnes sachant lire (%) Taux de natalit pour 1 000 personnes Fcondit : nombre moyen d'enfants Personnes habitant en ville (%) Log (base 10) de GDP_CAP Croissance dmographique (% par anne) Rapport entre les naissances et les dcs Taux de mortalit pour 1 000 personnes Log (base 10) de Population

Ecart. Type 8.272 32.222 18.625 10.552 1.593 22.835 .608 1.156 2.313 3.174 .686

N Analyse 72 72 72 72 72 72 72 72 72 72 72

35.132 82.472 24.375 3.205 62.583 3.504 1.697 3.577 8.038 4.153

Qualit de reprsentation Initiale Extraction 1.000 .953 .949 .825 .943 .875 .604 .738 .945 .925 .689 .292 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

LIFEEXPF LITERACY BIRTH_RT FERTILTY URBAN LOG_GDP POP_INCR B_TO_D DEATH_RT LOG_POP

BABYMORT 1.000

Mthode d'extraction : Analyse en composantes principales

456 Chapitre 29
Total des variables explicatives Sommes des carrs charges Total 6.960 2.579 % de variance 63.275 23.446 % cumul 63.275 86.721 Sommes des carrs pour la rotation Total 6.910 2.629 % de variance 62.819 23.902 % cumul 62.819 86.721

Valeurs propres initiales Composante 1 2 3 4 5 6 7 8 9 10 11 Total 6.960 2.579 .612 .361 .218 .130 6.131E-02 3.775E-02 2.610E-02 9.840E-03 4.461E-03 % de variance 63.275 23.446 5.562 3.281 1.985 1.183 .557 .343 .237 8.946E-02 4.055E-02 % cumul 63.275 86.721 92.283 95.564 97.549 98.732 99.290 99.633 99.870 99.959 100.000

Mthode d'extraction : analyse en composantes principales

457 Analyse factorielle

Matrice pivote des composants

Composant BIRTH_RT FERTILTY LITERACY LIFEEXPF BABYMORT POP_INCR LOG_GDP URBAN DEATH_RT B_TO_D LOG_POP .614 1 .969 .931 -.880 -.856 .853 .847 -.794 -.561 .226 .469 -.469 .476 .327 .539 -.827 .741 -.520 2

En composantes principales Mthode de rotation : Varimax avec normalisation de Kaiser.

Matrice des transformations des composants

Composant

1 2

1 .982 .190

2 -.190 .982

Mthode d'extraction : Analyse en composantes principales Mthode de rotation : Varimax avec normalisation de Kaiser.

458 Chapitre 29

Component Plot in Rotated Space


1.0 birth to death ratio people living in cit averag e female life .5 log (ba se 10) of gdp people who re ad (%) fertility: average n birth rate per 100 0.0

population increase

Component 2

-.5

log (ba se 10) of pop

infant mortality (de

death rate per 1 000 -1.0 -1.0 -.5 0.0 .5 1.0

Component 1

Obtenir une analyse factorielle


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Slectionnez les variables pour l'analyse factorielle.

459 Analyse factorielle Figure 29-2 Bote de dialogue Analyse factorielle

Slection des observations pour l'analyse factorielle


Figure 29-3 Slectionnez la bote de dialogue Analyse factorielle

Pour slectionner les observations pour votre analyse, choisissez une variable de slection, puis cliquez sur Valeur pour entrer une valeur de slection. Seules les observations ayant cette valeur pour la variable de slection sont utilises dans l'analyse factorielle.

460 Chapitre 29

Caractristiques d'analyse factorielle


Figure 29-4 Bote de dialogue Analyse Factorielle : Caractristiques...

Statistiques : Les statistiques univaries incluent la moyenne, l'cart type et le nombre d'observations valides pour chaque variable. La structure initiale affiche la qualit de reprsentation initiale, les valeurs propres, et le pourcentage de variance expliqu. Matrice de corrlation : Les options disponibles sont les coefficients, les seuils de signification, les dterminants, les inverses, les reproduits, l'anti-image et l'indice KMO et le test de sphricit de Bartlett.

Indice KMO et test de sphricit de Bartlett : Mesure de l'adquation de

l'chantillonnage de Kaiser-Meyer-Olkin qui teste si les corrlations partielles entre les variables sont faibles. Le test de sphricit de Bartlett teste si la matrice des corrlations est une matrice d'identit, ce qui indiquerait que le modle de facteur n'est pas adapt.

Reconstitue : Matrice des corrlations estime partir de la solution factorielle.

Les rsidus (diffrence entre les corrlations estimes et observes) sont galement affichs.

Anti-image : La matrice de corrlation des anti-images contient les opposs des

coefficients de corrlation partielle ; la matrice de covariance des anti-images contient les opposs des covariances partielles. Dans un bon modle factoriel, la plupart des lments hors diagonale doivent tre petits. La mesure d'adquation d'chantillonnage pour une variable est affiche sur la diagonale de la matrice de corrlation des anti-images.

461 Analyse factorielle

Spcification des statistiques rcapitulatives et des coefficients de corrlation


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Dans la bote de dialogue Analyse factorielle, cliquez sur Caractristiques.

Extraction d'analyse factorielle


Figure 29-5 Bote de dialogue Analyse Factorielle : Extraction

Mthode : Vous permet de spcifier la mthode d'extraction de facteur. Les mthodes disponibles sont les Composantes principales, les Moindres carrs non pondrs, les Moindres carrs gnraliss, le Maximum de vraisemblance, la Factorisation en axes principaux, l'Alpha-maximisation, et la Factorisation en projections.

Analyse en composantes principales : Mthode d'extraction de facteur utilise

pour former des combinaisons linaires non corrles des variables observes. La premire composante principale a une variance maximale. Les autres composantes expliquent progressivement des portions plus petites de la variance sans tre corrles les unes aux autres. L'analyse des composantes principales est

462 Chapitre 29

utilise pour obtenir la solution factorielle initiale. Elle peut tre utilise quand la matrice des corrlations est singulire.

Mthode des moindres carrs non pondrs : Mthode d'extraction de facteur qui

minimise la somme des carrs des diffrences entre les matrices de corrlations observes et reconstitues en ignorant les diagonales.

Mthode des Moindres carrs gnraliss : Mthode d'extraction de facteur qui

minimise la somme des carrs des diffrences entre les matrices de corrlations observes et reconstitues. Les corrlations sont pondres par l'inverse de leur unicit, de faon ce que les variables prsentant une forte unicit reoivent une pondration infrieure celles prsentant une faible unicit.

Mthode du maximum de vraisemblance : Mthode d'extraction de facteur qui

fournit les estimations de paramtres les plus susceptibles d'avoir gnr la matrice de corrlations observe si l'chantillon est issu d'une distribution gaussienne multivarie. Les corrlations sont pondres par l'inverse de l'unicit des variables et un algorithme itratif est utilis.

Factorisation en axes principaux : Mthode d'extraction de facteurs partir de la

matrice des corrlations initiales o les coefficients de corrlation multiple au carr sont placs sur la diagonale comme estimation initiale des qualits de reprsentation. Ces cartes factorielles sont utilises pour une nouvelle estimation des qualits de reprsentation qui remplace alors l'ancienne sur la diagonale. Les itrations se poursuivent jusqu' ce que les variations des qualits de reprsentation d'une itration l'autre satisfassent le critre de convergence de l'extraction.

Alpha de Cronbach : Mthode d'extraction de facteur qui considre les variables

dans l'analyse comme un chantillon issu de la population des variables potentielles. Maximise l'alpha de Cronbach des facteurs.

Factorisation en projections : Mthode d'extraction de facteur dveloppe par

Guttman et base sur la thorie d'une image. La partie commune de la variable, appele image partielle, est dfinie comme sa rgression linaire sur les autres variables, plutt qu'une fonction de facteurs hypothtiques.
Analyser : Vous permet de spcifier si l'analyse porte sur une matrice de corrlation ou sur une matrice de covariance.

463 Analyse factorielle

Matrice de corrlation : Utile si les variables de votre analyse sont mesures

selon des chelles diffrentes.


Matrice de covariance : Utile lorsque vous souhaitez appliquer l'analyse factorielle

plusieurs groupes avec des variances diffrentes pour chaque variable.


Extraire : Vous pouvez retenir tous les facteurs dont les valeurs propres dpassent une valeur spcifique ou retenir un nombre spcifique de facteurs. Afficher : Vous permet de demander la solution factorielle avant rotation et un diagramme des valeurs propres.

Structure factorielle sans rotation : Affiche les corrlations factorielles sans

rotation (matrice de projections factorielles), les qualits de reprsentation et les valeurs propres de la solution factorielle.

Diagramme des valeurs propres : Diagramme reprsentant la variance associe

chaque facteur. Permet de dterminer le nombre de facteurs conserver. Gnralement, le diagramme montre une coupure franche entre la forte pente des facteurs levs et la trane graduelle du reste (valeurs propres).
Maximum des itrations pour converger : Vous permet de spcifier le nombre maximum de pas que l'algorithme peut prendre pour estimer la solution.

Spcification des options de l'extraction


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Dans la bote de dialogue Analyse factorielle, cliquez sur Extraction.

464 Chapitre 29

Rotation d'analyse factorielle


Figure 29-6 Bote de dialogue Analyse factorielle : Rotation

Mthode : Vous permet de slectionner la mthode de rotation des facteurs. Les

mthodes disponibles sont Varimax, Oblimin directe, Quartimax, Equamax ou Promax.

Mthode varimax : Mthode de rotation orthogonale qui minimise le nombre de

variables ayant de fortes corrlations sur chaque facteur. Simplifie l'interprtation des facteurs.

Critre oblimin direct : Mthode de rotation oblique (non orthogonale). Lorsque

delta est nul (valeur par dfaut), les solutions sont les plus obliques. Plus la valeur de delta est ngative, moins les facteurs sont obliques. Pour remplacer la valeur nulle par dfaut de delta, entrez un nombre infrieur ou gal 0,8.

Mthode quartimax : Mthode de rotation qui rduit le nombre de facteurs requis

pour expliquer chaque variable. Simplifie l'interprtation des variables observes.


Equamax : Mthode de rotation qui est une combinaison de la mthode Varimax

(qui simplifie les facteurs) et de la mthode Quartimax (qui simplifie les variables). Le nombre de variables pesant sur un facteur et le nombre de facteurs ncessaires pour expliquer une variable sont minimiss.

Rotation Promax : Rotation oblique qui permet aux facteurs d'tre corrls. Peut

tre calcule plus rapidement qu'une rotation oblimin directe, aussi est-elle utile pour les vastes ensembles de donnes.

465 Analyse factorielle

Afficher : Vous permet d'inclure le rsultat de la structure aprs rotation, et galement

d'afficher les cartes factorielles sur le premier, le second et le troisime facteur (Cartes factorielles).

Structure aprs rotation : Vous devez slectionner une mthode de rotation pour

obtenir une structure aprs rotation. Pour les rotations orthogonales, la matrice de forme aprs rotation et la matrice de transformation factorielle sont affiches. Pour les rotations obliques, le programme affiche la matrice des projections factorielles, la matrice de structure et la matrice des corrlations de facteurs.

Diagramme des Contributions des Facteurs : Diagramme en trois dimensions des

contributions des trois premiers facteurs. Pour une solution deux facteurs, un diagramme en deux dimensions est affich. Le diagramme n'est pas affich si un seul facteur est extrait. Les diagrammes affichent des solutions ayant subi une rotation si cette dernire est demande.
Maximum des itrations pour converger : Vous permet de spcifier le nombre maximum

de pas que l'algorithme peut utiliser pour raliser la rotation.

Spcification des options de la rotation


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Dans la bote de dialogue Analyse factorielle, cliquez sur Rotation.

466 Chapitre 29

Scores d'analyse factorielle


Figure 29-7 Bote de dialogue Scores de l'Analyse Factorielle

Enregistrer dans des variables : Vous permet de crer une nouvelle variable pour

chaque facteur selon la structure finale. Slectionnez une des mthodes alternatives suivantes pour calculer les facteurs : Rgression, Bartlett, ou Anderson-Rubin.
Mthode de rgression : Mthode d'estimation des coefficients factoriels. Les carts

obtenus ont une moyenne de 0 et une variance gale au carr de la corrlation multiple entre les coefficients factoriels estims et les vraies valeurs du facteur. Les carts peuvent tre corrls mme lorsque les facteurs sont orthogonaux.

Facteurs de Bartlett : Mthode d'estimation des coefficients factoriels. Les facteurs

produits ont une moyenne de 0. La somme des carrs des facteurs uniques dans la plage de variables est minimise.

Mthode d'Anderson-Rubin : Mthode d'estimation des coefficients factoriels

; variante de la mthode de Bartlett qui garantit l'orthogonalit des facteurs estims. Les facteurs obtenus ont une moyenne de 0 et un cart type de 1, et ne sont pas corrls.
Afficher la matrice des coefficients factoriels : Vous permet de montrer les coefficients

par lesquels les variables sont multiplies pour obtenir les facteurs. Cela permet galement de montrer les corrlations entre les facteurs.

467 Analyse factorielle

Spcification des options des facteurs


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Dans la bote de dialogue Analyse factorielle, cliquez sur Facteurs.

Options d'analyse factorielle


Figure 29-8 Bote de dialogue des Options de l'Analyse Factorielle

Valeurs manquantes : Vous permet de spcifier comment traiter les valeurs manquantes.

Les options disponibles sont d'exclure toute observation incomplte, d'exclure seulement les composantes non valides ou de les remplacer par la moyenne.
Affichage des projections : Vous permet de contrler le format des matrices de rsultat.

Triez les coefficients par leur taille (option Classement des variables par taille) et supprimez les coefficients dont la valeur absolue est infrieure la valeur spcifie (option Supprimer les valeurs absolues infrieures ).

468 Chapitre 29

Spcification des options de l'analyse factorielle


E A partir du menu, slectionnez : Analyse Factorisation Analyse factorielle... E Dans la bote de dialogue Analyse factorielle, cliquez sur Options.

Choix d'une procdure de classification

30

Chapitre

Vous pouvez effectuer des analyses de classes l'aide de la procdure TwoStep, de la classification hirarchique ou des nues dynamiques. Chaque procdure utilise un algorithme diffrent pour la cration des classes, et chacune d'elles comporte des options qui ne sont pas disponibles dans les autres procdures.
Classification TwoStep : La procdure Analyse du composant Classe TwoStep est la mthode privilgie pour de nombreuses applications. Elle offre les fonctionnalits spcifiques suivantes :

Slection automatique du meilleur nombre de classes, en plus des mesures de slection parmi des modles de classe. Possibilit de crer simultanment des modles de classe sur la base de variables qualitatives et continues. Possibilit d'enregistrer le modle de classe dans un fichier XML externe, puis de lire ce fichier et de mettre jour le modle de classe l'aide des donnes les plus rcentes.

En outre, la procdure Analyse du composant Classe TwoStep permet d'analyser des fichiers de donnes volumineux.
Classification hirarchique : La procdure Classification hirarchique est limite des fichiers de donnes plus petits (centaines d'objets classer), mais offre les fonctionnalits spcifiques suivantes :

Possibilit de classer des observations ou des variables.

469

470 Chapitre 30

Possibilit de calculer plusieurs solutions possibles et d'enregistrer des classes d'affectation pour chacune de ces solutions. Plusieurs mthodes de formation de classes, de transformation de variables et de mesure de la dissimilarit entre les classes.

Tant que toutes les variables sont du mme type, la procdure Classification hirarchique peut analyser des variables d'intervalle (continues), d'effectif ou binaires.
Nues dynamiques : La procdure Nues dynamiques est limite aux donnes

continues et exige que vous indiquiez au pralable le nombre de classes. Elle offre nanmoins les fonctionnalits spcifiques suivantes :

Possibilit d'enregistrer les distances partir des centres de classes pour chaque objet. Possibilit de lire les centres de classes initiaux partir d'un fichier SPSS externe et d'enregistrer les centres de classes finaux dans un fichier de ce type.

En outre, la procdure Nues dynamiques permet d'analyser des fichiers de donnes volumineux.

Classification TwoStep

31

Chapitre

La procdure d'analyse TwoStep Cluster est un outil d'exploration conu pour rvler des groupements naturels (ou classes) au sein d'un ensemble de donnes. L'algorithme utilis par cette procdure possde plusieurs fonctionnalits qui le distinguent des techniques de classification standard :

Gestion des donnes qualitatives et continues : En supposant que les variables

soient indpendantes, une distribution jointe multinomiale-normale peut tre place sur des variables qualitatives et continues.

Slection automatique du nombre de classes : En comparant les valeurs d'un critre

de modle-choix dans diffrentes solutions de classification, la procdure peut dterminer automatiquement le nombre optimal de classes.

Evolutivit : En construisant une arborescence de fonctionnalits de classe (CF)

qui rcapitule les enregistrements, l'algorithme TwoStep vous permet d'analyser des fichiers de donnes volumineux.
Exemple : Les entreprises du domaine des produits de consommation et du commerce de dtail utilisent rgulirement des techniques de classification des donnes qui dcrivent les habitudes d'achat, le sexe, l'ge, le niveau de revenu, etc. de leurs clients. Ces socits adaptent leurs stratgies de marketing et de dveloppement produit chaque groupe de consommation afin d'augmenter les ventes et de dvelopper la fidlit la marque. Statistiques : Cette procdure produit des critres d'information (AIC ou BIC) par nombres de classes dans la solution, frquences de classe pour la classification finale et statistiques descriptives par classe pour la classification finale. Diagrammes : Cette procdure produit des diagrammes en btons pour les frquences de classe, des diagrammes en secteurs pour les frquences de classe et des diagrammes d'importance pour les variables.

471

472 Chapitre 31 Figure 31-1 Bote de dialogue Analyse du composant Classe TwoStep

Mesure de distance : Cette slection dtermine la faon dont la similarit entre deux

classes est calcule.

Log-vraisemblance : La mesure de vraisemblance place une distribution de

probabilit sur les variables. Les variables continues sont considres comme tant distribues normalement alors que les variables qualitatives sont considres comme tant multinomiales. Toutes les variables sont considres comme tant indpendantes.

Euclidienne : La mesure euclidienne est la distance en ligne droite entre

deux classes. Elle peut tre utilise uniquement lorsque toutes les variables sont continues.
Nombre de classes : Cette slection vous permet d'indiquer la faon dont le nombre

de classes doit tre dtermin.

Dterminer automatiquement : Cette procdure dterminera automatiquement

473 Classification TwoStep

le meilleur nombre de classes en utilisant le critre dfini dans le groupe Critre de classification. Vous pouvez galement entrer un entier positif qui dfinit les nombres maximaux de classes que la procdure doit prendre en compte.

Indiquer une valeur fixe : Vous permet d'indiquer le nombre de classes (valeur fixe)

dans la solution. Entrez un entier positif.


Nombre de variables continues : Ce groupe fournit un rcapitulatif des spcifications

de standardisation des variables continues qui sont dfinies dans la bote de dialogue Options. Pour plus d'informations, reportez-vous Options de la procdure d'analyse TwoStep Cluster , page 475.
Critre de classification : Cette slection dtermine la faon dont l'algorithme de

classification automatique dtermine le nombre de classes. Vous pouvez spcifier le critre d'information baysien (BIC) ou le critre d'information d'Akaike (AIC).

Remarques sur les donnes de la procdure d'analyse TwoStep Cluster


Donnes : Cette procdure fonctionne avec des variables continues et qualitatives. Les

observations reprsentent les objets classer et les variables reprsentent les attributs sur lesquels est base la classification.
Hypothses : La mesure de la distance de vraisemblance considre que les variables

du modle de classe sont indpendantes. De plus, chaque variable continue est considre comme ayant une distribution normale (gaussienne) et chaque variable qualitative comme ayant une distribution multinomiale. Des tests internes empiriques indiquent que la procdure est assez rsistante aux violations de l'hypothse d'indpendance et des hypothses de distribution, mais vous devez savoir comment ces hypothses sont vrifies. Utilisez la procdure Corrlations bivaries pour tester l'indpendance de deux variables continues. Utilisez la procdure Tableaux croiss pour tester l'indpendance de deux variables qualitatives. Utilisez la procdure Moyennes pour tester l'indpendance entre une variable continue et une variable qualitative. Utilisez la procdure Explorer pour tester la normalit d'une variable continue. Utilisez la procdure Test du Khi-deux pour tester si une variable qualitative comporte une distribution multinominale spcifie.

474 Chapitre 31

Pour effectuer une procdure d'analyse TwoStep Cluster


E

A partir du menu, slectionnez :


Analyse Classification Classification TwoStep...

E Slectionnez une ou plusieurs variables qualitatives ou continues.

Sinon, vous pouvez :


Ajuster les critres sur lesquels est base la construction des classes. Slectionner les paramtres de gestion du bruit, d'affectation de mmoire, de standardisation de variable et d'entre de modle de classe. Demander des tableaux et des diagrammes facultatifs. Enregistrer les rsultats de modle dans le fichier de travail ou dans un fichier XML externe.

475 Classification TwoStep

Options de la procdure d'analyse TwoStep Cluster


Figure 31-2 Bote de dialogue Options de la procdure d'analyse TwoStep Cluster

Traitement des valeurs loignes : Ce groupe permet de traiter les valeurs loignes, notamment lors de la classification, si l'arborescence des fonctionnalits de classe (CF) est sature. L'arborescence CF est sature si elle ne peut plus accepter d'autres observations dans un noeud feuille et qu'aucun noeud feuille ne peut tre divis.

Si vous slectionnez la gestion du bruit et que l'arborescence CF est sature, l'arborescence est reconstruite lorsque vous placez des observations de feuilles clates dans une feuille bruit . Une feuille est clate si elle contient un pourcentage infrieur au pourcentage d'observations correspondant la taille maximale de la feuille. Une fois que l'arborescence est reconstruite, les valeurs

476 Chapitre 31

loignes sont places dans l'arborescence CF si cela est possible. Sinon, les valeurs loignes sont supprimes.

Si vous ne slectionnez pas la gestion du bruit et que l'arborescence CF est sature, elle sera reconstruite l'aide d'un seuil de changement de distance suprieur. Aprs la classification finale, les valeurs ne pouvant tre affectes une classe deviennent des valeurs loignes tiquetes. Un numro d'identification de 1 est affect la classe de valeur loigne et cette dernire n'est pas prise en compte dans le nombre de classes.

Allocation de mmoire : Ce groupe vous permet d'indiquer la quantit de mmoire

maximale en mgaoctets (Mo) que l'algorithme de classe doit utiliser. Si la procdure dpasse cette limite, elle utilisera le disque pour stocker les informations ne pouvant pas tre enregistres en mmoire. Spcifiez une valeur suprieure ou gale 4.

Consultez l'administrateur systme pour connatre la plus grande valeur que vous pouvez spcifier sur votre systme. L'algorithme risque de ne pas trouver le nombre correct ou souhait de classes si cette valeur est trop basse.

Standardisation de variable : L'algorithme de classification fonctionne avec des

variables continues standardises. Les variables continues non standardises doivent tre laisses comme tant A standardiser . Pour gagner du temps et viter trop de calculs, vous pouvez slectionner une variable continue dj standardise comme variable Standardises .
Options avances Critres de rglage de l'arborescence CF : Les paramtres d'algorithme de classification

suivants s'appliquent de faon spcifique l'arborescence CF et doivent tre modifis avec le plus grand soin :

Seuil de modification de distance initiale : Il s'agit du seuil initial utilis pour

construire l'arborescence CF. Si l'insertion d'une observation dans une feuille de l'arborescence CF provoque une troitesse infrieure au seuil, la feuille n'est pas divise. Si l'troitesse dpasse le seuil, la feuille est divise.

Nombre maximum de branches (par noeud feuille) : Nombre maximum de noeuds

enfant qu'un noeud feuille peut contenir.

477 Classification TwoStep

Profondeur maximum de l'arborescence : Nombre maximum de niveaux que

l'arborescence CF peut contenir.


Nombre maximal de noeuds possible : Ceci indique le nombre maximal de noeuds

de l'arborescence CF pouvant tre gnrs par la procdure, d'aprs la fonction (bd+1 1) / ((b 1), b tant le nombre maximal de branches et d, la profondeur maximale de l'arborescence. Notez qu'une arborescence CF trop volumineuse risque d'puiser les ressources du systme et d'avoir des effets dfavorables sur les performances de la procdure. Chaque noeud exige au moins 16 octets.
Mettre jour le modle de classe : Ce groupe vous permet d'importer et de mettre

jour un modle de classe gnr dans une analyse prcdente. Le fichier d'entre contient l'arborescence CF au format XML. Le modle est ensuite mis jour avec les donnes du fichier actif. Vous devez slectionner les noms des variables dans la bote de dialogue principale dans le mme ordre que celui dans lequel ils ont t spcifis dans l'analyse prcdente. Le fichier XML demeure inchang, sauf si vous enregistrez les informations du nouveau modle en utilisant le mme nom de fichier. Pour plus d'informations, reportez-vous Rsultats de l'analyse TwoStep Cluster , page 479. Si vous avez indiqu la mise jour d'un modle de classe, les options relatives la gnration de l'arborescence CF spcifies pour le modle d'origine sont utilises. Plus prcisment, les paramtres de mesure de la distance, de gestion du bruit, d'affectation de mmoire ou les critres de rglage de l'arborescence CF pour le modle enregistr sont utiliss et tous les paramtres de ces options dans les botes de dialogue sont ignors. Remarque : Lorsque vous effectuez une mise jour d'un modle de classe, la procdure considre qu'aucune des observations slectionnes dans le fichier de travail n'a t utilise pour crer le modle de classe d'origine. La procdure considre galement que les observations utilises dans la mise jour du modle sont issues de la mme population d'observations utilise pour crer le modle d'origine. En d'autres termes, les moyennes et les variances des variables continues et les niveaux des variables qualitatives sont considrs comme tant identiques dans les deux groupes d'observations. Si votre nouveau groupe d'observations ne provient pas de la mme population que votre ancien groupe, excutez la procdure Analyse du composant Classe TwoStep sur les groupes d'observations combins pour obtenir de meilleurs rsultats.

478 Chapitre 31

Diagrammes de l'analyse TwoStep Cluster


Figure 31-3 Bote de dialogue Diagrammes de l'analyse TwoStep Cluster

Dans le graphique de pourcentage de classe : Fait apparatre les graphiques indiquant la variation de classe de chaque variable. Pour chaque variable qualitative, un diagramme en btons juxtaposs est produit, indiquant la frquence de modalit par ID de classe. Pour chaque variable continue, un diagramme de variation est produit, indiquant les variations par ID de classe. Diagramme en secteurs de classe : Fait apparatre un diagramme en secteurs indiquant

le pourcentage et le nombre d'observations dans chaque classe.


Diagramme d'importance des variables : Fait apparatre plusieurs diagrammes

diffrents indiquant l'importance de chaque variable dans chaque classe. Le rsultat est tri par ordre d'importance de chaque variable.

Rang des variables : Cette option dtermine si des diagrammes seront crs pour

chaque classe (Par classe) ou pour chaque variable (Par variable).


Mesure de l'importance : Cette option vous permet de slectionner la mesure

de l'importance des variables reprsenter. L'option Khi-deux ou test T de signification indique une statistique Khi-deux de Pearson comme importance

479 Classification TwoStep

d'une variable qualitative et une statistique t comme importance d'une variable continue. L'option Signification indique 1, moins la valeur p pour le test d'galit des moyennes pour une variable continue et la frquence thorique avec le groupe global des donnes pour une variable qualitative.

Niveau de confiance : Cette option vous permet de dfinir le niveau de confiance

pour le test d'galit de la distribution d'une variable dans une classe par rapport la distribution globale de la variable. Indiquez un nombre infrieur 100 et suprieur ou gale 50. Si les diagrammes sont crs par variable ou si la mesure de la signification est reprsente, la valeur du niveau de confiance apparat sous la forme d'une ligne verticale dans les diagrammes d'importance des variables.

Omettre les variables non significatives : Les variables non significatives au niveau

de confiance spcifi n'apparaissent pas dans les diagrammes d'importance des variables.

Rsultats de l'analyse TwoStep Cluster


Figure 31-4 Bote de dialogue des rsultats de l'analyse du composant Classe TwoStep

480 Chapitre 31

Statistiques : Ce groupe fournit des options d'affichage pour les tableaux des rsultats

de la classification. Les statistiques descriptives et les frquences de classe sont produites pour le modle de classe final alors que le tableau du critre d'information fait apparatre des rsultats pour une plage de solutions de classe.

Descriptives par classe : Fait apparatre deux tableaux qui dcrivent les variables

dans chaque classe. Dans un tableau, les moyennes et les carts types sont indiqus pour les variables continues par classe. L'autre tableau indique les effectifs des variables qualitatives par classe.

Frquences de classe : Fait apparatre un tableau indiquant le nombre

d'observations dans chaque classe.


Critre d'information (AIC ou BIC) : Fait apparatre un tableau contenant les valeurs

d'AIC ou de BIC en fonction du critre choisi dans la bote de dialogue principale, pour diffrents nombres de classes. Ce tableau est fourni uniquement lorsque le nombre de classes est dtermin automatiquement. Si le nombre de classes est fixe, ce paramtre est ignor et le tableau n'est pas fourni.
Fichier de travail : Ce groupe vous permet d'enregistrer des variables dans le fichier de

travail.

Crer une variable d'appartenance une classe : Cette variable contient un numro

d'identification de classe pour chaque observation. Le nom de cette variable est tsc_n, n tant un entier positif qui indique l'ordinal de l'opration d'enregistrement du fichier de travail effectue par cette procdure au cours d'une session.
Fichiers XML : Le modle de classe final et l'arborescence CF reprsentent deux types

de fichiers de rsultats pouvant tre exports au format XML.

Exporter le modle final : Le modle de classe final est export vers le fichier

spcifi. SmartScore et les versions ultrieures de WhatIf? pourront utiliser ce fichier.

Exporter l'arborescence CF : Cette option vous permet d'enregistrer l'tat actuel

de l'arborescence de classe et de le mettre jour ultrieurement en utilisant des donnes plus rcentes.

Classification hirarchique

32

Chapitre

Cette procdure tente d'identifier les classes d'observations (ou de variables) relativement homognes bases sur des caractristiques slectionnes, en utilisant un algorithme qui dbute avec chaque observation (ou variable) dans une classe spare et qui combine les classes jusqu' ce qu'il n'en reste qu'une. Vous pouvez analyser des variables non normes ou vous pouvez choisir parmi un assortiment de transformations standardises. Les mesures de distance ou de similarit sont gnres par la procdure Proximities (Proximits). Les statistiques s'affichent chaque tape pour vous aider choisir la meilleure solution.
Exemple : Y a-t-il des classes identifiables de spectacles tlvisuels qui attirent des audiences similaires l'intrieur de chaque classe ? Avec une classification hirarchique, vous pouvez reclasser les spectacles tlvisuels (observations) en classes homognes bases sur les caractristiques du spectateur. Cette mthode peut tre utilise pour identifier des segments des fins commerciales. Vous pouvez aussi classer les villes (observations) en groupes homognes pour permettre la slection de villes comparables afin de tester diverses stratgies commerciales. Statistiques : Chane des agrgations, matrice de distances (ou des similarits) et

classe d'affectation pour une seule solution ou un ensemble de solutions. Diagrammes : arbres hirarchiques et Stalactites.

Remarques sur les donnes de la classification hirarchique


Donnes : Les variables peuvent tre des donnes quantitatives, binaires ou d'effectif.

L'chelle des variables est un lment important : des diffrences d'chelle qui peuvent affecter votre (vos) solution(s) en classes hirarchiques. Si vos variables sont d'chelles trs diffrentes (par exemple, une variable est mesure en dollars et l'autre est mesure en annes), vous devez envisager de les standardiser (ceci peut tre fait automatiquement avec la procdure de la classification hirarchique).
481

482 Chapitre 32

Hypothses : Les mesures de distance ou de similarit utilises doivent convenir aux donnes analyses (Voir la procdure Proximities (proximits) pour plus de renseignements sur le choix des mesures de distances et de similarit). Vous devez aussi inclure toutes les variables appropries dans votre analyse. L'omission de variables influentes peut aboutir une solution errone. Parce que la classification hirarchique est une mthode d'exploration, les rsultats doivent tre considrs comme provisoires tant qu'ils ne sont pas confirms avec un chantillon indpendant.

Echantillon de rsultat
Figure 32-1 Rsultat de classification hirarchique
Agglomeration Schedule Cluster Combined Cluster 1 Stage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 11 6 7 6 7 1 6 13 2 1 1 15 1 1 1 Cluster 2 12 11 9 8 10 3 7 14 5 4 2 16 15 6 13 Coefficients .112 .132 .185 .227 .274 .423 .438 .484 .547 .691 1.023 1.370 1.716 2.642 4.772 Stage Cluster First Appears Cluster 1 0 0 0 2 3 0 4 0 0 6 10 0 11 13 14 Cluster 2 0 1 0 0 0 0 5 0 0 0 9 0 12 7 8 Next Stage 2 4 5 7 7 10 14 15 11 11 13 13 14 15 0

483 Classification hirarchique


Cluster Membership Label Case 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Argentina Brazil Chile Domincan R. Indonesia Austria Canada Denmark Italy Japan Norway Switzerland Bangladesh India Bolivia Paraguay 4 Clusters 1 1 1 1 1 2 2 2 2 2 2 2 3 3 4 4 3 Clusters 1 1 1 1 1 2 2 2 2 2 2 2 3 3 1 1 2 Clusters 1 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1

Vertical Icicle
14:India 14 13:Banglades 13 10:Japan 10 9:Italy 9 7:Canada 7 8:Denmark 8 12:Switzerlan 12 11:Norway 11 6:Austria 6 16:Paraguay 16 15:Bolivia 15 5:Indonesia 5 2:Brazil 2 4:Domincan R 4 3:Chile 3 1:Argentina

Case

Number of clusters 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

XX XX XX XX XX XX XXX XX XX XX XX XX XX XXX X XX X XX X XX X XX X XX X XX X XX X X X X X X X X X X X X X X X XX XX XX XX XXX XX XX XX XX XX XX XXX X XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX X XX XX X X X X X XX X XX X X X X X XX XXX XX XX XXX XX XX XXX XX X X X XXX XX XXX XX XXX X X XX XX XX XX XXX X X XX X X X X X X X X X X X X X X X X X X X X X X X XX XX XXX X X XX XX XXX X X XX X XX X X X X X X X X X X X X X X X X X XXX X X X X X X X X X X XX X XX X XX X XX X X X X X X X X X X X

484 Chapitre 32
* * * * * * H I E R A R C H I C A L * * C L U S T E R A N A L Y S I S * * * *

Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Norway Switzerland Austria Denmark Canada Italy Japan Brazil Indonesia Argentina Chile Domincan R. Bolivia Paraguay Bangladesh India 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ -+ -+ -+-+ -+ +-----------------------+ -+ I I -+-+ I -+ +---------------------+ -----+---+ I I -----+ +-------+ I I ---+---+ I I I I ---+ +-+ +---------+ I -------+ I I -------------+---+ I -------------+ I ---+---------------------------------------------+ ---+

Num 11 12 6 8 7 9 10 2 5 1 3 4 15 16 13 14

Obtenir une classification hirarchique


E A partir du menu, slectionnez : Analyse Classification Classification hirarchique... Figure 32-2 Bote de dialogue Classification hirarchique

485 Classification hirarchique E Si vous classez des observations, slectionnez au moins une variable numrique. Si

vous classez des variables, slectionnez au moins trois variables numriques. Vous avez la possibilit de slectionner une variable d'identification pour tiqueter les observations.

Mthode de classification hirarchique


Figure 32-3 Bote de dialogue Classification hirarchique : Mthode

Mthode d'agrgation : Les choix disponibles sont : la Distance moyenne entre classes, la Distance moyenne dans les classes, l'Agrgation suivant le saut minimum, l'Agrgation suivant le diamtre, les Barycentres, la Mdiane et la Mthode de Ward. Mesure : Il permet de spcifier la mesure de distance ou de similarit devant tre

utilise pour la classification. Slectionnez le type de donnes et la mesure approprie de distance ou de similarit :
Intervalle : Les choix possibles sont la Distance Euclidienne, le Carr de la distance

Euclidienne, le Cosinus, la Corrlation de Pearson, la Distance de Tchebycheff, la Distance de Manhattan (bloc), la Distance de Minkowski, et Autre.

486 Chapitre 32

Effectifs : Les choix possibles sont la Distance du Khi-deux et la Distance du

phi-deux.
Binaire : Les choix possibles sont la Distance Euclidienne, le Carr de la distance

Euclidienne, l'Ecart de taille, la Diffrence de motif, la Variance, la Dispersion, la Forme, l'Indice de Sokal et Michener, la Corrlation phi ttrachorique, le Lambda, le D d'Anderberg, Dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2, Lance et Williams, Ochiai, Rogers et Tanimoto, Russel et Rao, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Sokal et Sneath 4, Sokal et Sneath 5, le Y de Yule, et le Q de Yule.
Transformer les valeurs : Vous permet de standardiser les valeurs des donnes pour les

observations ou les valeurs avant le calcul des proximits (non disponible pour les donnes binaires). Les mthodes de standardisation disponibles sont Centrer-rduire, Entre 1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 ou Ecart type = 1.
Mesures : Vous permet de transformer les valeurs gnres par la mesure de distance. Elles sont appliques aprs le calcul de la mesure de distance. Les choix possibles sont Valeurs absolues, Inverser le signe, et Rchelonner entre 0 et 1.

Statistiques de la classification hirarchique


Figure 32-4 Bote de dialogue Classification hirarchique : Statistiques

Chane des agrgations : Affiche les observations ou les classes combines chaque

tape, les distances entre les observations ou les classes en cours de combinaison, et le dernier niveau de classe auquel une observation (ou une variable) a rejoint la classe.

487 Classification hirarchique

Matrice des distances : Indique les distances ou les similarits entre lments. Classe(s) d'affectation : Affiche le groupe auquel chaque observation appartient lors

d'une ou plusieurs tapes de la combinaison de classes. Les options disponibles sont Une seule partition, Plusieurs partitions ou Aucune.

Diagrammes (graphiques) de classification hirarchique


Figure 32-5 Bote de dialogue Classification hirarchique : Graphiques (diagrammes)

Arbre hirarchique : Affiche un arbre hirarchique. Les arbres hirarchiques peuvent tre utiliss pour valuer la cohsion des groupes forms et ils fournissent des renseignements sur le nombre appropri de groupes conserver. Stalactites : Affiche un diagramme en stalactite, incluant toutes les classes ou une classe spcifique. Les diagrammes en stalactite affichent des informations sur la faon dont les observations sont regroupes chaque itration de l'analyse. Orientation vous permet de slectionner un diagramme vertical ou horizontal.

488 Chapitre 32

Enregistrement des nouvelles variables de classification hirarchique


Figure 32-6 Bote de dialogue Classification hirarchique : Enregistrer les nouvelles...

Classe(s) d'affectation : Vous permet de sauvegarder les classes d'affectation pour une

ou plusieurs ou aucune partition(s). Les variables sauvegardes peuvent alors tre utilises pour des analyses ultrieures pour explorer d'autres diffrences entre groupes.

Nues dynamiques

33

Chapitre

Cette procdure cherche identifier des groupes d'observations relativement homognes d'aprs des caractristiques slectionnes, au moyen d'un algorithme qui peut traiter de grands nombres d'observations. L'algorithme vous demande toutefois d'indiquer le nombre de classes. Vous pouvez indiquer les centres de classe initiaux si vous connaissez cette information. Vous pouvez choisir entre deux mthodes de classement des observations, soit la mise jour des centres de classe de faon itrative, soit la classification seule. Vous pouvez enregistrer l'appartenance une classe, les informations de distance et les centres de classes finaux. Vous pouvez ventuellement indiquer une variable dont les valeurs servent tiqueter les rsultats par observations. Vous pouvez galement demander des statistiques F d'analyse de la variance. Bien que ces statistiques soient opportunistes (la procdure cherche former des groupes qui diffrent), la taille relative des statistiques fournit des informations sur la contribution de chaque variable la sparation des groupes.
Exemple : Quels sont les groupes de programmes de tlvision identifiables qui attirent des publics similaires au sein de chaque groupe ? Grce l'analyse des nues dynamiques, vous pouvez classer les programmes de tlvision (observations) en k groupes homognes d'aprs les caractristiques des tlspectateurs. Cette mthode peut tre utilise pour identifier des segments des fins commerciales. Vous pouvez aussi classer les villes (observations) en groupes homognes pour permettre la slection de villes comparables afin de tester diverses stratgies commerciales. Statistiques : Solution complte : centres de classes initiaux, tableau ANOVA. Chaque observation: information de classe, distance au centre de classe.

489

490 Chapitre 33

Considrations de donnes sur la classification en nues dynamiques


Donnes : Les variables doivent tre quantitatives au niveau intervalle ou ratio. Si vos variables sont binaires ou sont des effectifs, utilisez la procdure de classification hirarchique. Hypothses : Les distances sont calcules l'aide de la distance euclidienne simple. Si vous souhaitez utiliser une autre distance ou une mesure de similarit, utilisez la procdure de classification hirarchique. La mise l'chelle des variables est une considration importantessi vos variables sont mesures selon des chelles diffrentes (une variable est exprime en dollars par exemple et une autre en annes), vos rsultats risquent d'tre errons. Dans ces cas, vous pouvez envisager de standardiser vos variables avant d'effectuer l'analyse des nues dynamiques (cela peut tre fait dans la procdure Descriptives). La procdure suppose que vous avez slectionn le nombre voulu de classes et que vous avez inclus toutes les variables pertinentes. Si vous avez choisi un nombre de classes inadquat ou omis de variables importantes, vos rsultats risquent d'tre errons.

Echantillon de rsultat
Figure 33-1 Rsultats de l'analyse des nues dynamiques
Centres de classes initiaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.88606 -3.52581 -2.89320 .93737 4.16813 2.68796 4.41517 -1.99641 -.52182 2.24070 .24626 2 -1.54314 -1.69358 -1.65146 .16291 1.38422 .42699 .63185 -1.78455 -.31333 .75481 2.65246 3 1.45741 .62725 -.51770 3.03701 -.69589 .33278 -1.89037 .53091 4.40082 .46008 -1.29624 4 .55724 .99370 .88601 -1.12785 -.88983 -1.08033 .63185 1.22118 -.99285 -.76793 -.74406

491 Nues dynamiques

Historique des itrations Changements dans les centres de classes Itration 1 2 3 4 5 6 7 8 9 10 1 1.932 .000 .861 .604 .000 .000 .623 .000 .000 .000 2 2.724 .471 .414 .337 .253 .199 .160 .084 .080 .097 3 3.343 .466 .172 .000 .237 .287 .000 .000 .000 .185 4 1.596 .314 .195 .150 .167 .071 .000 .074 .077 .000

Centres de classes finaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.70745 -2.52826 -2.30833 .59747 2.43210 1.52607 2.10314 -1.77704 -.29856 1.51003 .83475 2 -.30863 -.15939 .13880 .13400 .22286 .12929 -.44640 -.58745 .19154 -.12150 .34577 3 .16816 -.28417 -.81671 1.45301 .25622 1.13716 -.71414 -.16871 1.45251 1.27010 -.49499 4 .62767 .80611 .73368 -.95175 -.80817 -.99285 .31319 .94249 -.84758 -.87669 -.22199

Distances entre les centres de classes finaux 1 Classe 1 2 3 4 5.627 5.640 7.924 2.897 3.249 5.246 2 5.627 3 5.640 2.897 4 7.924 3.249 5.246

492 Chapitre 33

ANOVA Classe Carr Moyen 10.409 19.410 18.731 18.464 18.621 19.599 13.628 17.599 16.316 18.829 3.907 df 3 3 3 3 3 3 3 3 3 3 3 Erreur Carr Moyen .541 .210 .229 .219 .239 .167 .444 .287 .288 .168 .877 df 68 68 68 68 68 68 68 68 68 68 68 F 19.234 92.614 81.655 84.428 77.859 117.339 30.676 61.313 56.682 112.273 4.457 Sig. .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .006

ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP

Les tests F ne doivent tre utiliss qu' des fins descriptives car les classes sont choisies pour maximiser les diffrences entre les observations des diffrentes classes. Les seuils de signification observs ne sont pas corrigs par la suite et ne peuvent donc pas tre interprts en tant que tests de lhypothse Selon laquelle les moyennes de classe sont gales.

Obtenir une analyse de nues dynamiques


E A partir du menu, slectionnez : Analyse Classification Nues dynamiques...

493 Nues dynamiques Figure 33-2 Bote de dialogue Nues dynamiques

E Slectionnez les variables utiliser dans l'analyse. E Spcifiez le nombre de classes. Le nombre de classes doit tre au moins de deux et ne

doit pas tre suprieur au nombre d'observations du fichier de donnes.


E Slectionnez soit la mthode Itrer et classer soit la mthode Classer seulement.

Vous avez la possibilit de slectionner une variable d'identification pour tiqueter les observations.

Efficacit de la classification en nues dynamiques


La commande d'analyse des nues dynamiques est efficace essentiellement parce qu'elle ne calcule pas les distances entre toutes les paires d'observations, comme c'est le cas dans de nombreux algorithmes de classification, y compris celui utilis par la commande de classification hirarchique de SPSS.

494 Chapitre 33

Pour plus d'efficacit, prenez un chantillon d'observations et utilisez la mthode Itrer et classer pour dterminer les centres. Slectionnez Ecrire les centres finaux dans Fichier. Rtablissez ensuite tout le fichier de donnes, puis slectionnez la mthode Classer seulement. Cliquez sur Centres et Lire les centres initiaux Fichier pour classer tout le fichier en utilisant les centres estims partir de l'chantillon.

Itration de la classification en nues dynamiques


Figure 33-3 Bote de dialogue Nues dynamiques : Itrer

Ces options ne sont disponibles que si vous avez slectionn la mthode Itrer et classer dans la bote de dialogue principale.
Maximum des itrations : Limite le nombre des itrations dans l'algorithme des nues

dynamiques. L'itration s'arrte aprs ce nombre d'itrations mme si le critre de convergence n'est pas satisfait. Ce nombre doit tre compris entre 1 et 999. Pour reproduire l'algorithme utilis par la commande de classement rapide Quick Cluster dans SPSS avant la version 5.0, indiquez 1 comme Maximum des itrations.
Critre de convergence : Dtermine le moment o l'itration s'arrte. Il reprsente une proportion de la distance minimale entre les centres de classes initiaux, et doit donc tre plus grand que 0 mais plus petit que 1. Si le critre est gal 0,02 par exemple, l'itration cesse lorsque une itration complte ne dplace plus aucun des centres d'une distance de plus de deux pour cent de la plus petite distance entre n'importe quels centres initiaux. Utiliser les nouveaux centres : Vous permet de demander la mise jour des centres aprs l'affectation de chaque observation. Si vous ne slectionnez pas cette option, les nouveaux centres seront calculs lorsque toutes les observations auront t affectes.

495 Nues dynamiques

Enregistrement des analyses de classes de nues dynamiques


Figure 33-4 Bote de dialogue Nues dynamiques : Enregistrer les nouvelles variables...

Vous pouvez enregistrer des informations sur la solution relatives aux nouvelles variables utiliser dans les analyses ultrieures :
Classe(s) d'affectation : Cre une nouvelle variable indiquant la classe d'affectation

finale de chaque observation. Les valeurs de la nouvelle variable vont de 1 au nombre de classes.
Distance au centre de classe : Cre une nouvelle variable indiquant la distance

euclidienne entre chaque nouvelle variable et son centre de classification.

Options d'analyses des classes de nues dynamiques


Figure 33-5 Bote de dialogue Nues dynamiques : Options

Statistiques : Vous pouvez slectionner les statistiques suivantes : Centres de classes

initiaux, Tableau ANOVA, et Affectation et distances au centre.

496 Chapitre 33

Centres de classe initiaux : Premire estimation des moyennes des variables

de chacune des classes. Par dfaut, le nombre d'observations assez espaces slectionn dans les donnes est gal au nombre de classes. Les centres de classes initiaux sont utiliss pour une premire classification et sont ensuite mis jour.

Tableau ANOVA : Affiche un tableau d'analyse de la variance, incluant les tests

F univaris pour chacune des variables de la classification. Les tests F sont uniquement descriptifs et les probabilits qui en rsultent ne doivent pas tre interprtes. Le tableau ANOVA n'apparat pas si toutes les observations sont affectes une seule classe.

Affectations et distances au centre : Affiche pour chaque observation l'affectation

de classe finale et la distance euclidienne entre l'observation et le centre de classe utilis pour classer l'observation. Affiche galement la distance euclidienne entre les centres de classe finaux.
Valeurs manquantes : Les options disponibles sont Exclure toute observation incomplte ou Exclure seulement les composantes non valides.

Exclure toute observation incomplte : Exclut de l'analyse les observations qui ont

des valeurs manquantes pour une variable de classe.


Exclure seulement les composantes non valides : Affecte des observations aux

classes bases sur des distances calcules partir de toutes les variables n'ayant pas de valeur manquante.

Tests non paramtriques

34

Chapitre

La procdure de tests non paramtriques propose plusieurs tests qui ne ncessitent pas d'hypothse concernant la forme de la distribution sous-jacente :
Test Khi-deux : Tabule une variable en modalits et calcule une statistique khi-deux base sur les diffrences entre les frquences observes et les frquences attendues. Test binomial : Compare la frquence observe dans chaque modalit d'une variable dichotomique avec les frquences attendues de la distribution binomiale. Suites en squence : Teste si l'ordre d'occurrence de deux valeurs d'une variable

est alatoire.
Test Kolmogorov-Smirnov pour un chantillon : Compare la fonction de distribution cumule observe pour une variable avec une distribution thorique spcifie, qui peut tre normale, uniforme ou Poisson. Tests de deux chantillons indpendants : Compare deux groupes d'observations

d'une variable. Le test U de Mann-Whitney, le test de Kolmogorov-Smirnov pour deux chantillons, le test de ractions extrmes Moses, et les suites en squences Wald-Wolfowitz sont disponibles.
Tests de plusieurs chantillons indpendants : Compare deux groupes d'observations

ou plus d'une variable. Le test de Kruskal-Wallis, le test de la mdiane et le test de Jonckheere-Terpstra sont disponibles.
Tests de deux chantillons lis : Compare les distributions de deux variables. Le test de Wilcoxon, le test des signes et le test de McNemar sont disponibles. Tests de plusieurs chantillons lis : Compare les distributions de deux variables

ou plus. Le test de Friedman, le test W de Kendall et le test Q de Cochran sont disponibles.

497

498 Chapitre 34

Les quartiles et la moyenne, l'cart type, le minimum, le maximum, et le nombre d'observations sont disponibles pour tous les tests ci-dessus.

Test du Khi-deux
La procdure de test du Khi-deux tabule une variable en modalits et calcule une statistique Khi-deux. Ce test de qualit de l'ajustement compare les frquences observes et attendues dans chaque modalit pour vrifier si toutes les modalits contiennent la mme proportion de valeurs ou si chaque modalit contient une proportion de valeurs spcifies par l'utilisateur
Exemples : Le test du Khi-deux peut tre utilis pour dterminer si un sac de bonbons

contient les mmes proportions de bonbons bleus, marrons, verts, oranges, rouges et jaunes. Vous pouvez aussi tester si le sac de bonbons contient 5 % de bonbons bleus, 30 % de bonbons marrons, 10 % de bonbons verts, 20 % bonbons oranges, 15 % de bonbons rouges et 15 % de bonbons jaunes.
Statistiques : Moyenne, cart type, minimum, maximum, et quartiles. Le nombre et

le pourcentage d'observations manquantes et non manquantes, le nombre de cas observs et attendus pour chaque modalit, les rsidus et la statistique khi-deux.

Test du Khi-deux : remarques sur les donnes


Donnes : Utilisez des variables qualitatives numriques ordonnes ou dsordonnes

(niveau de mesure ordinal ou nominal). Pour convertir des variables chanes en variables numriques, utilisez la procdure Recoder Automatiquement, disponible dans le menu Transformer.
Hypothses : Les tests non paramtriques ne ncessitent pas d'hypothses sur la forme

de la distribution sous-jacente. On part du principe que les donnes constituent un chantillon alatoire. Les frquences attendues pour chaque modalit doivent tre au moins gales 1,20 % des modalits au maximum doivent avoir des frquences infrieures 5.

499 Tests non paramtriques

Echantillon de rsultat
Figure 34-1 Rsultat de test du Khi-deux Couleur du bonbon haricot
N N Observ(e)s Thoriques 6 18.8 33 9 17 22 26 113
Tests statistiques Couleur du Bonbon Haricot 27.973 5 .000

Rsidu -12.8 14.2 -9.8 -1.8 3.2 7.2

Bleu Marron Vert Jaune Orange Rouge Total

18.8 18.8 18.8 18.8 18.8

Khi-deux df

Signification Asymptotique 1.

0 cellule. 0 % de frquences faibles. 18,8 frquences faibles thoriques

500 Chapitre 34
Couleur du bonbon haricot N N Observ(e)s Thoriques 6 18.8 33 9 17 22 26 113
Tests statistiques Couleur du Bonbon Haricot 1.041 5 .959

Rsidu -12.8 14.2 -9.8 -1.8 3.2 7.2

Bleu Marron Vert Jaune Orange Rouge Total

18.8 18.8 18.8 18.8 18.8

Khi-deux df

Signification Asymptotique

1. 0 cellule. 0 % de frquences faibles. 5,7 frquences faibles thoriques

Pour obtenir un test Khi-deux


E A partir du menu, slectionnez : Analyse Tests non paramtriques Khi-deux...

501 Tests non paramtriques Figure 34-2 Bote de dialogue Test du khi-deux

E Slectionnez des variables de test. Chaque variable produit un test distinct.

Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les quartiles et le contrle du traitement des donnes manquantes.

Valeurs et intervalles thoriques du test du Khi-deux


Intervalle thorique : Par dfaut, chaque valeur distincte de la variable est dfinie

comme modalit. Pour tablir des modalits dans un intervalle spcifique, slectionnez l'option Dans les limites spcifies, et indiquez les valeurs entires pour les limites infrieure et suprieure. Des modalits sont tablies pour chaque valeur entire comprise dans l'intervalle, et les observations l'extrieur des limites sont exclues. Par exemple, si vous spcifiez une valeur de limite infrieure de 1 et une valeur de limite suprieure de 4, seules les valeurs entires de 1 4 sont utilises pour le test du Khi-deux.
Effectifs thoriques : Par dfaut, toutes les modalits ont des valeurs thoriques gales. Les modalits peuvent avoir des proportions attendues dfinies par l'utilisateur. Slectionnez Valeurs, indiquez une valeur suprieure 0 pour chaque modalit de variable de test et cliquez sur Ajouter. Chaque fois que vous ajoutez une valeur, celle-ci apparat au bas de la liste des valeurs. L'ordre des valeurs est important.

502 Chapitre 34

Il correspond l'ordre croissant des valeurs des modalits de la variable de test. La premire valeur de la liste correspond la valeur de groupe la plus basse de la variable de test et la dernire valeur correspond la valeur la plus leve. Les lments de la liste des valeurs sont additionns et chaque valeur est ensuite divise par cette somme pour calculer la proportion d'observations attendues dans la modalit correspondante. Par exemple, une liste de valeurs de 3, 4, 5, 4 indique les proportions attendues de 3/16, 4/16, 5/16 et 4/16.

Test du Khi-deux : Options


Figure 34-3 Bote de dialogue Test du Khi-deux : Options

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Affiche la moyenne, l'cart type, le minimum, le maximum, et le

nombre d'observations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles.

Valeurs manquantes : Contrle le traitement des valeurs manquantes.


Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

503 Tests non paramtriques

Fonctionnalits supplmentaires de la commande NPAR TESTS (test du Khi-deux)


Le langage de commande SPSS vous permet aussi de :

Spcifier des valeurs minimale et maximale diffrentes, ou des frquences attendues pour diffrentes variables (avec la sous-commande CHISQUARE). Tester la mme variable avec diffrentes frquences attendues ou utiliser diffrentes plages (avec la sous-commande EXPECTED).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Test binomial
La procdure de test binomial compare les frquences observes des deux modalits d'une variable dichotomique avec les frquences que l'on peut attendre d'une distribution binomiale avec un paramtre de probabilit spcifi. Par dfaut, le paramtre de probabilit pour les deux groupes est de 0,5. Pour modifier les probabilits, vous pouvez entrer un test de proportion pour le premier groupe. La probabilit pour le second groupe sera de 1 moins la probabilit spcifie pour le premier groupe.
Exemple : Quand vous lancez une pice, la probabilit de tomber sur le ct face est de

1/2. Sur la base de cette hypothse, une pice est lance 40 fois, et les rsultats sont enregistrs (pile ou face). Du test binomial, il se peut que vous observiez que les 3/4 des lancements sont tombs sur le ct face et que le seuil de signification observ est bas (0,0027). Ces rsultats indiquent qu'il est peu probable que la probabilit pour que la pice tombe sur le ct face soit gale 1/2. La pice est probablement truque.
Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations avec

des valeurs non manquantes et quartiles.

Test binomial : remarques sur les donnes


Donnes : Les variables testes doivent tre numriques et dichotomiques. Pour

convertir des variables chanes en variables numriques, utilisez la procdure Recoder Automatiquement, disponible dans le menu Transformer. Une variable

504 Chapitre 34

dichotomique est une variable qui ne peut prendre que deux valeurs possibles : oui ou non, vrai ou faux, 0 ou 1, etc. Si les variables ne sont pas dichotomiques, il faut spcifier une csure. La csure rpartit les observations avec une valeur suprieure la csure dans un groupe et le reste des observations dans un autre groupe.
Hypothses : Les tests non paramtriques ne ncessitent pas d'hypothses sur la forme

de la distribution sous-jacente. On part du principe que les donnes constituent un chantillon alatoire.

Echantillon de rsultat
Figure 34-4 Rsultat du test binomial
Test binomial Signification Asymptotique (Bilatrale) .0031

Pice

Groupe 1 Groupe 2 Total

Modalit Face Pile

N 30 10 40

Proportion Observe .75 .25 1.00

Test de Proportion .50

1.

Bas sur l'approximation Z

Pour obtenir un test binomial


E A partir du menu, slectionnez : Analyse Tests non paramtriques Binomial...

505 Tests non paramtriques Figure 34-5 Bote de dialogue Test binomial

E Slectionnez une ou plusieurs variables numriques tester.

Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les quartiles et le contrle du traitement des donnes manquantes.

Test binomial : Options


Figure 34-6 Bote de dialogue Test binomial

506 Chapitre 34

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Affiche la moyenne, l'cart type, le minimum, le maximum, et le

nombre d'observations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.
Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour toutes les variables du test sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (Test binomial)


Le langage de commande SPSS vous permet aussi de :

Slectionner des groupes spcifiques (et excluez-en d'autres) lorsqu'une variable comporte plus de deux modalits (avec la sous-commande BINOMIAL). Spcifier diffrentes csures ou probabilits pour diffrentes variables (avec la sous-commande BINOMIAL). Tester la mme variable avec diffrentes csures ou probabilits (avec la sous-commande EXPECTED).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Suites en squences
La procdure Suites en squences teste si l'ordre d'occurrence de deux valeurs d'une variable est alatoire. Une squence est une suite d'observations semblables. Un chantillon comportant trop ou trop peu de squences suggre que l'chantillon n'est pas alatoire.

507 Tests non paramtriques

Exemples : Supposons que 20 personnes soient sondes pour dterminer si elles

achteraient un produit donn. On peut douter que l'chantillon soit alatoire si toutes les personnes sont du mme sexe. Le test Suites en squences peut tre utilis pour dterminer si l'chantillon a t tir au hasard.
Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations avec

des valeurs non manquantes et quartiles.

Suites en squences : Remarques sur les Donnes


Donnes : Les variables doivent tre numriques. Pour convertir des variables chanes

en variables numriques, utilisez la procdure Recoder Automatiquement, disponible dans le menu Transformer.
Hypothses : Les tests non paramtriques ne ncessitent pas d'hypothses sur la forme de la distribution sous-jacente. Utilisez des chantillons distribution de probabilit continue.

Echantillon de rsultat
Figure 34-7 Rsultat de suites en squences Suites en squences
Valeur de test 1 Observations < Valeur de test Observations >= Valeur de test Total des observations Nombre de squences Z Signification asymptotique (bilatrale)

Sexe 1.00 7 13 20 15 2.234 .025

1.

Mdiane

508 Chapitre 34

Pour obtenir un test de suites


E A partir du menu, slectionnez : Analyse Tests non paramtriques Squences... Figure 34-8 Bote de dialogue Suites en squences

E Slectionnez une ou plusieurs variables numriques tester.

Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les quartiles et le contrle du traitement des donnes manquantes.

Csure des Suites en squences


Csure : Spcifie une csure pour dichotomiser les variables que vous avez choisies. Vous pouvez utiliser soit la moyenne, la mdiane ou le mode observs, soit une valeur spcifie comme csure. Les observations dont les valeurs sont infrieures la csure sont assignes un groupe, et les observations dont les valeurs sont suprieures la csure sont assignes l'autre groupe. Un test est ralis pour chaque csure choisie.

509 Tests non paramtriques

Options des Suites en squences


Figure 34-9 Bote de dialogue Suites en squences : Options

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Affiche la moyenne, l'cart type, le minimum, le maximum, et le

nombre d'observations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.
Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (Suites en squences)


Le langage de commande SPSS vous permet aussi de :

Spcifier diffrentes csures pour diffrentes variables ( l'aide de la sous-commande RUNS). Tester la mme variable par rapport diffrentes csures personnalises ( l'aide de la sous-commande RUNS).

510 Chapitre 34

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Test Kolmogorov-Smirnov pour un chantillon


Le test de Kolmogorov-Smirnov pour un chantillon compare la fonction de distribution cumule observe d'une variable avec une distribution thorique spcifie, qui peut tre normale, uniforme, de Poisson ou exponentielle. Le Z de Kolmogorov-Smirnov est calcul partir de la plus grande diffrence (en valeur absolue) entre les fonctions de distribution cumules observes et thoriques. Le test de qualit de l'ajustement contrle si les observations peuvent avoir t raisonnablement dduites de la distribution spcifie.
Exemple : La plupart des tests paramtriques ncessitent des variables distribues

normalement. Le test de Kolmogorov-Smirnov pour un chantillon permet de tester si une variable comme Revenu, par exemple, est distribue normalement.
Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations avec

des valeurs non manquantes et quartiles.

Remarques sur les donnes du test de Kolmogorov-Smirnov pour un chantillon


Donnes : Utilisez des variables quantitatives (mesure d'intervalle ou de rapport). Hypothses : Le test de Kolmogorov-Smirnov part du principe que les paramtres de la distribution tester sont prciss a priori. Cette procdure estime les paramtres partir d'un chantillon. L'chantillon de moyenne et l'chantillon d'cart type sont les paramtres pour une distribution normale. Les valeurs minimum et maximum de l'chantillon dfinissent l'intervalle de la distribution uniforme, l'chantillon de moyenne est le paramtre pour la distribution de Poisson et l'chantillon de l'cart type est le paramtre pour la distribution exponentielle.

511 Tests non paramtriques

Echantillon de rsultat
Figure 34-10 du test de Kolmogorov-Smirnov pour un chantillon
Test Kolmogorov-Smirnov pour un chantillon Revenu 20 Moyenne Ecart type Diffrences les plus extrmes Absolues Positives Ngatives Z de Kolmogorov-Smirnov Signification asymptotique (bilatrale) 1. Distribution tester normale 2. Calcul partir de donnes 56250.00 45146.40 .170 .170 -.164 .760 .611

N Paramtres gaussiens 1,2

Pour obtenir un test de Kolmogorov-Smirnov pour un chantillon


E A partir du menu, slectionnez : Analyse Tests non paramtriques K-S 1 chantillon...

512 Chapitre 34 Figure 34-11 Bote de dialogue Test de Kolmogorov-Smirnov pour un chantillon

E Slectionnez une ou plusieurs variables numriques tester. Chaque variable produit

un test distinct. Vous pouvez galement cliquer sur Options pour les statistiques descriptives, les quartiles et le contrle du traitement des donnes manquantes.

Options du test de Kolmogorov-Smirnov pour un chantillon


Figure 34-12 Bote de dialogue K-S pour un chantillon : Options

513 Tests non paramtriques

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Affiche la moyenne, l'cart type, le minimum, le maximum, et le

nombre d'observations non manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.
Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

Fonctions supplmentaires de commandes NPAR TESTS (test de Kolmogorov-Smirnov pour un chantillon)


Le langage de commande SPSS vous permet aussi de :

Spcifier les paramtres de la distribution tester (avec la sous-commande K-S).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests pour deux chantillons indpendants


La procdure des tests pour deux chantillons indpendants compare deux groupes d'observations en fonction d'une variable.
Exemple : De nouveaux appareils dentaires qui sont censs tre plus confortables, avoir une apparence plus agrable et provoquer des progrs plus rapides pour le redressage des dents ont t dvelopps. Pour savoir si les nouveaux appareils doivent tre ports aussi longtemps que les anciens, 10 enfants sont choisis de faon alatoire pour porter les anciens appareils et 10 autres pour porter les nouveaux appareils. Le test U de Mann-Whitney peut par exemple vous montrer que les sujets portant les nouveaux appareils ne doivent pas les porter aussi longtemps que les sujets utilisant les anciens appareils.

514 Chapitre 34

Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations avec

des valeurs non manquantes et quartiles. Tests : U de Mann-Whitney, ractions extrmes de Moses, Z de Kolmogorov-Smirnov, suites de Wald-Wolfowitz.

Tests pour deux chantillons indpendants : remarques sur les donnes


Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Utilisez des chantillons indpendants, alatoires. Le test U de Mann-Whitney exige que les deux chantillons tests soient de forme semblable.

Echantillon de rsultat
Figure 34-13 Rsultat pour deux chantillons indpendants Rangs

N Temps Type Anciens coul en D'appareil Appareils Jours Nouveaux Appareils Total 10 10 20

Rang Moyen 14.10 6.90

Somme des rangs 141.00 69.00

515 Tests non paramtriques

Tests statistiques 2 Temps coul en jours U de Mann-Whitney 14.000 W de Wilcoxon Z Signification Asymptotique (Bilatrale) Signification exacte [2*(sig. Unilatrale)] 69.000 -2.721 .007
1

.005

1. Ex quo non corrigs. 2. Critre de regroupement qualitatif numrique : type d'appareil

Pour effectuer les tests pour deux chantillons indpendants


A partir du menu, slectionnez :
Analyse Tests non paramtriques 2 chantillons indpendants...

516 Chapitre 34 Figure 34-14 Bote de dialogue Tests pour deux chantillons indpendants

E Slectionnez une ou plusieurs variables numriques. E Slectionnez une variable de regroupement et cliquez sur Dfinir groupes... pour

scinder le fichier en deux groupes ou chantillons.

Types de tests pour deux chantillons indpendants


Type de test : Quatre tests sont disponibles pour tester si deux chantillons (groupes) proviennent de la mme population. Le test U de Mann-Whitney est le plus populaire des tests pour deux chantillons indpendants. Il quivaut au test de Wilcoxon et au test de Kruskal-Wallis pour deux groupes. Les tests de Mann-Whitney servent vrifier que deux chantillons d'une population ont une position quivalente. Les observations des deux groupes sont combines et ordonnes, et il leur est attribu un rang moyen en cas d'ex aequo. Le nombre d'ex aequo doit tre petit par rapport au nombre total d'observations. Si les populations ont une position identique, les rangs doivent tre attribus de faon alatoire entre les deux chantillons. Le nombre de fois ou un rsultat du groupe 1 prcde un rsultat du groupe 2 et le nombre de fois ou un rsultat du groupe 2

517 Tests non paramtriques

prcde un rsultat du groupe 1 sont calculs. La statistique du U de Mann-Whitney est le plus petit de ces deux nombres. La statistique de la somme de rangs de Wilcoxon W, galement affiche, est la somme des rangs du plus petit chantillon. Si les deux chantillons ont le mme nombre d'observations, W est la somme des rangs du groupe nomm en premier dans la bote de dialogue Dfinition des deux groupes d'chantillons indpendants. Le test Z de Kolmogorov-Smirnov et les suites en squences de Wald-Wolfowitz sont des tests plus gnraux qui dtectent les diffrences de position et la forme des distributions. Le test Z de Kolmogorov-Smirnov est bas sur la diffrence absolue maximum entre les fonctions de distribution cumules observes pour les deux chantillons. Lorsque cette diffrence est significative, on considre que les deux distributions sont diffrentes. Le test des suites en squences de Wald-Wolfowitz combine et ordonne les observations des deux groupes. Si les deux chantillons proviennent de la mme population, les deux groupes doivent tre disperss de faon alatoire dans tout le classement. Le test des ractions extrmes de Moses part du principe que la variable exprimentale influence certains sujets dans une direction et d'autres sujets dans la direction oppose. Il vrifie les rponses extrmes par rapport un groupe de contrle. Ce test permet d'tudier l'intervalle du groupe de contrle et de mesurer quel point les valeurs extrmes du groupe exprimental influencent l'amplitude lorsque ce test est associ au groupe de contrle. Le groupe de contrle est dfini par la valeur du groupe 1 dans la bote de dialogue Dfinition des deux groupes d'chantillons indpendants. Les observations des deux groupes sont combines et ordonnes. L'intervalle du groupe de contrle se calcule en effectuant la diffrence entre les rangs des valeurs les plus grandes et les plus petites du groupe de contrle plus 1. Puisque des valeurs loignes peuvent occasionnellement et facilement fausser l'intervalle d'amplitude, 5 % des observations de contrle sont filtres automatiquement chaque extrmit.

Dfinition de deux groupes d'chantillons indpendants


Figure 34-15 Bote de dialogue Tests pour deux chantillons indpendants : Dfinir groupes

518 Chapitre 34

Pour scinder le fichier en deux groupes ou chantillons, indiquez un nombre entier pour le groupe 1 et un autre pour le groupe 2. Les observations avec d'autres valeurs sont exclues de l'analyse.

Tests pour deux chantillons indpendants : Options


Figure 34-16 Bote de dialogue Deux chantillons indpendants : Options

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Indique la moyenne, l'cart type, le minimum, le maximum, et

le nombre d'observations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.
Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (tests pour deux chantillons indpendants)
Le langage de commande SPSS vous permet aussi de :

Spcifier le nombre d'observations devant tre filtres pour le test de Moses (avec la sous-commande MOSES).

519 Tests non paramtriques

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests pour deux chantillons lis


La procdure des tests pour deux chantillons lis compare les distributions pour deux variables.
Exemple : En gnral, une famille qui vend sa maison peroit-elle le prix demand ? En appliquant le test de Wilcoxon aux donnes de 10 foyers, vous apprendrez que sept familles peroivent moins que le prix demand, qu'une famille peroit plus que le prix demand et que deux familles peroivent le prix demand. Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations

avec des valeurs non manquantes et quartiles. Tests : Wilcoxon, Signe, McNemar, Homognit marginale.

Tests pour deux chantillons lis : remarques sur les donnes


Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Bien qu'aucune distribution particulire ne soit suppose pour les deux variables, on part du principe que la distribution de la population des diffrences lies est symtrique.

520 Chapitre 34

Echantillon de rsultat
Figure 34-17 Analyse pour deux chantillons lis Rangs
N Prix demand Rangs - Prix de vente Ngatifs Rangs Positifs Ex aequo Total 1. Prix demand < Prix de vente 2. Prix demand > Prix de vente 3. Prix demand = Prix de vente 7 1
1

Rangs Moyen 4.93 1.50

Somme des rangs 34.50 1.50

23 10

Tests statistiques

Z Signification Asymptotique (Bilatrale)

Prix demand - Prix de vente -2.3131 .021

1. Bas sur les rangs positifs 2. Test de Wilcoxon

Pour obtenir des tests pour deux chantillons lis


A partir du menu, slectionnez :
Analyse Tests non paramtriques 2 chantillons lis...

521 Tests non paramtriques Figure 34-18 Bote de dialogue Tests pour deux chantillons lis

E Slectionnez des paires de variables de la manire dcrite ci-dessous :

Cliquez sur chacune des deux variables. La premire variable apparat dans le groupe Choix courants comme Variable 1 et la seconde apparat comme Variable 2. Aprs avoir slectionn une paire de variables, cliquez sur le bouton flch pour dplacer la paire vers la liste Paire(s) tester. Vous pouvez slectionner d'autres paires de variables. Pour supprimer une paire de variables de l'analyse, slectionnez une paire dans la liste Paire(s) tester et cliquez sur le bouton flch.

Types de tests pour deux chantillons lis


Type de test : Les tests de cette section comparent les distributions pour deux variables lies. Le test qu'il convient d'utiliser dpend du type de donnes. Si vos donnes sont continues, utilisez le test de Signe ou le test de Wilcoxon. Le test de signe calcule les diffrences entre les deux variables pour toutes les observations, et classe les diffrences comme tant positives, ngatives ou lies. Si les deux variables sont rparties de la mme manire, le nombre de diffrences positives et le nombre de diffrences ngatives ne diffrent pas de faon significative. Le test de Wilcoxon prend en compte les informations relatives au signe des diffrences,

522 Chapitre 34

ainsi qu' l'amplitude des diffrences entre paires. Comme le test de Wilcoxon intgre plus de renseignements sur les donnes, il est plus puissant que le test des signes. Si vos donnes sont binaires, utilisez le test de McNemar. Ce test s'utilise frquemment lors de situations de mesures rptes, au cours desquelles la rponse du sujet est provoque deux fois, une fois avant qu'un vnement spcifi se produise et une fois aprs qu'un vnement spcifi s'est produit. Le test de McNemar dtermine si le taux de rponses initial (avant l'vnement) est gal au taux de rponse final (aprs l'vnement). Ce test est utile pour dtecter les changements dans les rponses dues une intervention exprimentale dans les plans avant et aprs. Si vos donnes sont qualitatives, utilisez le test d'Homognit marginale. Il s'agit d'un dveloppement du test de McNemar d'une rponse binaire une rponse multinomiale. Il recherche les changements de rponse en utilisant la distribution khi-deux et permet de dtecter les changements de rponse dus une intervention exprimentale dans les plans avant et aprs. Le test d'homognit marginale n'est disponible que si vous avez install les tests exacts SPSS.

Tests pour deux chantillons lis : Options


Figure 34-19 Bote de dialogue Tests pour deux chantillons lis : Options

Statistiques : Vous pouvez choisir une des statistiques rcapitulatives suivantes (ou les

deux) :

Caractristique : Indique la moyenne, l'cart type, le minimum, le maximum, et

le nombre d'observations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.

523 Tests non paramtriques Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR (Deux chantillons lis)


Le langage de commande SPSS vous permet aussi de :

tester une variable avec toute autre variable d'une liste.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tests pour plusieurs chantillons indpendants


La procdure de Tests pour Plusieurs Echantillons Indpendants compare deux groupes d'observations ou plus sur une variable.
Exemple : Trois marques d'ampoules 100 watts diffrent-elles par leur dure moyenne

de fonctionnement ? A partir de l'analyse de variance d'ordre 1 de Kruskal-Wallis, vous apprendrez peut-tre que les trois marques diffrent par leur dure de vie moyenne.
Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations avec

des valeurs non manquantes et quartiles. Tests : H de Kruskal-Wallis, mdiane.

Tests pour Plusieurs Echantillons Indpendants : Remarques sur les Donnes


Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Utilisez des chantillons indpendants, alatoires. Le test du H de Kruskal-Wallis ncessite que les chantillons tests soient de forme similaire.

524 Chapitre 34

Echantillon de rsultat
Figure 34-20 Rsultat des Tests pour plusieurs chantillons indpendants Rangs

Heures Marque Marque A Marque B Marque C Total


Tests statistiques 1,2 Heures 25.061 2 .000

N 10 10 10 30

Rang Moyen 15.20 25.50 5.80

Khi-deux df Signification Asymptotique

1. Test de Kruskal-Wallis 2. Critre de regroupement qualitatif numrique : Marque

Pour obtenir des tests pour plusieurs chantillons indpendants


A partir du menu, slectionnez :
Analyse Tests non paramtriques K chantillons indpendants

525 Tests non paramtriques Figure 34-21 Bote de dialogue Tests pour plusieurs chantillons indpendants

E Slectionnez une ou plusieurs variables numriques. E Slectionnez une variable de regroupement et cliquez sur Dfinir intervalle pour

spcifier les valeurs entires minimale et maximale pour la variable de regroupement.

Tests pour Plusieurs Echantillons Indpendants : Types de tests


Type de test : Trois tests permettent de dterminer si plusieurs chantillons

indpendants proviennent de la mme population. Le test du H de Kruskal-Wallis, le test de la Mdiane et le test de Jonckheere-Terpstra testent tous si plusieurs chantillons indpendants proviennent de la mme population. Le test H de Kruskal-Wallis, extension du test du U de Mann-Whitney, est l'quivalent non paramtrique de l'analyse de variance d'ordre 1 et dtecte les diffrences dans la position de la distribution. Le test de la mdiane, test plus gnral mais moins puissant, dtecte les diffrences de position et de forme des distributions. Le test du H de Kruskal-Wallis et le test de la mdiane supposent qu'il n'existe aucun classement a priori des k populations partir desquelles les chantillons sont tirs. Lorsqu'il existe un classement naturel a priori (ascendant ou descendant) des k populations, le test de Jonckheere-Terpstra est plus puissant. Par exemple, les k populations peuvent reprsenter k tempratures croissantes. L'hypothse selon laquelle diffrentes tempratures produisent la mme distribution des rponses est

526 Chapitre 34

teste contre l'hypothse alternative selon laquelle l'accroissement de temprature fait augmenter la magnitude de la rponse. Ici, l'hypothse alternative est ordonne ; le test de Jonckheere-Terpstra est donc le plus appropri. Le test de Jonckheere-Terpstra n'est disponible que si vous avez install les Tests Exacts de SPSS.

Tests pour Plusieurs Echantillons Indpendants : Dfinir l'Intervalle


Figure 34-22 Bote de dialogue Plusieurs chantillons indpendants : Dfinir l'intervalle

Pour dfinir l'intervalle, entrez les valeurs entires minimale et maximale correspondant la modalit la plus basse et la plus haute de la variable de regroupement. Les observations dont les valeurs se trouvent l'extrieur des limites sont exclues. Par exemple, si vous spcifiez une valeur minimale de 1 et une valeur maximale de 3, seules les valeurs entires comprises entre 1 et 3 seront utilises. La valeur minimale doit tre infrieure la valeur maximale, et les deux valeurs doivent tre spcifies.

527 Tests non paramtriques

Options des Tests pour Plusieurs Echantillons Indpendants


Figure 34-23 Bote de dialogue Plusieurs chantillons indpendants : Options

Statistiques : Vous pouvez choisir l'une des statistiques rcapitulatives suivantes,

ou bien les deux.


Caractristique : Indique la moyenne, l'cart type, le minimum, le maximum, et

le nombre d'observations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles. Valeurs manquantes : Contrle le traitement des valeurs manquantes.
Exclure les observations test par test : Lorsque plusieurs tests sont indiqus, chaque

test est effectu sparment selon le nombre des valeurs manquantes.

Exclure toute observation incomplte : Les observations avec des valeurs

manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.

Fonctionnalits supplmentaires de la commande NPAR TESTS (K chantillons indpendants)


Le langage de commande SPSS vous permet aussi de :

Spcifier une valeur diffrente de la mdiane observe pour le test de la mdiane (avec la sous-commande MEDIAN).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

528 Chapitre 34

Tests pour plusieurs chantillons lis


La procdure de Tests pour Plusieurs Echantillons Lis compare les distributions de deux variables ou plus.
Exemple : Le public associe-t-il diffrents niveaux de prestige un docteur, un avocat,

un officier de police et un enseignant ? On demande dix personnes de classer ces quatre mtiers par ordre de prestige. Le test de Friedman indique que le public associe effectivement diffrents niveaux de prestige ces quatre professions.
Statistiques : Moyenne, cart type, minimum, maximum, nombre d'observations

avec des valeurs non manquantes et quartiles. Tests : Friedman, W de Kendall et Q de Cochran.

Tests pour plusieurs chantillons lis de considrations de donnes


Donnes : Utilisez des variables numriques qui peuvent tre ordonnes. Hypothses : Les tests non paramtriques ne ncessitent pas d'hypothses sur la forme

de la distribution sous-jacente. Utilisez des chantillons dpendants, alatoires.

Echantillon de rsultat
Figure 34-24 Rsultat des Tests pour Plusieurs Echantillons Lis

Rangs Rang Moyen 1.50 2.50 3.40 2.60

Mdecin Homme de loi Policier Enseignant

529 Tests non paramtriques


Tests statistiques N Khi-deux df Signification asymptotique 1. Test de Friedman
1

10 10.920 3 .012

Pour obtenir des tests pour plusieurs chantillons lis


A partir du menu, slectionnez :
Analyse Tests non paramtriques K chantillons lis Figure 34-25 Bote de dialogue Tests pour plusieurs chantillons lis

E Slectionnez deux variables numriques ou plus tester.

Tests pour plusieurs chantillons lis de types de tests


Type de test : Trois tests sont disponibles pour comparer les distributions de plusieurs

variables lies.

530 Chapitre 34

Le testdeFriedman est l'quivalent non paramtrique d'un plan de mesures rptes sur un chantillon ou d'une analyse de variance d'ordre 2 avec une observation par cellule. Le test de Friedman teste l'hypothse nulle selon laquelle k variables lies proviennent de la mme population. Pour chaque observation, les variables k sont classes de 1 k. La statistique de test est base sur ces classements. Le test W de Kendall est une standardisation de la statistique de Friedman. Le test W de Kendall peut tre interprt comme le coefficient de concordance, qui est une mesure de l'accord entre les valuateurs. Chaque observation est un juge ou un indicateur, et chaque variable est une personne ou un lment jug. Pour chaque variable, la somme des rangs est calcule. Le W de Kendall se situe entre 0 (pas d'accord) et 1 (accord total). Le Q de Cochran est identique au test de Friedman mais s'applique lorsque toutes les rponses sont binaires. C'est une extension du test de McNemar K chantillons. Le Q de Cochran teste l'hypothse nulle selon laquelle plusieurs variables dichotomiques lies ont la mme moyenne. Les variables sont mesures sur le mme individu ou sur des individus comparables.

Statistiques des tests pour plusieurs chantillons lis


Figure 34-26 Bote de dialogue Statistiques pour Plusieurs Echantillons Lis

Caractristique : Indique la moyenne, l'cart type, le minimum, le maximum, et

le nombre d'observations sans valeurs manquantes.


Quartiles : Indique les valeurs correspondant au 25me, 50me et 75me centiles.

Fonctionnalits supplmentaires de la commande NPAR TESTS (K chantillons lis)


Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse des rponses multiples

35

Chapitre

Deux procdures sont proposes pour l'analyse des vecteurs comportant plusieurs variables dichotomiques ou plusieurs modalits. La procdure Frquences multirponses affiche les tableaux de frquences. La procdure des Tableaux croiss multirponses affiche des tableaux croiss deux ou trois dimensions. Avant d'utiliser l'une de ces procdures, vous devez dfinir des vecteurs multirponses.
Exemple : Cet exemple illustre l'utilisation des lments multirponses dans une tude

de march. Ces donnes sont fictives et ne doivent pas tre considres comme relles. Une compagnie arienne est parfois amene interroger les passagers d'un trajet donn pour valuer la concurrence. Dans cet exemple, American Airlines veut savoir si ses passagers utilisent d'autres compagnies ariennes pour couvrir le trajet Chicago-New York et connatre l'importance relative des horaires et du service dans le choix d'une compagnie arienne. L'htesse distribue chaque passager un court questionnaire lors de l'embarquement. La premire question est la suivante : Entourez toutes les compagnies ariennes par lesquelles vous avez effectu au moins un vol dans les six derniers mois parmi American, United, TWA, USAir et d'autres. Il s'agit d'une question rponses multiples, car le passager peut entourer plus d'une rponse. Cependant, cette question ne peut pas tre code directement, parce qu'une variable SPSS ne peut avoir qu'une valeur pour chaque cas. Vous devez utiliser plusieurs variables pour mapper les rponses chaque question. Ceci peut tre fait de deux manires. L'une consiste dfinir une variable correspondant chaque choix possible (par exemple, American, United, TWA, USAir et d'autres). Si le passager entoure United, le numro de code 1 est affect la variable united, sinon c'est le code 0 qui lui est affect. Il s'agit de la mthode de codage de variables dichotomie multiple. L'autre mthode permettant de mapper les rponses est la mthode des modalits multiples, o vous devez estimer le nombre maximal de rponses possibles la question et dfinir le mme nombre de variables, avec des codes correspondant la compagnie arienne emprunte. En utilisant un chantillon de questionnaires, vous vous apercevrez peut-tre que personne n'a emprunt plus de trois compagnies
531

532 Chapitre 35

diffrentes pour ce trajet. Qui plus est, vous vous rendrez compte que, du fait de la drglementation des compagnies ariennes, 10 autres compagnies figurent dans la modalit Autre. A l'aide de la mthode multirponses, vous pouvez dfinir trois variables, codes comme suit : 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta, etc. Si un passager entoure American et TWA, la premire variable porte le code 1, la seconde le code 3, et la troisime un code sans valeur. Un autre passager a peut-tre entour American et ajout Delta. Ainsi, la premire variable porte le code 1, la seconde le code 5, et la troisime un code sans valeur. Si vous utilisez la mthode des dichotomies multiples, d'un autre ct, vous finissez par vous retrouver avec 14 variables diffrentes. Les deux mthodes de codage sont possibles dans le cadre de cette enqute. Cependant, votre choix dpendra de la rpartition des rponses.

Dfinition de vecteurs multirponses


La procdure de dfinition de vecteurs multirponses regroupe des variables itemaires dans des vecteurs de dichotomies ou de modalits, pour lesquels vous pouvez obtenir des tableaux de frquences et des tableaux croiss. Vous pouvez dfinir jusqu' 20 vecteurs multirponses. Chaque vecteur doit avoir un nom unique. Pour liminer un vecteur, slectionnez-le dans la liste des vecteurs multirponses et cliquez sur Eliminer. Pour modifier un vecteur, slectionnez-le dans la liste, modifiez-en les caractristiques et cliquez sur Changer. Vous pouvez coder vos variables itemaires sous forme de dichotomies ou de modalits. Pour utiliser des variables dichotomiques, slectionnez Variables dichotomiques afin de crer un vecteur de dichotomies multiples. Entrez une valeur entire dans Valeur compte. Chaque variable ayant au moins une occurrence de la valeur compte devient une modalit du vecteur de dichotomies multiples. Slectionnez Modalits pour crer un vecteur de modalits multiples ayant le mme intervalle de valeurs que les variables qui le composent. Entrez des nombres entiers pour le minimum et le maximum de l'intervalle des modalits du vecteur de modalits multiples. SPSS totalise chaque valeur entire contenue dans l'intervalle pour toutes les variables qui le composent. Les modalits vides ne sont pas tabules. A chaque vecteur multirponses doit tre attribu un nom unique de 7 caractres maximum. La procdure ajoute un signe dollar ($) devant le nom que vous avez attribu. Les noms rservs suivants ne doivent pas tre utiliss : casenum, sysmis, jdate, date, time, length et width. Le nom du vecteur multirponses doit uniquement tre utilis dans les procdures multirponses. Vous ne pouvez pas faire rfrence

533 Analyse des rponses multiples

aux noms des vecteurs multirponses dans les autres procdures. A titre facultatif, vous pouvez entrer une tiquette de variable dcrivant le vecteur multirponses. Cette tiquette peut comporter jusqu' 40 caractres.

Pour dfinir des vecteurs de rponses multiples


E A partir du menu, slectionnez : Analyse Rponses multiples Dfinir des groupes... Figure 35-1 Bote de dialogue Dfinition des vecteurs multirponses

E Slectionnez deux ou plusieurs variables. E Si vos variables sont codes comme dichotomies, indiquez la valeur que vous

souhaitez calculer. Si elles sont codes comme modalits, dfinissez leur intervalle.
E Entrez un nom unique pour chaque vecteur multirponses. E Cliquez sur Ajouter pour ajouter les vecteurs multirponses la liste des vecteurs

dfinis.

534 Chapitre 35

Tableaux de frquences des rponses multiples


La procdure Frquences multirponses produit des tableaux de frquences pour les vecteurs multirponses. Vous devez d'abord dfinir un ou plusieurs vecteurs multirponses (voir Dfinir les vecteurs multirponses ). Pour les vecteurs de dichotomies multiples, les noms de modalit apparaissant dans le rsultat proviennent d'tiquettes de variable dfinies pour les variables itemaires du groupe. Si les tiquettes de variable ne sont pas dfinies, les noms de variables servent d'tiquettes. Pour les vecteurs de modalits multiples, les tiquettes des modalits proviennent des tiquettes de valeurs de la premire variable du groupe. Si les modalits manquantes de la premire variable sont prsentes pour d'autres variables du groupe, dfinissez une tiquette de valeurs pour les modalits manquantes.
Valeurs manquantes : Les cas de valeurs manquantes sont exclus tableau par tableau. Vous pouvez donc choisir l'une ou les deux solutions suivantes :

Exclure les observations ayant une information incomplte l'intrieur des dichotomies : Ceci permet d'exclure les observations ayant des valeurs

manquantes pour toute variable issue du tableau crois du vecteur de dichotomies multiples. Ceci s'applique seulement aux vecteurs multirponses dfinis comme vecteurs de dichotomies. Par dfaut, une observation est considre manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur compte. Les cas de valeurs manquantes pour certaines variables, mais pas toutes, sont inclus dans les tabulations du groupe si au moins une variable contient la valeur compte.

Exclure toute observation ayant une information incomplte l'intrieur des modalits : Cela permet d'exclure les observations ayant des valeurs manquantes

pour toute variable provenant du tableau crois du vecteur des modalits multiples. Ceci s'applique seulement aux vecteurs multirponses dfinis comme des vecteurs de modalits. Par dfaut, une observation est considre manquante pour un vecteur de modalits multiples si aucune de ses composantes n'a de valeurs valides l'intrieur de l'intervalle dfini.
Exemple : Chaque variable cre partir d'une question de l'enqute est une variable lmentaire. Pour analyser un lment multirponses, vous devez combiner les variables dans l'un des deux types de vecteurs multirponses : vecteur de modalits multiples ou vecteur de dichotomies multiples. Par exemple, si dans une enqute, une compagnie arienne vous demande la compagnie (American Airlines, United Airlines ou TWA) que vous avez emprunte au cours des six derniers mois, si vous utilisez des

535 Analyse des rponses multiples

variables dichotomiques et avez dfini un vecteur de dichotomies multiples, chacune des trois variables du vecteur devient une modalit de la variable de regroupement. Les effectifs et les pourcentages correspondant aux trois compagnies ariennes s'affichent dans un tableau de frquences. Si vous dcouvrez qu'aucun des rpondants n'a mentionn plus de deux compagnies, vous pouvez crer deux variables, chacune ayant trois codes, un par compagnie arienne. Si vous dfinissez un vecteur de modalits multiples, les valeurs sont tabules et les mmes codes sont ajouts dans toutes les variables lmentaires. Le vecteur de valeurs rsultant est le mme que pour chacune des variables itemaires. Par exemple, 30 rponses pour United reprsentent la somme des cinq rponses United pour la compagnie arienne 1 et des 25 rponses United pour la compagnie 2. Les effectifs et les pourcentages correspondant aux trois compagnies ariennes s'affichent dans un tableau de frquences.
Statistiques : Tableaux de frquences contenant des effectifs, des pourcentages de

rponses, des pourcentages de cas, le nombre de cas valables, et le nombre de cas manquants.

Gestion des donnes des frquences de rponses multiples


Donnes : Utilisez des vecteurs multirponses. Hypothses : Les effectifs et pourcentages reprsentent une description utile des

donnes de n'importe quelle distribution.


Procdures apparentes : La procdure Dfinir Vecteurs multirponses vous permet de dfinir des vecteurs multirponses.

536 Chapitre 35

Echantillon de rsultat
Figure 35-2 Rsultat de la mthode des frquences de rponses multiples

Pour obtenir des tableaux de frquences de rponses multiples


E A partir du menu, slectionnez : Analyse Rponses multiples Frquences... Figure 35-3 Bote de dialogue Frquences de rponses multiples

E Slectionnez un ou plusieurs vecteurs multirponses.

537 Analyse des rponses multiples

Tableaux croiss des rponses multiples


La procdure Tableaux croiss de rponses multiples classe, par tableaux croiss, des vecteurs multirponses dfinis, des variables itemaires ou une combinaison. Vous pouvez galement obtenir des pourcentages de cellules bass sur des observations ou des rponses, modifier la gestion des valeurs manquantes ou obtenir des tableaux croiss apparis. Vous devez d'abord dfinir un ou plusieurs vecteurs multirponses (veuillez consulter Pour Dfinir des vecteurs multirponses ). Pour les vecteurs de dichotomies multiples, les noms de modalit apparaissant dans le rsultat proviennent d'tiquettes de variable dfinies pour les variables itemaires du groupe. Si les tiquettes de variable ne sont pas dfinies, les noms de variables servent d'tiquettes. Pour les vecteurs de modalits multiples, les tiquettes des modalits proviennent des tiquettes de valeurs de la premire variable du groupe. Si les modalits manquantes de la premire variable sont prsentes pour d'autres variables du groupe, dfinissez une tiquette de valeurs pour les modalits manquantes. SPSS affiche les tiquettes de modalit des colonnes sur trois lignes, avec jusqu' huit caractres par ligne. Pour viter de scinder les mots, vous pouvez inverser les lments lignes et les lments colonnes ou redfinir les tiquettes.
Exemple : Les vecteurs de dichotomies multiples et les vecteurs de modalits multiples

peuvent tre croiss avec d'autres variables dans cette procdure. Dans le cadre d'une enqute mene auprs de passagers de compagnies ariennes, voici ce qui leur a t demand : Parmi les compagnies ariennes suivantes, entourez toutes celles avec lesquelles vous avez voyag au moins une fois durant les six derniers mois (American, United, TWA). Est-il plus important de privilgier l'horaire ou le service ? Choisissez une seule rponse. Aprs avoir saisi les donnes en tant que dichotomies ou modalits multiples, et aprs les avoir combines dans un vecteur, vous pouvez croiser les choix de compagnie arienne dclars avec la question relative au service ou aux horaires.
Statistiques : Tableau crois avec cellule, ligne, colonne, et effectif total, et avec les pourcentages ligne, colonne, et effectif total. Les pourcentages cellule peuvent tre bass sur les observations ou les rponses.

538 Chapitre 35

Remarques sur les Donnes de Tableaux croiss de rponses multiples


Donnes : Utilisez des vecteurs multirponses ou des variables qualitatives

numriques.
Hypothses : Les effectifs et pourcentages offrent une description utile des donnes qui suivent tout type de distribution. Procdures apparentes : La procdure Dfinir Vecteurs multirponses vous permet de dfinir des vecteurs multirponses.

Echantillon de rsultat
Figure 35-4 Rsultat Tableaux croiss de rponses multiples

539 Analyse des rponses multiples

Pour obtenir des tableaux croiss des rponses multiples


E A partir du menu, slectionnez : Analyse Rponses multiples Tableaux croiss... Figure 35-5 Bote de dialogue Tableaux Croiss de rponses multiples

E Slectionnez une ou plusieurs variables numriques ou vecteurs multirponses pour

chaque dimension de tableau crois.


E Dfinissez l'intervalle de chaque variable itemaire.

Sinon, vous pouvez obtenir un tableau crois bilatral pour chaque modalit de variable de contrle ou chaque vecteur multirponses. Slectionnez un ou plusieurs lments pour la liste de strate(s).

540 Chapitre 35

Dfinir Intervalles Tableaux croiss De rponses multiples


Figure 35-6 Dfinir bote de dialogue Intervalle Variables Tableaux croiss de rponses multiples

Les intervalles des valeurs doivent tre dfinis pour toute variable itemaire de tableaux croiss. Entrez les valeurs entires de modalits minimum et maximum que vous souhaitez tabuler. Les modalits se situant en dehors de l'intervalle sont exclues de l'analyse. Les valeurs se situant l'intrieur de l'intervalle inclusif sont supposes tre des nombres entiers (les nombres non entiers sont tronqus).

Options Tableaux croiss de rponses multiples


Figure 35-7 Bote de dialogue Options Tableaux croiss de rponses multiples

Pourcentages de cellule : Les effectifs des cellules sont toujours affichs. Vous

pouvez choisir d'afficher les pourcentages lignes, les pourcentages colonnes, et les pourcentages tableau bilatral (total).

541 Analyse des rponses multiples

Pourcentages bass sur : Vous pouvez baser les pourcentages cellules sur les

observations (ou rpondants). Ceci n'est pas possible si vous slectionnez la fonction qui permet d'apparier les variables entre les vecteurs de modalits multiples. Vous pouvez aussi baser les pourcentages cellules sur les rponses. Pour les vecteurs de dichotomies multiples, le nombre de rponses est gal au nombre de valeurs comptes travers les observations. Pour les vecteurs de modalits multiples, le nombre de rponses correspond au nombre de valeurs comprises dans l'intervalle dfini.
Valeurs manquantes : Vous avez le choix entre les deux options suivantes :

Exclure les observations ayant une information incomplte l'intrieur des dichotomies : Ceci permet d'exclure les observations ayant des valeurs

manquantes pour toute variable issue du tableau crois du vecteur de dichotomies multiples. Ceci s'applique seulement aux vecteurs multirponses dfinis comme vecteurs de dichotomies. Par dfaut, une observation est considre manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur compte. Les observations ayant des valeurs manquantes pour certaines, mais pas toutes, les variables sont incluses dans les tableaux croiss du groupe si au moins une variable contient la valeur compte.

Exclure toute observation ayant une information incomplte l'intrieur des modalits : Cela permet d'exclure les observations ayant des valeurs manquantes

pour toute variable provenant du tableau crois du vecteur des modalits multiples. Ceci s'applique seulement aux vecteurs multirponses dfinis comme des vecteurs de modalits. Par dfaut, une observation est considre manquante pour un vecteur de modalits multiples si aucune de ses composantes n'a de valeurs valides l'intrieur de l'intervalle dfini. Par dfaut, lorsque vous croisez deux vecteurs de modalits multiples, SPSS tabule chaque variable du premier groupe avec chaque variable du second groupe et additionne les effectifs de chaque cellule. Par consquent, certaines rponses peuvent apparatre plus d'une fois dans un tableau. Vous pouvez choisir l'option suivante :
Apparier les variables entre les vecteurs rponses : Cela permet d'apparier la premire

variable du premier groupe avec la premire variable du second groupe, etc. Si vous slectionnez cette option, SPSS base les pourcentages cellules sur les rponses plutt que sur les rpondants. On ne peut apparier les vecteurs de dichotomies multiples ou les variables itemaires.

542 Chapitre 35

Fonctionnalits supplmentaires de la commande MULT RESPONSE


Le langage de commande SPSS vous permet aussi de :

Obtenir des tableaux croiss ayant jusqu' cinq dimensions (avec la sous-commande BY). Modifier les options de formatage du rsultat, y compris la suppression des tiquettes de valeurs (avec la sous-commande FORMAT).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Tableaux de Rsultats

36

Chapitre

Les listes d'observations et les statistiques descriptives sont des outils de base permettant d'tudier et de prsenter des donnes. Vous pouvez obtenir les listes d'observations l'aide de l'diteur de Donnes ou de la procdure Rcapituler, les effectifs de frquence et les statistiques descriptives l'aide de la procdure Frquences, et les statistiques de sous-population l'aide de la procdure Moyennes. Chacune de ces procdures utilise un format destin rendre les informations claires. Si vous souhaitez afficher les informations dans un format diffrent, les procdures Tableaux de bord en lignes et Tableaux de bord en colonnes vous permettent de contrler la prsentation des donnes.

Tableaux de bord en lignes


Tableaux de bord en lignes produit des tableaux de bord dans lesquels diffrentes statistiques rcapitulatives sont disposes en lignes. Les listes d'observations sont galement disponibles, avec ou sans statistiques rcapitulatives.
Exemple : Une socit possdant une chane de magasins conserve des dossiers

sur les employs comprenant le salaire, l'anciennet, le magasin et le service o chaque employ travaille. Vous pourriez gnrer un tableau de bord fournissant les informations individuelles sur les employs (liste) divises par magasin et par division (critres d'agrgation), avec les statistiques rcapitulatives (par exemple, salaire moyen) pour chaque magasin, division et par division dans chaque magasin.
Variables en colonnes : Donne la liste des variables de tableau pour lesquelles vous

voulez obtenir des listes d'observations ou des statistiques rcapitulatives, et contrle le format d'affichage des Variables en colonnes.

543

544 Chapitre 36

Variables de ventilation : Donne la liste des critres d'agrgation optionnels qui

divisent le tableau de bord en groupes et contrle les statistiques rcapitulatives et les formats d'affichage des colonnes de ventilation. Pour les critres d'agrgation multiples, il y aura un groupe spar pour chaque modalit de chaque critre d'agrgation l'intrieur des modalits du critre d'agrgation prcdent dans la liste. Les critres d'agrgation doivent tre des variables qualitatives discrtes qui divisent les observations en un nombre limit de modalits significatives. Les valeurs individuelles de chaque critre d'agrgation apparaissent, tries, dans une colonne spare gauche des Variables en colonnes.
Tableau de bord : Contrle les caractristiques globales du tableau de bord, y compris

les statistiques rcapitulatives globales, l'affichage des valeurs manquantes, la numrotation des pages et les titres.
Afficher les observations : Affiche les valeurs relles (ou les tiquettes de valeurs) des

variables de Variables en colonnes pour chaque observation. La liste produite peut tre nettement plus longue qu'un tableau de bord.
Aperu : N'affiche que la premire page du tableau de bord. Cette option est utile pour avoir un aperu du format de votre tableau sans traiter le tableau entier. Les donnes sont dj tries : Pour les rapports avec critres d'agrgation, le fichier de

donnes doit tre tri par valeur des critres d'agrgation avant de gnrer le tableau de bord. Si votre fichier de donnes est dj tri par valeur des critres d'agrgation, vous pouvez gagner du temps de traitement en slectionnant cette option. Cette option est particulirement utile aprs avoir vu un aperu du tableau.

545 Tableaux de Rsultats

Echantillon de rsultat
Figure 36-1 Tableau de bord combin avec listes d'observations et statistiques rcapitulatives
Anciennet Anciennet dans Socit Niveau Salaire -- Annuel __________ _____ _______ ______ ______________ Division dans Age Revtements de sol 27.00 3.67 2.17 22.00 3.92 3.08 23.00 3.92 3.08 24.00 4.00 3.25 30.00 27.00 33.00 33.00 44.00 36.00 4.08 4.33 2.67 3.75 4.83 3.83 3.08 3.17 2.67 3.25 4.33 3.25 $10,900 $10,900 $10,000 $10,000 $10,000 $9,335 $10,000 $15,690 $10,000 $15,520 $19,500 3.31 $11,754 $8,700 $9,200

35.00 3.50 3.00 35.00 6.00 5.33 Moyenne 30.75 4.04

Appareils mnagers 21.00 2.67 2.67 26.00 32.00 33.00 34.00 2.92 2.92 3.42 5.08 2.08 2.92 2.92 4.50 $8,000 $8,900 $8,900 $15,300 $8,975 $18,000 $7,500 $28,300 3.54

24.00 3.17 3.17 42.00 6.50 6.50 30.00 2.67 2.67 38.00 5.00 4.42 Moyenne 31.11 3.81

$12,508

Pour obtenir un rapport rcapitulatif : Rcapitulatifs en lignes


E A partir du menu, slectionnez : Analyse Rapports Tableaux de bord en lignes... E Slectionnez une ou plusieurs variables pour les variables en colonnes. Une colonne

est gnre dans le tableau de bord pour chaque variable slectionne.


E Pour les tableaux tris et affichs par sous-groupe, slectionnez une ou plusieurs

variables pour les critres d'agrgation.


E Pour les tableaux avec statistiques rcapitulatives de sous-groupe dfinies par des

critres d'agrgation, slectionnez le critre d'agrgation dans la liste et cliquez sur


Tableau rcapitulatif dans le groupe Variables de ventilation pour spcifier les mesures

rcapitulatives.

546 Chapitre 36 E Pour les tableaux avec statistiques rcapitulatives globales, cliquez sur Fonction dans

le groupe Tableau pour spcifier les mesures rcapitulatives.


Figure 36-2 Bote de dialogue Tableaux de bord en lignes

Format des Colonnes de donnes/Ventilations des Tableaux de bord


Les botes de dialogue Format contrlent les titres et largeurs des colonnes, l'alignement du texte et l'affichage des valeurs de donnes ou des tiquettes de valeurs. Format colonne de donnes contrle le format des Variables en colonnes du ct droit de la page du tableau de bord. Format colonne de ventilation contrle le format des Colonnes de ventilation du ct gauche.

547 Tableaux de Rsultats Figure 36-3 Bote de dialogue Tableau de bord : Format colonne de donnes

Titre de la colonne : Pour la variable slectionne, contrle le titre de la colonne. Les titres longs sont automatiquement ajusts dans la colonne. Utilisez la touche Entre pour insrer manuellement des sauts de lignes aux endroits o vous voulez ajuster les titres. Position des valeurs dans la colonne : Pour la variable slectionne, contrle l'alignement des valeurs de donnes ou des tiquettes de donnes dans la colonne. L'alignement des valeurs ou des tiquettes n'affecte pas l'alignement des titres de colonnes. Vous pouvez soit indenter le contenu de la colonne d'un nombre de caractres donn, soit centrer le contenu de la colonne. Contenu de la colonne : Pour la variable slectionne, contrle l'affichage soit des

valeurs de donnes, soit des tiquettes de valeurs dfinies. Les valeurs de donnes sont affiches pour toutes les valeurs qui ne possdent pas d'tiquette de valeur dfinie. (Non disponible pour les Variables en colonnes dans les Tableaux de bord en colonnes)

548 Chapitre 36

Fonctions rcapitulatives des Tableaux pour/Fonctions rcapitulatives Finales


Les deux botes de dialogue Fonctions rcapitulatives contrlent l'affichage des statistiques rcapitulatives pour les agrgats et pour l'ensemble du tableau de bord. L'option Fonctions rcapitulatives contrle les statistiques de sous-groupe pour chaque modalit dfinie par les critres d'agrgation. Fonctions rcapitulatives Finales contrle les statistiques globales affiches la fin du tableau de bord.
Figure 36-4 Bote de dialogue Tableau de bord : Fonction rcapitulative

Les statistiques rcapitulatives disponibles sont la somme des valeurs, la moyenne des valeurs, la valeur minimale, la valeur maximale, le nombre d'observations (effectif), le pourcentage d'observations situes au-dessus ou en dessous d'une valeur spcifie, le pourcentage d'observations compris l'intrieur d'un intervalle donn de valeurs, l'cart type, l'aplatissement, la variance et l'asymtrie.

Options de Ventilation de Tableau de Bord


Options de Ventilation contrle l'espacement et la pagination des informations de modalit de ventilation.

549 Tableaux de Rsultats Figure 36-5 Bote de dialogue Options de Ventilation des Tableaux de bord

Gestion des pages : Contrle l'espacement et la pagination des modalits du critre d'agrgation slectionn. Vous pouvez spcifier un nombre de lignes vides entre les modalits de ventilation ou commencer chaque modalit de ventilation sur une nouvelle page. Lignes sauter avant fonctions lmentaires : Contrle le nombre de lignes vides

entre les tiquettes ou les donnes des modalits de ventilation et les statistiques rcapitulatives. Cette option est particulirement utile pour les tableaux de bords combins incluant des listes d'observations individuelles et des statistiques rcapitulatives pour les modalits de ventilation ; dans ces tableaux, vous pouvez insrer des espaces entre les listes d'observations et les statistiques rcapitulatives.

Options du Tableau de bord


Options du Tableau de bord contrle le traitement et l'affichage des valeurs manquantes et la numrotation des pages du tableau de bord.

550 Chapitre 36 Figure 36-6 Bote de dialogue Tableau de bord : Options colonne de ventilation ...

Exclure les observations avec des valeurs manquantes : Elimine (du tableau de bord) toute observation avec des valeurs manquantes pour l'une des variables du tableau de bord. Reprsentation des valeurs manquantes : Vous permet de spcifier le symbole reprsentant les valeurs manquantes dans le fichier de donnes. Ce symbole ne peut comporter qu'un seul caractre et sert reprsenter les valeurs Manquante par dfaut et Spcifie par l'utilisateur. Paginer partir de : Vous permet de spcifier un numro pour la premire page du

tableau de bord.

Prsentation du Tableau de bord


Prsentation du Tableau de bord contrle la largeur et la longueur de chaque page du tableau de bord, l'emplacement du tableau sur la page et l'insertion de lignes vides et d'tiquettes.

551 Tableaux de Rsultats Figure 36-7 Bote de dialogue Tableau : Prsentation

Mise en page : Contrle les marges de page exprimes en lignes (haut et bas) et en

caractres (gauche et droite), et reporte l'alignement l'intrieur des marges.


Titres et bas de page : Contrle le nombre de lignes sparant les titres et les pieds de page du corps du tableau de bord. Variables de ventilation : Contrle l'affichage des colonnes de ventilation. Si des

critres d'agrgation multiples sont spcifis, ils peuvent tre affichs en colonnes spares ou dans la premire colonne. Placer tous les critres d'agrgation dans la premire colonne produit un tableau de bord plus troit.
Titres des colonnes : Contrle l'affichage des titres de colonnes, y compris le soulignement des titres, l'espacement entre les titres et le corps du tableau, et l'alignement vertical des titres de colonnes. Position var/tiquettes de ventilation : Contrle l'emplacement des informations de

Variables en colonnes (valeurs de donnes et/ou statistiques rcapitulatives) par rapport aux tiquettes de ventilation au dbut de chaque modalit de ventilation. La premire ligne des informations de Variables en colonnes peut commencer soit sur la

552 Chapitre 36

mme ligne que l'tiquette de modalit de ventilation, soit un nombre donn de lignes aprs cette tiquette. (Non disponible pour les Tableaux de bord en colonnes)

Titres du Tableau de bord


Titres du Tableau de bord contrle le contenu et l'emplacement des titres et pieds de page du tableau de bord. Vous pouvez spcifier jusqu' dix lignes de titre et jusqu' dix lignes de pieds de page, avec des composants justifis gauche, centrs et justifis droite sur chaque ligne.
Figure 36-8 Bote de dialogue Tableau : Titres

Si vous insrez des variables dans les titres ou les pieds de page, l'tiquette de valeur actuelle ou la valeur de la variable est affiche dans le titre ou le pied de page. Dans les titres, l'tiquette de valeur correspondant la valeur de la variable au dbut de la page est affiche. Dans les pieds de page, l'tiquette de valeur correspondant la valeur de la variable la fin de la page est affiche. S'il n'y a aucune tiquette de valeur, la valeur relle est affiche.

553 Tableaux de Rsultats

Variables spciales : Les variables spciales DATE et PAGE vous permettent d'insrer la date actuelle ou le numro de page dans l'une des lignes d'un en-tte ou d'un pied de page. Si votre fichier de donnes contient des variables nommes DATE ou PAGE, vous ne pouvez pas utiliser ces variables dans les titres ou les pieds de page des tableaux.

Tableaux de bord en colonnes


Tableaux de bord en colonnes produit des tableaux de bord dans lesquels diffrentes statistiques rcapitulatives apparaissent en colonnes spares.
Exemple : Une socit possdant une chane de magasins conserve des dossiers sur les

employs comprenant le salaire, l'anciennet et le service o chaque employ travaille. Vous pourriez gnrer un tableau de bord fournissant des statistiques rcapitulatives sur les salaires (par exemple moyenne, minimum, maximum) pour chaque division.
Variables en colonnes : Fournit la liste des variables du tableau de bord pour lesquelles

vous voulez des statistiques rcapitulatives et contrle le format d'affichage et les statistiques rcapitulatives affiches pour chaque variable.
Variables de ventilation : Fournit la liste des critres d'agrgation optionnels qui divisent le tableau de bord en groupes et contrle les formats d'affichage des colonnes de ventilation. Pour les critres d'agrgation multiples, il y aura un groupe spar pour chaque modalit de chaque critre d'agrgation l'intrieur des modalits du critre d'agrgation prcdent dans la liste. Les critres d'agrgation doivent tre des variables qualitatives discrtes qui divisent les observations en un nombre limit de modalits significatives. Tableau de bord : Contrle les caractristiques globales du tableau de bord, y compris

l'affichage des valeurs manquantes, la numrotation des pages et les titres.


Aperu : N'affiche que la premire page du tableau de bord. Cette option est utile pour avoir un aperu du format de votre tableau sans traiter le tableau entier. Les donnes sont dj tries : Pour les rapports avec critres d'agrgation, le fichier de

donnes doit tre tri par valeur des critres d'agrgation avant de gnrer le tableau de bord. Si votre fichier de donnes est dj tri par valeur des critres d'agrgation, vous pouvez gagner du temps de traitement en slectionnant cette option. Cette option est particulirement utile aprs avoir vu un aperu du tableau.

554 Chapitre 36

Echantillon de rsultat
Figure 36-9 Tableau de bord avec statistiques rcapitulatives en colonnes
Division Moyenne Salaire Salaire Salaire Age moyen annuel annuel annuel Minimum Maximum

__________ ________ ________ ________ ________ Revtements de sol 30.75 $11,754 $9,200 $19,500 $12,508 $7,500 $28,300

Appareils mnagers 31.11 Meubles Matriel

36.87 $13,255 $8,975 $17,050 36.20 $17,580 $7,450 $22,500

Pour obtenir un rapport rcapitulatif : Rcapitulatifs en colonnes


E A partir du menu, slectionnez : Analyse Rapports Tableaux de bord en colonnes E Slectionnez une ou plusieurs variables pour les variables en colonnes. Une colonne

est gnre dans le tableau de bord pour chaque variable slectionne.


E Pour modifier la mesure rcapitulative d'une variable, slectionnez la variable dans la liste Variables en colonnes et cliquez sur Fonction. E Pour obtenir plus d'une mesure rcapitulative pour une variable, slectionnez la

variable dans la liste source et dplacez-la dans la liste Variables en colonnes plusieurs fois, une fois pour chaque mesure rcapitulative que vous souhaitez.
E Pour afficher une colonne contenant la somme, la moyenne, le rapport ou une autre fonction de colonnes existantes, cliquez sur Insrer le total. Une variable appele total

est alors place dans la liste Variables en colonnes.


E Pour les tableaux tris et affichs par sous-groupe, slectionnez une ou plusieurs

variables pour les critres d'agrgation.

555 Tableaux de Rsultats Figure 36-10 Bote de dialogue Tableaux de bord en colonnes

Fonction rcapitulative des Colonnes de donnes


Fonctions rcapitulatives contrle les statistiques rcapitulatives affiches pour la variable de colonne de donnes slectionne.
Figure 36-11 Bote de dialogue Tableau de bord : Fonction rcapitulative

556 Chapitre 36

Les statistiques rcapitulatives disponibles sont la somme, la moyenne, le minimum, le maximum, le nombre d'observations, le pourcentage d'observations situes au-dessus ou en dessous d'une valeur spcifie, le pourcentage d'observations l'intrieur d'un intervalle donn de valeurs, l'cart type, la variance, l'aplatissement et l'asymtrie.

Fonction lmentaire des Colonnes de Donnes pour colonne de total


Variables rcapituler contrle les statistiques rcapitulatives totales qui rcapitulent deux ou plusieurs Variables en colonnes. Les statistiques rcapitulatives totales sont la somme des colonnes, la moyenne des colonnes, le minimum, le maximum, la diffrence entre les valeurs de deux colonnes, le quotient des valeurs d'une colonne divises par les valeurs d'une autre colonne et le produit des valeurs de colonnes multiplies.
Figure 36-12 Bote de dialogue Tableau de bord : Colonnes

Somme des colonnes : La colonne total reprsente la somme des colonnes de la liste Variables rcapituler. Moyenne des colonnes : La colonne total reprsente la moyenne des colonnes de la liste Variables rcapituler. Minimum des colonnes : La colonne total reprsente la somme minimale des colonnes de la liste Variables rcapituler. Maximum des colonnes : La colonne total reprsente la somme maximale des colonnes

de la liste Variables rcapituler.

557 Tableaux de Rsultats

1re colonne 2me colonne : La colonne total reprsente la diffrence des colonnes

de la liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes.
1re colonne / 2me colonne : La colonne total reprsente le quotient des colonnes

de la liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes.
% 1re colonne / 2me colonne : La colonne total reprsente le pourcentage de la

premire colonne par rapport la seconde colonne de la liste Variables rcapituler. La liste Variables rcapituler doit contenir exactement deux colonnes.
Produit des colonnes : La colonne total reprsente le produit des colonnes de la liste

Variables rcapituler.

Format des Colonnes du Tableau de bord


Les options de format des Variables en colonnes et de ventilation pour les Tableaux de bord en colonnes sont identiques celles dcrites pour les Tableaux de bord en lignes.

Tableaux de bord en Colonnes : Options de Ventilation


Options de Ventilation contrle l'affichage des sous-totaux, l'espacement et la pagination des modalits de ventilation.
Figure 36-13 Bote de dialogue Options de Ventilation des Tableaux de bord

558 Chapitre 36

Sous-total : Contrle l'affichage des sous-totaux pour les modalits de ventilation. Gestion des pages : Contrle l'espacement et la pagination des modalits du critre d'agrgation slectionn. Vous pouvez spcifier un nombre de lignes vides entre les modalits de ventilation ou commencer chaque modalit de ventilation sur une nouvelle page. Lignes sauter avant sous-total : Contrle le nombre de lignes vides entre les donnes des modalits de ventilation et les sous-totaux.

Options des Tableaux de bord en Colonnes


Options contrle l'affichage des totaux gnraux, l'affichage des valeurs manquantes et la pagination dans les Tableaux de bord en colonnes.
Figure 36-14 Bote de dialogue Tableau de bord : Options colonne de ventilation ...

Total gnral : Affiche et tiquette un total gnral pour chaque colonne ; affich

au bas de la colonne.
Exclure les observations avec des valeurs manquantes : Vous pouvez exclure les

valeurs manquantes du tableau ou slectionner un caractre unique indiquant les valeurs manquantes dans le tableau de bord.

Prsentation du Tableau de bord en Colonnes


Les options de prsentation pour les Tableaux de bord en colonnes sont identiques celles prsentes pour les Tableaux de bord en lignes.

559 Tableaux de Rsultats

Fonctionnalits supplmentaires de la commande REPORT


Le langage de commande SPSS vous permet aussi de :

Afficher diffrentes fonctions rcapitulatives dans les colonnes d'une ligne de fonction unique. Insrer des fonctions rcapitulatives dans les Variables en colonnes pour des variables autres que la variable de la colonne de donnes, ou pour diverses combinaisons (fonctions composites) de fonctions rcapitulatives. rcapitulatives.

Utiliser la Mdiane, le Mode, la Frquence et le Pourcentage comme des fonctions

Contrler plus prcisment le format d'affichage des statistiques rcapitulatives. Insrer des lignes vides divers emplacements du tableau de bord. Insrer des lignes vides toutes les n observations dans les listes.

Du fait de la complexit de la syntaxe de la commande REPORT, vous trouverez peut-tre utile, lorsque vous construirez un nouveau tableau de bord avec syntaxe, d'approcher le tableau gnr partir des botes de dialogue, de copier et coller la syntaxe correspondante, puis de prciser cette syntaxe afin d'obtenir le tableau de bord exact que vous souhaitez. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse de fiabilit

37

Chapitre

L'analyse de fiabilit vous permet d'tudier les proprits des chelles de mesure et des lments qui les constituent. La procdure d'analyse de fiabilit calcule plusieurs mesures frquemment utilises de la fiabilit de l'chelle et propose galement des informations sur les relations entre les diffrents lments de l'chelle. Les coefficients de corrlation intra-classe peuvent tre utiliss pour calculer les estimations de fiabilit inter-coefficients.
Exemple : Mon questionnaire mesure-t-il de faon fidle la satisfaction de la clientle

? L'analyse de la fiabilit vous permet de dterminer dans quelle mesure les lments de votre questionnaire sont lis les uns aux autres et vous procure un indice gnral de la consistance ou de la cohrence interne de l'chelle dans son ensemble. Elle vous permet enfin d'identifier les lments qui posent problme et qu'il faudrait exclure de l'chelle.
Statistiques : Descriptions de chaque variable et pour l'chelle, statistiques

rcapitulatives sur les lments, corrlations et covariances entre lments, prvisions de fiabilit, tableau d'ANOVA, coefficients de corrlation intra-classe, T2 d'Hotelling et test d'additivit de Tukey.
Modles : Les modles suivants de fiabilit sont disponibles :

Alpha (Cronbach) : Il s'agit d'un modle de cohrence interne, fond sur la

corrlation moyenne entre lments.


Split-half : Ce modle fractionne l'chelle en deux et examine la corrlation

entre les deux parties.


Guttman : Ce modle calcule les limites minimales de Guttman pour une fiabilit

vraie.

561

562 Chapitre 37

Parallle : Ce modle part de l'hypothse que tous les lments ont des variances

gales et des variances d'erreur gales en cas de rplication.


Parallle strict : Ce modle se fonde sur les mmes hypothses que le modle

parallle mais envisage galement que tous les lments ont la mme moyenne.

Remarques sur les donnes de l'analyse de fiabilit


Donnes : Les donnes peuvent tre dichotomiques, ordinales ou constituer des

intervalles, mais elles doivent tre codes en numrique.


Hypothses : Les observations doivent tre indpendantes, les erreurs ne doivent pas

tre corrles entre lments. Chaque paire d'lments doit avoir une distribution gaussienne bivarie. Les chelles doivent tre additives, de sorte que chaque lment est linairement reli au total.
Procdures apparentes : Si vous souhaitez explorer la dimensionnalit des lments

de votre chelle (pour voir si plusieurs lments de base sont ncessaires au modle des calculs), utilisez Analyse factorielle ou Positionnement multidimensionnel. Pour identifier des groupes homognes de variables, vous pouvez vous servir de la classification hirarchique pour classer les variables.

Echantillon de rsultat
Figure 37-1 Rsultat de fiabilit
Moyenne 1. 2. 3. 4. Aucune Ennui Critiques Collgues .4868 .5022 .5033 .5287 Ecart-type Observations .5001 .5003 .5003 .4995 906.0 906.0 906.0 906.0

563 Analyse de fiabilit

Matrice de corrlation Aucune Aucune Ennui Critiques Collgues 1.0000 .8150 .8128 .7823 Ennui 1.0000 .8256 .8068 Critiques Collgues

1.0000 .8045

1.0000

Coefficients de fiabilit Alpha = .9439

4 items Alpha d'item standardis = .9439

Obtenir une analyse de fiabilit


E A partir du menu, slectionnez : Analyse Echelle Analyse de la fiabilit... Figure 37-2 Bote de dialogue Analyse d'items

E Slectionnez deux variables (lments) au moins en tant que composants potentiels

d'une chelle additive.


E Slectionnez un modle dans la liste droulante Modle.

564 Chapitre 37

Statistiques de l'analyse de fiabilit


Figure 37-3 Bote de dialogue Analyse d'items : Statistiques

Vous pouvez slectionner les diffrentes statistiques dcrivant votre chelle et vos lments. Les statistiques mises par dfaut regroupent le nombre d'observations, le nombre d'lments et les prvisions de fiabilit de la faon suivante :

Modles alpha : Coefficient alpha. Pour les donnes dichotomiques, il s'agit d'un quivalent du coefficient Kuder-Richardson 20 (KR20). Modles Split-half : Corrlation entre les sous-chelles, fiabilit Split-half de Guttman, fiabilit de Spearman-Brown (longueur gale ou ingale) et coefficient alpha pour chaque moiti. Modles de Guttman : Coefficients de fiabilit lambda 1 lambda 6. Modles parallle et parallle strict: test de fiabilit du modle, estimation de la variance de l'erreur, variance commune et relle, estimation de la corrlation commune entre lments, estimation de la fiabilit et estimation de la fiabilit non biaise.

565 Analyse de fiabilit

Caractristiques pour : Produit des statistiques descriptives pour les chelles ou les lments sur les observations. Les options disponibles sont Item, Echelle et Echelle sans l'item.

Echelle sans l'item : Affiche les statistiques rcapitulatives en comparant chaque

item l'chelle compose des autres items. Les statistiques incluent la moyenne et la variance de l'chelle si l'item a t supprim de l'chelle, la corrlation entre l'item et l'chelle compose des autres items, et l'alpha de Cronbach si l'item a t supprim de l'chelle.
Principales statistiques : Fournit des statistiques descriptives de la distribution des

lments sur l'ensemble des lments dans l'chelle. Les options disponibles sont Moyennes, Variances, Covariances et Corrlations.

Moyennes : Statistiques rcapitulatives pour les moyennes d'lment. Les

moyennes d'lment minimale, maximale et intermdiaire sont affiches, ainsi que le rapport de la moyenne maximale la moyenne minimale.

Variances : Statistique rcapitulative des variances d'lment. Les valeurs de

variance maximale, minimale et moyenne sont affiches, ainsi que la plage et la variance des variances d'lment, et le rapport entre les variances d'lment maximale et minimale.

Covariances : Statistiques rcapitulatives pour les covariances d'lment. Les

covariances entre lments minimale, maximale et intermdiaire sont affiches, ainsi que l'intervalle et la variance des covariances entre lments, et le rapport de la covariance entre lments maximale la covariance minimale.

Corrlations : Statistiques rcapitulatives pour les corrlations d'lment. Les

corrlations entre lments minimale, maximale et intermdiaire sont affiches, ainsi que l'intervalle et la variance des corrlations entre lments, et le rapport de la corrlation entre lments maximale la corrlation minimale.
Cohrence inter-items : Produit des matrices de corrlations et de covariances entre

lments.
Tableau ANOVA : Produit des tests de moyennes gales. Les possibilits sont Aucune, Test F, Khi-deux de Friedman ou Khi-deux de Cochran.

Test F : Affiche un tableau d'analyse de la variance des mesures rptes.

566 Chapitre 37

Khi-deux de Friedman : Affiche le test de Friedman (khi-deux) et le coefficient

de concordance de Kendall. Cette option convient aux donnes organises sous forme de rangs. Le test du khi-deux remplace le test F habituel dans le tableau ANOVA.

Khi-deux de Cochran : Affiche la valeur Q de Cochran. Cette option est approprie

pour les donnes dichotomiques. Le Q de Cochran remplace le test F habituel dans le tableau ANOVA.
T-carr de Hotelling : Produit un test multivari bas sur l'hypothse nulle que tous les

lments sur l'chelle ont la mme moyenne.


Test d'additivit de Tukey : Produit un test bas sur l'hypothse qu'il n'y a pas

d'interaction multiplicative entre les lments.


Coefficient de corrlation intra-classe : Produit des mesures d'homognit ou de

cohrence des valeurs par observation.

Modle : Slectionnez le modle de calcul du coefficient de corrlation

intra-classe. Les modles disponibles sont Mixte deux facteurs, Alatoire deux facteurs, et Alatoire un facteur. Slectionnez le modle mixte deux facteurs lorsque les effets de population sont alatoires et les effets d'item sont fixes, le modle alatoire deux facteurs lorsque les effets de population et les effets d'item sont alatoires, et le modle alatoire un facteur lorsque les effets de population sont alatoires.

Type : Slectionnez le type d'index. Les types disponibles sont Homognit et

Cohrence absolue.
Intervalle de confiance : Spcifiez le niveau de l'intervalle de confiance. La valeur

par dfaut est 95 %.


Valeur test : Spcifiez la valeur hypothtique du coefficient pour le test

d'hypothse. Il s'agit de la valeur par rapport laquelle la valeur observe est compare. La valeur par dfaut est 0.

Fonctionnalits supplmentaires de la commande RELIABILITY


Le langage de commande SPSS vous permet aussi de :

Lire et analyser une matrice de corrlation.

567 Analyse de fiabilit

Enregistrer une matrice de corrlation analyser ultrieurement. Spcifier un fractionnement autre qu'en deux moitis gales quant au nombre d'lments pour la mthode Split-half.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Positionnement multidimensionnel

38

Chapitre

Le positionnement multidimensionnel tente de dterminer une structure dans un ensemble de mesures de distance entre objets ou observations. Pour cela, il affecte les observations des positions particulires dans un espace conceptuel ( deux ou trois dimensions gnralement) de telle sorte que les distances entre les points dans l'espace correspondent le mieux possible aux dissimilarits donnes. Dans la plupart des cas, les dimensions de cet espace conceptuel peuvent tre interprtes et utilises pour mieux comprendre les donnes. Si vous avez mesur objectivement les variables, vous pouvez utilisez le positionnement multidimensionnel comme technique de factorisation (le Positionnement multidimensionnel calcule pour vous les distances partir des donnes multivaries, le cas chant). Le positionnement multidimensionnel peut galement s'appliquer des estimations subjectives de dissimilarit entre objets ou concepts. D'autre part, le positionnement multidimensionnel peut grer les informations de dissimilarit provenant de plusieurs sources, comme c'est le cas lorsqu'il y a plusieurs indicateurs ou plusieurs rpondants au questionnaire.
Exemple : Comment les gens peroivent-ils les relations entre diffrentes voitures ? Si les donnes que vous obtenez de vos rpondants indiquent des valuations de similarit entre diffrentes modles, le positionnement multidimensionnel peut servir identifier les dimensions qui dcrivent les perceptions des consommateurs. Vous pouvez trouver, par exemple, que le prix et la taille du vhicule dfinissent un espace deux dimensions qui tient compte des similarits reportes par les rpondants. Statistiques : Pour chaque modle : matrice des donnes, positionnement optimis des donnes de la matrice, stress S (de Young), stress S (de Kruskal), RSQ, coordonnes des stimuli, stress moyen et RSQ pour chaque stimulus (modles RMDS). Pour les modles des diffrences individuelles : pondrations des sujets et indice de singularit pour chaque sujet. Pour chaque matrice dans les modles de positionnement multidimensionnel rpliqus : stress et RSQ pour chaque stimulus. Diagrammes :

569

570 Chapitre 38

coordonnes des stimulus ( deux ou trois dimensions), diagramme de dispersion des disparits par rapport aux distances.

Remarques sur les donnes du positionnement multidimensionnel


Donnes : Si vos donnes sont dissemblables, toutes les dissemblances doivent tre

quantitatives et mesures avec les mmes units et chelles. Si vos donnes sont multivaries, les variables peuvent tre quantitatives, binaires mais peuvent aussi tre des donnes d'effectif. Le positionnement des variables est un enjeu de taille : les diffrences de positionnement peuvent affecter votre solution. Si vos variables prsentent de grandes diffrences de positionnement (par exemple, si une variable est mesure en dollar et l'autre en anne), vous devez envisager de les standardiser (et cela automatiquement par la procdure de positionnement multidimensionnel).
Hypothses : La procdure de positionnement multidimensionnel est relativement

indpendante de toute hypothse de distribution. Assurez-vous que vous avez slectionn le niveau de mesure appropri (ordinal, intervalle ou rapport) dans les options afin de garantir la justesse des rsultats.
Procdures apparentes : Si votre but est la factorisation, vous pouvez galement

envisager l'analyse factorielle, plus particulirement si vos donnes sont quantitatives. Si vous souhaitez identifier des groupes d'observations similaires, envisagez de complter votre analyse par positionnement multidimensionnel avec une analyse des nues dynamiques ou une analyse de la classification hirarchique.

Obtenir une analyse par positionnement multidimensionnel


E A partir du menu, slectionnez : Analyse Echelle Positionnement multidimensionnel...

571 Positionnement multidimensionnel Figure 38-1 Bote de dialogue Positionnement multidimensionnel

E Dans Distances, slectionnez Donnes en matrice(s) ou Calcules partir des donnes. E Si vos donnes sont des distances, vous devez slectionner au moins quatre variables numriques pour l'analyse, et vous pouvez cliquer sur Forme pour indiquer la forme

de la matrice de distances.
E Si vous souhaitez que SPSS cre des distances avant de les analyser, vous devez slectionner au moins une variable numrique, puis cliquer sur Mesure pour indiquer

le type de mesure de distance souhait. Vous pouvez crer des matrices distinctes pour chaque modalit d'une variable de regroupement (numrique ou alphanumrique). Pour cela, dplacez cette variable dans la liste Matrices individuelles pour.

Forme des donnes du positionnement multidimensionnel


Figure 38-2 Bote de dialogue Positionnement multidimensionnel : Forme des donnes

572 Chapitre 38

Si votre fichier de travail reprsente les distances au sein d'un ensemble d'objets, ou entre deux ensembles d'objets, vous devez indiquer la forme de votre matrice de donnes afin d'obtenir des rsultats corrects. Choisir une possibilit : Matrice carre symtrique, Matrice carre asymtrique ou Matrice rectangulaire. Remarque : Vous pouvez slectionner Carr symtrique si la bote de dialogue Modle indique une conditionnalit de ligne.

Positionnement multidimensionnel : crer une mesure


Figure 38-3 Bote de dialogue Positionnement multidimensionnel : Calcul de l'indice de dissimilarit

Le positionnement multidimensionnel utilise les donnes de dissimilarit pour crer une solution de codage. Si vos donnes sont multivaries (valeurs des variables mesures), vous devez crer des donnes de dissimilarit afin de calculer une solution de positionnement multidimensionnel. Vous pouvez spcifier les dtails de cration de mesures de dissimilarit partir de vos donnes.
Mesure : Vous permet de spcifier la mesure de dissimilarit adapte votre analyse.

Slectionnez une possibilit dans le groupe Mesure correspondant votre type de donnes, puis slectionnez l'une des mesures dans la liste droulante correspondant ce type de mesure. Les possibilits sont :

Intervalle : Distance Euclidienne, Carr de la distance Euclidienne, Distance de

Tchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.

573 Positionnement multidimensionnel

Compter: Distance du Khi-deux ou Distance du phi-deux. Binaire : Distance Euclidienne, Carr de la distance Euclidienne, Ecart de taille,

Diffrence de motif, Variance ou Lance et Williams.


Crer une matrice de distances : Vous permet de choisir l'unit d'analyse. Les possibilits sont Par variables ou Par observations. Transformer les valeurs : Dans certains cas, comme lorsque les variables sont mesures selon des chelles trs diffrentes, vous voudrez peut-tre standardiser des valeurs avant de calculer les proximits (ne s'applique pas aux donnes binaires). Slectionnez une mthode de standardisation dans la liste droulante Standardiser (si la standardisation n'est pas ncessaire, slectionnez Aucune).

Modle de positionnement multidimensionnel


Figure 38-4 Bote de dialogue Positionnement multidimensionnel : Modle

Une estimation correcte d'un modle de positionnement multidimensionnel dpend des aspects des donnes et du modle lui-mme.
Niveau de mesure : Vous permet de spcifier le niveau de vos donnes. Les possibilits

sont Ordinales, Intervalle ou Rapport. Si vos variables sont ordinales, la slection de l'option Dlier des observations lies demande qu'elles soient traites en tant que variables continues, de telle sorte que les liens (mmes valeurs pour des observations diffrentes) soient rsolus de manire optimale.

574 Chapitre 38

Conditionnalit : Vous permet de spcifier les comparaisons pertinentes. Les

possibilits sont Matrice, Ligne et Inconditionnel.


Dimensions : Vous permet de spcifier la dimensionnalit de la ou des solutions de

positionnement. Une seule solution est calcule pour chaque nombre de l'intervalle. Indiquez des nombres entiers entre 1 et 6. La valeur minimale 1 n'est autorise que si vous slectionnez l'option Distance Euclidienne comme modle de positionnement. Pour n'obtenir qu'une seule solution, indiquez le mme nombre en tant que minimum et maximum.
Modle de positionnement : Vous permet de spcifier les hypothses sous lesquelles le positionnement est effectu. Les possibilits existantes sont Distance Euclidienne ou Distance Euclidienne des diffrences individuelles (connue galement en tant que INDSCAL). Pour le modle Distance Euclidienne des diffrences individuelles, vous pouvez slectionner l'option Permet la pondration ngative, si cela convient vos donnes.

Positionnement multidimensionnel : Options


Figure 38-5 Bote de dialogue Positionnement multidimensionnel : Options

575 Positionnement multidimensionnel

Vous pouvez spcifier les options de votre analyse par Positionnement multidimensionnel :
Afficher : Vous permet d'afficher les diffrents types d'affichage. Les options possibles sont Diagrammes des stimuli, Diagrammes des sujets, Matrice des donnes et Rcapitulatif des options du modle. Critres : Vous permet de dterminer quand l'itration doit s'interrompre. Pour

modifier les valeurs par dfaut, entrez des valeurs pour la Convergence du stress S, le Minimum du stress S et le Maximum des itrations.
Traiter les dissimilarits infrieures n comme des valeurs manquantes : Ces distances

sont exclues de l'analyse.

Fonctions supplmentaires de la commande Positionnement multidimensionnel


Le langage de commande SPSS vous permet aussi de :

Utiliser trois modles supplmentaires, ASCAL, AINDS et GEMSCAL dans la documentation relative au Positionnement multidimensionnel. Effectuer des transformations polynomiales sur l'intervalle et les donnes de type ratio. Analyser les similarits (plutt que les distances) avec des donnes ordinales. Analyser les donnes nominales. Enregistrer diverses matrices de coordonnes et de pondration dans des fichiers et les relire pour l'analyse. Contraindre le dpliage multidimensionnel.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Statistiques de ratio

39

Chapitre

La procdure Statistiques de ratio permet d'obtenir la liste exhaustive des statistiques rcapitulatives qui servent dcrire le rapport entre deux variables d'chelle. Vous pouvez trier le rsultat sur la base des valeurs d'une variable de regroupement, dans l'ordre croissant ou dcroissant. Vous pouvez supprimer le rapport des statistiques de ratio dans le document de sortie et enregistrer les rsultats dans un fichier externe.
Exemple : Le rapport existant entre le prix estimatif et le prix de vente des maisons est-il uniforme dans chacun de ces cinq comts ? D'aprs les rsultats, vous pouvez conclure que la distribution des rapports varie considrablement d'un comt l'autre. Statistiques : Mdiane, moyenne, moyenne pondre, intervalles de confiance,

coefficient de dispersion (COD), coefficient de variation avec mdiane centre, coefficient de variation avec moyenne centre, diffrentiel li au prix (PRD), cart type, cart absolu moyen (AAD), intervalle, valeurs minimale et maximale, et index de concentration calculs pour un intervalle ou un pourcentage dfini par l'utilisateur dans le rapport mdian.

Remarque sur les donnes des statistiques de ratio


Donnes : Utilisez des codes numriques ou alphanumriques courts pour coder les

variables de regroupement (mesures de niveau nominal ou ordinal).


Hypothses : Vous devez utiliser des variables d'chelle acceptant les valeurs positives

pour les variables qui dfinissent le numrateur et le dnominateur du rapport.

577

578 Chapitre 39

Pour obtenir des statistiques de ratio


E A partir du menu, slectionnez : Analyse Statistiques descriptives Ratio... Figure 39-1 Bote de dialogue Statistiques de ratio

E Slectionnez la variable du numrateur. E Slectionnez la variable du dnominateur.

Sinon, vous pouvez :


Slectionner une variable de regroupement et prciser l'ordre de prsentation des groupes dans le rsultat. Dcider d'afficher ou non les rsultats dans le Viewer. Choisir ou non d'enregistrer les rsultats dans un fichier externe en vue d'une utilisation ultrieure, et prciser le nom du fichier dans lequel les rsultats sont enregistrs.

579 Statistiques de ratio

Statistiques de ratio
Figure 39-2 Bote de dialogue Statistiques

Tendance centrale : Les mesures de tendance centrale sont des statistiques qui

dcrivent la distribution des rapports.


Mdiane : La valeur telle que le nombre de ratios infrieurs cette valeur est

identique au nombre de ratios suprieurs cette valeur.


Moyenne : Rsultat de la somme des ratios divise par le nombre total de ratios. Moyenne pondre : Rsultat de la division de la moyenne du numrateur par la

moyenne du dnominateur. Correspond galement la moyenne des ratios pondre par le dnominateur.

Intervalles de confiance : Affiche les intervalles de confiance de la moyenne,

de la mdiane et de la moyenne pondre (si demande). Affectez une valeur suprieure ou gale 0, et infrieure 100 au niveau de confiance.
Dispersion : Ces statistiques permettent de mesurer le degr de variation, ou de rpartition, au niveau des valeurs observes.

AAD : L'cart absolu moyen est gal la somme des carts absolus des ratios

relatifs la mdiane, divise par le nombre total de ratios.

580 Chapitre 39

COD : Le coefficient de dispersion rsulte de l'expression de l'cart moyen absolu

en pourcentage de la mdiane.
PRD : Le diffrentiel li au prix, ou index de rgressivit, rsulte de la division de

la moyenne par la moyenne pondre.


Mdiane centre COV : Le coefficient de variation avec mdiane centre rsulte

de l'expression de la racine de la moyenne des carrs de l'cart par rapport la mdiane en pourcentage de la mdiane.
Moyenne centre COV : Le coefficient de variation avec moyenne centre rsulte de

l'expression de l'cart type en tant que pourcentage de la moyenne.

Ecart type : L'cart type est la racine carre positive de la somme des carrs des

carts des ratios relatifs la moyenne divise par le nombre total des ratios moins un.

Intervalle : Rsulte de la soustraction du ratio minimal au ratio maximal. Minimum : Ratio le plus petit. Maximum : Ratio le plus grand.

Index de concentration : Le coefficient de concentration mesure le pourcentage des ratios compris dans un intervalle. Vous pouvez le calculer de deux manires :

Ratios entre : Dans ce cas, vous dfinissez l'intervalle de manire explicite en

prcisant les valeurs minimale et maximale. Entrez les valeurs des proportions infrieure et suprieure, puis cliquez sur Ajouter pour obtenir un intervalle.

Ratios dans : Dans ce cas, vous dfinissez l'intervalle de manire implicite

en indiquant le pourcentage de la mdiane. Entrez une valeur comprise entre 0 et 100, et cliquez sur Ajouter. La limite infrieure de l'intervalle est gale (1 0,01valeur)mdiane et la limite suprieure est gale (1 + 0,01valeur)mdiane.

Prsentation de l'utilitaire de diagramme

40

Chapitre

Les procdures du menu Diagrammes et de nombreuses procdures du menu Analyse permettent de crer des diagrammes et des graphiques haute rsolution. Ce chapitre prsente l'utilitaire de diagramme. Les diagrammes interactifs, disponibles dans le sous-menu Interactif du menu Diagrammes, sont abords dans le manuel SPSS Interactive Graphics.

Cration et modification d'un diagramme


Avant de crer un diagramme, vous devez disposer de donnes dans l'diteur de donnes. Vous pouvez saisir les donnes directement dans l'diteur de donnes, ouvrir un fichier de donnes dj enregistr ou lire une feuille de calcul, un fichier de donnes dlimit par des tabulations ou un fichier de base de donnes. L'lment Didacticiel du menu Aide propose des exemples en ligne de cration et de modification de diagramme, et le systme d'aide en ligne explique comment crer et modifier tous les types de diagramme.

Cration du diagramme
Une fois les donnes entres dans l'diteur de donnes, vous pouvez crer un diagramme en slectionnant un type dans le menu Diagrammes. Une bote de dialogue de diagramme apparat.

581

582 Chapitre 40 Figure 40-1 Bote de dialogue de diagramme

La bote de dialogue contient des icnes correspondant aux divers types de diagramme et la liste des structures de donnes. Cliquez sur Dfinir pour ouvrir une bote de dialogue de dfinition de diagramme semblable celle-ci.
Figure 40-2 Bote de dialogue de dfinition du diagramme

583 Prsentation de l'utilitaire de diagramme

Cette bote de dialogue permet de slectionner les variables adaptes au diagramme et de choisir les options voulues. Pour plus d'informations sur les divers choix proposs, cliquez sur Aide. Le diagramme apparat dans le Viewer.
Figure 40-3 Diagramme dans le Viewer

Modification d'un diagramme


Pour modifier un diagramme, double-cliquez n'importe o dans le diagramme affich dans le Viewer. Le diagramme apparat dans l'diteur de diagrammes.

584 Chapitre 40 Figure 40-4 Diagramme initial dans l'diteur de diagrammes

Vous pouvez modifier tout lment du diagramme ou choisir un autre type de diagramme pour reprsenter les mmes donnes. Pour ajouter, afficher ou masquer des lments, utilisez les menus de l'diteur de diagrammes.
Pour modifier un lment de diagramme :
E Slectionnez l'lment modifier. E A partir du menu, slectionnez : Affichage Proprits

La fentre Proprits apparat. Les onglets de la fentre Proprits dpendent des choix effectus. L'aide en ligne explique comment afficher les onglets ncessaires.

585 Prsentation de l'utilitaire de diagramme Figure 40-5 Fentre Proprits

Les modifications suivantes sont frquemment apportes :


Modification du texte du diagramme. Modification de la couleur et du motif de remplissage des btons. Ajout de texte au diagramme (par exemple, un titre ou une annotation). Modification de l'emplacement de la ligne d'origine des btons.

Remplacement de la bordure transparente du cadre extrieur par une bordure noire.

Ci-dessous figure un diagramme modifi.

586 Chapitre 40 Figure 40-6 Diagramme modifi

Les modifications apportes au diagramme sont enregistres lorsque vous fermez la fentre de diagramme. Le diagramme modifi apparat alors dans le Viewer.

Options globales de dfinition du diagramme


Lorsque vous dfinissez un diagramme, la bote de dialogue prvue cet effet contient gnralement les boutons Titres et Options, ainsi qu'un groupe Modle. Ces options globales sont disponibles avec la plupart des diagrammes, quel que soit leur type. Elles ne sont toutefois pas proposes pour les diagrammes P-P, Q-Q, squentiels ou les diagrammes de sries chronologiques.

587 Prsentation de l'utilitaire de diagramme Figure 40-7 Bote de dialogue de dfinition du diagramme

Cliquez sur Titres pour spcifier des titres, des sous-titres ou des notes de bas de page. Vous pouvez cliquer sur Options pour contrler le traitement des valeurs manquantes de la plupart des diagrammes et des tiquettes d'observation des diagrammes de dispersion. Vous pouvez galement appliquer un modle d'attributs prcdemment slectionns lors de la dfinition du diagramme ou aprs la cration du diagramme. Les sections suivantes expliquent comment dfinir ces caractristiques lors de la dfinition du diagramme.

Titres, sous-titres et notes de bas de page


Lors de la dfinition initiale du diagramme, vous pouvez spcifier deux lignes de titre, une ligne de sous-titre et deux lignes de note de bas de page. Pour spcifier des titres ou des notes de bas de page lors de la dfinition d'un diagramme, cliquez sur Titres dans la bote de dialogue de dfinition du diagramme. La bote de dialogue Titres apparat.

588 Chapitre 40 Figure 40-8 Bote de dialogue Titres

Chaque ligne peut compter jusqu' 72 caractres. Toutefois, le nombre de caractres accept sur le diagramme lui-mme dpend de la police et de la taille choisies. Par dfaut, la plupart des titres sont aligns gauche et tronqus droite s'ils sont trop longs. Les titres des diagrammes en secteurs sont quant eux centrs par dfaut et tronqus des deux cts s'ils sont trop longs. Les titres, les sous-titres et les notes de bas de page sont reprsents par des zones de texte dans l'diteur de diagrammes. Dans l'diteur de diagrammes, vous pouvez ajouter ou supprimer des zones de texte, et modifier leur contenu, leur police, leur taille ou leur justification.

Options
La bote de dialogue Options propose des options de traitement des valeurs manquantes et d'affichage des tiquettes d'observation. Elle est accessible via le bouton Options de la bote de dialogue de dfinition du diagramme.
Figure 40-9 Options

589 Prsentation de l'utilitaire de diagramme

La disponibilit de chaque option dpend des choix effectus prcdemment. Les options des valeurs manquantes ne sont pas proposes avec les diagrammes utilisant des valeurs d'observations individuelles ou avec les histogrammes. L'option d'affichage des tiquettes d'observation n'est disponible qu'avec les diagrammes de dispersion qui disposent d'une variable slectionne pour les tiquettes d'observation.
Valeurs manquantes : Si vous avez slectionn des rcapitulatifs de variables distinctes

pour un diagramme qualitatif ou si vous crez un diagramme de dispersion, vous pouvez choisir l'une des options suivantes pour exclure les observations comportant des valeurs manquantes :

Exclure toute observation incomplte : Si l'une des variables du diagramme

comporte une valeur manquante pour une observation donne, l'observation est intgralement exclue du diagramme.

Exclure les observations variable par variable : Si une variable slectionne

comporte des valeurs manquantes, les observations contenant ces valeurs manquantes sont exclues lors de l'analyse de la variable. Pour connatre la diffrence entre les exclusions de valeurs manquantes de type Exclure toute observation incomplte et Exclure les observations variable par variable, tudiez les figures suivantes qui reprsentent le diagramme en btons correspondant chacune des deux options.
Figure 40-10 Exclusion des valeurs manquantes de toute observation incomplte

590 Chapitre 40 Figure 40-11 Exclusion des valeurs manquantes des observations variable par variable

Ces diagrammes ont t crs partir d'une version du fichier Employee data.sav. Cette dernire a t modifie afin que les variables du salaire actuel et du type de poste occup contiennent quelques valeurs manquantes par dfaut (vides). Dans d'autres observations, la valeur 0 a t saisie et dfinie comme manquante. L'option Afficher les groupes dfinis par des valeurs manquantes tant slectionne pour les deux diagrammes, la modalit Manquant est ajoute aux types de poste affichs. Dans chaque diagramme, les valeurs de la fonction rcapitulative Nombre d'observations figurent dans les tiquettes des btons. 26 observations des deux diagrammes comportent une valeur manquante par dfaut pour le type de poste occup, et 13 la valeur manquante utilisateur 0. Dans le diagramme avec exclusion de toute observation incomplte, le nombre d'observations est identique pour les deux variables de chaque regroupement de btons. En effet, si une valeur est manquante, l'observation est exclue pour toutes les variables. Dans le diagramme avec exclusion des observations variable par variable, le nombre d'observations non manquantes de chaque variable d'une modalit donne est reprsent indpendamment des valeurs manquantes dans les autres variables. L'option suivante est galement disponible pour les valeurs manquantes :
Afficher les groupes dfinis par des valeurs manquantes : Si des valeurs manquantes

figurent dans les donnes des variables utilises pour dfinir des modalits ou des sous-groupes, les valeurs manquantes utilisateur (valeurs identifies

591 Prsentation de l'utilitaire de diagramme

comme manquantes par l'utilisateur) et les valeurs manquantes par dfaut sont regroupes dans la modalit Manquant. La modalit Manquant figure sur l'axe de modalits ou dans la lgende, et se traduit par exemple par l'ajout d'un bton supplmentaire, d'un secteur dans les diagrammes en secteurs ou d'une bote dans les botes moustaches. Dans les diagrammes de dispersion, les valeurs manquantes ajoutent une modalit Manquant l'ensemble des marques. S'il n'existe aucune valeur manquante, la modalit Manquant n'apparat pas. Si vous avez slectionn cette option et que vous ne voulez plus afficher la modalit Manquant une fois le diagramme trac, slectionnez ce dernier, puis choisissez Proprits dans le menu Modifier. L'onglet Modalits permet de dplacer vers la liste Exclues les modalits masquer. Cette option n'est pas disponible avec les diagrammes de dispersion superposs ou mono-srie, dans lesquels les donnes sont rcapitules selon des variables distinctes. La dernire option de la bote de dialogue Options permet de contrler l'tat des tiquettes d'observation lors de l'affichage initial d'un diagramme de dispersion.

Afficher le diagramme avec les tiquettes d'observation : Lorsque cette option est

slectionne, toutes les tiquettes d'observation figurent sur le diagramme de dispersion cr. Par dfaut, elle est dslectionne. Autrement dit, le diagramme de dispersion affich par dfaut ne comporte aucune tiquette. Si vous slectionnez cette option, les tiquettes d'observation risquent de se chevaucher.

Modles de diagramme
Vous pouvez appliquer la plupart des attributs et des lments textuels d'un diagramme un autre. Il est possible de modifier un diagramme, de l'enregistrer en tant que modle, puis d'utiliser le modle pour crer toute une srie de diagrammes similaires. Pour utiliser un modle lors de la cration d'un diagramme, slectionnez l'option Utiliser les spcifications du graphique de (dans le groupe Modle de la bote de dialogue de dfinition du diagramme) et cliquez sur Fichier. Une bote de dialogue standard de slection de fichier apparat. Pour appliquer un modle un diagramme qui figure dj dans une fentre de diagramme, slectionnez dans les menus :
Fichier Appliquer modle de diagramme...

592 Chapitre 40

Une bote de dialogue standard de slection de fichier apparat. Slectionnez le fichier utiliser comme modle. Si vous tes en train de crer un diagramme, le nom du fichier slectionn apparat dans le groupe Modle lorsque vous revenez dans la bote de dialogue de dfinition du diagramme. Les modles permettent d'emprunter le format d'un diagramme et de l'appliquer au diagramme en cours de cration. En gnral, toutes les informations de formatage de l'ancien diagramme applicables au nouveau diagramme s'appliquent automatiquement. Par exemple, si l'ancien diagramme est un diagramme en btons juxtaposs dont les btons ont t colors en vert et en jaune, et le nouveau un diagramme curviligne multiple, les lignes de ce dernier seront vertes et jaunes. Si l'ancien diagramme est un diagramme en btons simples comportant des ombrages, et le nouveau un diagramme curviligne simple, les lignes de ce dernier n'auront pas d'ombrages car ceux-ci ne s'appliquent pas aux diagrammes curvilignes. Si le diagramme modle comporte des titres, mais pas le nouveau diagramme, les titres du diagramme modle sont repris. Si des titres sont dfinis dans le nouveau diagramme, ils remplacent ceux du diagramme modle.
Pour crer un modle de diagramme
E Crez un diagramme. E Modifiez le diagramme afin qu'il contienne les attributs souhaits dans le modle. E A partir des menus de l'diteur de diagrammes, slectionnez : Fichier Enregistrer modle de diagramme... E Dans la bote de dialogue Enregistrer le modle de diagramme, indiquez les

caractristiques du diagramme enregistrer dans le modle. L'aide en ligne dcrit ces paramtres en dtail.
E Cliquez sur Poursuivre. E Entrez le nom de fichier et l'emplacement du nouveau modle. L'extension du modle

est .sgt.

Courbes ROC

41

Chapitre

Cette procdure constitue un moyen efficace d'valuer les performances des mthodes de classement ne mettant en uvre qu'une seule variable deux modalits et utilises pour la classification des sujets.
Exemple : L'intrt de la banque est donc de classer correctement les clients en

modalits, savoir ceux qui assumeront ou non le remboursement de leur prt. Des mthodes particulires sont en cours de dveloppement afin de les aider dans leur choix. Les courbes ROC peuvent tre utilises pour valuer le mode de fonctionnement optimal de ces mthodes.
Statistiques : La zone infrieure la courbe ROC comporte un intervalle de confiance

ainsi que les coordonnes de cette courbe. Diagrammes : Courbe ROC


Mthodes : L'estimation de la zone situe sous la courbe ROC peut tre calcule de

faon paramtrique ou non l'aide du modle exponentiel bingatif.

Remarques sur les donnes de la courbe ROC


Donnes : Les variables de test sont quantitatives. Elles se composent souvent des

probabilits issues d'une analyse discriminante, d'une rgression logistique ou des scores indiqus sur une chelle arbitraire et spcifiant la force de conviction d'un indicateur lorsqu'un sujet se rapporte l'une ou l'autre des modalits. La variable d'tat peut tre d'un type quelconque et indique la vritable modalit laquelle un sujet appartient. La valeur de la variable d'tat indique la modalit considrer comme positive.
Hypothses : Les nombres croissants d'une chelle d'indicateurs confirment que le

sujet appartient une modalit, tandis que les nombres dcroissants d'une chelle confirment qu'il appartient une autre modalit. L'utilisateur doit choisir la direction

593

594 Chapitre 41

positive. On suppose galement que la vritable modalit laquelle chaque sujet appartient est connue.

Echantillon de rsultat
Figure 41-1 Rsultat de la courbe ROC

595 Courbes ROC

Pour obtenir une courbe ROC


E A partir du menu, slectionnez : Graphes Courbe ROC... Figure 41-2 Bote de dialogue Courbe ROC

E Slectionnez une ou plusieurs variables de probabilit de test. E Slectionnez une variable d'tat. E Identifiez la valeur positive de la variable d'tat.

596 Chapitre 41

Courbe ROC : Options


Figure 41-3 Bote de dialogue Courbe ROC : Options

Vous pouvez indiquer les options suivantes pour votre analyse ROC :
Classification : Permet de spcifier si la valeur du point de csure doit tre incluse

ou exclue lors d'une classification positive. La valeur n'a pas de consquence sur le rsultat.
Direction du test : Permet de spcifier la direction de l'chelle en fonction de la

modalit positive.
Paramtres pour une erreur standard de zone : Vous permet de spcifier la mthode

utilise pour estimer l'erreur standard de la zone situe sous la courbe. Les mthodes disponibles sont des valeurs exponentielles non paramtriques et bi-ngatives. Vous permet galement de dfinir le niveau de l'intervalle de confiance. Les valeurs de l'intervalle se situent entre 50,1 % et 99,9 %.
Valeurs manquantes : Vous permet de spcifier comment traiter les valeurs manquantes.

Outils

42

Chapitre

Ce chapitre dcrit les fonctions du menu Outils et vous indique comment rordonner les listes de variables cible en utilisant les menus systmes de Windows.

Informations de la variable
La bote de dialogue Variables affiche des informations sur la dfinition des variables pour les variables couramment slectionnes, y compris :

le format des Donnes l'tiquette Variable les valeurs manquantes spcifies les tiquettes Valeurs

Figure 42-1 la bote de dialogue Variables

Aller : Permet d'accder la variable slectionne dans la fentre de l'diteur de

donnes.

597

598 Chapitre 42

Coller : Permet de coller les variables slectionnes dans la fentre syntaxe dsigne

l'emplacement du curseur. (Non disponible dans la version Education). Pour modifier les dfinitions de variables, utilisez l'affichage des variables dans l'diteur de donnes.

Pour obtenir des informations sur les variables


E A partir du menu, slectionnez : Outils Variables... E Slectionnez la variable dont vous souhaitez afficher les informations de dfinition

variable.

Commentaires de fichier de donnes


Vous pouvez inclure des commentaires descriptifs dans le fichier de donnes. Pour les fichiers de donnes au format SPSS, les commentaires sont enregistrs avec le fichier de donnes. Pour ajouter, modifier, supprimer ou afficher les commentaires de fichier de donnes :
E A partir du menu, slectionnez : Outils Commentaires de fichier de donnes... E Pour afficher les commentaires dans le Viewer, slectionnez Afficher les commentaires dans la sortie.

Les commentaires ne sont pas limits en longueur, mais ne doivent pas dpasser 80 octets (en gnral, cela correspond 80 caractres dans les langues sur un octet) par ligne. Les lignes sont automatiquement interrompues par un renvoi la ligne suivante partir de 80 caractres. La police utilise pour afficher les commentaires est celle utilise pour les rsultats texte de manire donner une reprsentation fidle de l'affichage dans le Viewer.

599 Outils

Un cachet de date (la date actuelle entre parenthses) est automatiquement ajout la fin de la liste des commentaires ds que vous modifiez un commentaire ou que vous en ajoutez un. Ceci peut entraner des ambiguts au niveau des dates associes aux commentaires lorsque vous modifiez un commentaire ou que vous insrez un nouveau commentaire entre deux commentaires existants.

Groupes de Variables
Vous pouvez limiter le nombre de variables devant s'afficher dans les listes des variables source de la bote de dialogue. Pour cela, dfinissez et utilisez des groupes de variables. Ceci est particulirement utile pour les fichiers de donnes avec un grand nombre de variables. Les petits groupes de variables facilitent la recherche et la slection des variables pour votre analyse et peuvent aussi augmenter votre performance sur SPSS. Si votre fichier de donnes a un grand nombre de variables et si les botes de dialogue s'ouvrent lentement, le fait de rduire les listes source de botes de dialogue en sous-groupes de variables plus petits devrait permettre de rduire le temps ncessaire l'ouverture des botes de dialogue.

Dfinir des groupes de variables


La procdure Dfinir des groupes de variables cre des sous-groupes de variables pour permettre d'afficher les listes source de botes de dialogue.

600 Chapitre 42 Figure 42-2 Dfinir bote de dialogue Dfinir des groupes

Nom du groupe : Les noms de groupes peuvent contenir jusqu' 12 caractres. Tous

les caractres, y compris vides, peuvent tre utiliss. Les noms de Groupes sont indiffrents aux observations.
Variables du groupe : Toute combinaison de variables numriques, alphanumriques

et alphanumriques longues peuvent tre comprises dans un groupe. L'ordre des variables dans le groupe n'a pas d'effet sur l'ordre d'affichage des variables dans les listes source de la bote de dialogue. Une variable peut appartenir de multiples groupes.

Pour dfinir des groupes de variables


E A partir du menu, slectionnez : Outils Dfinir des groupes... E Slectionnez les variables inclure dans le groupe.

601 Outils E Saisir un nom de groupe (jusqu' 12 caractres). E Cliquez sur Ajouter.

Utiliser les groupes


La procdure Utiliser des groupes limite le nombre de variables affiches dans les listes source de la bote de dialogue aux groupes slectionns que vous avez dfinis.
Figure 42-3 Utiliser la bote de dialogue Dfinir des groupes

Groupes utiliss : Affiche les groupes utiliss pour produire les listes source de variables dans les botes de dialogue. Les variables apparaissent dans les listes source dans l'ordre alphabtique ou dans l'ordre du fichier. L'ordre des groupes et l'ordre des variables dans le groupe n'ont pas d'effet sur l'ordre des listes source de variables. Par dfaut, deux groupes dfinis par dfaut sont utiliss : ALLVARIABLES : Ce groupe contient toutes les variables du fichier de donnes, y

compris les nouvelles variables cres pendant une session.


NEWVARIABLES : Ce groupe contient seulement les nouvelles variables cres

pendant la session.

602 Chapitre 42

Vous pouvez enlever ces groupes de la liste et en slectionner d'autres, mais il doit y avoir au moins un groupe dans la liste. Si vous n'enlevez pas le groupe ALLVARIABLES de la liste des Groupes utiliss, tous les autres groupes que vous incluez ne sont pas significatifs.

Pour limiter les listes source de bote de dialogue des groupes de variables dfinis
E A partir du menu, slectionnez : Outils Utiliser des groupes... E Slectionnez les groupes de variables dfinis qui contiennent les variables que vous

souhaitez voir apparatre dans les listes source de la bote de dialogue.

Rordonner Listes Variables Cible


Les variables apparaissent dans les listes cible de la bote de dialogue dans l'ordre dans lequel elles sont slectionnes partir de la liste source. Si vous souhaitez modifier l'ordre des variables d'une liste cible mais que vous ne souhaitez pas dslectionner toutes les variables et les reslectionner dans le nouvel ordre vous pouvez faire remonter et redescendre les variables dans la liste cible en utilisant le menu systme dans le coin suprieur gauche de la bote de dialogue ( laquelle vous pouvez accder en cliquant sur la partie gauche de la barre de titre de la bote de dialogue).

603 Outils Figure 42-4 Menu systme de Windows avec rordonnance de la liste cible

Faire remonter slection : Fait remonter la ou les variables slectionnes d'une position

dans la liste destination.


Faire redescendre slection : Fait descendre la ou les variables slectionnes d'une

position dans la liste destination. Vous pouvez dplacer simultanment les variables multiples si elles sont attenantes (regroupes). Vous ne pouvez pas dplacer les groupes de variables non attenantes.

Options

43

Chapitre

Les commandes Options permettent de contrler un grand nombre de paramtres, y compris :


le journal de session qui enregistre toutes les commandes excutes dans chaque session ; l'ordre d'affichage des variables dans les listes source des botes de dialogue ; les lments affichs et masqus dans les nouveaux rsultats de sortie ; le modle de tableau pour les nouveaux tableaux pivotants et le modle de graphiques pour les nouveaux diagrammes interactifs ; les formats montaires personnaliss (devises); les fichiers et fonctions autoscript permettant de personnaliser la sortie.

Pour modifier les paramtres d'options


E A partir du menu, slectionnez : Affichage Options... E Cliquez sur les onglets correspondant aux paramtres que vous souhaitez modifier. E Modifiez les paramtres. E Cliquez sur OK ou sur Appliquer.

605

606 Chapitre 43

Options gnrales
Figure 43-1 Options : onglet Gnral

Listes de variables : Contrle l'affichage des variables dans botes de dialogue et botes

de liste. Vous pouvez afficher des noms de variables ou des tiquettes de variable. On peut afficher les variables dans l'ordre alphabtique ou dans l'ordre du fichier qui correspond l'ordre dans lequel elles interviennent dans le fichier de donnes (et dans lequel elles sont affiches dans la fentre Editeur de donnes). L'ordre d'affichage affecte seulement la liste des variables source. Les listes de variables cible reproduisent toujours l'ordre dans lequel les variables ont t slectionnes.
Journal de session : Fichier-journal de toutes les commandes excutes dans une session. Celui-ci comprend les commandes saisies et excutes dans les fentres de syntaxe, ainsi que les commandes gnres par les choix de bote de dialogue. Vous pouvez modifier le fichier-journal et rutiliser les commandes dans d'autres sessions. Vous pouvez activer ou dsactiver la fonction journal, ajouter au fichier-journal ou l'craser et slectionner le nom et l'emplacement du fichier-journal. Vous pouvez

607 Options

copier la syntaxe de commande partir du fichier-journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser avec le systme de production automatise. (La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student.)
Rpertoire temporaire : Contrle l'emplacement des fichiers temporaires crs

au cours d'une session. En mode distribu (disponible avec la version serveur), cette option n'affecte pas l'emplacement des fichiers de donnes temporaires. En mode distribu, l'emplacement des fichiers temporaires est contrl par la variable d'environnement SPSSTMPDIR, qui ne peut tre dfinie que sur l'ordinateur excutant la version serveur du programme. Si vous devez modifier l'emplacement du rpertoire temporaire, contactez votre administrateur systme.
Liste des fichiers rcemment utiliss : Cette procdure permet de contrler le nombre de fichiers rcemment utiliss qui apparaissent dans le menu Fichier. Ouvrir la fentre de syntaxe au dmarrage : Les fentres de syntaxe sont des fentres de fichier de texte utilises pour saisir, modifier, et excuter les commandes SPSS. Si vous travaillez frquemment avec la syntaxe de commande, slectionnez cette option pour ouvrir automatiquement une fentre de syntaxe au dbut de chaque session SPSS. Ceci est particulirement utile pour les utilisateurs avertis de SPSS qui prfrent travailler avec la syntaxe de commande plutt que les botes de dialogue. (non disponible avec la version Student). Pas d'affichage scientifique pour les petits nombres dans les tableaux : Supprime l'affichage scientifique pour les petites valeurs dcimales dans le rsultat. Les valeurs dcimales trs petites sont affiches au format suivant : 0 (ou 0,000). Type de Viewer au dmarrage : Contrle le type de Viewer utilis et le format de

rsultat. Le Viewer produit des tableaux pivotants interactifs et des diagrammes interactifs. Le Viewer en mode brouillon convertit les tableaux pivotants en sortie texte et les diagrammes en mtafichiers.
Units de mesure : Systme de mesure utilis (Points, Pouces, ou Centimtres) pour spcifier les attributs tels que les marges de cellules du tableau pivotant, les largeurs de cellules et l'espace d'impression entre les tableaux Langage : Contrle le langage utilis dans les rsultats. Ne s'applique ni au

rsultat texte simple, ni aux graphiques interactifs, ni aux cartes (disponible avec l'option Maps). La liste des langages disponibles dpend des fichiers de langage installs. De nombreux langages sont installs automatiquement lorsque

608 Chapitre 43

vous installez SPSS. Pour obtenir d'autres fichiers de langage, visitez le site http://www.spss.com/tech/downloads/base.htm. Remarque : Les scripts personnaliss fonds sur des chanes de texte propres un langage dans le rsultat risquent de ne pas tre excuts correctement lorsque vous modifiez le langage des rsultats. Pour plus d'informations, reportez-vous Options script , page 625.
Notification : Cette procdure contrle la faon dont SPSS notifie que votre excution

est termine et que les rsultats sont accessibles dans le Viewer.

Options Viewer
Les options d'affichage du rsultat avec l'explorateur affectent seulement le nouveau rsultat produit aprs modification de la configuration. Un rsultat dj affich dans le Viewer n'est pas affect par les changements de ces paramtres.
Figure 43-2 Onglet Viewer

609 Options

Etat initial rsultats : Cette procdure dtermine quels lments seront automatiquement affichs ou masqus chaque fois que vous excuterez une procdure et combien d'lments sont initialement aligns. Vous pouvez contrler l'affichage des lments suivants : Log, Avertissements, Remarques, Titre, Tableau pivotant, Diagramme, et Rsultat texte (sortie non affiche dans les tableaux pivotants). Vous pouvez galement dmarrer ou arrter l'affichage des commandes SPSS dans le journal. Vous pouvez copier la syntaxe de commande partir du journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser dans le systme de production automatis. (La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student.)

Remarque : Tous les lments de rsultat sont affichs aligns gauche dans le Viewer. Seul l'alignement des rsultats imprims est affect par les paramtres d'alignement. Les lments centrs et aligns droite sont identifis par un symbole situ au-dessus et gauche des lments en question.
Police du titre : Cette procdure permet de contrler le style de police, la taille, et

la couleur des titres de sortie.


Police du titre de la page : Cette procdure permet de contrler tous les styles de

police, la taille et la couleur des nouveaux titres de page et de ceux gnrs par la syntaxe de commande TITLE et SUBTITLE, ou crs dans le menu Insertion l'aide de l'option Nouveau titre de page.
Taille de page rsultats texte : Cette procdure permet de contrler la largeur de page dans la sortie de texte (exprime en nombre de caractres), ainsi que la longueur de page (exprime en nombre de lignes). Dans certaines procdures, certaines statistiques sont affiches seulement en format Large. Police rsultats texte : Police utilise pour la sortie de texte. Le rsultat texte SPSS

est prvu pour tre utilis dans une police monoespace ( espacement fixe). Si vous slectionnez une police qui n'est pas monoespace, le tableau de rsultats ne sera pas correctement align.

Options du Viewer en mode brouillon


Les options d'affichage des rsultats dans le Viewer affectent seulement le nouveau rsultat produit aprs modification des paramtres Un rsultat dj affich dans le Viewer n'est pas affect par les changements de ces paramtres.

610 Chapitre 43 Figure 43-3 Onglet Viewer

Afficher items rsultats : Contrle les lments afficher automatiquement chaque excution d'une procdure. Vous pouvez contrler l'affichage des lments suivants : Journal, Avertissement, Remarques, Titre, Rsultats en tableau (les tableaux pivotants sont convertis en sortie texte), Diagramme, et Rsultats texte (rsultats en sparation d'espace). Vous pouvez galement dmarrer ou arrter l'affichage des commandes dans le journal. Vous pouvez copier la syntaxe de commande partir du journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser dans le systme de production automatis. (La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student.) Sauts de page entre : Insre des sauts de page entre les rsultats partir de diffrentes

procdures et/ou entre des lments de rsultat individuels.


Police : Police utilise pour le nouveau rsultat. Seules les polices espacement

fixe (monoespaces) sont disponibles car le rsultat texte en sparation d'espace ne s'alignera pas correctement avec une police proportionnelle.

611 Options

Rsultats en tableau : Contrle