SPSS Base 12.

0 - Guide de l’utilisateur

®

Sommaire
1 Sommaire 1
Nouveautés de SPSS 12.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Fenêtres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Barre d'état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Noms de variables et étiquettes de variable dans les listes de boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Commande des boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Sous-boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Sélection de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Obtenir des informations sur les variables dans les boîtes de dialogue . . . . 11 Obtenir des informations sur les commandes des boîtes de dialogue . . . . . 12 Procédures de base dans l'analyse des données . . . . . . . . . . . . . . . . . . . . 13 Assistant statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 En savoir plus sur SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2

Obtention d'Aide

15

Utilisation du sommaire de l'aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Utilisation de l'index de l'aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Aide sur les commandes des boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . 17 Aide sur les termes utilisés dans les résultats . . . . . . . . . . . . . . . . . . . . . . . 18 Utilisation de l'option Etudes d'observation. . . . . . . . . . . . . . . . . . . . . . . . . 19 Copie de texte d'aide à partir d'une fenêtre contextuelle. . . . . . . . . . . . . . . 19

ix

3

Fichiers de données

21

Ouverture d'un fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Pour ouvrir un fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Types de fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Ouvrir les options de fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Lecture de fichiers Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Lecture d'autres fichiers Excel et de fichiers d'autres tableurs avec l'éditeur de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Lecture des fichiers dBASE avec l'éditeur de données . . . . . . . . . . . . . . . . 25 Lire des fichiers de base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Sélectionner une source de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Procédure d'entrée dans la base de données . . . . . . . . . . . . . . . . . . . . . . . 28 Sélectionner des champs de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Créer une requête de paramètre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Définition de variables (Assistant de capture de base de données) . . . . . . . 38 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Assistant de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Informations sur les fichiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Enregistrement des fichiers de données . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Pour enregistrer des fichiers de données modifiés . . . . . . . . . . . . . . . . . . . 54 Enregistrement de fichiers de données au format Excel . . . . . . . . . . . . . . . 54 Enregistrement de fichiers de données au format SAS . . . . . . . . . . . . . . . . 55 Pour enregistrer des fichiers de données sous des formats différents. . . . . 57 Enregistrement de données : Types de fichier de données . . . . . . . . . . . . . 58 Enregistrement de sous-ensembles de variables . . . . . . . . . . . . . . . . . . . . 60 Enregistrement de fichier : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Protection des données d'origine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Fichier actif virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

x

4

Mode d'analyse distribuée

67

Comparaison de l'analyse distribuée par rapport à l'analyse locale. . . . . . . 68

5

Editeur de données

81

Affichage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Affichage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Saisie de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Modification de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Aller à l'observation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Etat de la sélection de l'observation dans l'éditeur de données. . . . . . . . . 104 Options d'affichage de l'éditeur de données . . . . . . . . . . . . . . . . . . . . . . . 104 Impression de l'éditeur de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6

Préparation des données

107

Définition des propriétés de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Copie des propriétés de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Identification des observations dupliquées . . . . . . . . . . . . . . . . . . . . . . . . 124 Outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Regroupement de variables en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Génération automatique de modalités regroupées en bandes . . . . . . . . . . 135 Copie de modalités regroupées en bandes . . . . . . . . . . . . . . . . . . . . . . . . 137 Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

xi

7

Transformations de données

141

Calcul de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 Valeurs manquantes dans les fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . 145 Générer des nombres aléatoires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Compter occurrences des valeurs par observation . . . . . . . . . . . . . . . . . . 147 Recodage de valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Recodage de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Création de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Ordonner les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Recoder automatiquement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Transformation de données pour série chronologique. . . . . . . . . . . . . . . . 161

8

Gestion et transformations de fichiers

169

Trier les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Transposer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Fusionner des fichiers de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Ajouter des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Ajouter des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Agréger les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Scinder un fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 Sélectionner des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Pondérer les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 Restructuration des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

xii

9

Utilisation du résultat

217

Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Utilisation de résultats dans d'autres applications . . . . . . . . . . . . . . . . . . 226 Collage d'objets dans le Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Collage spécial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Collage d'objets d'une autre application dans le Viewer . . . . . . . . . . . . . . 231 Exporter résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 Impression de documents du Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 Enregistrement des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

10 Viewer en mode brouillon

251

Pour créer un résultat en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . 252 Contrôle du format du résultat en mode brouillon . . . . . . . . . . . . . . . . . . . 252 Attributs de polices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 Pour imprimer un résultat en mode brouillon. . . . . . . . . . . . . . . . . . . . . . . 257 Pour enregistrer une sortie du Viewer en mode brouillon . . . . . . . . . . . . . 259

11 Tableaux pivotants

261

Manipulation d'un tableau pivotant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 Utilisation des strates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 Signets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Montrer ou masquer des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Modification des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 Modification de l'aspect des tableaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 Propriétés du tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
xiii

Pour modifier les propriétés d'un tableau pivotant . . . . . . . . . . . . . . . . . . 277 Propriétés de tableau : Général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Modification des propriétés générales d'un tableau . . . . . . . . . . . . . . . . . 278 Propriétés de tableau : Notes de bas de page. . . . . . . . . . . . . . . . . . . . . . 279 Modification des propriétés des marques des notes de bas de page. . . . . 279 Propriétés de tableau : Formats de cellule . . . . . . . . . . . . . . . . . . . . . . . . 280 Modification des formats des cellules. . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 Propriétés de tableau : Bordures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 Pour modifier les bordures d'un tableau . . . . . . . . . . . . . . . . . . . . . . . . . . 282 Pour afficher des bordures masquées dans un tableau pivotant . . . . . . . . 283 Propriétés de tableau : Impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Pour contrôler l'impression d'un tableau pivotant . . . . . . . . . . . . . . . . . . . 284 Polices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 Largeur des cellules de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Propriétés de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Modification des propriétés de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . 287 Propriétés des cellules : Valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 Modification des formats des valeurs dans une cellule . . . . . . . . . . . . . . . 288 Pour modifier le format des valeurs dans une colonne . . . . . . . . . . . . . . . 288 Propriétés des cellules : Alignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 Modification de l'alignement dans les cellules . . . . . . . . . . . . . . . . . . . . . 290 Propriétés des cellules : Marges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 Modification des marges dans les cellules . . . . . . . . . . . . . . . . . . . . . . . . 290 Propriétés des cellules : Ombrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Modification de l'ombrage des cellules. . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Marque de bas de page . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Sélection des lignes et des colonnes dans les tableaux pivotants . . . . . . . 292 Pour sélectionner une ligne ou une colonne dans un tableau pivotant. . . . 293 Modification des résultats d'un tableau pivotant . . . . . . . . . . . . . . . . . . . . 293 Impression des tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
xiv

Pour imprimer les strates masquées d'un tableau pivotant . . . . . . . . . . . . 295 Contrôle des sauts de tableau pour les tableaux longs et larges . . . . . . . . 295

12 Utilisation de la syntaxe de commande

297

Règles de syntaxe de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 Création d'une syntaxe depuis les boîtes de dialogue . . . . . . . . . . . . . . . . 299 Utilisation de la syntaxe depuis le fichier de résultat . . . . . . . . . . . . . . . . . 300 Utilisation de la syntaxe dans un fichier-journal . . . . . . . . . . . . . . . . . . . . 302 Exécuter une syntaxe de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Commandes Execute multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

13 Fréquences

307

Remarques sur les données de fréquences. . . . . . . . . . . . . . . . . . . . . . . . 307 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 Pour obtenir des tableaux de fréquences . . . . . . . . . . . . . . . . . . . . . . . . . 309

14 Caractéristiques

315

Remarques sur les données de Caractéristiques. . . . . . . . . . . . . . . . . . . . 315 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Pour obtenir des statistiques descriptives. . . . . . . . . . . . . . . . . . . . . . . . . 316

xv

15 Explorer

321

Remarques sur les Données d'Explorer. . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Pour explorer vos données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323

16 Tableaux croisés

329

Remarques sur les Données pour tableau croisé . . . . . . . . . . . . . . . . . . . 330 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Pour obtenir des tableaux croisés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331

17 Récapituler

341

Récapituler les commentaires de données . . . . . . . . . . . . . . . . . . . . . . . . 341 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 Obtenir des récapitulatifs des observations . . . . . . . . . . . . . . . . . . . . . . . 342

18 Moyennes

349

Remarques sur les données des moyennes. . . . . . . . . . . . . . . . . . . . . . . . 349 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 Pour obtenir des moyennes de sous-groupes . . . . . . . . . . . . . . . . . . . . . . 351

xvi

19 Cubes OLAP

355

Remarques sur les données des cubes OLAP . . . . . . . . . . . . . . . . . . . . . . 355 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Pour obtenir des cubes OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356

20 Tests T

363

Test T pour échantillons indépendants . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 Remarques sur les Données du Test T pour Echantillons Indépendants. . . 364 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 Obtenir un test t pour échantillons indépendants . . . . . . . . . . . . . . . . . . . 365 Test T pour échantillons appariés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 Commentaires relatifs au test T pour échantillons appariés. . . . . . . . . . . . 369 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 Obtenir un test t pour échantillons appariés . . . . . . . . . . . . . . . . . . . . . . . 369 Test T pour échantillon unique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 Commentaires sur les Données du Test T pour échantillon unique. . . . . . . 372 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 Obtenir un test t pour échantillon unique. . . . . . . . . . . . . . . . . . . . . . . . . . 373

21 ANOVA à 1 facteur

375

Remarques sur les Données ANOVA à 1 facteur . . . . . . . . . . . . . . . . . . . . 376 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376 Obtenir une analyse de variance à un facteur . . . . . . . . . . . . . . . . . . . . . . 377

xvii

22 Analyse GLM – Univarié

385

Remarques sur les données GLM - Univarié . . . . . . . . . . . . . . . . . . . . . . . 386 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 Pour obtenir des tables GLM - Univarié. . . . . . . . . . . . . . . . . . . . . . . . . . . 387 Contrastes GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 Diagrammes de profils GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 Comparaisons post hoc GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

23 Corrélations bivariées

403

Remarques sur les données des corrélations bivariées. . . . . . . . . . . . . . . 403 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 Pour obtenir des corrélations bivariées. . . . . . . . . . . . . . . . . . . . . . . . . . . 404

24 Corrélations partielles

409

Remarques sur les données des corrélations partielles. . . . . . . . . . . . . . . 409 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 Obtenir des corrélations partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410

25 Distances

413

Pour obtenir des matrices de distance . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Distances : Mesures de dissimilarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 Indices : Mesures de similarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416

xviii

26 Régression linéaire

419

Régression linéaire : Remarques sur les données . . . . . . . . . . . . . . . . . . . 420 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 Obtenir une analyse de régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . 422 Méthodes de sélection des variables de régression linéaire . . . . . . . . . . . 424 Régression linéaire : Définir la règle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 Diagrammes de régression linéaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 Régression linéaire : Enregistrer de nouvelles variables . . . . . . . . . . . . . . 427 Statistiques de régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 Régression linéaire : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432

27 Ajustement de fonctions

435

Remarques sur les données de l'ajustement de fonctions . . . . . . . . . . . . . 435 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 Pour obtenir un ajustement de fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . 437

28 Analyse discriminante

441

Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443 Obtenir une analyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444

29 Analyse factorielle

453

Remarques sur les données d'analyse factorielle . . . . . . . . . . . . . . . . . . . 454 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
xix

Obtenir une analyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 Caractéristiques d'analyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 Spécification des statistiques récapitulatives et des coefficients de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461 Spécification des options de l'extraction. . . . . . . . . . . . . . . . . . . . . . . . . . 463 Spécification des options de la rotation . . . . . . . . . . . . . . . . . . . . . . . . . . 465 Spécification des options des facteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 Spécification des options de l'analyse factorielle . . . . . . . . . . . . . . . . . . . 468

30 Choix d'une procédure de classification 31 Classification TwoStep

469 471

Remarques sur les données de la procédure d'analyse TwoStep Cluster. . 473 Pour effectuer une procédure d'analyse TwoStep Cluster. . . . . . . . . . . . . 474 Options de la procédure d'analyse TwoStep Cluster . . . . . . . . . . . . . . . . . 475 Diagrammes de l'analyse TwoStep Cluster . . . . . . . . . . . . . . . . . . . . . . . . 478 Résultats de l'analyse TwoStep Cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . 479

32 Classification hiérarchique

481

Remarques sur les données de la classification hiérarchique . . . . . . . . . . 481 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482 Obtenir une classification hiérarchique. . . . . . . . . . . . . . . . . . . . . . . . . . . 484 Statistiques de la classification hiérarchique . . . . . . . . . . . . . . . . . . . . . . 486 Diagrammes (graphiques) de classification hiérarchique . . . . . . . . . . . . . 487 Enregistrement des nouvelles variables de classification hiérarchique . . . 488

xx

33 Nuées dynamiques

489

Considérations de données sur la classification en nuées dynamiques . . . 490 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490 Obtenir une analyse de nuées dynamiques . . . . . . . . . . . . . . . . . . . . . . . . 492 Enregistrement des analyses de classes de nuées dynamiques . . . . . . . . 495 Options d'analyses des classes de nuées dynamiques . . . . . . . . . . . . . . . 495

34 Tests non paramétriques

497

Test du Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498 Test du Khi-deux : remarques sur les données . . . . . . . . . . . . . . . . . . . . . 498 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 Pour obtenir un test Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 Test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 Test binomial : remarques sur les données . . . . . . . . . . . . . . . . . . . . . . . . 503 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 Pour obtenir un test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 Suites en séquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 Suites en séquences : Remarques sur les Données . . . . . . . . . . . . . . . . . 507 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 Pour obtenir un test de suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 Test Kolmogorov-Smirnov pour un échantillon . . . . . . . . . . . . . . . . . . . . . 510 Remarques sur les données du test de Kolmogorov-Smirnov pour un échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 510 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511 Pour obtenir un test de Kolmogorov-Smirnov pour un échantillon . . . . . . . 511 Tests pour deux échantillons indépendants. . . . . . . . . . . . . . . . . . . . . . . . 513 Tests pour deux échantillons indépendants : remarques sur les données . 514
xxi

. . . . . . . . . . 536 Tableaux croisés des réponses multiples . . . . . . . . . . . . . . . . 538 Echantillon de résultat . . . . . . . . . . . . 523 Echantillon de résultat . . . . . . . . . . . . . . 520 Tests pour plusieurs échantillons indépendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528 Echantillon de résultat . . . . . . . . . . . . . . 520 Pour obtenir des tests pour deux échantillons liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528 Pour obtenir des tests pour plusieurs échantillons liés . . . . 514 Pour effectuer les tests pour deux échantillons indépendants. . 535 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 538 Pour obtenir des tableaux croisés des réponses multiples . . . . . . . . . . . . 529 35 Analyse des réponses multiples 531 Définition de vecteurs multiréponses . 537 Remarques sur les Données de Tableaux croisés de réponses multiples . . . . . . . . . . . . . . . . . . 519 Tests pour deux échantillons liés : remarques sur les données . . . . . . . . . . . . . . . 534 Gestion des données des fréquences de réponses multiples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536 Pour obtenir des tableaux de fréquences de réponses multiples . . . . . . . . . . . . . 515 Tests pour deux échantillons liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524 Tests pour plusieurs échantillons liés . . . . . . . . . . . . . . . . . . . . 533 Tableaux de fréquences des réponses multiples . . . . . . . . . . 524 Pour obtenir des tests pour plusieurs échantillons indépendants . . . . . . . . . . . . . . . 539 xxii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532 Pour définir des vecteurs de réponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523 Tests pour Plusieurs Echantillons Indépendants : Remarques sur les Données . . . 528 Tests pour plusieurs échantillons liés de considérations de données . . . . . . . . . . . 519 Echantillon de résultat . . . . . . . . . .

. . . . . . . . . . . . . . . . . . 562 Echantillon de résultat . . 574 Fonctions supplémentaires de la commande Positionnement multidimensionnel. . . . . . . . . . . . . . . . . 543 Tableaux de bord en colonnes . . . . . . . . 562 Obtenir une analyse de fiabilité. . .36 Tableaux de Résultats 543 Tableaux de bord en lignes . . . . 575 39 Statistiques de ratio 577 Remarque sur les données des statistiques de ratio . . . . . . . . . . 577 Pour obtenir des statistiques de ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570 Obtenir une analyse par positionnement multidimensionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572 Modèle de positionnement multidimensionnel . . . . . . . . 578 Statistiques de ratio . . 553 37 Analyse de fiabilité 561 Remarques sur les données de l'analyse de fiabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 Fonctionnalités supplémentaires de la commande RELIABILITY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573 Positionnement multidimensionnel : Options . . . . . 570 Positionnement multidimensionnel : créer une mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566 38 Positionnement multidimensionnel 569 Remarques sur les données du positionnement multidimensionnel . . . 579 xxiii . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 606 Options Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 41 Courbes ROC 593 Remarques sur les données de la courbe ROC . . . . . . . . . . . . . . . . 599 Définir des groupes de variables. . . . . . . . . . . . . . . . . . . . . . . . . .40 Présentation de l'utilitaire de diagramme 581 Création et modification d'un diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602 43 Options 605 Options générales. . . . . 608 Options du Viewer en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . . . 593 Echantillon de résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594 Pour obtenir une courbe ROC . . . . . . . . 613 xxiv . 597 Commentaires de fichier de données . . . . . . . . . . . 611 Options de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581 Options globales de définition du diagramme . . . . . . . . . . . . . . . . . . . 599 Utiliser les groupes. . . . . . . . . . . . . . . . . . . . . . . 601 Réordonner Listes Variables Cible. . . . . . . . . . . . 598 Groupes de Variables . . . . . . . . . . . . . . . 595 42 Outils 597 Informations de la variable . . . . . . . . . . . . . . . . . . . . . . . . . . 609 Options Etiquettes Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . 651 xxv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 629 45 Système de production 635 Utilisation de l'Utilitaire de Production . . . . . . . . . . . . . . . . . . . . . . 637 Options d'exportation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645 Exécution de tâches de production à partir d'une ligne de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 Personnalisation des barres d'outils . . . . . . . . . . . . . . . . . . . . . . . . . . 648 Publication sur le Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 636 Règles de syntaxe pour le système de production SPSS . . . 628 Montrer barres d'outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 Connexion au serveur Web SmartViewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643 Options de production . . . . . . 629 Pour personnaliser les barres d'outils. . . . . . . . . . . . . . . . . . . . . . 618 Options tableaux pivotants . . . . . . . 619 Options de données . . . . . . . . . . . . . . . . . . 638 Invites utilisateur . . . . . . . . . . . . . 641 Sollicitation de macros de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622 Options monétaires (devises) . . . . . . . . 625 44 Personnalisation des menus et des barres d'outils 627 Editeur de menu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623 Options script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 Contrôle du format des tâches de production . . .Options diagrammes interactifs .

. . 658 L'Assistant script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 Table des classes d'objet et conventions d'appellation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 Fonctionnement des scripts . . . . . . .46 Utilitaire de script SPSS 653 Exécution d'un script . . . . . . . . . . . . . . . . . 677 Boîtes de dialogue de script personnalisées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654 Autoscripts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 Création de scripts automatiques . . 653 Scripts livrés avec SPSS. . . . . . . 657 Modification d'un script . . 682 Fichiers de script et de syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Création et modification de scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 Fenêtre de script . . . . . 685 47 Système de gestion des résultats 689 Identificateurs OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677 Mise au point des scripts . . . . 669 Nouvelle procédure (Script) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689 xxvi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674 Ajout d'une description à un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . 698 Pour utiliser un autre fichier ou emplacement pour le code HTML personnalisé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697 Contenu et format du fichier texte pour code HTML personnalisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Annexes A Administrateur d'accès de base de données B Personnalisation de documents HTML 695 697 Pour ajouter du code HTML personnalisé à des documents de résultat exportés . 698 Index 701 xxvii . . . .

Chapitre

Fichiers de données

3

Les fichiers de données se présentent sous une grande diversité de formats et SPSS a été conçu pour traiter nombre d'entre eux, dont :
„ „ „ „ „ „

les feuilles de calcul créées sous Lotus 1-2-3 et Excel les fichiers de bases de données créés sous dBASE et sous différents formats SQL fichiers texte délimités par des tabulations et autres types de fichier ASCII les fichiers de données au format SPSS créés avec d'autres systèmes d'exploitation Fichiers de données SYSTAT Fichiers de données SAS

Ouverture d'un fichier de données
Outre les fichiers sauvegardés au format SPSS, vous pouvez ouvrir les fichiers Excel, Lotus 1-2-3, dBASE, ainsi que les fichiers tabulés sans avoir à convertir les fichiers en un format intermédiaire ni à entrer d'informations de définition de données.

Pour ouvrir un fichier de données
E A partir du menu, sélectionnez : Fichier Ouvrir Données... E Dans la boîte de dialogue Ouvrir un fichier, sélectionnez le fichier à ouvrir. E Cliquez sur Ouvrir. 21

22 Chapitre 3

Sinon, vous pouvez :
„ „ „

lire les noms de variables à partir de la première ligne dans le cas des feuilles de calcul et des fichiers délimités par des tabulateurs spécifier une plage de cellules à lire dans le cas de fichiers de feuilles de calcul spécifier une feuille à lire dans un fichier Excel (version Excel 5 ou supérieure)

Types de fichier de données
SPSS : Ouvre les fichiers de données enregistrés en format SPSS, y compris SPSS

pour Windows, Macintosh, UNIX, et également le produit DOS SPSS/PC+.
SPSS/PC+ : Ouvre les fichiers de données SPSS/PC+. SYSTAT : Ouvre les fichiers de données SYSTAT. SPSS portable : Ouvre les fichiers de données SPSS sauvegardés en format portable.

Sauvegarder un fichier en format portable prend bien plus de temps que de sauvegarder le fichier en format SPSS.
Excel : Ouvre les fichiers Excel. Lotus 1-2-3 : Ouvre les fichiers de données enregistrés au format 1-2-3 pour les versions 3.0 et 2.0, ainsi que pour la version 1A de Lotus. SYLK : Ouvre les fichiers de données sauvegardés en format SYLK (lien symbolique), format utilisé par quelques applications de tableurs. dBASE : Ouvre des fichiers de format dBASE pour dBASE IV, dBASE III ou III

PLUS, ou pour dBASE II. Chaque observation est un enregistrement. Les étiquettes de variable et de valeurs ainsi que les spécifications de valeurs manquantes sont perdues lorsque vous sauvegardez un fichier dans ce format.
Nom de fichier SAS long : SAS version 7-8 pour Windows, extension longue. Nom de fichier SAS court : SAS version 7-8 pour Windows, extension courte. SAS version 6 pour Windows : SAS version 6.08 pour Windows et OS2. SAS version 6 pour UNIX : SAS version 6 pour UNIX (Sun, HP, IBM). SAS transfert : Fichier de transfert SAS. Texte : Fichier texte ASCII.

23 Fichiers de données

Ouvrir les options de fichier
Lire les noms de variables : Dans le cas des feuilles de calcul, vous pouvez lire le nom des variables à partir de la première ligne du fichier ou de la première ligne de la plage définie. En fonction de vos besoins, vous pouvez convertir les valeurs pour créer des noms de variables valides, en n'oubliant pas de convertir les espaces en traits de soulignement. Feuille de calcul : Les fichiers de la version Excel 5 ou supérieure peuvent contenir

plusieurs feuilles de calcul. Par défaut, l'éditeur de données lit la première feuille. Pour lire une autre feuille de calcul, sélectionnez-la dans la liste déroulante.
Intervalle : Pour les fichiers de données sous forme de feuilles de calcul, vous pouvez également lire une plage de cellules. Utilisez la même méthode pour spécifier des intervalles de cellules comme vous le feriez pour des applications tableur.

Lecture de fichiers Excel
Lire les noms de variables : Vous pouvez lire le nom des variables sur la première ligne du fichier ou sur la première ligne de la plage définie. Les valeurs qui ne sont pas conformes aux règles de dénomination de variable sont converties en noms de variable valides, et les en-têtes originaux sont utilisés en tant qu'étiquettes de variable. Feuille de calcul : Les fichiers Excel peuvent contenir plusieurs feuilles de calcul.

Par défaut, l'éditeur de données lit la première feuille. Pour lire une autre feuille de calcul, sélectionnez-la dans la liste déroulante.
Intervalle : Vous pouvez également lire une plage de cellules. Utilisez la même

méthode pour spécifier des plages de cellules que celle que vous utiliseriez dans Excel.

Comment l'éditeur de données lit les fichiers Excel version 5 ou ultérieure
Les règles suivantes s'appliquent à la lecture de fichiers Excel version 5 ou ultérieure :
Type de données et largeur : Chaque colonne représente une variable. Le type de

données et la largeur de chaque variable sont déterminés par le type de données et la largeur dans le fichier Excel. Si la colonne contient plusieurs types de données (par

24 Chapitre 3

exemple, des dates et des valeurs numériques), le type de données est converti en chaîne et toutes les valeurs sont lues comme des valeurs de chaînes valides.
Cellules blanches : En ce qui concerne les variables numériques, les cellules vides sont converties en valeurs manquantes par défaut et identifiées par un point. En ce qui concerne les variables chaîne, un blanc est une valeur de caractère valide, et les cellules vides sont traitées comme des valeurs de chaîne valides. Noms des variables : Si vous lisez la première ligne du fichier Excel (ou la première

ligne de la plage spécifiée) en tant que noms de variable, les valeurs qui ne sont pas conformes aux règles de dénomination de variable sont converties en noms de variable valides et les noms initiaux sont utilisés comme étiquettes de variable. Si vous ne lisez pas les noms de variables à partir du fichier Excel, des noms de variables par défaut sont affectés.

Lecture d'autres fichiers Excel et de fichiers d'autres tableurs avec l'éditeur de données
Les règles applicables à la lecture de fichiers Excel antérieurs à la version 5 et à celle de fichiers d'autres tableurs sont les suivantes :
Type de données et largeur : Le type de données et la largeur de chaque variable sont déterminés par la largeur de la colonne et le type de données de la première cellule de données de la colonne. Les valeurs d'autres types sont converties en valeurs manquantes par défaut. Si, dans la colonne, la première cellule de données est vide, le type général de données par défaut pour la feuille de calcul (habituellement numérique) est utilisé. Cellules blanches : En ce qui concerne les variables numériques, les cellules vides sont converties en valeurs manquantes par défaut et identifiées par un point. En ce qui concerne les variables chaîne, un blanc est une valeur de caractère valide, et les cellules vides sont traitées comme des valeurs de chaîne valides. Noms des variables : Si, à partir de la feuille de calcul, vous ne pouvez pas lire le nom

des variables, SPSS utilise les lettres des colonnes (A, B, C, etc.) comme noms de variable pour les fichiers Excel et Lotus. En ce qui concerne les fichiers SYLK et Excel enregistrés au format d'affichage R1C1, le programme utilise le numéro de la colonne, précédé par la lettre C (C1, C2, C3, etc.).

25 Fichiers de données

Lecture des fichiers dBASE avec l'éditeur de données
Les fichiers de base de données sont logiquement très semblables aux fichiers de données au format SPSS. Les règles générales suivantes s'appliquent aux fichiers dBASE :
„ „

Les noms de champ sont convertis en noms de variable valides. Les signes deux points utilisés dans les noms de champ dBASE sont convertis en traits de soulignement. purgés, sont inclus. SPSS crée une nouvelle variable chaîne, D_R, qui contient un astérisque pour les observations indiquées comme devant être supprimées.

„ Les enregistrements indiqués comme devant être supprimés, mais qui n'ont pas été

Lire des fichiers de base de données
Vous pouvez lire des données à partir de n'importe quel format de base de données pour laquelle vous avez un pilote adapté. En mode d'analyse locale, les pilotes nécessaires doivent être installés sur votre ordinateur local. En mode d'analyse distribuée (disponible avec la version serveur), les pilotes doivent être installés sur le serveur distant. Pour plus d'informations, reportez-vous à « Mode d'analyse distribuée » dans Chapitre 4 , page 67.

Lire des fichiers de base de données
E A partir du menu, sélectionnez : Fichier Ouvrir la base de données Nouvelle requête... E Sélectionnez la source des données. E Selon la source de données, vous devez peut-être sélectionner le fichier de base de

données et/ou entrer un nom de connexion, un mot de passe et d'autres informations.
E Sélectionnez les tables et les champs. E Spécifiez toute relation existante entre vos tables.

26 Chapitre 3

Sinon, vous pouvez :
„ „ „ „

Spécifier les critères éventuels de sélection de vos données. Ajouter une invite pour que l'utilisateur puisse y entrer un paramètre de requête. Définir les attributs de variable. Enregistrer la requête que vous avez construite avant de l'exécuter.

Pour modifier une requête de base de données enregistrée
E A partir du menu, sélectionnez : Fichier Ouvrir la base de données Modifier requête... E Sélectionnez le fichier requête (*.spq) à modifier. E Suivez les instructions de création d'une nouvelle requête.

Pour lire des fichiers de base de données avec des requêtes enregistrées
E A partir du menu, sélectionnez : Fichier Ouvrir la base de données Exécuter requête... E Sélectionnez le fichier requête (*.spq) à exécuter. E Selon le fichier de base de données, vous aurez peut-être à entrer un nom de procédure

d'entrée ou un mot de passe.
E Si la requête a une invite imbriquée, vous pourrez avoir besoin d'entrer d'autres

informations (par exemple, le trimestre pour lequel vous voulez récupérer les chiffres de ventes).

27 Fichiers de données

Sélectionner une source de données
Utilisez la première boîte de dialogue pour sélectionner le type de source de données à lire dans SPSS. Après avoir choisi le type de fichier, l'Assistant de base de données vous invitera peut-être à entrer le chemin d'accès vers votre fichier de données. Si vous n'avez pas de sources de données configurées ou si vous souhaitez ajouter une nouvelle source de données, cliquez sur Ajouter source données. En mode d'analyse distribuée (disponible avec la version serveur), ce bouton n'est pas disponible. Pour ajouter des sources de données en mode d'analyse distribuée, consultez votre administrateur système.
Source de données : Une source de données est composée de deux principaux éléments

d'informations : Le pilote qui sera utilisé pour accéder aux données et l'emplacement de la base de données à laquelle vous souhaitez accéder. Pour spécifier des sources de données, vous devez installer les pilotes appropriés. En mode d'analyse locale, vous devez installer les pilotes à partir du CD-ROM pour ce produit :
„ „

SPSS Data Access Pack : Installe les pilotes de différents formats de base de

données. Disponible dans le menu d'exécution automatique.
Microsoft Data Access Pack : Installe les pilotes pour les produits Microsoft,

notamment Microsoft Access. Pour installer Microsoft Data Access Pack, double-cliquez sur Microsoft Data Access Pack dans le dossier Microsoft Data Access Pack qui se trouve sur le CD-ROM.

28 Chapitre 3 Figure 3-1 Boîte de dialogue Assistant de base de données

Exemple : Supposons que vous ayez une base de données Microsoft Access 7.0

qui contient des données sur vos employés et sur les régions dans lesquelles ils travaillent, et que vous vouliez importer ces données. Sélectionnez l'icône MS Access 97 Database (Base de données MS Access 7.0), puis cliquez sur Suivant pour continuer. La boîte de dialogue Select Database (Sélectionner base de données) s'affiche. Spécifiez le chemin d'accès vers votre base de données et cliquez sur OK.

Procédure d'entrée dans la base de données
Si votre base de données nécessite un mot de passe, l'Assistant de base de données vous en demandera un avant de pouvoir ouvrir la source des données.

29 Fichiers de données Figure 3-2 Boîte de dialogue de la procédure d'initialisation

Sélectionner des champs de données
La boîte de dialogue de sélection des données vérifie les tables et les champs lus dans SPSS. Les champs base de données (colonnes) sont lus comme des variables. Si une table comporte un ou plusieurs champs sélectionnés, tous ses champs seront visibles dans les fenêtres d'Assistant de base de données suivantes, mais seuls les champs sélectionnés dans cette boîte de dialogue seront importés comme variables. Cela vous permet de créer des jointures de tables et de spécifier les critères d'utilisation des champs que vous n'importez pas.
Figure 3-3 Boîte de dialogue Sélectionner base de données

30 Chapitre 3

Affichage des noms de champs : Pour lister les champs dans une table, cliquez sur le signe « plus » (+) à gauche du nom d'une table. Pour masquer les champs, cliquez sur le signe moins (–) à gauche du nom d'une table. Pour ajouter un champ : Cliquez sur un champ de la liste des tables disponibles ou

faites-le glisser dans les champs Extraction de cette liste de commandes. Les champs peuvent être rangés de nouveau en les glissant et en les laissant dans la liste des champs sélectionnés.
Pour retirer un champ : Double-cliquez sur n'importe quel champ Extraction de cette

liste de commandes ou faites-le glisser jusqu'à la liste des tables disponibles.
Trier les noms de champs : Si vous l'avez sélectionné, l'assistant de base de données

affiche les champs disponibles dans l'ordre alphabétique.
Exemple : Supposez que vous vouliez importer des éléments à partir d'une base de

données avec deux tables, Employés et Régions. La table Employés contient des informations sur les employés de votre société, y compris la région où ils travaillent, leur modalité d'emploi, et leurs ventes annuelles. Un code région (REGION) est assigné à chaque employé. Ceux qui ne sont pas domiciliés dans une région obtiennent le code spécial 0. La table Régions garde un grand nombre de données sur les territoires dans lesquels votre société opère et sur les marchés de prospection. Il utilise un code région (REGION) pour identifier le territoire et fournit le revenu par tête moyen pour le territoire, entre autres. Pour établir le rapport entre les ventes de chaque employé avec le revenu moyen de la région, sélectionnez les champs suivants à partir du tableau Employés : ID, REGION et VENTES. Sélectionnez ensuite les champs suivants à partir du tableau Régions : REGION et REVMOY. Cliquez sur Suivant pour continuer.

Créer une relation entre des tables
La boîte de dialogue Spécifier les relations vous permet de définir les relations existant entre des tables. Si les champs de plus d'une table sont sélectionnés, vous devez définir au moins une jointure.

31 Fichiers de données Figure 3-4 Boîte de dialogue Spécifier relations

Etablir des relations : Pour créer une relation, faites glisser un champ de n'importe

quelle table vers le champ auquel vous souhaitez le lier. L'Assistant de base de données tire un trait de jointure entre les deux champs pour indiquer leur relation. Ces champs doivent être du même type de données.
Jointure automatique de tables : Essaie de joindre automatiquement deux tables d'après les clés primaire/étrangère, ou de mettre en correspondance le nom des champs et le type de données. Spécifier les types de jointures : Si votre pilote prend en charge les jointures externes,

vous pouvez spécifier soit des jointures internes, soit des jointures externes gauches ou droites. Pour sélectionner le type de jointure, cliquez sur la ligne de jointure entre les champs et SPSS affichera la boîte de dialogue Propriétés de relations. Vous pouvez également utiliser les icônes dans le coin supérieur droit de la boîte de dialogue pour choisir le type de jointure.

Propriétés de la relation
Cette boîte de dialogue vous permet de spécifier quels types relations lient vos tables.

32 Chapitre 3 Figure 3-5 Boîte de dialogue Propriétés des relations

Jointures internes : Une jointure interne n'inclut que les lignes dont les champs reliés

sont égaux.
Exemple : Continuons avec nos données et supposons que vous vouliez importer

des données seulement pour les employés qui travaillent dans une région définie et seulement pour les régions dans lesquelles votre société opère. Dans ce cas, vous utiliserez une jointure interne qui exclura les employés en déplacement et filtrera les informations sur les régions de prospection dans lesquelles vous n'êtes pas actuellement présent. Cela vous donnera un ensemble de données contenant les variables ID, REGION, VENTES95 et REVMOY pour chaque employé ayant travaillé dans une région définie.

33 Fichiers de données Figure 3-6 Créer une jointure interne

Jointures externes : Une jointure externe gauche inclut tous les enregistrements de la

table de gauche, et seuls les enregistrements de la table de droite dont les champs reliés sont égaux. Dans une jointure externe droite, cette relation est inversée si bien que SPSS importe tous les enregistrements de la table de droite, et seulement les enregistrements de la table de gauche dont les champs reliés sont égaux.
Exemple : Si vous souhaitez importer des données uniquement pour les employés

ayant travaillé dans une région définie (un sous-ensemble de la table Employés), mais que vous ayez besoin d'informations sur toutes les régions, une jointure externe droite serait appropriée. Cela génère un ensemble de données qui contient les variables ID, REGION, VENTES95 et REVMOY pour chaque employé ayant travaillé dans une région définie, plus les données sur le reste des régions dans lesquelles votre société n'opère pas actuellement.

34 Chapitre 3 Figure 3-7 Création d'une jointure externe droite

Limiter les observations récupérées
La boîte de dialogue Limiter les observations récupérées vous permet de spécifier les critères pour sélectionner des sous-groupes d'observations (lignes). Limiter les observations consiste généralement à remplir la grille de critères avec un ou plusieurs critères. Les critères consistent en deux expressions et des relations entre elles. Ils renvoient la valeur True (vrai), False (faux) ou manquant pour chaque observation.
„ „ „ „

Si le résultat est vrai, l'observation est sélectionnée. Si le résultat est faux ou manquant, l'observation n'est pas sélectionnée. La plupart des critères utilisent un ou plusieurs des six opérateurs relationnels (<, >, <=, >=, = et <>). Les expressions conditionnelles peuvent inclure des noms de champs, des constantes, des opérateurs arithmétiques, des fonctions numériques et autres, des variables logiques et des opérateurs relationnels. Vous pouvez utiliser des champs que vous ne prévoyez pas d'importer comme variables.

35 Fichiers de données Figure 3-8 Boîte de dialogue Limiter les observations récupérées Pour établir vos critères. Pour modifier notre exemple précédent et n'extraire que les données sur les employés qui répondent aux modalités d'emploi 1 ou 3. constantes. qui est disponible dans les cellules d'expression actives. placez votre curseur dans une cellule Expression. faites glisser le champ à partir de la liste Champs ou sélectionnez un champ dans le menu déroulant. vous avez besoin d'au moins deux expressions et d'une relation pour les connecter. . fonctions numériques et autres et variables logiques. opérateur arithmétiques. créez deux critères dans la grille des critères. puis faites précéder le second critère du connecteur OU. E Les deux expressions sont généralement liées par un opérateur relationnel. placez votre curseur dans la cellule Relation et tapez l'opérateur ou sélectionnez-le dans le menu déroulant. Vous disposez d'autres méthodes pour mettre le champ dans une cellule de critères : double-cliquez sur le champ dans la liste Champs. Pour choisir la relation. E Pour établir une expression. comme = ou >. Vous pouvez taper les noms de champs.

Si le nombre total d'observations spécifié est supérieur au nombre total d'observations dans le fichier de données. „ Exactement : Sélectionne un échantillon aléatoire du nombre d'observations spécifié dans le nombre total d'observations indiqué. chaîne. Comme cette routine génère une décision indépendante pseudo-aléatoire pour chaque observation. logique. Par exemple. ce dernier doit lire la totalité de la source de données pour extraire un échantillon aléatoire. Demander une valeur : Vous pouvez imbriquer une invite dans votre requête pour créer une requête de paramètre. Placez votre curseur dans une cellule Expression et cliquez sur Demander une valeur pour créer une invite. il leur est demandé d'entrer ici les informations spécifiées. le pourcentage d'observations sélectionnées peut seulement approcher le pourcentage spécifié. est plus rapide que l'échantillonnage aléatoire de SPSS . date et heure) est fournie. Vous pouvez sélectionner une fonction de la liste et la glisser dans une expression ou entrer n'importe quelle fonction SQL valide. Lorsque les utilisateurs utilisent la requête. plus le pourcentage des observations sélectionnées sera proche de la valeur indiquée. Cette méthode peut s'avérer utile lorsque vous avez besoin par exemple de voir différents affichages des mêmes données. vous pouvez limiter le nombre d'observations à un échantillon restreint et représentatif. Consultez votre documentation sur les bases de données pour les fonctions SQL valides. vous voulez exécuter la même requête pour voir les chiffres de ventes des différents trimestres fiscaux. s'il est disponible pour la source de données.'CATEMP' = 3 Fonctions : Une sélection de fonctions SQL intégrées (arithmétique. l'échantillon contiendra proportionnellement moins d'observations que le nombre demandé. Utiliser échantillon aléatoire : Sélectionne un échantillon aléatoire d'observations dans la source de données. en effet. Plus il y a d'observations dans le fichier de données. .'CATEMP' = 1 Critère 2 : 'VentesEmployés'. L'échantillonnage aléatoire natif. Pour les sources de données volumineuses.36 Chapitre 3 Critère 1 : 'VentesEmployés'. Ceci peut considérablement réduire le temps d'exécution des procédures. „ Environ : SPSS génère un échantillon aléatoire d'observations dont le nombre correspond approximativement au pourcentage indiqué.

. La chaîne d'invite est affichée chaque fois qu'un utilisateur exécute votre requête. elle doit indiquer la syntaxe de la saisie. si l'utilisateur ne sélectionne rien dans une liste. chaîne ou date.37 Fichiers de données Créer une requête de paramètre Utilisez la boîte de dialogue Demander une valeur pour créer une boîte de dialogue sollicitant des informations auprès des utilisateurs chaque fois que quelqu'un exécute votre requête.. T2.) ». T3. Cela est utile si vous souhaitez effectuer une requête sur les mêmes sources de données en utilisant des critères différents. Type de données : Spécifiez ici le type de données. . vous pouvez limiter l'accès de l'utilisateur aux valeurs que vous avez placées dans la liste et qui sont séparées par des retours chariot. Elle doit spécifier le type d'information à entrer et. vous avez besoin d'entrer une chaîne d'invite et une valeur par défaut. soit nombre. Par exemple. « Entrez un trimestre (T1.. Autoriser l'utilisateur à sélectionner une valeur dans la liste : Si cette option est sélectionnée. Figure 3-9 Boîte de dialogue Demander une valeur Pour établir une invite.

l'Assistant de base de données affecte des noms de variables à chaque colonne à partir de la base de données de l'une des manières suivantes : „ „ Si le nom du champ de la base de données constitue un nom unique et valide de variable SPSS. Si le nom du champ de la base de données ne constitue pas un champ unique et valide de variable.38 Chapitre 3 Le résultat final ressemble à ceci : Figure 3-10 Boîte de dialogue Invite définie par l'utilisateur Définition de variables (Assistant de capture de base de données) Noms de variables et étiquettes : La totalité du nom de champ de la base de données (colonne) est utilisée en tant qu'étiquette de variable. SPSS crée un nom unique. . Conversion des chaînes en valeurs numériques : Cochez la case Etiquettes de valeurs d'une variable chaîne pour la convertir automatiquement en variable numérique. Les valeurs de chaîne sont converties en valeurs entières consécutives dans l'ordre alphabétique des valeurs d'origine. Les valeurs d'origine sont conservées comme étiquettes de valeurs pour les nouvelles variables. A moins que vous ne modifiez le nom de variable. Cliquez sur n'importe quelle cellule pour modifier le nom de variable. il est utilisé comme nom de variable.

„ „ Vous pouvez enregistrer la requête pour une future utilisation grâce à l'option Enregistrer la requête dans le fichier. Le fait de copier-coller l'instruction Select depuis la fenêtre Résultats ne collera pas la syntaxe de commande nécessaire. Sélectionnez Coller dans l'éditeur de syntaxe pour coller la syntaxe complète GET DATA dans une fenêtre de syntaxe.39 Fichiers de données Figure 3-11 Boîte de dialogue Définir variables Résultats La boîte de dialogue Résultats affiche l'instruction SQL Select nécessaire à votre requête. les dernières modifications de l'instruction Select seront perdues. „ Si vous modifiez l'instruction SQL Select avant d'exécuter la requête et cliquez sur le bouton Précédent pour apporter des modifications aux étapes précédentes. .

40 Chapitre 3 Mettre données en cache localement : Un cache de données est une copie complète du fichier de données. La création d'un cache du fichier de données peut améliorer les performances. enregistrée dans un espace disque temporaire. Figure 3-12 Boîte de dialogue Résultats Assistant de texte L'Assistant de texte permet de lire des fichiers de données texte formatés de différentes façons „ „ „ „ Fichiers délimités par des tabulations Fichiers délimités par des espaces Fichiers délimités par des virgules Fichiers de format fixe .

41 Fichiers de données Dans le cas des fichiers délimités. Lire des fichiers de données texte E A partir du menu.étape 1 . Assistant de texte .étape 1 Figure 3-13 Assistant de texte . E Suivez les étapes de l'Assistant de texte pour définir le mode de lecture du fichier de données. sélectionnez : Fichier Lire les données du texte E Sélectionnez le fichier texte dans la boîte de dialogue d'ouverture. vous pouvez choisir d'autres caractères en guise de séparateurs entre les valeurs et spécifier plusieurs séparateurs.

42 Chapitre 3 Le fichier texte est affiché dans une fenêtre d'aperçu. Par exemple. Vous pouvez appliquer un format prédéfini (précédemment enregistré dans l'Assistant de texte) ou suivre les étapes de l'Assistant de texte pour spécifier la façon dont les données doivent être lues. . Assistant de texte .étape 2 Figure 3-14 Assistant de texte . une variable est similaire à un champ. l'assistant de texte doit déterminer où finit la valeur d'une variable et où commence la valeur de la variable suivante.étape 2 Cette étape offre des informations sur les variables. Dans une base de données. chaque élément d'un questionnaire est une variable. Disposition de vos variables : Pour lire correctement vos données. La disposition des variables définit la méthode utilisée pour différencier les variables entre elles.

de virgules. C'est la position des colonnes qui détermine la variable lue par l'Assistant. Les variables sont enregistrées dans le même ordre pour chacune des observations. „ Largeur fixe : Pour chaque observation dans le fichier de données. dans la plupart des fichiers de données texte générés par des programmes informatiques. Aucun séparateur n'est requis entre les variables. mais pas nécessairement dans les mêmes positions de colonnes. sur le même enregistrement (ligne). Les valeurs qui ne sont pas conformes aux règles de dénomination de variable sont converties en noms de variable valides. les valeurs de données peuvent sembler se chevaucher sans même être séparées par des espaces. chaque variable est enregistrée dans la même position de la colonne. Les noms de variable sont-ils inclus dans la partie supérieure de votre fichier ? Si la première ligne du fichier de données contient des étiquettes descriptives pour chaque variable. . vous pouvez utiliser ces étiquettes comme noms de variable. En fait. de tabulations ou d'autres caractères.43 Fichiers de données „ Délimité : Les variables sont séparées à l'aide d'espaces.

étape 3 : fichiers délimités Cette étape offre des informations sur les observations. . Dans une base de données.44 Chapitre 3 Assistant de texte . Par exemple. chaque répondant pour un questionnaire est un enregistrement. La première observation commence à la ligne : Indique la première ligne du fichier de données contenant des valeurs de données.étape 3 : fichiers délimités Figure 3-15 Assistant de texte . Si les lignes supérieures du fichier de données contiennent des étiquettes descriptives ou tout autre type de texte ne correspondant pas à des valeurs de données. elles ne seront pas considérées comme la première ligne du fichier. Représentation de vos observations : Contrôle la façon dont l'assistant de texte détermine où finit chaque observation et où commence la suivante. une observation est similaire à un enregistrement.

en outre. La même ligne peut contenir plusieurs observations . L'Assistant de texte détermine la fin de chaque observation en fonction du nombre de valeurs lues. le pourcentage d'observations sélectionnées ne peut qu'approcher le pourcentage spécifié. même s'il peut s'agir d'une très longue ligne dans le cas de fichiers de données comportant un grand nombre de variables. dans le cas contraire. . les observations peuvent commencer au milieu d'une ligne et se poursuivre sur la ligne suivante. plus le pourcentage des observations sélectionnées sera proche de la valeur indiquée.45 Fichiers de données „ Chaque ligne représente une observation : Chaque ligne ne contient qu'une observation. Il est assez courant que chaque observation soit contenue sur une seule ligne. les n premières observations (n étant un nombre que vous avez défini). Plus il y a d'observations dans le fichier de données. ou encore un échantillon aléatoire d'un pourcentage spécifié. Cette routine générant une décision indépendante pseudo-aléatoire pour chaque observation. quel que soit le nombre de lignes. Chaque observation doit contenir des valeurs de données (ou des valeurs manquantes indiquées par des séparateurs) pour toutes les variables . le nombre de variables pour chaque observation est déterminé par la ligne comportant le plus grand nombre de valeurs. Combien d'observations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de données. „ Un nombre spécifique de variables représente une observation : Le nombre spécifié de variables pour chaque observation indique à l'Assistant de texte où terminer la lecture d'une observation et où commencer la lecture de la suivante. Les observations contenant moins de valeurs recevront alors des valeurs manquantes pour les variables supplémentaires. le fichier de données ne sera pas lu correctement. Si les lignes ne contiennent pas toutes le même nombre de valeurs.

46 Chapitre 3 Assistant de texte . Par exemple. Combien de lignes représente une observation ? Contrôle la façon dont l'assistant de texte détermine où finit chaque observation et où commence la suivante.étape 3 : fichiers de largeur fixe Figure 3-16 Assistant de texte . chaque répondant pour un questionnaire est un enregistrement. La première observation commence à la ligne ? Indique la première ligne du fichier de données contenant des valeurs de données.étape 3 : fichiers de largeur fixe Cette étape offre des informations sur les observations. Si les lignes supérieures du fichier de données contiennent des étiquettes descriptives ou tout autre type de texte ne correspondant pas à des valeurs de données. une observation est similaire à un enregistrement. elles ne seront pas considérées comme la première ligne du fichier. Chaque variable est définie par son numéro de ligne dans l'observation et par sa position de . Dans une base de données.

Combien d'observations souhaitez-vous importer ? Vous pouvez importer toutes les observations du fichier de données. Plus il y a d'observations dans le fichier de données.étape 4 : fichiers délimités Cette étape présente la meilleure méthode déterminée par l'Assistant de texte sur la façon de lire le fichier de données et vous permet de modifier cette méthode. plus le pourcentage des observations sélectionnées sera proche de la valeur indiquée. le pourcentage d'observations sélectionnées ne peut qu'approcher le pourcentage spécifié.47 Fichiers de données colonne. . les n premières observations (n étant un nombre que vous avez défini). Vous devez spécifier le nombre de lignes de chaque observation pour que vos données soient lues correctement. Cette routine générant une décision indépendante pseudo-aléatoire pour chaque observation. Assistant de texte .étape 4 : fichiers délimités Figure 3-17 Assistant de texte . ou encore un échantillon aléatoire d'un pourcentage spécifié.

si la virgule est un séparateur. Qu'est-ce qu'un qualificateur de texte ? Il s'agit de caractères utilisés pour délimiter les valeurs contenant des caractères séparateur. Par exemple.48 Chapitre 3 Quels séparateurs s'affichent entre les variables ? Indique les caractères ou les symboles utilisés pour séparer les valeurs de données. de points-virgules. Le qualificateur de texte apparaît au début et à la fin de la valeur. Les fichiers de données au format CSV exportés à partir d'Excel utilisent le guillemet («) comme qualificateur de texte. les virgules de la valeur ne sont pas considérées comme des séparateurs de valeurs. et délimite ainsi la valeur entière. Vous pouvez sélectionner n'importe quelle combinaison d'espaces. de virgules. . de tabulations ou d'autres caractères. les valeurs contenant des virgules ne seront lues correctement que si un qualificateur de texte délimite la valeur . Plusieurs séparateurs consécutifs non séparés par des valeurs de données sont considérés comme des valeurs manquantes. ainsi.

il peut s'avérer difficile de déterminer l'endroit où commence chaque variable. De tels fichiers de données sont généralement associés à . Insérez. Remarque : Dans le cas de fichiers de données générés par ordinateur et présentant un flux continu de valeurs de données non séparées par des espaces ni par d'autres caractéristiques distinctives. déplacez et supprimez les lignes de délimitation des variables à votre convenance pour séparer les variables. Les lignes verticales présentées dans la fenêtre d'aperçu indiquent les positions que l'Assistant de texte estime correspondre au début de chaque variable dans le fichier. Si chaque observation utilise plusieurs lignes. sélectionnez chaque ligne dans la liste déroulante et modifiez les lignes de délimitation des variables en conséquence.étape 4 : fichiers de largeur fixe Cette étape présente la meilleure méthode déterminée par l'Assistant de texte sur la façon de lire le fichier de données et vous permet de modifier cette méthode.étape 4 : fichiers de largeur fixe Figure 3-18 Assistant de texte .49 Fichiers de données Assistant de texte .

étape 5 Figure 3-19 Assistant de texte . Assistant de texte . Si vous choisissez des noms de variable provenant du fichier de données.étape 5 Cette étape définit le nom de variable et le format de données utilisés par l'Assistant de texte pour lire chaque variable et détermine les variables qui seront incluses dans le fichier de données final. puis entrez un nom de variable. .50 Chapitre 3 un fichier de définitions de données ou à toute autre description écrite définissant la position de ligne et de colonne de chaque variable. l'assistant de texte modifiera automatiquement les noms de variable qui ne sont pas conformes aux règles de dénomination de variable. Nom de la variable : Vous pouvez remplacer les noms de variables par défaut par vos propres noms de variable. Sélectionnez une variable dans la fenêtre d'aperçu.

Assistant de texte : options de formatage Les options de formatage pour la lecture des variables au moyen de l'Assistant de texte sont les suivantes : Ne pas importer : Cette option permet d'omettre la ou les variables sélectionnées dans le fichier de données importé. Numérique : Les valeurs valides incluent les nombres. l'Assistant de texte détermine que ce nombre de caractères correspond à celui de la valeur de chaîne la plus longue pour la ou les variables sélectionnées. Date/Heure : Les valeurs valides correspondent aux dates exprimées dans les formats traditionnels jj-mm-aaaa. des virgules comme séparateurs de milliers. puis sélectionnez un format dans la liste déroulante. des chiffres romains. un signe plus ou moins en début. Les mois peuvent être représentés par des chiffres. ou bien ils peuvent être énoncés en entier. Dollar : Les valeurs valides sont des nombres précédés.aaaa. appuyez sur le bouton de la souris tout en maintenant la touche Maj enfoncée . appuyez sur le bouton de la souris tout en maintenant la touche Ctrl enfoncée. pour sélectionner plusieurs variables non contiguës. Dans le cas des fichiers de largeur fixe. également en option. jj.mm. et dans divers autres formats de date et d'heure. en option. . par un signe dollar et. aaaa/mm/jj. Point : Les valeurs valides correspondent aux nombres utilisant une virgule comme indicateur décimal et des points comme séparateurs de milliers. Virgule : Les valeurs valides correspondent aux nombres utilisant un point comme indicateur décimal et des virgules comme séparateurs de milliers. Par défaut. Pour sélectionner plusieurs variables contiguës. Sélectionnez un format de date dans la liste.51 Fichiers de données Format des données : Sélectionnez une variable dans la fenêtre d'aperçu. Dans le cas des fichiers délimités. le nombre de caractères des valeurs de chaîne est défini par le positionnement des lignes de délimitation des variables effectué à l'étape 4. et un indicateur de décimale. hh:mm:ss. des abréviations à trois lettres. vous pouvez spécifier le nombre de caractères de la valeur (le nombre maximal étant de 255). Chaîne : Les valeurs valides incluent pratiquement tous les caractères du clavier avec des blancs imbriqués. mm/jj/aaaa.

Vous pouvez enregistrer vos sélections dans un fichier pour les appliquer lors de l'importation de fichiers de données texte similaires. Assistant de texte . Les valeurs contenant l'un des séparateurs spécifiés seront considérées comme des valeurs multiples.étape 6 Il s'agit de la dernière étape de l'Assistant de texte. Il vous est également possible de coller la syntaxe générée par l'Assistant de texte dans une fenêtre de syntaxe.étape 6 Figure 3-20 Assistant de texte .52 Chapitre 3 Remarque : les valeurs comportant des caractères incorrects pour le format sélectionné seront traitées comme des valeurs manquantes. . Vous pouvez alors personnaliser et/ou enregistrer cette syntaxe afin de l'utiliser dans d'autres sessions ou d'autres tâches de production.

E Pour les autres fichiers de données. Enregistrement des fichiers de données Toute modification effectuée dans un fichier de données ne dure que le temps de la session en cours. puis sélectionnez le fichier de données. enregistrée dans un espace disque temporaire. La création d'un cache du fichier de données peut améliorer les performances. Vous pouvez également afficher des informations de dictionnaire complètes pour le fichier de travail. Les informations sur le fichier de données sont affichées dans le Viewer. dont : „ „ „ Le nom des variables Le format des variables Les étiquettes descriptives de variables et de valeurs. Il contient également toutes les informations sur la définition des variables. Informations sur les fichiers Un fichier de données SPSS contient bien plus que des données brutes. L'éditeur de données permet de voir les informations de la définition des variables. . choisissez : Fichier externe. à moins que vous n'enregistriez ces modifications de façon explicite. Ces informations sont enregistrées dans la partie dictionnaire du fichier de données de SPSS.53 Fichiers de données Mettre données en cache localement : Un cache de données est une copie complète du fichier de données. sélectionnez : Fichier Afficher des informations sur un fichier de données E Pour le fichier de données en cours d'utilisation. choisissez Fichier de travail. Pour obtenir des informations sur un fichier de données E A partir des menus de la fenêtre de l'éditeur de données. ou tout autre fichier de données SPSS.

Le format de fichier Excel induit des contraintes qui n'existent pas dans SPSS. Si vos données excèdent ces limites. Par exemple.0 ne peut pas ouvrir un document Excel 2000. Ces contraintes sont les suivantes : „ „ „ „ Les informations sur les variables. telles que les valeurs manquantes et les étiquettes de variable. une option permet d'inclure les étiquettes de valeurs au lieu des valeurs. Enregistrement de fichiers de données au format Excel Vous pouvez enregistrer vos données dans un des trois formats Microsoft Excel. Le choix du format dépend de la version d'Excel qui sera utilisée pour ouvrir les données. Les fichiers Excel 4. Les fichiers Excel 97–2000 autorisent 65 536 enregistrements.0/95 sont limités à 16 384 enregistrements. Excel 2000 peut facilement lire un document Excel 5.0 et Excel 5. un message d'avertissement apparaît et les données sont tronquées à la taille maximale autorisée par Excel. Excel 5. les 256 premières variables sont comprises dans le fichier exporté. Types de variable Le tableau suivant indique la concordance des types de variable entre les données SPSS d'origine et les données exportées dans Excel. sélectionnez : Fichier Enregistrer Le fichier de données modifié est enregistré. ou lignes de données.54 Chapitre 3 Pour enregistrer des fichiers de données modifiés E Faites en sorte que l'éditeur de données devienne la fenêtre active (cliquez n'importe où dans la fenêtre pour la rendre active). . E A partir du menu. Concernant l'exportation vers Excel 97 et les versions ultérieures. ne sont pas comprises dans les fichiers Excel exportés. et écrase les versions précédentes du fichier. L'application Excel ne peut pas ouvrir de fichier créé dans une version plus récente.0. Du fait que tous les fichiers Excel sont limités à 256 colonnes de données. Cependant.

#. value ORIGIN /* Pays d'origine */ . Les étiquettes de variable SPSS contenant plus de 40 caractères sont tronquées quand elles sont exportées vers un fichier SAS v6.##0. S'il n'existe aucune étiquette de variable dans les données SPSS.. le fichier de syntaxe généré contient : libname library 'd:\spss\' .. Quand elles existent.00.sav sont exportées.##0_).##0. $#. les étiquettes de variable SPSS sont associées aux étiquettes de variable SAS. proc format library = library . alors que SPSS en autorise un grand nombre. Par conséquent. lorsque les étiquettes de valeurs du fichier de donnéesvoitures. ces caractères interdits sont remplacés par un trait de soulignement. toutes les valeurs manquantes par défaut de SPSS sont associées à une seule de ces valeurs dans le fichier SAS. comme @.00. SAS n'autorise qu'une seule valeur manquante par défaut. 0... #.00. Lors de l'exportation des données.. Ces traitements sont les suivants : „ Certains caractères autorisés dans les noms de variable SPSS ne sont pas valides dans SAS. „ „ „ Enregistrement des étiquettes de valeurs Vous pouvez choisir d'enregistrer les valeurs et les étiquettes de valeurs associées à votre fichier de données dans un fichier de syntaxe SAS. le nom de variable est associé à l'étiquette de variable SAS...55 Fichiers de données Type de variable SPSS Numérique Virgule Dollar Date Heure Chaîne Format de données Excel 0.. # et $. Par exemple.00.. j-mmm-aaaa hh:mm:ss Général Enregistrement de fichiers de données au format SAS Vos données reçoivent divers traitements spéciaux quand elles sont enregistrées en tant que fichier SAS.

proc datasets library = library . value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */ 0 = 'Non sélectionnés' 1 = 'Sélectionnés' . value CYLINDER /* Nombre de cylindres */ 3 = '3 cylindres' 4 = '4 cylindres' 5 = '5 cylindres' 6 = '6 cylindres' 8 = '8 cylindres' .. Type de variable SPSS Numérique Virgule Points Notation scientifique Type de variable SAS Numérique Numérique Numérique Numérique Format de données SAS 12 12 12 12 . modify cars. Cette fonctionnalité n'est pas prise en charge par le fichier de transfert SAS. CYLINDER CYLINDER.. Types de variable Le tableau suivant indique la concordance des types de variable entre les données SPSS d'origine et les données exportées dans SAS.56 Chapitre 3 1 = 'Américaine' 2 = 'Européenne' 3 = 'Japonaise' . FILTER__ FILTER__.. format format format quit. ORIGIN ORIGIN.

sélectionnez : Fichier Enregistrer sous. E Entrez un nom de fichier pour le nouveau fichier de données. MMJJAA10. Pour enregistrer les étiquettes de valeurs à la place des valeurs de données au format Excel 97 : E Dans la boîte de dialogue Enregistrer les données sous. E A partir du menu.. Pour enregistrer les étiquettes de valeurs dans un fichier de syntaxe SAS (cette option n'est active que si un type de fichier SAS est sélectionné) : E Dans la boîte de dialogue Enregistrer les données sous.sas. cliquez sur Enregistrer les étiquettes de valeurs lorsqu'elles sont définies à la place des valeurs de données.. E Sélectionnez un type de fichier de la liste proposée. cliquez sur Enregistrer les étiquettes de valeurs dans un fichier .. Pour écrire des noms de variable sur la première ligne d'un fichier de données de format feuille de calcul ou délimité par des tabulations : E Cliquez sur Ecrire nom de var.57 Fichiers de données Type de variable SPSS Date Date (Heure) Dollar Devise personnalisée Chaîne Type de variable SAS Numérique Numérique Numérique Numérique Caractère Format de données SAS (date) par exemple. Time18 12 12 $8 Pour enregistrer des fichiers de données sous des formats différents E Faites en sorte que l'éditeur de données devienne la fenêtre active (cliquez n'importe où dans la fenêtre pour la rendre active). dans tableur dans la boîte de dialogue Enregistrer Données sous. ...

dat) : Fichier ASCII texte en format fixe.dat) : Fichiers texte ASCII avec valeurs séparées par des tabulations. Toutefois. Excel 2. Lorsque vous utilisez des fichiers de données ayant des noms de plus de huit octets sous SPSS 10.sav) : Format SPSS. Les noms de variable sont limités à huit octets et sont automatiquement convertis en noms à huit octets uniques si nécessaire. les noms longs originaux des variables sont perdus si vous enregistrez le fichier de données. les valeurs manquantes par défaut supplémentaires seront réalignées sur la première valeur manquante par défaut. les noms de variables originaux sont conservés pour la version 12. . Excel versions 97 et ultérieures (*. mais n'incluent pas les vecteurs multiréponses définis ni les données entrées pour l'information de Windows. Les fichiers de données enregistrés au format SPSS 7. Macintosh.0 (*. SPSS portable (*.58 Chapitre 3 Enregistrement de données : Types de fichier de données Vous pouvez enregistrer des données sous les formats suivants : SPSS (*. Le nombre maximum de variables est de 256 et le nombre maximum de lignes est de 65 536.xls) : Fichier de type tableur Microsoft Excel 2.x.1. Il n'y a pas de tabulations ni d'espaces entre les champs de variables.1 (*. Tabulé (*. Dans les versions SPSS antérieures à la version 10.0 et par les versions SPSS pour Windows antérieures. ASCII fixe (*.0 ou supérieure.0 peuvent être lus par SPSS 7.0 pour Windows. qui utilise le format d'écriture par défaut pour toutes les variables. SPSS 7.x ou 11. SPSS/PC+ (*.5.sav) : Format SPSS 7. seules les 500 premières seront sauvegardées. des versions uniques de noms de variable à huit octets sont utilisées. Les fichiers de données enregistrés dans le format SPSS ne peuvent être lus avec les versions du logiciel antérieures à la version 7. UNIX). Le nombre maximum de variables est de 256 et le nombre maximum de lignes est de 16 384.xls) : Fichier de type feuille de calcul Microsoft Excel 97/2000/XP. Si le fichier de données contient plus de 500 variables.sys) : Format SPSS/PC+.por) : Fichier SPSS portable qui peut être lu par d'autres versions de SPSS sur d'autres systèmes d'exploitation (par exemple. En ce qui concerne les variables ayant plus d'une valeur manquante par défaut définie.

Vous pouvez enregistrer un nombre maximum de 256 variables.xpt) : Fichier de transfert SAS. Vous pouvez enregistrer un nombre maximum de 256 variables. dBASE IV (*.ssd01) : Format de fichier SAS v6 pour UNIX (Sun.wk1) : Fichier tableur Lotus 1-2-3. format de nom de fichier long. SAS v6 pour UNIX (*.ssd04) : Format de fichier SAS v6 pour Alpha/OSF (DEC UNIX).59 Fichiers de données 1-2-3 Version 3.dbf) : Format dBASE II.slk) : Format de lien symbolique pour fichiers de type tableur Microsoft Excel et Multiplan.sd7) : SAS version 7-8 pour Windows.0 (*.0. version 2. dBASE III (*. SYLK (*. . SAS v7+ pour UNIX (*.dbf) : Format dBASE III. SAS v6 pour Alpha/OSF (*.0. SAS v7+ extension longue Windows (*. HP.0 (*.0 (*. version 3.sas7bdat) : SAS version 7-8 pour Windows. version 1A. Vous pouvez enregistrer un nombre maximum de 256 variables. format de nom de fichier court. IBM). SAS v7+ extension courte Windows (*. 1-2-3 Version 1.wks) : Fichier tableur Lotus 1-2-3. Vous pouvez enregistrer un nombre maximum de 256 variables. 1-2-3 Version 2.ssd01) : SAS v8 pour UNIX.sd2) : Format de fichier SAS v6 pour Windows/OS2. SAS v6 pour Windows (*.dbf) : Format dBASE IV.wk3) : Fichier tableur Lotus 1-2-3. SAS transfert (*. dBASE II (*.

E Sélectionnez SPSS (*.. la boîte de dialogue Enregistrer les données en tant que variables vous permet de sélectionner les variables à enregistrer dans le nouveau fichier de données.60 Chapitre 3 Enregistrement de sous-ensembles de variables Figure 3-21 Boîte de dialogue Enregistrer les données en tant que variables Pour les données enregistrées au format SPSS. Désélectionnez les variables à ne pas enregistrer.. ou cliquez sur Supprimer tout puis sélectionnez les variables à enregistrer. toutes les variables sont enregistrées. E A partir du menu. Par défaut. E Cliquez sur Variables. . sélectionnez : Fichier Enregistrer sous.sav) dans la liste des types de fichier. Pour enregistrer un sous-groupe de variables E Faites en sorte que l'éditeur de données devienne la fenêtre active (cliquez n'importe où dans la fenêtre pour la rendre active). E Sélectionnez les variables à enregistrer.

. puis que vous essayez d'enregistrer le fichier de données.61 Fichiers de données Enregistrement de fichier : Options Vous pouvez écrire des noms de variables dans la première ligne des fichiers de type tableur et des fichiers tabulés. Les procédures qui modifient les données nécessitent un certain volume d'espace disque temporaire afin de conserver une trace de ces modifications. la source de données d'origine est lue chaque fois que vous exécutez une procédure différente. Fichier actif virtuel Le fichier actif virtuel vous permet de travailler avec des fichiers de données volumineux sans nécessiter d'importants volumes d'espace disque temporaire. E A partir des menus de l'éditeur de données. Vous pouvez redonner au fichier l'attribut de lecture/écriture en sélectionnant Marquer le fichier comme étant en lecture/écriture dans le menu Fichier. vous pouvez paramétrer les fichiers en lecture seule. Dans le cas de la plupart des procédures d'analyse et de création de diagrammes. vous pouvez uniquement l'enregistrer sous un autre nom . et certaines opérations requièrent toujours un espace disque suffisant pour pouvoir effectuer au moins une copie intégrale du fichier de données. les données d'origine sont ainsi protégées. sélectionnez : Fichier Marquer le fichier comme étant en lecture seule Si vous apportez d'importantes modifications aux données. Protection des données d'origine Pour éviter de modifier/supprimer vos données d'origine par accident.

recodage de variables existantes . lecture de tableaux de base de données avec l'assistant de base de données . fusion de deux fichiers de données SPSS ou plus . fusion d'un fichier de données SPSS avec un tableau de base de données .62 Chapitre 3 Figure 3-22 Espace disque temporaire requis Les opérations ne nécessitant pas d'espace disque temporaire sont les suivantes : „ „ „ „ „ lecture de fichiers de données SPSS . . exécution de procédures créant ou modifiant des variables (par exemple. Les opérations créant une ou plusieurs colonnes de données dans un espace disque temporaire sont les suivantes : „ „ „ calcul de nouvelles variables . Explorer). exécution de procédures lisant les données (par exemple. Fréquences. Tableaux croisés. enregistrement de prévisions dans la Régression linéaire). Les opérations créant une copie intégrale du fichier de données dans un espace disque temporaire sont les suivantes : „ lecture de fichiers Excel .

Lecture des données avec la commande GET TRANSLATE ou DATA LIST Utilisation de la fonctionnalité Données de mémoire cache ou de la commande CACHE Ouverture depuis SPSS d'autres applications lisant le fichier de données (par exemple. Trier les observations. cette commande nécessitent des données triées .63 Fichiers de données „ „ „ „ exécution de procédures triant les données (par exemple. Pour désactiver cette option. aboutissant ainsi à la création d'une copie complète de ce fichier. l'absence d'une copie temporaire du fichier « actif » signifie que la source de données d'origine doit être lue de nouveau pour chaque procédure. cette option est sélectionnée. l'interface de boîtes de dialogue de ces procédures triera donc automatiquement le fichier de données. AnswerTree. DecisionTime). la requête SQL qui consulte les informations de la base doit être réexécutée .) Opérations créant une copie intégrale du fichier de données par défaut : „ „ Lecture de bases de données avec l'Assistant de base de données Lecture de fichiers texte avec l'Assistant de texte Les Assistants de base de données et de texte proposent un paramètre facultatif permettant de mettre automatiquement des données en mémoire cache. Toutefois. Dans le cas de fichiers de données volumineux provenant d'une source externe. Par défaut. Remarque : La commande GET DATA assure des fonctionnalités comparables à celles de la commande DATA LIST mais sans créer de copie intégrale du fichier de données dans un espace disque temporaire. (La syntaxe de commande n'est pas disponible dans la version Student. pour pouvoir fonctionner correctement. Création d'un cache de données Bien que le fichier actif virtuel contribue à réduire considérablement le volume d'espace disque temporaire requis. Dans le cas de tableaux de données lus dans une base de données. la création d'une copie temporaire des données peut améliorer les performances de lecture. Scinder fichier) . désélectionnez la case Mettre données en cache localement. Dans sa syntaxe. la commande SPLIT FILE ne trie pas le fichier de données et n'en crée donc pas de copie.

L'option Cacher maintenant est surtout utile pour deux raisons : „ Une source de données est « verrouillée » et ne peut être mise à jour tant que vous n'avez pas fermé la session. la requête SQL est donc réexécutée pour chaque nouvelle procédure que vous lancez.. Ceci étant le cas de quasiment toutes les procédures d'analyse statistique et de création de diagrammes. vous pouvez éliminer de nombreuses requêtes SQL et réduire ainsi les temps de traitement en créant un cache de données du fichier actif. L'option Cacher maintenant crée un cache de données immédiatement. Toutefois. le cache de données n'est pas créé automatiquement. Pour les sources de données volumineuses. C'est l'option que vous choisirez le plus souvent puisque cette opération ne nécessite pas de passage de données supplémentaire. ce qui généralement ne devrait pas s'avérer nécessaire. sélectionnez : Fichier Données de mémoire cache. l'Assistant de base de données crée automatiquement un cache de données. Remarque : Par défaut.. Le cache de données est une copie temporaire de la totalité des données. „ . (La syntaxe de commande n'est pas disponible dans la version Student. si vous utilisez la commande GET FILE dans une syntaxe afin de lire une base de données. ce qui risque d'entraîner un allongement considérable des temps de traitement si vous devez exécuter un grand nombre de procédures. E Cliquez sur OK ou sur Cacher maintenant. L'option OK créera un cache de données à la prochaine lecture des données (par exemple.) Pour créer un cache de données E A partir du menu. Si l'ordinateur sur lequel vous effectuez l'analyse (qu'il s'agisse de votre ordinateur local ou d'un serveur distant) dispose d'un volume d'espace disque suffisant. la consultation du contenu des données dans l'éditeur de données s'avérera bien plus rapide si vous placez les données dans un cache.64 Chapitre 3 pour toute commande ou procédure nécessitant la lecture des données. lorsque vous exécuterez une procédure statistique). ouvert une autre source de données ou créé un cache des données.

Par défaut. sélectionnez : Fichier Nouveau Syntaxe E Dans la fenêtre de syntaxe. sélectionnez : Exécuter Tous Remarque : Vous devez définir le paramètre de cache pour chaque session.65 Fichiers de données Pour mettre automatiquement des données en mémoire cache Vous pouvez paramétrer la commande SET pour qu'elle crée automatiquement un cache de données dès que vous avez apporté un certain nombre de modifications dans le fichier de données actif. La valeur n correspond au nombre de modifications apportées au fichier de données actif avant sa mise en mémoire cache. E A partir du menu. A chaque nouvelle session. entrez SET CACHE n. la valeur est paramétrée par défaut sur 20. E Dans le menu de la fenêtre de syntaxe. . le fichier de données actif est automatiquement mis en mémoire cache après 20 modifications.

.

des tâches sollicitant la mémoire de façon intensive. telles que la lecture et la transformation de données ainsi que le calcul de nouvelles variables et de statistiques. Remarque : L'analyse distribuée n'est disponible que si vous disposez à la fois d'une version locale du programme et d'un accès à une version serveur du même logiciel installé sur un serveur distant. L'analyse distribuée effectuée à l'aide d'un serveur distant peut s'avérer utile si votre travail met en œuvre : „ „ des fichiers de données volumineux. Les serveurs distants utilisés pour l'analyse distribuée se révélant généralement plus puissants et plus rapides que votre ordinateur local. 67 . contenant notamment des données provenant de bases de données . L'analyse distribuée n'affecte que les tâches impliquant des données. Elle n'a aucun effet sur les tâches associées à la modification de résultats. une utilisation appropriée du mode d'analyse distribuée permet de réduire considérablement les temps de traitement.Chapitre Mode d'analyse distribuée 4 Le mode d'analyse distribuée vous permet d'utiliser un autre ordinateur local que le vôtre (ou de bureau) pour les tâches sollicitant la mémoire de façon intensive. telles que la manipulation de tableaux pivotants ou la modification de diagrammes. Toute tâche longue à effectuer en mode d'analyse locale serait ainsi mieux adaptée à une analyse distribuée.

les autres diagrammes mettant en œuvre des données récapitulatives ou agrégées seront traités de façon adéquate en mode distribué puisque l'opération consistant à agréger les données est effectuée sur le serveur.68 Chapitre 4 Comparaison de l'analyse distribuée par rapport à l'analyse locale Voici quelques recommandations destinées à vous permettre de choisir entre le mode d'analyse locale et celui d'analyse distribuée : Accès aux bases de données : Il est possible que les tâches effectuant des requêtes dans des bases de données s'exécutent plus rapidement en mode distribué si le serveur dispose d'un accès prioritaire à ces bases de données ou qu'il s'exécute sur le même poste que le moteur de base de données. vous ne pourrez accéder à la base de données qu'en mode distribué. cette nécessité risque d'entraîner un ralentissement des performances en mode distribué puisque les données doivent être envoyées par le serveur distant à votre ordinateur local. Tâches rapides : Les tâches s'exécutant rapidement en mode local le feront presque toujours plus lentement en mode distribué du fait des sollicitations système inhérentes à l'architecture client-serveur. des tableaux pivotants en petit nombre ou peu volumineux. En revanche. . de brefs résultats en format texte. ou encore des diagrammes simples ou en nombre réduit) offriront des performances optimales si elles sont exécutées en mode distribué. Diagrammes interactifs : La possibilité (disponible en option) d'enregistrer des données brutes avec des diagrammes interactifs pouvant entraîner le transfert d'importantes quantités de données entre le serveur distant et votre ordinateur local. les diagrammes de résidus de régression ou les diagrammes séquentiels. Diagrammes : Les diagrammes conçus pour les observations. Rapport entre calculs et résultats : Les commandes effectuant un grand nombre de calculs et produisant peu de résultats (par exemple. Dans le cas de fichiers de données ou de tableaux de base de données volumineux. le temps requis pour l'enregistrement de vos résultats risque d'en être considérablement allongé. Le gain de performances obtenu dépend dans une large mesure de la puissance de calcul du serveur distant. Si le logiciel d'accès à la base de données requise n'est disponible que sur le serveur ou que votre administrateur réseau ne vous permet pas de télécharger des tableaux de données de grande taille. nécessitent la présence de données brutes sur votre ordinateur local. tels que les diagrammes de dispersion.

plus elle sera longue à s'effectuer en mode distribué. les résultats en format texte ne sollicitent que faiblement le système et sont transmis rapidement. tels que ceux disponibles dans la procédure Récapituler. Ceci se vérifie plus particulièrement dans le cas de la procédure Cubes OLAP et des tableaux contenant des données d'observations individuelles. Figure 4-1 Boîte de dialogue Connexion au serveur Vous pouvez ajouter et modifier des serveurs distants de la liste. Toutefois. Pour plus d'informations sur la connexion. ou en supprimer.69 Mode d'analyse distribuée Tableaux pivotants : La création de tableaux pivotants de grande taille peut s'avérer plus longue en mode distribué. . Résultats texte : Plus la quantité de texte générée est importante. Il peut s'agir de votre ordinateur local ou d'un serveur distant. et parfois même un nom de domaine. puis copié sur votre ordinateur local pour affichage. Les serveurs distants nécessitent généralement un ID utilisateur ainsi qu'un mot de passe. Connexion au serveur SPSS La boîte de dialogue Connexion au serveur vous permet de sélectionner l'ordinateur qui traite les commandes et exécute les procédures. car ce texte est créé sur le serveur distant.

Vous pouvez sélectionner un serveur par défaut et enregistrer l'ID utilisateur.78). contactez l'administrateur système. Figure 4-2 Boîte de dialogue Paramètres de connexion au serveur Contactez l'administrateur système pour obtenir la liste des serveurs disponibles et des numéros de port associés aux serveurs. vous êtes automatiquement connecté au serveur par défaut. Description : Entrez une description facultative devant apparaître dans la liste des serveurs. 202. Ajout et modification des paramètres de connexion au serveur Utilisez la boîte de dialogue Paramètres de connexion au serveur pour ajouter ou modifier des informations de connexion pour les serveurs distants à utiliser en mode d'analyse distribuée. les ID utilisateur. Nom : Un « nom » de serveur peut être un nom alphanumérique affecté à un ordinateur (par exemple.456. ainsi que des informations de connexion supplémentaires. les mots de passe et noms de domaine. Lorsque vous démarrez une session. .123. Numéro de port : Le numéro du port est le port que le logiciel du serveur utilise pour les communications.70 Chapitre 4 les serveurs disponibles. hqdev001) ou une adresse IP unique attribuée à un ordinateur (par exemple. N'utilisez le protocole SSL que si l'administrateur vous le demande. le nom de domaine et le mot de passe associés à un serveur.

Remarque : Lorsque vous démarrez une session. Sélection. sélectionnez : Fichier Changer serveur... nom de domaine et mot de passe (le cas échéant). toutes les fenêtres ouvertes sont automatiquement fermées. vous êtes automatiquement connecté au serveur par défaut. Pour sélectionner un serveur par défaut : E Dans la liste des serveurs. . Pour qu'il soit activé. changement ou ajout de serveurs E A partir du menu. Pour ajouter un serveur : E Demandez les informations de connexion du serveur à l'administrateur. Pour utiliser un autre serveur : E Sélectionnez un serveur dans la liste. cochez la case située en regard du serveur à utiliser. Remarque : Lorsque vous changez de serveur au cours d'une session. E Entrez l'ID utilisateur. le protocole SSL doit être configuré sur votre ordinateur et sur le serveur. E Cliquez sur Ajouter pour ouvrir la boîte de dialogue Paramètres de connexion au serveur.71 Mode d'analyse distribuée Connecter avec Secure Socket Layer : Le protocole SSL (Secure Sockets Layer) code les demandes d'analyse distribuée envoyées au serveur SPSS distant. le nom de domaine et le mot de passe fournis par l'administrateur. Avant d'utiliser le protocole SSL. E Entrez votre ID utilisateur. Le système vous demande d'enregistrer vos modifications avant la fermeture des fenêtres. consultez l'administrateur.

72 Chapitre 4 E Entrez les informations de connexion et les paramètres facultatifs. Le nom du serveur utilisé est indiqué dans la zone supérieure de la boîte de dialogue. . E Cliquez sur Edition pour ouvrir la boîte de dialogue Paramètres de connexion au serveur. la boîte de dialogue Ouvrir fichier distant remplace la boîte de dialogue Ouvrir fichier. „ La liste des fichiers. E Entrez les modifications et cliquez sur OK. Pour modifier un serveur : E Demandez les informations de connexion révisées à l'administrateur. dossiers et lecteurs disponibles dépend des données accessibles sur le serveur distant. puis cliquez sur OK. Ouverture de fichiers de données à partir d'un serveur distant Figure 4-3 Boîte de dialogue Ouvrir fichier distant En mode d'analyse distribuée.

73 Mode d'analyse distribuée „ En mode d'analyse distribuée. même s'ils se trouvent dans des dossiers partagés.. . Si vous souhaitez ouvrir plusieurs fichiers de données simultanément.. vous n'aurez accès aux fichiers de données de votre ordinateur local que si vous définissez le lecteur correspondant comme un lecteur partagé et les dossiers contenant vos fichiers de données comme des dossiers partagés. Si le système d'exploitation du serveur est différent du vôtre (Windows et UNIX par exemple). démarrez plusieurs sessions. ou Fichier Ouvrir la base de données ou Fichier Lire les données du texte. sélectionnez les options de menu suivantes : Fichier Ouvrir Données. Pour ouvrir des fichiers de données à partir d'un serveur distant E Si vous n'êtes pas encore connecté au serveur distant. „ Vous ne pouvez ouvrir qu'un seul fichier de données à la fois.. faites-le maintenant. vous n'aurez probablement pas accès aux fichiers de données locaux en mode d'analyse distribuée. Le fichier de données courant est automatiquement fermé quand un nouveau fichier de données est ouvert.. E Selon le type de fichier de données à ouvrir.

Les droits d'accès relatifs aux dossiers partagés doivent inclure la possibilité d'écrire dans les dossiers si vous souhaitez enregistrer les fichiers de données dans un dossier local. vous n'aurez probablement pas accès aux fichiers de données locaux en mode d'analyse distribuée. Vous n'aurez accès aux dossiers de votre ordinateur local que si vous définissez le lecteur correspondant comme un lecteur partagé et les dossiers comme des dossiers partagés. même s'ils se trouvent dans des dossiers partagés. la boîte de dialogue Enregistrer fichier distant remplace la boîte de dialogue Enregistrer fichier standard. Si le système d'exploitation du serveur est différent du vôtre (Windows et UNIX par exemple).74 Chapitre 4 Enregistrement de fichiers de données à partir d'un serveur distant Figure 4-4 Boîte de dialogue Enregistrer fichier distant En mode d'analyse distribuée. Pour enregistrer des fichiers de données à partir d'un serveur distant E Activez la fenêtre de l'éditeur de données. Le nom du serveur utilisé est indiqué dans la zone supérieure de la boîte de dialogue. . La liste des dossiers et lecteurs disponibles dépend des données accessibles sur le serveur distant.

75 Mode d'analyse distribuée E A partir du menu. Vous pouvez afficher tous les fichiers de données et dossiers de votre ordinateur. il ne s'agit pas des dossiers et lecteurs de votre ordinateur. dossiers et lecteurs correspond à celui obtenu du point de vue du serveur distant. l'affichage des fichiers de données. sélectionnez : Fichier Enregistrer (ou Enregistrer sous.. Mode d'analyse locale : Lorsque vous utilisez votre ordinateur local comme « serveur ». mais des dossiers et lecteurs du serveur distant. Mode d'analyse distribuée : Lorsque vous utilisez un autre ordinateur comme « serveur distant » pour exécuter les commandes et procédures. l'affichage des fichiers de données. . Bien que vous puissiez obtenir des noms de dossiers familiers tels que Program Files et des lecteurs portant la lettre C. dossiers et lecteurs dans la boîte de dialogue d'accès aux fichiers (permettant d'ouvrir les fichiers de données) est le même que celui fourni dans d'autres applications ou dans l'Explorateur de Windows.. dossiers (répertoires) et lecteurs de votre ordinateur local et du réseau dépend de l'ordinateur que vous utilisez pour traiter les commandes et exécuter les procédures (qui ne correspond pas obligatoirement à l'ordinateur que vous avez en face de vous).) Accès aux fichiers de données en mode d'analyse locale ou distribuée Mode : L'affichage des fichiers de données. ainsi que tous les fichiers et dossiers stockés sur les lecteurs réseau que vous obtenez en temps normal.

Si le système d'exploitation du serveur est différent du vôtre (Windows et UNIX par exemple). Si le titre de la boîte de dialogue contient le terme Distant (comme dans Ouvrir fichier distant) ou . examinez la barre de titre de la boîte de dialogue permettant d'accéder aux fichiers de données. En mode local. En mode distribué. vous n'aurez probablement pas accès aux fichiers de données locaux en mode d'analyse distribuée. vous accédez à d'autres disques réseau depuis le serveur distant. Vous pouvez accéder aux fichiers de données situés sur d'autres disques réseau en mode d'analyse locale ou en mode d'analyse distribuée. même s'ils se trouvent dans des dossiers partagés. Pour savoir si vous utilisez le mode local ou le mode distribué. vous n'aurez accès aux fichiers de données de votre ordinateur local que si vous définissez le lecteur correspondant comme un lecteur partagé et les dossiers contenant vos fichiers de données comme des dossiers partagés. L'utilisation du mode d'analyse distribuée n'équivaut pas à accéder aux fichiers de données stockés sur un autre ordinateur de votre réseau. vous accédez à d'autres disques à partir de votre ordinateur local.76 Chapitre 4 Figure 4-5 Affichages local et distant En mode d'analyse distribuée.

le passage de l'utilisation de votre ordinateur local à celle d'un serveur distant entraînera la suppression des procédures concernées des menus ainsi que des erreurs dans les fichiers de commande correspondants. Pour plus d'informations sur le partage de lecteurs et de dossiers. E Cliquez sur l'onglet Partage. Pour tous les autres types de fichier (tels que les fichiers Viewer. Bien que cette dernière situation paraisse peu probable. et vice versa. Vous ne pouvez pas utiliser de procédures installées sur le serveur mais non installées sur votre version locale. Ouvrir base de données et Appliquer le dictionnaire des données). seules les procédures installées à la fois sur votre version locale et sur la version du serveur distant sont disponibles. les fichiers de syntaxe et les fichiers scripts). puis sur Nom de partage. . Remarque : Ceci ne concerne que les boîtes de dialogue permettant d'accéder aux fichiers de données (telles que Ouvrir données. Enregistrer sous. il peut arriver que certains éléments optionnels soient installés sur votre poste local et ne soient pas disponibles sur le serveur distant. consultez l'aide de votre système d'exploitation. Disponibilité des procédures en mode d'analyse distribuée En mode d'analyse distribuée. Pour définir des droits d'accès de partage pour un lecteur ou un dossier E Dans Poste de travail. cliquez sur Propriétés.77 Mode d'analyse distribuée que le libellé Serveur distant : [nom_de_serveur] apparaît dans la zone supérieure de la boîte de dialogue. Dans ce cas. Vous devrez rétablir le mode local pour restaurer toutes les procédures affectées. E Dans le menu Fichier. vous utilisez le mode d'analyse distribuée. l'affichage local est toujours utilisé. cliquez sur le dossier (répertoire) ou le lecteur à partager.

78 Chapitre 4 Utilisation des spécifications de chemins UNC Avec la version serveur Windows NT de SPSS. comme dans l'exemple suivant : GET FILE='\\204. . Si aucun nom n'a été attribué à l'ordinateur. Si le répertoire et/ou le fichier n'existent pas sur le serveur distant.sav'. vos fichiers de commande seront soumis à des erreurs. les spécifications de chemins relatifs pour des fichiers de données sont relatives par rapport au serveur utilisé en mode d'analyse distribuée.125. Une spécification de chemin UNC prend généralement la forme suivante : \\nom_serveur\nom_partage\chemin\nom_fichier „ „ „ „ L'élément nom_serveur est le nom de l'ordinateur contenant le fichier de données. vous pouvez utiliser des noms de chemin UNC (Universal Naming Convention = convention de dénomination universelle) pour spécifier l'emplacement des fichiers de données dans vos fichiers de commande. L'élément nom_fichier est le nom du fichier de données. cela signifie qu'une spécification de chemin telle que c:\Mes_documents\Mes_données.125. L'élément nom_partage désigne le dossier (répertoire) de l'ordinateur défini comme dossier de partage. Avec la version serveur Windows NT de SPSS. et non par rapport à votre ordinateur local. Lorsque vous utilisez le mode d'analyse distribuée. mais un répertoire et un fichier du disque dur du serveur distant.sav'. vous pouvez utiliser son adresse IP.sav ne désigne pas un répertoire et un fichier de votre disque C. les fichiers de données de votre ordinateur local sont inclus dans le traitement. Par exemple : GET FILE='\\hqdev001\public\juillet\ventes. Concrètement. comme dans l'exemple suivant : GET FILE='c:\Mes_documents\Mes_données. Même si vous utilisez des spécifications de chemins UNC.53\public\juillet\ventes.sav'. L'élément chemin correspond aux sous-dossiers (sous-répertoires) du dossier partagé. vous ne pouvez accéder qu'aux fichiers de données installés sur des lecteurs et des dossiers partagés.

si le fichier de données se trouve dans le répertoire /bin/spss/data et que le répertoire actif est également /bin/spss/data.sav' n'est pas valide.79 Mode d'analyse distribuée Serveurs UNIX : Sur les plateformes UNIX. la commande GET FILE='ventes. Par exemple. Vous devez indiquer l'intégralité du chemin d'accès. à savoir : GET FILE='/bin/data/spss/ventes. Pour tous les répertoires. vous devez indiquer un chemin d'accès absolu.sav'. Les chemins relatifs ne sont pas admis. il n'existe aucun équivalent à la dénomination UNC. commençant à la racine du serveur. .

.

semblable à celle d'un tableur. chaîne. 81 . Affichage des variables : Affiche les informations de définition des variables. La fenêtre de l'éditeur de données s'ouvre automatiquement lorsque vous lancez une session SPSS. L'éditeur de données permet d'afficher les données de deux façons : „ „ Affichage Données : Affiche les valeurs réelles des données ou les étiquettes de valeurs définies. Dans les deux affichages. à savoir les étiquettes de valeurs et de variable définies. vous pouvez ajouter. modifier et supprimer les informations contenues dans le fichier de données.Chapitre Editeur de données 5 L'éditeur de données fournit une méthode pratique. date ou valeur numérique). ordinale ou échelle) et les valeurs manquantes définies par l'utilisateur. le niveau de mesure (nominale. le type des données (par exemple. permettant de créer et de modifier des fichiers de données SPSS.

La taille du fichier de données est déterminée par le nombre d'observations et de variables. chaque élément ou élément d'un questionnaire est une variable. Si vous entrez des données dans une cellule en dehors des limites du fichier de données défini. les „ „ „ . Il y a toutefois des différences importantes : „ Les lignes sont des observations. Le fichier de données est rectangulaire. Les cellules contiennent des valeurs. Chaque ligne représente une observation. Vous pouvez entrer des données dans n'importe quelle cellule. Chaque cellule contient une seule valeur pour une variable et pour une observation. Les cellules ne contiennent que des valeurs de données. En ce qui concerne les variables numériques. chaque répondant d'un questionnaire est considéré comme étant une observation. les cellules de l'éditeur de données ne peuvent pas contenir de formules. La cellule est l'intersection de l'observation et de la variable. Par exemple. Chaque colonne représente une variable ou une caractéristique étant mesurée. Les colonnes sont des variables. A la différence des tableurs. Par exemple.82 Chapitre 5 Affichage des données Figure 5-1 Affichage des données Un grand nombre de fonctions de l'Affichage des données sont similaires à celles que proposent les tableurs. SPSS agrandit le rectangle des données pour inclure toutes les lignes et/ou colonnes nécessaires entre cette cellule et les limites du fichier. Il n'y a pas de cellule « vide » à l'intérieur des limites du fichier de données.

Les colonnes sont des attributs de variable. En ce qui concerne les variables chaîne. Vous pouvez ajouter ou supprimer des variables et modifier les attributs de ces dernières. Les valeurs manquantes définies par l'utilisateur . un blanc est considéré comme une valeur valide. Affichage des variables Figure 5-2 Affichage des variables L'Affichage des variables présente les descriptions des attributs de chaque variable du fichier de données.83 Editeur de données cellules à blanc sont converties en valeurs manquantes par défaut. à savoir : „ „ „ „ „ „ Le nom de la variable Le type de données Le nombre de chiffres ou de caractères Le nombre de décimales Les étiquettes descriptives de variables et de valeurs. Dans l'Affichage des variables : „ „ Les lignes sont des variables.

84 Chapitre 5 „ „ La largeur des colonnes Le niveau de mesure Tous ces attributs sont enregistrés lorsque vous sauvegardez le fichier de données. L'option Définir les propriétés de variable (également disponible dans le menu Données de la fenêtre de l'éditeur de données) permet d'analyser vos données et de répertorier toutes les valeurs de données uniques pour les variables sélectionnées et d'identifier les valeurs non étiquetées. et fournit une fonction d'étiquetage automatique. entrez un nom de variable dans une ligne vierge. Les autres caractères peuvent être . Ceci est particulièrement utile pour les variables qualitatives qui utilisent des codes numériques pour représenter les modalités. E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des données ou cliquez sur l'onglet Affichage des variables. Vous pouvez définir les propriétés des variables dans l'Affichage des variables. E Sélectionnez les attributs à définir ou modifier. „ Pour afficher ou définir des attributs de variable E Activez la fenêtre de l'éditeur de données. Noms de variable Les règles suivantes s'appliquent pour les noms des variables : „ Le nom doit commencer par une lettre. Par exemple. 0 = Masculin. mais vous disposez également de deux autres méthodes pour ce faire : „ L'assistant Copier des propriétés de données permet d'utiliser un fichier de données SPSS externe comme modèle pour définir les propriétés de fichier et de variable dans le fichier de travail. 1 = Féminin. Vous pouvez également utiliser des variables du fichier de travail comme modèles pour d'autres variables de ce même fichier. L'option Copier des propriétés de données est disponible dans le menu Données de la fenêtre de l'éditeur de données. E Pour définir de nouvelles variables.

un point. chinois et coréen par exemple). !. et *). BY. „ „ „ „ „ Niveau de mesure des variables Vous pouvez spécifier un niveau de mesure d'échelle (données numériques sur un intervalle ou une échelle de rapport).85 Editeur de données n'importe quelle lettre. russe. Les noms de variables peuvent être définis par n'importe quelle combinaison de majuscules et de minuscules. GE. Les espaces et les caractères spéciaux ne peuvent pas être utilisés (par exemple.) Les fichiers de données au format SPSS utilisés avec l'Arbre de réponse. '. AND. allemand. Chaque nom de variable doit être unique . _ ou $. aucune duplication n'est admise. italien. Les noms de variable se terminant par un blanc souligné sont à éviter (pour éviter des conflits avec les variables créées automatiquement par certaines procédures). EQ. arabe et thaï par exemple) et à 32 caractères dans les langues sur deux octets (japonais. ou les symboles @. La casse est respectée pour des raisons d'affichage. LT. espagnol. GT. SPSS essaie d'insérer les sauts de ligne au niveau des traits de soulignement. LE. Les variables nominales et ordinales sont toutes deux traitées comme qualitatives. NE. des virgules et des passages de minuscule à majuscule. #. OR. TO. „ „ „ Les noms de variable ne peuvent pas se terminer par un point. La longueur du nom ne doit pas excéder 64 octets. WITH. NOT. La spécification de mesure n'est à utiliser que pour : „ Procédures Tableaux personnalisés et procédures de diagramme qui identifient les variables comme variables d'échelle ou variables qualitatives. Lorsque des noms longs occupent plusieurs lignes au niveau du résultat. „ . ordinal ou nominal Les données nominales et ordinales peuvent être des chaînes de caractères (alphanumériques) ou numériques. (l'option Tableaux personnalisés n'est disponible que pour les composants de l'option complémentaire Tableaux. hébreu. ?. n'importe quel chiffre. français. grec. Soixante-quatre octets correspondent à 64 caractères dans les langues sur un octet (anglais. Les mots-clés réservés ne peuvent pas être utilisés pour les noms de variables : Les mots-clés réservés sont les suivants : ALL.

2 = moyen. Les variables ordinales peuvent être des valeurs chaîne (alphanumériques) ou des valeurs numériques représentant des modalités distinctes (par exemple. pour une variable chaîne comportant des valeurs Faible. Par exemple.86 Chapitre 5 Vous pouvez sélectionner l'un des trois niveaux de mesure suivants : Echelle : Les valeurs de données sont des valeurs numériques sur une échelle d'intervalles ou une échelle de rapport (par exemple. Nominal : Les valeurs de données représentent les modalités sans ordre intrinsèque (par exemple. il est recommandé d'utiliser les codes numériques pour représenter les données ordinales. 1 = faible. Remarque : Pour les variables chaîne ordinales. l'ordre alphabétique des valeurs chaîne est supposé refléter l'ordre des modalités. tout à fait d'accord. Faible ou Moyen. Ordinal : Les valeurs de données représentent les modalités dans un ordre intrinsèque (par exemple. . élevé . modalité d'emploi ou service d'entreprise). Moyen. âge ou revenu). En règle générale. 3 = élevé). 1 = Masculin. Elevé. moyen. plutôt d'accord. pas du tout d'accord). l'ordre des modalités est interprété comme Elevé. 2 = Féminin). faible. plutôt pas d'accord. Les variables d'échelle doivent être numériques. Les variables nominales peuvent être des valeurs chaîne (alphanumériques) ou des valeurs numériques représentant des modalités distinctes (par exemple. ce qui ne correspond pas à l'ordre correct.

modifiez les options de diagramme interactif (dans le menu Edition. Les variables sous forme de chaîne de caractères ainsi que les variables numériques avec des étiquettes de valeurs définies sont définies comme ordinales. Le nombre par défaut de valeurs uniques est 24. choisissez Options. .87 Editeur de données Figure 5-3 Variables d'échelle et qualitatives dans une procédure de diagramme Pour les fichiers de données au format SPSS créés avec les anciennes versions de produits SPSS. Les variables numériques sans étiquettes de valeurs définies mais supérieures à un nombre spécifié de valeurs uniques sont définies comme variables d'échelle. Les variables numériques sans étiquettes de valeurs définies mais inférieures à un nombre spécifié de valeurs uniques sont définies comme ordinales. onglet Interactif). Pour modifier la valeur spécifiée. les règles suivantes s'appliquent : „ „ „ „ Les variables sous forme de chaîne de caractères (alphanumériques) sont définies comme nominales.

. Par défaut. il vous suffit de sélectionner un format dans une liste déroulante contenant des exemples. toute nouvelle variable est numérique. Pour certains types de données. Figure 5-4 Boîte de dialogue Type de variable Les types de données disponibles sont les suivants : Numérique : Variable dont les valeurs sont des nombres. Virgule : Variable numérique dont les valeurs sont affichées avec des virgules toutes les trois positions. Le contenu de la boîte de dialogue Type de variable dépend du type de données sélectionné.88 Chapitre 5 Type de variable L'option Type de variable permet de définir le type de données pour chaque variable. le point servant de séparateur décimal. L'éditeur de données accepte les valeurs numériques pour les variables de point avec ou sans point ou sous forme de notation scientifique. la virgule servant de séparateur décimal. L'éditeur de données accepte les valeurs numériques au format standard ou sous forme de notation scientifique. Pour d'autres types de données. L'éditeur de données accepte les valeurs numériques pour les variables de virgule avec ou sans virgule ou sous forme de notation scientifique. il y a des zones de texte où sont indiqués la longueur et le nombre de décimales. Point : Variable numérique dont les valeurs sont affichées avec des points toutes les trois positions. Les valeurs sont affichées en format numérique standard. Vous pouvez utiliser l'option Type de variable pour changer le type des données.

vous pouvez entrer des valeurs avec n'importe quel nombre de positions décimales (maximum 16).23E2. onglet Données). Par exemple.23+2.23E+2 et même 1. L'exposant peut être précédé d'un E ou d'un D avec ou sans signe. L'éditeur de données accepte des valeurs numériques pour les variables de notation scientifique avec ou sans exposant. comme séparateur.23D2. Sélectionnez un format dans la liste. 1. des points. 1. Chaîne : Variable dont les valeurs ne sont pas numériques et ne sont donc pas utilisées pour les calculs. Virgule et Point. Ces variables peuvent contenir n'importe quel caractère. et la valeur entière est enregistrée. E Sélectionnez le type de données dans la boîte de dialogue Type de variable. Pour définir le type de variable E Cliquez sur le bouton de la cellule Type de la variable à définir. Egalement appelées variables alphanumériques. Vous pouvez entrer des dates avec. des virgules ou des espaces. . la valeur complète est utilisée dans tous les calculs. ou seulement d'un signe. 1.89 Editeur de données Notation scientifique : Variable numérique dont les valeurs sont affichées avec un E intégré et un exposant de puissance dix avec signe. des barres obliques. les valeurs affichées dans l'Affichage des données peuvent différer des valeurs réelles entrées et enregistrées en interne. Options. des traits d'union. Symbole monétaire : Variable numérique dont les valeurs sont affichées dans l'un des formats monétaires personnalisés que vous avez définis dans l'onglet Devise de la boîte de dialogue Options. L'Affichage des données n'affiche que le nombre de décimales défini et arrondit les valeurs comportant plus de décimales. Date : Variable numérique dont les valeurs sont affichées dans l'un des formats de date ou d'heure possibles. Toutefois. Les majuscules et les minuscules sont différenciées. La valeur du siècle pour les années à 2 chiffres est déterminée par les paramètres Options (accessibles depuis le menu Edition. 123. Les caractères de symbole monétaire définis ne sont pas utilisables lors de la saisie de données mais sont affichés dans l'éditeur de données. dans la limite de la longueur définie. Voici quelques règles générales : „ Pour les formats Numérique. Formats d'entrée/d'affichage Selon le format.

les mois et les années. Les dates de format général sous la forme jj/mm/aa et mm/jj/aa sont affichées avec des barres obliques comme séparateurs et des nombres pour le mois. De manière interne. onglet Données). les temps sont enregistrés comme étant le nombre de secondes depuis le 14 octobre 1582. Pour une variable chaîne d'une longueur de 4. contrairement aux noms de variables. Pour les formats de temps.90 Chapitre 5 „ Pour les variables chaîne. des tirets. vous pouvez utiliser les deux points. vous pouvez utiliser des barres obliques. des virgules ou des points comme séparateurs entre les jours. toutes les valeurs sont cadrées à droite au maximum de la longueur. De façon interne. choisissez Options. Les dates de format général sous la forme jj-mmm-aa sont affichées avec des tirets servant de séparateurs et des abréviations à trois lettres pour le mois. „ „ Etiquettes des variables Vous pouvez définir des étiquettes descriptives des variables contenant jusqu'à 256 caractères (128 caractères dans les langues sur deux octets). des espaces. des abréviations à trois lettres ou le nom des mois en clair. Pour les mois. une valeur de 'Non' est enregistrée en tant que 'Non' et n'est pas équivalente à ' Non'. et elles peuvent comporter des espaces et des caractères réservés. les minutes et les secondes. les dates sont enregistrées sous la forme d'un nombre de secondes à partir du 14 octobre 1582. Pour les formats de dates. E Entrez l'étiquette de variable descriptive dans la cellule Etiquette de la variable. La plage de siècles pour les dates avec des années à deux chiffres est déterminée à partir des paramètres Options (dans le menu Edition. . des points ou des espaces comme séparateurs entre les heures. Les temps sont affichés avec des deux points comme séparateurs. Pour spécifier des étiquettes de variable E Activez la fenêtre de l'éditeur de données. E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des données ou cliquez sur l'onglet Affichage des variables. vous pouvez entrer des nombres.

vous pouvez également modifier les résultats pour insérer des sauts de ligne manuellement si vous voulez que le saut de ligne se fasse ailleurs. Les étiquettes de valeur ne sont pas disponibles pour les variables chaîne longues (variables chaîne de plus de 8 caractères). E Pour chaque valeur. Ceci se révèle particulièrement utile si votre fichier de données utilise des codes numériques pour représenter des modalités non numériques (par exemple. Insertion de sauts de ligne dans les étiquettes Les étiquettes de variable ou de valeur ont un retour à la ligne automatique dans les tableaux pivotants et les diagrammes si la cellule ou la zone n'est pas assez large pour afficher l'étiquette sur une seule ligne . E Cliquez sur Ajouter pour entrer l'étiquette de valeur. entrez la valeur et une étiquette.91 Editeur de données Etiquettes de valeurs Vous pouvez affecter des étiquettes descriptives de valeur pour chaque valeur d'une variable. Vous pouvez aussi créer des étiquettes de variable ou de valeur qui . Figure 5-5 Boîte de dialogue Etiquettes de valeurs Pour spécifier des étiquettes de valeur E Cliquez sur le bouton de la cellule Valeurs de la variable à définir. „ „ Les étiquettes de valeur peuvent comporter jusqu'à 60 caractères. les codes 1 et 2 pour homme et femme).

. sélectionnez la cellule Valeurs de la variable dans la zone Affichage des variables de l'éditeur de données. E Dans l'étiquette. Il est souvent utile de savoir la raison pour laquelle une information est manquante. Les valeurs des données définies comme valeurs utilisateur manquantes sont repérées par un indicateur en vue d'un traitement spécial et sont exclues de la plupart des calculs. Valeurs manquantes L'option Valeurs manquantes permet de définir les valeurs de données spécifiées comme valeurs manquantes spécifiées par l'utilisateur. vous pouvez vouloir faire la distinction entre les données manquantes parce qu'une personne interrogée a refusé de répondre et les données manquantes parce que la question ne s'appliquait pas au répondant. saisissez \n à l'endroit où vous voulez insérer un retour à la ligne. Par exemple. sélectionnez la cellule Etiquette de la variable dans la zone Affichage des variables de l'éditeur de données. il est reconnu comme un caractère de saut de ligne.92 Chapitre 5 effectueront toujours un retour à la ligne en des points définis et qui comporteront plusieurs lignes : E Pour les étiquettes de variable. puis sélectionnez l'étiquette que vous souhaitez modifier dans la boîte de dialogue Etiquettes de valeur. E Pour les étiquettes de valeur. Le « \n » ne s'affiche pas dans les tableaux pivotants ou les diagrammes . cliquez sur le bouton qui apparaît dans la cellule.

un intervalle de valeurs manquantes ou un intervalle plus une valeur de votre choix. Pour définir des valeurs nulles ou vides comme manquantes pour une variable chaîne.93 Editeur de données Figure 5-6 Boîte de dialogue Valeurs manquantes „ „ Vous pouvez entrer jusqu'à trois valeurs manquantes de votre choix. (variables chaîne de plus de 8 caractères). Les intervalles ne peuvent être spécifiés que pour des valeurs numériques. y compris les valeurs nulles ou vides. entrez un seul espace dans l'un des champs pour Valeurs manquantes discrètes. E Entrez les valeurs ou l'intervalle de valeurs représentant les valeurs manquantes. Pour définir les valeurs manquantes E Cliquez sur le bouton de la cellule Manquante de la variable à définir. . „ Vous ne pouvez pas définir de valeur manquante pour des variables chaîne longues Valeurs manquantes pour des variables de chaîne : Toutes les valeurs de chaîne. sont considérées comme des valeurs valides à moins que vous ne les définissiez comme manquantes.

L'alignement par défaut est « droite » pour les variables numériques et « gauche » pour les variables chaîne. sont considérées comme des valeurs valides à moins que vous ne les définissiez comme manquantes. vous pouvez copier des attributs et les appliquer à une ou à plusieurs variables. Vous pouvez également modifier la largeur des colonnes dans l'Affichage des données en cliquant sur les bords des colonnes et en les faisant glisser. Les formats de colonnes affectent seulement l'affichage des valeurs dans l'éditeur de données. Largeur des colonnes Vous pouvez spécifier le nombre de caractères définissant la largeur des colonnes. Vous pouvez : „ „ „ Copier un seul attribut (par exemple. Ce paramètre affecte uniquement l'Affichage des données. Alignement de variable L'alignement contrôle l'affichage des valeurs des données et/ou des étiquettes de valeurs dans l'Affichage des données.94 Chapitre 5 Toutes les valeurs de chaîne. entrez un seul espace dans l'un des champs pour Valeurs manquantes discrètes. des astérisques (*) apparaissent dans l'Affichage des données. Modifier la largeur de la colonne ne change pas la largeur définie d'une variable. L'application d'attributs de définition de variable s'effectue au moyen des opérations Copier et Coller de base. Application d'attributs de définition de variable à plusieurs variables Lorsque vous avez défini les attributs de définition d'une variable. y compris les valeurs nulles ou vides. les étiquettes de valeurs) et le coller dans la ou les mêmes cellules d'attribut d'une ou de plusieurs variables. Copier tous les attributs d'une variable et les coller dans d'autres variables. Créer plusieurs variables avec tous les attributs de la copie d'une variable. Si la largeur réelle et la largeur définie d'une valeur sont plus larges que la colonne. Pour définir des valeurs nulles ou vides comme manquantes pour une variable chaîne. .

procédez comme suit : E Dans l'Affichage des variables. E A partir du menu. E A partir du menu. sélectionnez : Edition Coller . E A partir du menu. à l'exception de celui que vous avez sélectionné. sélectionnez la cellule d'attribut à appliquer à d'autres variables. de nouvelles variables sont créées avec des valeurs d'attribut par défaut pour tous les attributs. La totalité de la ligne est mise en surbrillance. sélectionnez : Edition Copier E Sélectionnez le numéro de ligne de la variable à laquelle vous souhaitez appliquer les attributs. procédez comme suit : E Dans l'Affichage des variables. sélectionnez : Edition Copier E Sélectionnez la ou les cellules d'attribut auxquelles vous souhaitez appliquer l'attribut. E A partir du menu. Vous pouvez sélectionner plusieurs variables cible.95 Editeur de données Application d'attributs de définition de variable à d'autres variables Pour appliquer certains attributs d'une variable définie. Pour appliquer tous les attributs d'une variable définie. sélectionnez : Edition Coller Si vous collez l'attribut dans des lignes vierges. sélectionnez le numéro de ligne de la variable présentant les attributs à utiliser. Vous pouvez sélectionner plusieurs variables cible.

E Entrez le nombre de variables à créer. Les noms des nouvelles variables seront composés du préfixe spécifié et d'un numéro séquentiel commençant par le numéro spécifié.. cliquez sur le numéro de ligne de la variable présentant les attributs à utiliser pour la nouvelle variable. La totalité de la ligne est mise en surbrillance. „ Lorsque vous sélectionnez une cellule et lorsque vous entrez une valeur de données.. sélectionnez : Edition Copier E Cliquez sur le numéro de la ligne vide qui se trouve sous la dernière variable définie dans le fichier de données. Vous pouvez entrer des données par observation ou par variable. E A partir du menu. . Vous pouvez entrer des données dans n'importe quel ordre. E A partir du menu.96 Chapitre 5 Création de plusieurs nouvelles variables avec les mêmes attributs E Dans l'Affichage des variables. Saisie de données Vous pouvez entrer des données directement dans l'éditeur de données au niveau de l'Affichage des données. Le nom de variable et le numéro de ligne de la cellule active sont affichés dans le coin supérieur gauche de l'éditeur de données. E Entrez un préfixe et un numéro de départ pour les nouvelles variables. „ „ La cellule active est mise en surbrillance. la valeur est affichée dans l'éditeur de cellules en haut de l'éditeur de données. pour des zones sélectionnées ou des cellules individuelles. sélectionnez : Edition Coller les variables.

E Entrez la valeur des données.97 Editeur de données „ „ Les valeurs de données ne sont pas enregistrées tant que vous n'avez pas appuyé sur Entrée ou que vous n'avez pas sélectionné une autre cellule. Pour entrer autre chose que des données numériques simples. vous devez d'abord définir le type de variable. E Appuyez sur Entrée ou sélectionnez une autre cellule pour enregistrer la valeur. La valeur est affichée dans l'éditeur de cellules en haut de l'éditeur de données. Figure 5-7 Fichier de travail dans l'Affichage des données Pour entrer des données numériques E Sélectionnez une cellule dans l'Affichage des données. . Si vous entrez une valeur dans une colonne vide. l'éditeur de données crée automatiquement une nouvelle variable et affecte un nom de variable.

Restrictions concernant la valeur de données dans l'éditeur de données Le type et la largeur de la variable définie déterminent le type de valeur que vous pouvez entrer dans la cellule de l'Affichage des données. „ Si vous tapez un caractère qui n'est pas autorisé par le type défini de la variable. Remarque : cela ne fonctionne que si vous avez défini des étiquettes de valeurs pour la variable. Pour utiliser des étiquettes de valeur pour l'entrée de données E Si les étiquettes de valeurs n'apparaissent pas dans l'Affichage des données. La valeur est saisie et l'étiquette de valeur est affichée dans la cellule. choisissez dans les menus : Affichage Etiquettes de valeurs E Cliquez sur la cellule dans laquelle vous souhaitez entrer la valeur. E Double-cliquez sur le numéro de ligne ou cliquez sur l'onglet Affichage des données. E Cliquez sur le bouton de la cellule Type de la variable. . l'éditeur de données émet un signal sonore et n'accepte pas le caractère. E Sélectionnez une étiquette de valeur dans la liste déroulante. E Sélectionnez le type de données dans la boîte de dialogue Type de variable. E Cliquez sur OK.98 Chapitre 5 Pour entrer des données non numériques E Double-cliquez sur un nom de variable en haut de la colonne de l'Affichage des données ou cliquez sur l'onglet Affichage des variables. entrez les données dans la colonne. E Pour la variable que vous venez de définir.

Pour remplacer ou modifier les valeurs de données Pour supprimer l'ancienne valeur et pour entrer une nouvelle valeur : E Dans l'Affichage des données. E Modifiez la valeur directement dans la cellule ou dans l'éditeur de cellules. Ajouter et supprimer des observations.99 Editeur de données „ „ Pour les variables chaîne. les caractères dépassant la largeur définie ne sont pas autorisés. vous pouvez modifier les valeurs des données dans l'Affichage des données de plusieurs manières. Changer l'ordre des variables. Couper. (Remarque : changer la largeur de la colonne n'affecte pas la largeur de la variable). Ajouter et supprimer des variables. changez la largeur définie de la variable. Vous pouvez: „ „ „ „ „ Changer les valeurs des données. Modification de données Avec l'éditeur de données. La valeur de la cellule est affichée dans l'éditeur de cellules. copier et coller des valeurs de données. . E Appuyez sur Entrée (ou déplacez-vous sur une autre cellule) pour enregistrer la nouvelle valeur. double-cliquez sur la cellule. des nombres entiers dépassant la valeur définie peuvent être entrés mais l'éditeur de données affichera dans la cellule une notation scientifique ou des astérisques pour indiquer que la valeur dépasse la largeur définie. Pour les variables numériques. Pour afficher la valeur dans la cellule.

Point ou Virgule) et les formats de date sont convertis en caractères s'ils sont collés dans une cellule de variables chaîne. Conversion de données de valeurs collées dans l'éditeur de données Si les types définis de variables des cellules source et cible ne sont pas les mêmes. copier et coller des valeurs de données Vous pouvez couper. Déplacer ou copier un groupe de valeurs de cellule dans un autre groupe de cellules. Etant donné que les dates sont enregistrées en interne . Déplacer ou copier la valeur d'une seule cellule dans un groupe de cellules. Numérique. Par exemple. Déplacer ou copier les valeurs d'une seule observation (ligne) dans plusieurs observations. copier et coller des valeurs individuelles de cellules ou des groupes de valeurs dans l'éditeur de données. Valeurs de caractères en numérique ou de date : Les valeurs de chaînes qui contiennent des caractères acceptables pour le format numérique ou de date de la cellule cible sont converties dans la valeur équivalente numérique ou de date. la valeur manquante par défaut est insérée dans la cellule cible. Dollar. Si aucune conversion n'est possible. une valeur de caractères de 25/12/91 est convertie en date valide si le type de format de la cellule cible est un des formats jour-mois-année. SPSS essaye de convertir la valeur. Les valeurs qui excèdent la largeur définie de la variable chaîne sont tronquées. le signe Dollar qui est affiché devient partie intégrante de la valeur de caractères. pour une variable dont le format est exprimé en dollars. Point ou Virgule). Numérique ou date en caractères : Les formats numériques (par exemple.100 Chapitre 5 Couper. Vous pouvez: „ „ „ „ „ Déplacer ou copier la valeur d'une seule cellule dans une autre cellule. mais elle est convertie en valeur manquante par défaut si le type de format de la cellule est de type mois-jour-année. Dollar. Par exemple. Déplacer ou copier les valeurs d'une seule variable (colonne) dans plusieurs variables. Date en numérique : Les valeurs de dates et de temps sont converties en un nombre de secondes si la cellule cible est d'un format numérique (par exemple. Numérique. La valeur d'une chaîne est la valeur numérique telle qu'elle est affichée dans la cellule.

L'éditeur de données insère la valeur manquante par défaut pour toutes les autres variables de cette observation. Vous pouvez également insérer de nouvelles observations entre des observations existantes Pour insérer de nouvelles observations entre des observations existantes E Dans l'Affichage des données. Par exemple.101 Editeur de données comme le nombre de secondes depuis le 14 octobre 1582. E A partir du menu. S'il y a quelques lignes blanches entre la nouvelle observation et les observations existantes.073.400 sont converties dans la valeur manquante par défaut.600. Insérer de nouvelles variables La saisie de données dans une colonne vide de l'Affichage des données ou dans une ligne vide de l'Affichage des variables crée automatiquement une nouvelle variable portant un nom par défaut (préfixe var et numéro séquentiel) et un type de format de . le fait de convertir des dates en valeurs numériques peut résulter en des nombres très importants. sélectionnez n'importe quelle cellule pour l'observation (ligne) située sous de la position où vous souhaitez insérer la nouvelle observation.908. En ce qui concerne les dates. Numérique en date ou temps : Les valeurs numériques sont converties en dates ou temps si la valeur représente un nombre de secondes pouvant produire une date ou un temps valides. sélectionnez : Données Insérer les observations Une nouvelle ligne est insérée pour cette observation et toutes les variables reçoivent la valeur manquante par défaut. les lignes blanches deviennent également des nouvelles observations avec des valeurs manquantes par défaut pour toutes les variables. Insérer de nouvelles observations Le fait d'entrer des données dans une cellule sur une ligne blanche crée automatiquement une nouvelle observation. la date du 10/29/91 a une valeur de conversion numérique de 12. les valeurs numériques inférieures à 86.

. Dans l'Affichage des variables. E Faites glisser la variable jusqu'à son nouvel emplacement. Vous pouvez également insérer des nouvelles variables entre les variables existantes.102 Chapitre 5 données par défaut (numérique). ces colonnes ou lignes deviennent également de nouvelles variables avec une valeur manquante par défaut pour toutes les observations. déposez-la sur la ligne de variables située sous l'endroit où vous voulez la placer. E A partir du menu. sélectionnez : Données Insérer une variable Une nouvelle variable est insérée avec la valeur manquante par défaut pour toutes les observations. Pour insérer de nouvelles variables entre des variables existantes E Sélectionnez n'importe quelle cellule de la variable située à droite (pour l'Affichage des données) ou sous (pour l'Affichage des variables) de l'endroit où vous souhaitez insérer la nouvelle variable. Pour déplacer des variables E Pour sélectionner la variable. S'il existe des colonnes vides dans l'Affichage des données ou des lignes vides dans l'Affichage des variables entre la nouvelle variable et les variables existantes. L'éditeur de données insère la valeur manquante par défaut pour toutes les observations concernées par la nouvelle variable. dans l'Affichage des données. E Pour placer la variable entre deux autres. cliquez sur son nom dans l'Affichage des données ou sur son numéro de ligne dans l'Affichage des variables. déposez-la sur la colonne située à droite de son emplacement de destination.

dans ce cas. E A partir du menu.103 Editeur de données Pour modifier le type de données Vous pouvez à tout moment modifier le type de données d'une variable via la boîte de dialogue Type de variable dans l'Affichage des variables . SPSS affiche une boîte d'alerte et vous demande si vous voulez poursuivre le changement ou si vous désirez l'annuler.. Si le changement du format des données peut avoir pour conséquence la perte des spécifications de la valeur manquante par défaut ou d'étiquettes de valeurs. Figure 5-8 Boîte de dialogue Aller à l'observation Pour rechercher une observation dans l'éditeur de données E Activez la fenêtre de l'éditeur de données.. . Si aucune conversion n'est possible. la valeur manquante par défaut est affectée. Aller à l'observation Aller à l'observation va au numéro d'observation (ligne) spécifié dans l'éditeur de données. Les règles de conversion sont les mêmes que celles pour coller des valeurs de données à une variable de type de format différent. sélectionnez : Données Aller à l'observation. E Entrez le numéro de ligne de l'observation de l'éditeur de données. l'éditeur de données tentera de convertir les valeurs existantes dans le nouveau type.

Quadrillage : Permet de basculer l'affichage du quadrillage. Etiquette de valeur : Permet de basculer entre les valeurs de données actuelles et les étiquettes de valeurs descriptives définies par l'utilisateur. . Figure 5-9 Observations filtrées dans l'éditeur de données Options d'affichage de l'éditeur de données Le menu Affichage propose plusieurs options d'affichage pour l'éditeur de données : Polices : Contrôle les caractéristiques de la police pour l'affichage des données. Cette option n'est disponible que dans l'Affichage des données. celles-ci sont identifiées dans l'éditeur de données par une ligne verticale dans le numéro de ligne.104 Chapitre 5 Etat de la sélection de l'observation dans l'éditeur de données Si vous avez sélectionné un sous-ensemble d'observations mais si vous n'avez pas écarté les observations non sélectionnées.

. Dans l'Affichage des données. Dans l'Affichage des variables. les données sont imprimées. „ „ Utilisez le menu Affichage dans la fenêtre de l'éditeur de données pour afficher ou masquer le quadrillage et pour activer/désactiver l'affichage des valeurs de données et des étiquettes de valeurs. Les étiquettes de valeurs sont imprimées si elles apparaissent dans l'Affichage des données. Le quadrillage n'est imprimé que s'il apparaît dans l'affichage sélectionné. E Cliquez sur l'onglet correspondant à l'affichage que vous souhaitez imprimer.105 Editeur de données Impression de l'éditeur de données Un fichier de données s'imprime tel qu'il apparaît à l'écran. ce sont les informations de définition des données qui sont imprimées.. Dans le cas contraire. sélectionnez : Fichier Imprimer. ce sont les valeurs de données réelles qui sont imprimées. E A partir du menu. Pour imprimer le contenu de l'éditeur de données E Activez la fenêtre de l'éditeur de données.. „ Les informations de l'affichage en cours sont imprimées.

.

Attribution de niveaux de mesure (nominal. Cependant. 0 = homme et 1 = femme). vous pouvez créer des tableaux. Identification des codes de valeurs manquantes (par exemple.Chapitre Préparation des données 6 Une fois que vous avez ouvert le fichier de données ou saisi les données dans l'éditeur de données. 99 = Sans objet). il existe des fonctions de préparation des données supplémentaires qui peuvent vous être utiles. Créer des variables avec différentes modalités qui représentent des intervalles de valeurs provenant de variables comportant un grand nombre de valeurs possibles. et les exclure des analyses ou les supprimer du fichier de données. par exemple : „ „ „ Affecter des propriétés de variable qui décrivent les données et déterminent le traitement devant être appliqué à certaines valeurs. Propriétés de variable Les données simplement saisies dans l'éditeur de données dans l'affichage des données ou lues dans SPSS à partir d'un format de fichier externe (une feuille de calcul Excel ou un fichier texte par exemple) ne sont pas dotées de certaines propriétés de variable que vous pourriez trouver très utiles. Identifier les observations pouvant contenir des informations redondantes. ordinal ou échelle). des diagrammes et des analyses sans effectuer aucune autre tâche préliminaire. comme : „ „ „ Définition d'étiquettes de valeurs descriptives pour les codes numériques (par exemple. 107 .

„ Définition des propriétés de variable L'option Définir les propriétés de variable vous aide dans le processus de création d'étiquettes de valeurs descriptives pour les variables qualitatives (nominales ou ordinales)... Définir les propriétés de variable : „ „ „ Analyse les valeurs réelles des données et répertorie toutes les valeurs de données uniques pour chaque variable sélectionnée. Identifie les valeurs non étiquetées et possède une fonction d'« étiquetage automatique ». sélectionnez : Données Définir les propriétés de variables.108 Chapitre 6 Toutes ces propriétés de variable (ainsi que d'autres) peuvent être affectées dans la vue Variable de l'éditeur de données. Plusieurs utilitaires peuvent également vous aider dans ce processus : „ L'option Définir les propriétés de variable peut vous aider à définir les étiquettes de valeurs descriptives et les valeurs manquantes. Pour définir les propriétés de variable E A partir du menu. L'option Copier des propriétés de données permet d'utiliser un fichier de données au format SPSS existant comme modèle pour les propriétés de fichier et de variable dans le fichier de données en cours. Ceci est particulièrement utile si vous utilisez fréquemment des fichiers de données au format externe ayant un contenu similaire (comme des rapports mensuels au format Excel). saisissez 0 dans le nombre d'observations à analyser. . Permet de copier des étiquettes de valeurs définies d'une autre variable vers la variable sélectionnée ou de la variable sélectionnée vers plusieurs autres variables. Remarque : Pour utiliser l'option Définir les propriétés de variable sans analyse préalable des observations. Ceci est particulièrement utile pour les données qualitatives dotées de codes numériques utilisés pour les valeurs de modalités.

pour lesquelles une analyse complète du fichier de données prendrait beaucoup de temps. E Spécifier une limite supérieure pour le nombre de valeurs uniques à afficher. des . E Spécifier le nombre d'observations à analyser afin de générer la liste de valeurs uniques. telles que les valeurs manquantes ou les étiquettes de variable descriptives. ou définir ou modifier d'autres propriétés de variables. Remarque : Les variables chaîne longues (variables chaîne d'une largeur définie de plus de huit caractères) ne sont pas affichées dans la liste de variables. Ceci est particulièrement utile pour les fichiers de données comportant un grand nombre d'observations. Cette opération est particulièrement utile pour éviter de répertorier des centaines.109 Préparation des données Figure 6-1 Boîte de dialogue initiale permettant de sélectionner les variables à définir E Sélectionnez les variables numériques ou les variables chaîne courtes pour lesquelles vous voulez créer des étiquettes de valeurs. Les variables chaîne longues ne peuvent pas avoir d'étiquettes de valeurs définies ou de modalités de valeurs manquantes.

E Cliquez sur Poursuivre pour ouvrir la boîte de dialogue principale de la fonction Définir les propriétés de variable. . E Saisissez le texte de l'étiquette pour toutes les valeurs non étiquetées affichées dans la grille Etiquette de valeur. E Sélectionnez une variable pour laquelle vous voulez créer des étiquettes de valeurs. vous pouvez saisir les valeurs dans la colonne Valeur. sous la dernière valeur analysée. E Cliquez sur OK pour appliquer les étiquettes de valeurs et les autres propriétés de variable. voire des millions de valeurs pour les variables d'échelle (intervalle continu. ou définir ou modifier d'autres propriétés de variable. rapport). E Si vous souhaitez créer des étiquettes de valeurs pour des valeurs qui ne sont pas affichées. E Répétez l'opération pour chaque variable répertoriée pour laquelle vous voulez créer des étiquettes de valeurs.110 Chapitre 6 milliers.

Pour trier la liste de variables dans le but d'afficher en tête de liste toutes les variables non étiquetées : E Cliquez sur le titre de colonne Sans étiquette sous la liste des variables analysées. . une coche dans la colonne Sans étiquette indique que la variable contient des valeurs qui ne possèdent pas d'étiquette de valeur. Vous pouvez également faire un tri par nom de variable ou par niveau de mesure en cliquant sur le titre de colonne correspondant dans la liste des variables analysées. boîte de dialogue principale La boîte de dialogue principale de la fonction Définir les propriétés de variable donne l'information suivante concernant les variables analysées : Liste des variables analysées : Pour chaque variable analysée.111 Préparation des données Définition des étiquettes de valeurs et des autres propriétés de variable Figure 6-2 Définir les propriétés de variable.

vous ne pouvez ni ajouter ni supprimer des modalités de valeurs manquantes pour cette variable avec la fonction Définir les propriétés de variable. Cette liste de valeurs uniques se fonde sur le nombre d'observations analysées. . sauf pour les étiquettes de valeurs et/ou les modalités de valeurs manquantes définies pour la variable sélectionnée. „ Manquant : Valeurs représentant les données manquantes. Remarque : Dans la boîte de dialogue initiale. Valeur : Valeurs uniques pour chaque variable sélectionnée. Dans l'éditeur de données. vous pouvez utiliser l'option d'affichage des variables pour modifier les modalités de valeurs manquantes de la variable possédant des plages de valeurs manquantes. En cas de doute sur le niveau de mesure à affecter à une variable. si vous indiquez 0 comme nombre d'observations à analyser. il peut être important d'affecter le niveau de mesure correct. la liste reflétera uniquement les valeurs uniques présentes dans ces observations. la grille Etiquette de valeur est d'abord vide. Si le fichier de données a déjà été trié par la variable à laquelle vous voulez affecter des étiquettes de valeurs. Par exemple. par défaut. page 92. Niveau de mesure : Comme les étiquettes de valeurs sont particulièrement utiles pour les variables qualitatives (nominales et ordinales). En outre. la liste pourrait afficher beaucoup moins de valeurs uniques qu'il n'en existe dans les données. Par conséquent. le bouton Suggérer du niveau de mesure est désactivé.112 Chapitre 6 Grille d'étiquettes de valeurs „ „ Etiquette : Affiche toute étiquette de valeur définie. Pour plus d'informations. Si une variable possède déjà une plage de valeurs définies comme manquantes par l'utilisateur (par exemple. „ Effectif : Nombre d'occurrences de chaque valeur dans les observations analysées. Dans cette colonne. 90-99). Toutefois. cliquez sur Suggérer. la modalité est définie en tant que modalité manquante spécifiée par l'utilisateur. reportez-vous à « Valeurs manquantes » dans Chapitre 5 . „ Modifié : Indique que vous avez ajouté ou modifié une étiquette de valeur. Vous pouvez modifier la désignation des valeurs manquantes de la modalité en cochant la case. si vous analysez seulement les 100 premières observations du fichier de données. vous pouvez ajouter ou modifier des étiquettes. Si la case est cochée. le niveau de mesure d'échelle est affecté à toutes les nouvelles variables numériques. de nombreuses variables normalement qualitatives peuvent être initialement affichées en tant que variables d'échelle. et comme certaines procédures traitent les variables qualitatives et d'échelle différemment.

reportez-vous à « Options monétaires (devises) » dans Chapitre 43 . Pour les variables chaîne. dont les décimales et/ou les indicateurs de regroupement) et le nombre de décimales. Valeurs non étiquetées : Pour créer automatiquement des étiquettes pour les valeurs non étiquetées. Un astérisque est affiché dans la colonne Valeur si la largeur indiquée est inférieure soit à celle des valeurs analysées. Pour ce qui est du format numérique de date. page 623. mais pas le format d'affichage. vous ne pouvez modifier que l'étiquette de variable. aaaajjj. Par exemple. vous pouvez changer le type numérique (nombres. Pour plus d'informations. etc.) Pour un format numérique personnalisé. soit à celle des valeurs affichées. la largeur (nombre maximal de chiffres.113 Préparation des données Copier les propriétés : Vous pouvez copier les étiquettes de variable ou les autres propriétés de variable à partir d'une autre variable vers la variable sélectionnée. Etiquette de variable et Format d'affichage Vous pouvez modifier l'étiquette de variable descriptive et le format d'affichage. une valeur numérique interne de moins de 86 400 n'est pas valide pour une variable format de date. dans le cas des étiquettes de valeurs définies déjà existantes ou des modalités de valeurs manquantes. mm/jj/aa. vous pouvez sélectionner un format de date spécifique (tel que jj-mm-aaaa. vous pouvez sélectionner un des cinq formats de devise personnalisés (de CCA à CCE). ou à partir de la variable sélectionnée vers une ou plusieurs autres variables. „ „ „ „ .) est affiché si les valeurs analysées ou les valeurs affichées (pour les étiquettes de valeurs définies déjà existantes ou pour les modalités de valeurs manquantes) ne sont pas valides pour le type de format d'affichage sélectionné. dollars ou autre devise). „ „ „ Vous ne pouvez pas modifier le type fondamental de la variable (chaîne ou numérique). Concernant les variables numériques. cliquez sur Etiquettes automatiques. dates. Un point (.

l'explication du niveau de mesure suggéré peut indiquer que la suggestion est due. mais elles sont déjà définies comme manquantes.114 Chapitre 6 Affectation du niveau de mesure Quand vous cliquez sur Suggérer pour le niveau de mesure dans la boîte de dialogue principale Définir les propriétés de variable. Figure 6-3 Boîte de dialogue Suggestion d'un niveau de mesure Remarque : Les valeurs définies comme étant manquantes ne sont pas comprises dans l'évaluation pour le niveau de mesure. elle peut en contenir. La zone Explication propose une brève description des critères utilisés pour déterminer le niveau de mesure suggéré. Par exemple. en partie. la variable en cours est évaluée en fonction des observations analysées et des étiquettes de valeurs définies. au fait que la variable ne contient pas de valeurs négatives. E Cliquez sur Poursuivre pour accepter le niveau de mesure suggéré ou sur Annuler pour ne pas modifier le niveau de mesure. alors qu'en réalité. . et un niveau de mesure est suggéré dans la boîte de dialogue de suggestion d'un niveau de mesure qui apparaît.

115 Préparation des données Copie de propriétés de variable La boîte de dialogue Appliquer des étiquettes et un niveau apparaissent lorsque vous cliquez sur A partir d'une autre variable ou sur Vers d'autres variables dans la boîte de dialogue principale Définir les propriétés de variable. la largeur définie doit également correspondre. ou E Sélectionnez une ou plusieurs variables qui doivent recevoir les étiquettes de valeurs et les autres propriétés de variable. „ Les étiquettes de valeurs existantes et les modalités de valeurs manquantes des variables cible ne sont pas remplacées. Toutes les variables analysées correspondant au type de la variable courante (numérique ou chaîne) sont alors affichées. E Cliquez sur Copier pour copier les étiquettes de valeurs et le niveau de mesure. . Figure 6-4 Boîte de dialogue Appliquer les étiquettes et le niveau E Sélectionnez une seule variable dont vous allez copier les étiquettes de valeurs et les autres propriétés de variable (sauf l'étiquette de variable). Dans le cas des variables chaîne.

Le niveau de mesure des variables destination est toujours remplacé. les définitions de valeurs manquantes ne sont pas copiées. „ „ „ Lors de la copie de propriétés de données. Les propriétés de variable comprennent les étiquettes de valeurs. l'alignement et la largeur des colonnes (dans l'éditeur de données). Créer des variables dans le fichier de travail à partir de variables d'un fichier externe. les groupes de variables et la pondération. Si vous utilisez le fichier de travail comme fichier source. Copier des propriétés de variable à partir d'un fichier de données externe vers les variables concordantes dans le fichier de travail. Les propriétés de fichier comprennent les documents. les étiquettes de fichier. Si la variable source ou cible possède un intervalle défini de valeurs manquantes. les règles générales suivantes sont appliquées : „ „ Si vous utilisez un fichier de données externe en tant que fichier source. celui-ci doit être au format SPSS. Il n'est pas possible d'utiliser un fichier de travail vierge comme fichier de données source.116 Chapitre 6 „ Les étiquettes de valeurs et les modalités de valeurs manquantes des valeurs qui ne sont pas encore définies pour les variables cible sont ajoutées au groupe d'étiquettes de valeurs et de modalités de valeurs manquantes des variables cible. le niveau de mesure. Vous pouvez également utiliser des variables du fichier de travail comme modèles pour d'autres variables de ce même fichier. Copier des propriétés de variable à partir d'une variable d'un fichier de données externe ou du fichier de travail vers plusieurs variables du fichier de travail. les valeurs manquantes. . les vecteurs multiréponses. „ „ Copie des propriétés de données L'assistant Copier des propriétés de données permet d'utiliser un fichier de données SPSS externe comme modèle pour définir les propriétés de fichier et de variable dans le fichier de travail. celui-ci doit contenir au moins une variable. Vous pouvez : „ Copier des propriétés à partir d'un fichier de données externe vers le fichier de travail. le format d'impression et d'écriture. les étiquettes de variable.

Les propriétés de variable ne sont copiées à partir de la variable source que sur des variables d'un type correspondant : chaîne (alphanumérique) ou numérique (nombres. Figure 6-5 Assistant Copier des propriétés de données : Etape 1 .117 Préparation des données „ „ Les propriétés non définies (vides) du fichier de données source ne remplacent pas les propriétés définies dans le fichier de travail. sélectionnez : Données Copie des propriétés de données. auparavant disponible dans le menu Fichier. Remarque : L'option Copier des propriétés de données remplace l'option d'application du dictionnaire de données. dates et devises). Pour copier des propriétés de données E A partir des menus de la fenêtre de l'éditeur de données...

vous pouvez spécifier les variables source contenant les propriétés de variable à copier et les variables cible qui doivent recevoir ces propriétés. Les variables sont concordantes si le type (chaîne ou numérique) et le nom . Il peut s'agir d'un fichier de données externe au format SPSS ou du fichier de travail.118 Chapitre 6 E Sélectionnez le fichier de données possédant les propriétés de fichier et/ou de variable à copier. Figure 6-6 Assistant Copier des propriétés de données : Etape 2 Application des propriétés provenant de variables du fichier source à des variables concordantes du fichier de travail : Les propriétés de variable sont copiées à partir d'une ou de plusieurs variables source sur les variables concordantes dans le fichier de travail. E Suivez les instructions de l'assistant Copier des propriétés de données étape par étape. Sélection des variables source et cible Dans cette étape.

Si le fichier de travail ne contient pas de variables (dans le cas d'un fichier vierge). Application des propriétés d'un ensemble de données uniquement. seules les chaînes de même longueur que la variable source sont affichées. toutes les variables du fichier de données source sont affichées et les nouvelles variables fondées sur les variables source concernées sont créées automatiquement dans le fichier de travail. . Dans le cas des variables de chaîne. Seules des variables de même type (numérique ou chaîne) que la variable choisie dans la liste source sont affichées dans la liste du fichier de travail. Cette option n'est pas disponible si le fichier de travail ne contient pas de variables. les documents. Par défaut. Si vous sélectionnez des variables source qui n'existent pas dans le fichier de travail (d'après le nom de variable). Les propriétés non définies (vides) des variables source ne remplacent pas les propriétés définies des variables cible. seules les variables concordantes sont affichées dans les deux listes de variables. „ Création de variables concordantes dans le fichier de travail si celles-ci n'existent pas : Permet de mettre à jour la liste source afin d'afficher toutes les variables dans le fichier de données source. Application des propriétés d'une variable source unique sur des variables de même type d'un fichier de travail : Les propriétés d'une variable de la liste source peuvent être appliquées à une ou à plusieurs variables de la liste du fichier de travail. En ce qui concerne les variables chaîne. Aucune propriété de variable n'est appliquée. les nouvelles variables sont créées dans le fichier de travail avec les noms et propriétés de variable du fichier source. Remarque : Il n'est pas possible de créer de nouvelles variables dans le fichier de travail avec cette option. les étiquettes de fichier et la pondération) sont appliquées au fichier de travail. Choix des propriétés de variable à copier Vous pouvez copier des propriétés de variable à partir des variables source vers les variables cible. la longueur définie doit également être la même. sans sélection de variable : Seules les propriétés du fichier (par exemple. Cette option n'est pas disponible si le fichier de travail est également le fichier source.119 Préparation des données de la variable sont les mêmes.

Si la même valeur possède une étiquette définie dans les deux variables source et cible. 98 pour Ne se prononce pas et 99 pour Sans objet). Les étiquettes de valeurs sont souvent utilisées quand des valeurs de données numériques représentent des modalités non numériques (par exemple.120 Chapitre 6 Figure 6-7 Assistant Copier des propriétés de données : Etape 3 Etiquette de valeur : Les étiquettes de valeurs sont des étiquettes descriptives associées à des valeurs de données. Valeurs manquantes : Les valeurs manquantes représentent des données manquantes (par exemple. L'option Fusionner fusionne les étiquettes de valeurs définies de la variable source avec toute étiquette de valeur définie existante de la variable cible. „ „ L'option Remplacer supprime les étiquettes de valeurs définies dans la variable cible et les remplace par les étiquettes de valeurs définies de la variable source. les codes 1 et 2 pour Homme et Femme). Ces valeurs possèdent également des étiquettes de valeurs définies qui décrivent ce que . l'étiquette de valeur de la variable cible reste inchangée. Vous pouvez remplacer ou fusionner les étiquettes de valeurs dans les variables cible.

Cette option est ignorée pour les variables chaîne. Les valeurs manquantes définies existant dans la variable cible sont supprimées et remplacées par les valeurs manquantes définies dans la variable source.) . Formats : Concernant les variables numériques. la largeur (nombre total de caractères affichés. (Cette option n'est pas disponible si le fichier de travail est le fichier source. ordinal ou d'échelle. plusieurs éléments sont à prendre en compte. Niveau de mesure : Le niveau de mesure peut être nominal. Copie des propriétés d'ensembles de données (propriétés de fichier) Vous pouvez appliquer des propriétés choisies d'un ensemble de données global à partir du fichier de données source vers le fichier de travail. droite. et l'indicateur décimal) et le nombre de décimales affichées. dates ou devises). Alignement : Cette option n'affecte que l'alignement (gauche. centré) de l'affichage des données de l'éditeur de données. cette option contrôle le type numérique (nombres. dont les caractères de début et de fin. les niveaux nominal et ordinal sont tous deux considérés comme qualitatifs. Largeur des colonnes dans l'éditeur de données : Cette option n'affecte que la largeur des colonnes de l'affichage des données dans l'éditeur de données.121 Préparation des données représentent les codes de la valeur manquante. Pour les procédures qui font une distinction entre différents niveaux de mesure. Avant de copier des propriétés d'une seule variable source sur plusieurs variables cible. Etiquette de variable : Les étiquettes de variable descriptive peuvent contenir des espaces et des caractères réservés qui ne sont pas autorisés dans les noms de variable.

) „ Les vecteurs multiréponses du fichier de données source contenant des variables qui n'existent pas dans le fichier de travail sont ignorés. L'option Fusionner ajoute les vecteurs multiréponses du fichier de données source à l'ensemble de vecteurs multiréponses du fichier de travail. (Remarque : Les vecteurs multiréponses ne sont actuellement utilisés que par l'option complémentaire Tableaux. à moins que ces variables ne soient créées selon les spécifications de l'étape 2 (sélection des variables source et cible) avec l'assistant Copier des propriétés de données. le vecteur existant dans le fichier de travail reste inchangé.122 Chapitre 6 Figure 6-8 Assistant Copier des propriétés de données : Etape 4 Vecteurs multiréponses : Applique les définitions de vecteur multiréponses du fichier de données source vers le fichier de travail. L'option Remplacer supprime tous les vecteurs multiréponses du fichier de travail et les remplace par les vecteurs multiréponses du fichier source. S'il existe dans les deux fichiers un vecteur portant le même nom. „ „ .

123 Préparation des données Groupes de variables : Les groupes de variables permettent de contrôler la liste des variables affichées dans les boîtes de dialogue. Les documents uniques dans le fichier source et qui n'existent pas dans le fichier de travail sont ajoutés à ce fichier. le vecteur existant dans le fichier de travail reste inchangé. „ Les groupes du fichier de données source contenant des variables qui n'existent pas dans le fichier de travail sont ignorés à moins que ces variables ne soient créées selon les spécifications de l'étape 2 (sélection des variables source et cible) avec l'assistant Copier des propriétés de données. Tous les documents sont ensuite triés par date. L'option Remplacer supprime tous les groupes de variables existant dans le fichier de travail et les remplace par les groupes de variables du fichier source. S'il existe dans les deux fichiers un vecteur portant le même nom. Spécification de pondération : Pondère les observations à l'aide de la variable de pondération actuelle s'il existe une variable concordante dans le fichier de travail. L'option Fusionner ajoute les groupes de variables du fichier de données source à l'ensemble des groupes de variables du fichier de travail. „ „ L'option Remplacer supprime tous les documents existants du fichier de travail et les remplace par les documents du fichier source. „ „ Documents : Remarques ajoutées au fichier de données via la commande DOCUMENT. . Cette opération remplace toute pondération en cours dans le fichier de travail. Les groupes de variables sont définis à l'aide de l'option Définir les vecteurs du menu Utilitaires. L'option Fusionner combine les documents des fichiers source et de travail. Etiquette de fichier : Etiquette descriptive appliquée à un fichier de données via la commande FILE LABEL.

le nombre de nouvelles variables qui seront créées et le nombre de propriétés d'ensembles de données (propriétés de fichier) qui seront copiées. Identification des observations dupliquées Vos données peuvent comprendre des observations « dupliquées » pour les raisons suivantes : „ La même observation est saisie plusieurs fois par erreur. .124 Chapitre 6 Résultats Figure 6-9 Assistant Copier des propriétés de données : Etape 5 La dernière étape de l'assistant Copier des propriétés de données fournit des informations sur le nombre de variables dont les propriétés seront copiées à partir du fichier de données source. Vous pouvez également choisir de coller la syntaxe de commande générée dans une fenêtre de syntaxe et de l'enregistrer pour un usage ultérieur.

Sinon. E Sélectionnez les variables qui identifient les observations concordantes. Plusieurs observations représentent la même observation. L'ordre de tri défini par ces variables détermine la « première » et la « dernière » observation de chaque groupe.. vous pouvez : E Sélectionner des variables pour trier les observations dans des groupes définis par les variables des observations concordantes sélectionnées. plusieurs achats effectués par la même personne ou la même société pour des produits différents ou à des heures différentes). Pour identifier et repérer les observations dupliquées : E A partir du menu. mais ont des valeurs d'ID secondaire différentes (par exemple. Sinon. les graphiques ou le calcul des statistiques. les membres d'une famille qui vivent tous dans la même maison). „ L'identification des observations dupliquées vous permet de définir la variable duplicate suivant vos besoins et de contrôler la détermination automatique des observations principales par rapport aux observations dupliquées.125 Préparation des données „ Plusieurs observations partagent la même valeur d'ID principal.. E Sélectionnez des options dans la zone Variables à créer. mais les valeurs des variables autres que celles qui identifient l'observation sont différentes (par exemple. l'ordre utilisé est celui d'origine du fichier. . E Filtrer automatiquement les observations dupliquées afin qu'elles ne soient pas incluses dans les rapports. sélectionnez : Données Identifier les observations dupliquées.

les observations sont triées en fonction de la quantité correspondant à chaque date. vous pouvez effectuer le tri dans l'ordre croissant ou décroissant. Si vous sélectionnez plusieurs variables de tri. . „ „ Pour chaque variable de tri. Trier les groupes concordants par : Les observations sont automatiquement triées par les variables qui définissent les observations concordantes. Pour identifier uniquement les observations dont la concordance est égale à 100 %. les observations sont triées pour chaque variable au sein des modalités de la variable précédente dans la liste.126 Chapitre 6 Figure 6-10 Boîte de dialogue Identifier les observations dupliquées Définir les observations concordantes par : Les observations sont considérées comme étant dupliquées lorsque leurs valeurs concordent avec toutes les variables sélectionnées. si la première variable de tri sélectionnée est date et que la deuxième est quantité. Vous pouvez sélectionner d'autres variables de tri qui détermineront l'ordre des observations dans chaque groupe concordant. Par exemple. sélectionnez toutes les variables.

utilisez les boutons fléchés Haut et Bas situés à droite de la liste. dans chaque groupe concordant. la date la plus récente devient la dernière date du groupe. vous pouvez trier les observations du groupe dans l'ordre croissant à partir d'une variable de date. le tableau indique le nombre d'observations dont la valeur est 0 pour cette variable (ce qui indique le nombre d'observations dupliquées) . c'est-à-dire l'ordre d'origine du fichier ou celui déterminé par les variables de tri indiquées. Si vous n'indiquez aucune variable de tri. „ En fonction de l'ordre de tri déterminé dans le groupe concordant.127 Préparation des données „ „ Pour modifier l'ordre de tri des variables. L'ordre de tri détermine la « première » et la « dernière » observation de chaque groupe concordant. Par exemple. Indicateur d'observations principales : Crée une variable dont la valeur est 1 pour toutes les observations uniques et pour l'observation identifiée comme étant l'observation principale de chaque groupe d'observations concordantes. l'ordre d'origine du fichier détermine celui des observations dans chaque groupe. Par exemple. Afficher les fréquences pour les variables créées : Tableaux de fréquences indiquant le nombre d'observations pour chaque valeur des variables créées. et 0 pour les observations dupliquées non principales de chaque groupe. Le contrôle visuel des observations concordantes est ainsi facilité dans l'éditeur de données. pour filtrer toutes les observations. l'observation principale peut être la dernière ou la première observation de ce groupe. „ Effectif séquentiel des observations concordantes de chaque groupe : Crée une variable dont la valeur séquentielle est comprise entre 1 et n pour les observations de chaque groupe concordant. qui détermine la valeur de la variable indicatrice principale facultative. De cette façon. Vous pouvez utiliser la variable indicatrice en tant que variable de filtre pour exclure les observations dupliquées non principales des rapports et des analyses sans les supprimer du fichier de données. Déplacer les observations concordantes vers le haut : Trie le fichier de données afin que tous les groupes d'observations concordantes se trouvent au début de ce fichier. La séquence est basée sur l'ordre en cours des observations dans chaque groupe. à l'exception de la plus récente. pour la variable indicatrice principale.

vous pouvez fusionner une échelle d'évaluation allant jusqu'à neuf pour obtenir trois modalités qui représenteraient les niveaux faible. Les observations disposant de la valeur manquante par défaut pour une variable d'identificateur sont traitées comme si elles disposaient de valeurs concordantes pour cette variable. Pour les variables chaîne. Par exemple. vous pouvez utiliser la variable d'échelle Revenu pour créer une variable qualitative contenant les tranches de revenus. vous pouvez effectuer les opérations suivantes : E Sélectionner l'échelle numérique et/ou les variables ordinales pour lesquelles créer des variables qualitatives (en bandes). les observations ne disposant d'aucune valeur pour une variable d'identificateur sont traitées comme si elles disposaient de valeurs concordantes pour cette variable. la valeur manquante par défaut est traitée comme toute autre valeur. . Valeurs manquantes : Pour les variables numériques.128 Chapitre 6 et le nombre d'observations dont la valeur est 1 pour cette variable (c'est-à-dire le nombre d'observations uniques et principales). Fusionner un grand nombre de modalités ordinales en un jeu de modalités plus petit. L'outil visuel de regroupement en bandes vous permet d'effectuer les opérations suivantes : „ Créer des variables qualitatives à partir de variables d'échelle continues. „ Dans la première étape de l'outil visuel de regroupement en bandes. moyen et élevé. Outil visuel de regroupement en bandes L'outil visuel de regroupement en bandes est conçu pour vous aider lors de la création de variables basées sur le regroupement des valeurs contiguës de variables dans un nombre distinct de modalités. Par exemple.

Vous pouvez modifier le niveau de mesure défini d'une variable dans la vue Variable de l'éditeur de données. En effet. Pour les fichiers de données contenant un grand nombre d'observations. reportez-vous à « Niveau de mesure des variables » dans Chapitre 5 . L'outil visuel de regroupement en bandes requiert l'utilisation de variables numériques qui sont mesurées sur une échelle ou au niveau ordinal. Pour plus d'informations. . page 85. même si la limitation du nombre d'observations analysées peut permettre de gagner du temps. évitez si possible de procéder à cette opération car elle risque d'avoir une incidence sur la distribution des valeurs utilisées dans les calculs effectués ultérieurement dans l'outil visuel de regroupement en bandes. Remarque : Les variables chaîne et les variables numériques nominales ne sont pas affichées dans la liste des variables source.129 Préparation des données Figure 6-11 Première boîte de dialogue permettant de sélectionner les variables à regrouper en bandes Vous pouvez également limiter le nombre d'observations à analyser. l'outil considère que les valeurs de données représentent un ordre logique qui peut servir à regrouper les valeurs de manière significative.

130 Chapitre 6 Pour regrouper les variables en bandes E A partir des menus de la fenêtre de l'éditeur de données. reportez-vous à « Regroupement de variables en bandes » . Les noms de variable doivent être uniques et conformes aux règles de dénomination de variables SPSS. E Sélectionnez une variable dans la zone Liste des variables analysées. E Cliquez sur OK. E Entrez le nom de la nouvelle variable regroupée en bandes. sélectionnez : Transformer Outil visuel de regroupement en bandes : E Sélectionner l'échelle numérique et/ou les variables ordinales pour lesquelles créer des variables qualitatives (en bandes). page 84. . E Définissez les critères de regroupement en bandes de la nouvelle variable. Pour plus d'informations. reportez-vous à « Noms de variable » dans Chapitre 5 . Pour plus d'informations. page 131.

Pour ce faire.131 Préparation des données Regroupement de variables en bandes Figure 6-12 Boîte de dialogue principale de l'outil visuel de regroupement en bandes La boîte de dialogue principale de l'outil visuel de regroupement en bandes fournit les informations suivantes concernant les variables analysées : Liste des variables analysées : Affiche les variables sélectionnées dans la première boîte de dialogue. cliquez sur les titres de colonne. y compris l'histogramme affiché dans la boîte de dialogue principale et les divisions basées sur les centiles ou les écarts types. Observations analysées : Indique le nombre d'observations analysées. par étiquette de variable ou par nom. Toutes les observations analysées dont la variable sélectionnée ne présente aucune valeur manquante par défaut ou utilisateur sont utilisées pour générer la distribution des valeurs servant aux calculs effectués dans l'outil visuel de regroupement en bandes. . Vous pouvez trier la liste par niveau de mesure (échelle ou ordinal).

Valeurs non manquantes : L'histogramme affiche la distribution des valeurs non manquantes pour la variable sélectionnée. Pour plus d'informations. reportez-vous à « Noms de variable » dans Chapitre 5 . qui seront utilisés comme base pour les nouvelles variables regroupées en bandes. Vous pouvez supprimer les bandes en faisant glisser les lignes de division hors de l'histogramme. „ Nom : Vous devez entrer le nom de la nouvelle variable. sans changer les intervalles de bandes. Si vous n'incluez pas toutes les observations dans l'analyse. basée sur les observations analysées. Variable actuelle : Nom et étiquette (si disponible) de la variable sélectionnée.132 Chapitre 6 Valeurs manquantes : Indique le nombre d'observations analysées contenant des valeurs manquantes par défaut et spécifiées par l'utilisateur. L'étiquette de variable par défaut est l'étiquette (si disponible) ou le nom de la variable source. Variable regroupée en bandes : Nom et étiquette facultative de la nouvelle variable regroupée en bandes. Les valeurs manquantes ne sont incluses dans aucune modalité regroupée en bandes. Minimum et Maximum : Valeurs minimales et maximales de la variable sélectionnée. „ „ Remarque : L'histogramme (affichant les valeurs non manquantes). Les noms de variable doivent être uniques et conformes aux règles de dénomination de variables SPSS. les lignes verticales de l'histogramme apparaissent afin d'indiquer les divisions définissant ces bandes. „ Une fois que vous avez défini les bandes de la nouvelle variable. puis les déplacer vers différents emplacements de l'histogramme. Vous pouvez cliquer sur les lignes de division. basées sur les observations analysées et n'incluant pas de valeurs définies en tant que valeurs manquantes spécifiées par l'utilisateur. page 139. „ Etiquette : Vous pouvez entrer une étiquette de variable descriptive contenant jusqu'à 255 caractères. page 84. Pour plus d'informations. suivi de la mention (Regroupé en bandes). et les valeurs minimales et maximales sont basés sur les valeurs analysées. reportez-vous à « Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes » . vous risquez de ne pas obtenir une distribution .

Etant donné que les valeurs de la nouvelle variable sont des valeurs entières séquentielles comprises entre 1 et n. sélectionnez Supprimer la ligne. E Dans le menu contextuel. Si vous n'analysez pas d'observations. une division dont la valeur est ELEVE est automatiquement incluse. „ Etiquettes : Etiquettes descriptives facultatives pour les valeurs de la nouvelle variable regroupée en bandes. Pour supprimer une bande de la grille : E Cliquez avec le bouton droit de la souris sur la cellule Valeur ou Etiquette de la bande. Vous pouvez entrer les étiquettes de valeur ou utiliser l'option Créer des étiquettes pour les créer automatiquement. La bande définie par la division la moins élevée inclut toutes les valeurs non manquantes inférieures ou égales à cette valeur (ou simplement inférieures à cette valeur. Pour supprimer toutes les étiquettes ou toutes les bandes définies : E Cliquez avec le bouton droit n'importe où dans la grille. Par défaut. „ Valeur : Valeurs qui définissent les extrema supérieurs de chaque bande. la valeur par défaut manquante de la nouvelle variable est attribuée à toutes les observations dont les valeurs sont supérieures à celle de la dernière division spécifiée. E Dans le menu contextuel.133 Préparation des données précise et représentative. sélectionnez Supprimer toutes les étiquettes ou Supprimer toutes les divisions. aucune information sur la distribution des valeurs n'est disponible. en fonction de la définition des extrema supérieurs). les étiquettes décrivant les valeurs peuvent se révéler très utiles. surtout si le fichier de données a été trié par la variable sélectionnée. Vous pouvez entrer des valeurs ou utiliser l'option Créer des divisions pour créer automatiquement des bandes en fonction des critères sélectionnés. Cette bande contient alors toutes les valeurs non manquantes situées au-dessus des autres divisions. Grille : Affiche les valeurs qui définissent les extrema supérieurs de chaque bande et les étiquettes de valeur facultatives de chaque bande. Remarque : Si vous supprimez la bande ELEVE. .

„ Inclus (<=) : Les observations contenant la valeur spécifiée dans la cellule Valeur sont incluses dans la modalité regroupée en bandes. Inverser l'échelle : Par défaut. reportez-vous à « Génération automatique de modalités regroupées en bandes » . les observations dont la valeur est 25 seront placées dans la seconde bande. les intervalles avec le même nombre d'observations ou les intervalles basés sur les écarts types. basées sur les valeurs se trouvant dans la grille et le traitement des extrema supérieurs (inclus ou exclus). . les valeurs de la nouvelle variable regroupée en bandes sont des valeurs entières séquentielles croissantes comprise entre 1 et n. Inversez l'échelle pour que ces valeurs deviennent des entiers séquentiels décroissants compris entre n et 1. Copier les bandes : Vous pouvez copier les spécifications de regroupement à partir d'une variable vers la variable sélectionnée ou à partir de la variable sélectionnée vers d'autres variables. Cette option n'est disponible que si vous analysez au moins une observation. cette bande inclut les observations dont les valeurs sont inférieures ou égales à 25. Pour plus d'informations. Par exemple.134 Chapitre 6 Extrema supérieurs : Contrôle le traitement des valeurs des extrema supérieurs saisies dans la colonne Valeur de la grille. Pour plus d'informations. En effet. si vous spécifiez les valeurs 25. En effet. Créer des divisions : Génère automatiquement des modalités regroupées en bandes pour les intervalles de longueur identique. „ Exclu (<) : Les observations contenant la valeur spécifiée dans la cellule Valeur ne sont pas incluses dans la modalité regroupée en bandes. Créer des étiquettes : Génère des étiquettes descriptives pour les valeurs entières séquentielles de la nouvelle variable regroupée en bandes. page 135. page 137. reportez-vous à « Copie de modalités regroupées en bandes » . Par exemple. 50 et 75. la première bande inclut uniquement les observations dont les valeurs sont inférieures à 25. Elles sont incluses dans la bande suivante. si vous spécifiez les valeurs 25. les observations dont la valeur est 25 seront placées dans la première bande. 50 et 75.

135 Préparation des données Génération automatique de modalités regroupées en bandes La boîte de dialogue Créer des divisions vous permet de générer automatiquement les modalités regroupées en bandes en fonction des critères sélectionnés. E Cliquez sur Appliquer. Figure 6-13 Boîte de dialogue Créer des divisions . Pour utiliser la boîte de dialogue Créer des divisions : E Dans la zone Liste des variables analysées. sélectionnez une variable en cliquant dessus. qui définira les modalités regroupées en bandes. E Sélectionnez les critères de génération des divisions. E Cliquez sur Créer des divisions.

136 Chapitre 6 Remarque : La boîte de dialogue Créer des divisions n'est disponible que si vous avez analysé des observations. 21–30. fondées sur les observations analysées : Génère des modalités regroupées en bandes basées sur les valeurs de la moyenne et de l'écart type de la distribution de la variable. plus 1. trois divisions génèrent quatre bandes de centiles (quartiles). Par exemple. la valeur 33. . la valeur 10 indique un intervalle comprenant toutes les valeurs jusqu'à 10). Par exemple. 11–20. 1–10. plus 1. etc. en fonction de l'un des critères suivants : „ Nombre de divisions : Le nombre de modalités regroupées en bandes correspond au nombre de divisions.) en fonction de deux des trois critères suivants : „ Emplacement de la première division : Valeur qui définit la limite supérieure de la modalité regroupée en bandes la moins élevée (par exemple. Si la variable source comporte peu de valeurs distinctes ou de nombreuses observations ayant la même valeur. exprimée en pourcentage du nombre total des observations. „ Largeur (%) : Longueur de chaque intervalle. „ Nombre de divisions : Le nombre de modalités regroupées en bandes correspond au nombre de divisions. Centiles égaux fondés sur les observations analysées : Génère des modalités regroupées en bandes avec un nombre d'observations identique dans chaque bande (à l'aide de l'algorithme empirique pour les centiles). 9 divisions génèrent 10 modalités regroupées en bandes. Divisions au niveau de la moyenne et des écarts types sélectionnés. Par exemple. „ Largeur : Longueur de chaque intervalle. la valeur 10 regroupe les données d'âge en années par intervalles de 10 ans.3 générerait trois modalités regroupées en bandes (deux divisions). chacune contenant 33. Par exemple. chacune contenant 25 % des observations. vous risquez d'obtenir un nombre de bandes inférieur à celui requis.3 % des observations. Intervalles de longueur identique : Génère des modalités regroupées en bandes de longueur identique (par exemple.

Remarque : Les calculs de centiles et d'écarts types reposent sur les observations analysées. 68 % des observations sont comprises dans un écart type de la moyenne. en particulier si le fichier de données est trié par variable source. 95 %. Si vous limitez le nombre d'observations analysées. voire hors de l'intervalle des valeurs possibles (par exemple. la moyenne étant utilisée comme division entre les bandes. „ Vous pouvez sélectionner n'importe quelle combinaison d'intervalles d'écarts types en utilisant un.137 Préparation des données „ Si vous ne sélectionnez pas les intervalles d'écarts types. vous pouvez copier les spécifications du regroupement à partir d'une variable vers la variable sélectionnée ou à partir de la variable sélectionnée vers plusieurs variables. . Dans une distribution normale. vous n'obtiendrez pas quatre bandes d'âge en centiles contenant 25 % des observations. deux et/ou trois écarts types. huit modalités regroupées en bandes sont créées : six bandes dans un intervalle d'écarts types. Par exemple. deux modalités regroupées en bandes sont créées. certaines bandes définies risquent de se retrouver hors de l'intervalle de données réel. Si la création de modalités regroupées en bandes est basée sur les écarts types. Par exemple. mais plutôt trois bandes contenant chacune 3. dans deux écarts types et 99 % dans trois écarts types. Copie de modalités regroupées en bandes Si vous souhaitez créer des modalités regroupées en bandes pour plusieurs variables. si vous limitez l'analyse aux 100 premières observations d'un fichier de données contenant 1 000 observations et que ce fichier de données est trié dans l'ordre croissant de l'âge des répondants.3 % des observations et une quatrième en contenant 90 %. et deux bandes pour les observations supérieures ou inférieures à la moyenne de plus de trois écarts types. si vous sélectionnez les trois. les bandes obtenues risquent de ne pas contenir la proportion d'observations souhaitée. un intervalle de salaires négatif).

cliquez sur la variable vers laquelle copier les modalités regroupées en bandes concernées. cliquez sur une variable pour laquelle vous avez défini des modalités regroupées en bandes. E Sélectionnez les variables pour lesquelles créer des variables ayant les mêmes modalités regroupées en bandes. ou E Dans la zone Liste des variables analysées. . E Cliquez sur Copier. E Cliquez sur Vers d'autres variables. E Cliquez sur A partir d'une autre variable.138 Chapitre 6 Figure 6-14 Copie de bandes à partir de ou vers la variable actuelle Pour copier les spécifications de regroupement en bandes : E Définissez des modalités regroupées en bandes pour une variable au moins (ne cliquez pas sur OK ni sur Coller). E Dans la zone Liste des variables analysées.

vous ne pouvez pas utiliser cet outil pour copier les modalités regroupées en bandes vers d'autres variables. cette dernière est utilisée comme étiquette pour la valeur recodée de la nouvelle variable. E Cliquez sur Copier. Toutes les étiquettes de valeur définies pour les codes de valeur manquante sont également copiées. Si vous avez spécifié des étiquettes de valeur pour la variable à partir de laquelle vous copiez les spécifications de regroupement. Remarque : Si la variable source comporte un intervalle défini de valeurs manquantes utilisateur sous la forme LO-n (n étant un nombre positif). .139 Préparation des données E Sélectionnez la variable avec les modalités regroupées en bandes définies à copier. Cette valeur devient alors la nouvelle valeur manquante spécifiée par l'utilisateur. le code de la valeur manquante de cette nouvelle variable est modifié : 100 est ajouté à la valeur la plus élevée de la modalité regroupée en bandes. les valeurs manquantes utilisateur correspondantes de la nouvelle variable sont des nombres négatifs. Par exemple. Si la valeur manquante utilisateur de la variable source comporte une étiquette de valeur définie. Les valeurs manquantes utilisateur des variables source sont copiées en tant que telles pour la nouvelle variable. Remarque : Une fois que vous avez cliqué sur OK dans la boîte de dialogue principale de l'outil visuel de regroupement en bandes pour créer les variables regroupées en bandes (ou que vous avez fermé cette boîte de dialogue d'une autre manière). Si un code de valeur manquante est en conflit avec l'une des valeurs de modalité regroupée en bandes pour la nouvelle variable. Valeurs manquantes utilisateur dans l'outil visuel de regroupement en bandes Les valeurs définies comme valeurs manquantes spécifiées par l'utilisateur (valeurs identifiées comme codes pour les données manquantes) pour la variable source ne sont pas incluses dans les modalités regroupées en bandes de la nouvelle variable. la valeur 106 de la nouvelle variable vient remplacer la valeur 1 de la variable source pour toutes les observations. ces étiquettes sont également copiées. si la valeur 1 est définie comme valeur manquante utilisateur de la variable source et que la nouvelle variable comporte six modalités regroupées en bandes.

.

de distribution. ou des transformations de données peuvent s'avérer nécessaires pour déterminer la véritable relation entre les variables. Vous pouvez créer de nouvelles variables ou remplacer les valeurs de variables existantes. Calcul de variables Calculer la variable calcule les valeurs d'une variable en fonction des transformations numériques d'autres variables. comme la création de nouvelles variables basées sur des équations complexes et des instructions conditionnelles. Vous pouvez utiliser plus de 70 fonctions intégrées. et toute relation entre les variables est soit linéaire soit orthogonale. ou des tâches plus évoluées. et de chaîne. vos données brutes conviennent parfaitement pour le type d'analyse que vous désirez effectuer. Vous pouvez calculer les valeurs de manière sélective pour des sous-ensembles de données en fonction de conditions logiques. „ „ 141 . vous pouvez aussi spécifier le type et l'étiquette. L'analyse préliminaire peut révéler des schémas de codage peu pratiques ou des erreurs de codage. „ „ Vous pouvez calculer les valeurs de variables numériques ou sous forme de chaîne de caractères (alphanumérique). Malheureusement.Chapitre Transformations de données 7 Dans une situation idéale. SPSS vous permet d'effectuer des transformations de données simples. comme la fusion de modalités pour une analyse. c'est rarement le cas. statistiques. Dans le cas de nouvelles variables. dont des fonctions arithmétiques.

. „ „ Collez les fonctions depuis la liste des fonctions et renseignez les paramètres indiqués par des points d'interrogation.. Il peut s'agir d'une variable existante ou d'une nouvelle variable à ajouter au fichier de travail. sélectionnez : Transformer Calculer.142 Chapitre 7 Figure 7-1 Boîte de dialogue Calculer la variable Pour calculer des variables E A partir du menu. E Entrez le nom d'une seule variable cible. soit les saisir directement depuis le clavier. Les constantes alphanumériques doivent être présentées entre guillemets ou apostrophes.. vous pouvez soit coller les composants dans le champ Expression. E Pour construire une expression.

des constantes. Si le résultat d'une expression conditionnelle est False (faux) ou manquant. (Expressions conditionnelles) vous permet d'appliquer les transformations de données à des sous-ensembles d'observations sélectionnées. vous devez aussi sélectionner Type & étiquette pour spécifier le type de données. Une expression conditionnelle renvoie la valeur True (vrai).. la transformation est appliquée à l'observation. des fonctions. >.. = et ~=) du pavé numérique. „ „ „ „ Si le résultat d'une expression conditionnelle est True (vrai). <=. >=. La plupart des expressions conditionnelles utilisent un ou plus des six opérateurs relationnels (<. Pour les nouvelles variables chaîne. la transformation n'est pas appliquée à l'observation. des opérateurs arithmétiques. Transformations conditionnelles La boîte de dialogue Si. des variables logiques et des opérateurs relationnels. le point (. numériques ou non. au moyen d'expressions conditionnelles.143 Transformations de données „ „ Les constantes numériques doivent être saisies en format américain.) servant de séparateur décimal. . Ces expressions conditionnelles peuvent comprendre des noms de variable. False (faux) ou manquant pour chaque observation.

vous devez spécifier le type de données et sa longueur. Etiquette : Etiquette de variable facultative et descriptive jusqu'à 120 caractères. . Pour calculer une nouvelle variable chaîne.144 Chapitre 7 Figure 7-2 Boîte de dialogue Calculer la variable : si les observations Calculer la variable : Type et étiquette Par défaut. Type : Les variables calculées peuvent être numériques ou alphanumériques. les nouvelles variables calculées sont numériques. Les variables chaîne ne peuvent être utilisées dans des calculs. Vous pouvez entrer une étiquette ou utiliser les 110 premiers caractères de l'expression de calcul comme étiquette.

145 Transformations de données Figure 7-3 Boîte de dialogue Calculer la variable : Type et étiquette Fonctions Plusieurs types de fonctions sont prises en charge. Valeurs manquantes dans les fonctions Les fonctions et les expressions arithmétiques simples traitent les valeurs manquantes de manière différente. . y compris : „ „ „ „ „ „ „ Fonctions arithmétiques Fonctions statistiques Fonctions sur chaînes les fonctions date et heure Fonctions de distribution les fonctions de variable aléatoire les fonctions de valeur manquante Recherchez les fonctions dans l'index de l'aide en ligne pour obtenir la liste complète des fonctions. Cliquez avec le bouton droit de la souris sur une fonction sélectionnée dans la liste pour en afficher la description. Dans l'expression : (var1+var2+var3)/3 le résultat est manquant s'il manque une valeur dans l'une des trois variables d'une observation.

146 Chapitre 7 Dans l'expression : MEAN(var1. utilisez cette boîte de dialogue pour réinitialiser le générateur à une valeur spécifique avant chaque analyse utilisant les nombres aléatoires. var3) le résultat ne manque que si les valeurs des trois variables manquent dans l'observation. pour vous permettre de reproduire une séquence de nombres aléatoires. var2.2(var1. Pour répliquer une séquence de nombres aléatoires. var2. . un échantillonnage aléatoire ou une pondération d'observation. Pour ce faire. tapez un point et le nombre minimal après le nom de la fonction. Figure 7-4 Boîte de dialogue Générer des nombres aléatoires Le nombre aléatoire est automatiquement réinitialisé à 2 000 000 chaque fois que vous démarrez une nouvelle session SPSS. Pour les fonctions statistiques. var3) Générer des nombres aléatoires Le générateur fixe à une valeur spécifique le nombre aléatoire utilisé. comme suit : MEAN. Le nombre aléatoire change chaque fois qu'un nombre aléatoire est généré pour être utilisé dans des transformations (comme les fonctions UNIFORM et NORMAL). vous pouvez spécifier le nombre minimal d'arguments ne comportant pas de valeurs manquantes.

E Sélectionnez Définir le générateur à..000..147 Transformations de données Pour définir la génération de données aléatoires E A partir du menu. Par exemple. E Entrez un entier positif compris entre 1 et 2. Vous pourriez compter le nombre de réponses oui pour chaque répondant et créer une nouvelle variable contenant le nombre total de magazines lus.000. Figure 7-5 Boîte de dialogue Compter occurrences des valeurs par observation . sélectionnez : Transformer Générer des nombres aléatoires. une enquête peut comporter une liste de magazines avec des cases à cocher oui/non pour indiquer les magazines lus par chaque répondant.000. Compter occurrences des valeurs par observation Cette boîte de dialogue crée une variable qui compte les occurrences des mêmes valeurs dans une liste de variables pour chaque observation.

. et des intervalles. Les spécifications de valeurs peuvent inclure des valeurs individuelles.. la variable cible est incrémentée plusieurs fois pour cette variable. Les limites comprennent leurs extrêmes et toute valeur manquante spécifiée figurant dans l'intervalle. En option.. E Cliquez sur Définir les valeurs et spécifiez les valeurs à compter.. Compter les occurrences des valeurs par observations : Valeurs à compter La valeur de la variable cible (dans la boîte de dialogue principale) est incrémentée d'une unité chaque fois que l'une des variables sélectionnées correspond à une spécification dans la liste Valeurs à compter. (Expression conditionnelle) pour la définition de sous-ensembles d'observations est la même que celle décrite pour Calculer la variable. E Entrez le nom d'une variable cible. Si une observation correspond à plusieurs spécifications pour une variable quelconque. des valeurs manquantes ou manquantes par défaut.148 Chapitre 7 Pour compter les occurrences de valeurs par observations E A partir du menu. E Sélectionnez deux ou plusieurs variables du même type (numérique ou alphanumérique). . vous pouvez définir un sous-ensemble d'observations dont il faut compter les occurrences de valeurs. La boîte de dialogue Si. sélectionnez : Transformer Compter.

Recodage de variables Le recodage dans les mêmes variables réaffecte les valeurs de variables existantes ou fusionne des intervalles de valeurs existantes dans de nouvelles valeurs. Vous pouvez recoder des variables numériques et chaîne. .149 Transformations de données Figure 7-6 Boîte de dialogue Compter occurrences des valeurs par observation : Valeurs à compter Recodage de valeurs Vous pouvez modifier les valeurs de données en les recodant. elles doivent toutes être du même type. Vous pouvez recoder les valeurs à l'intérieur de variables existantes ou créer des variables sur la base des valeurs recodées de variables existantes. Par exemple. Ceci est particulièrement utile pour fusionner des modalités ou les combiner. Vous ne pouvez pas recoder ensemble des variables numériques et chaîne. vous pourriez fusionner des salaires dans des modalités d'intervalles de salaires. Si vous sélectionnez plusieurs variables.

. E Cliquez sur Anciennes et nouvelles valeurs et spécifiez comment recoder les valeurs. elles doivent être du même type (numérique ou alphanumérique).. Si vous sélectionnez plusieurs variables. (Expression conditionnelle) pour la définition de sous-ensembles d'observations est la même que celle décrite pour Calculer la variable. . Recodage de variables : Anciennes et nouvelles valeurs Vous pouvez définir les valeurs à recoder dans cette boîte de dialogue..150 Chapitre 7 Figure 7-7 Boîte de dialogue Recodage de variables Pour recoder les valeurs d'une variable E A partir du menu. Toutes les spécifications de valeurs doivent être du même type de données (numérique ou alphanumérique) que les variables sélectionnées dans la boîte de dialogue principale. En option. vous pouvez définir un sous-ensemble d'observations à recoder. La boîte de dialogue Si.. sélectionnez : Transformer Recode Recodage de variables. E Sélectionnez les variables que vous désirez recoder.

). „ Toutes les autres valeurs : Toute autre valeur non incluse dans l'une des spécifications de la liste Ancienne-Nouvelle. „ Valeur : Les anciennes valeurs individuelles doivent être recodées par de nouvelles valeurs. comme l'indique le point (.151 Transformations de données Ancienne valeur : Valeurs à recoder. ou comportant des valeurs inconnues et auxquelles ont été attribuées des valeurs par défaut. Vous pouvez entrer une valeur ou la valeur manquante par défaut. Nouvelle valeur : Valeur unique en laquelle chaque ancienne valeur ou intervalle de valeurs est recodé. et des valeurs manquantes. Les valeurs manquantes par défaut numériques sont affichées sous forme de points. Les variables chaîne ne peuvent pas comporter de valeurs manquantes par défaut. Les valeurs manquantes par défaut et les intervalles ne peuvent être sélectionnés pour des variables chaîne. des intervalles de valeurs. puisqu'elles acceptent tous les caractères. „ Manquant par défaut : Valeurs affectées par le programme lorsque certaines valeurs de vos données sont non définies d'après le type de format spécifié. La valeur doit être du même type de données (numérique ou chaîne) que l'ancienne variable. et les observations avec des valeurs manquantes par défaut sont exclues de nombreuses procédures. „ Plage : Intervalle de valeurs inclusif. Les valeurs manquantes par défaut ne sont pas utilisées dans les calculs. Apparaît sous l'intitulé ELSE dans la liste Ancienne-Nouvelle. Non disponible pour les variables de chaîne. Vous pouvez recoder des valeurs uniques. . La valeur doit être du même type de données (numérique ou chaîne) que la variable que vous recodez. Non disponible pour les variables de chaîne. „ Manquante par défaut ou spécifiée : Observations comportant des valeurs définies comme valeurs manquantes par défaut. car aucun de ces concepts ne s'applique à ce type de variable. Les limites comprennent leurs extrêmes et toute valeur manquante spécifiée figurant dans l'intervalle. lorsqu'un champ numérique est vide ou lorsqu'une valeur résultant d'une commande de transformation n'est pas définie. Les valeurs manquantes spécifiées comprises dans l'intervalle sont prises en compte. „ Manquant par défaut : Recode les anciennes valeurs spécifiées en valeurs manquantes par défaut. „ Valeur : Valeur dans laquelle une ou plusieurs valeurs anciennes devront être recodées.

puis toutes les autres valeurs. Si vous sélectionnez plusieurs variables. selon l'ordre suivant : valeurs uniques. La liste est triée automatiquement. vous pourriez fusionner les salaires en une nouvelle variable contenant des modalités d'intervalles de salaires. valeurs manquantes. intervalles. elles doivent toutes être du même type. en fonction de la spécification de l'ancienne valeur. si nécessaire. modifier et supprimer des spécifications dans la liste.152 Chapitre 7 Ancienne—>Nouvelle : Liste les spécifications qui seront utilisées pour recoder la ou les variables. „ „ „ Vous pouvez recoder des variables numériques et chaîne. SPSS trie de nouveau la liste automatiquement. . Vous pouvez recoder des variables numériques en variables chaîne et inversement. pour conserver cet ordre. Vous ne pouvez pas recoder ensemble des variables numériques et chaîne. Vous pouvez ajouter. Si vous changez une spécification de recodage dans la liste. Figure 7-8 Boîte de dialogue Anciennes et nouvelles valeurs Création de variables Recoder dans des variables différentes (création de variables) réaffecte les valeurs des variables existantes ou fusionne les intervalles de valeurs existantes en de nouvelles valeurs pour une nouvelle variable. Par exemple.

vous pouvez définir un sous-ensemble d'observations à recoder. puis cliquez sur Remplacer. En option. . sélectionnez : Transformer Recode Création de variables. E Sélectionnez les variables que vous désirez recoder.. Recoder et créer de nouvelles variables : Anciennes et nouvelles valeurs Vous pouvez définir les valeurs à recoder dans cette boîte de dialogue. Si vous sélectionnez plusieurs variables. E Cliquez sur Anciennes et nouvelles valeurs et spécifiez comment recoder les valeurs. elles doivent être du même type (numérique ou alphanumérique)..153 Transformations de données Figure 7-9 Boîte de dialogue Recoder et créer de nouvelles variables Pour recoder les valeurs d'une variable dans une nouvelle variable E A partir du menu. E Entrez un nom de variable de résultat (nouveau) pour chaque nouvelle variable.

comme l'indique le point (. Nouvelle valeur : Valeur unique en laquelle chaque ancienne valeur ou intervalle de valeurs est recodé. La valeur doit être du même type de données (numérique ou chaîne) que l'ancienne variable. Les anciennes valeurs doivent être du même type de données (numérique ou alphanumérique) que la variable d'origine. des intervalles de valeurs. „ Toutes les autres valeurs : Toute autre valeur non incluse dans l'une des spécifications de la liste Ancienne-Nouvelle. „ Manquante par défaut ou spécifiée : Observations comportant des valeurs définies comme valeurs manquantes par défaut. Apparaît sous l'intitulé ELSE dans la liste Ancienne-Nouvelle. Vous pouvez recoder des valeurs uniques. La valeur doit être du même type de données (numérique ou chaîne) que la variable que vous recodez. „ Plage : Intervalle de valeurs inclusif. Les variables chaîne ne peuvent pas comporter de valeurs manquantes par défaut. puisqu'elles acceptent tous les caractères. Les valeurs manquantes spécifiées comprises dans l'intervalle sont prises en compte. Les limites comprennent leurs extrêmes et toute valeur manquante spécifiée figurant dans l'intervalle. lorsqu'un champ numérique est vide ou lorsqu'une valeur résultant d'une commande de transformation n'est pas définie.). Non disponible pour les variables de chaîne. Les valeurs manquantes par défaut et les intervalles ne peuvent être sélectionnés pour des variables chaîne.154 Chapitre 7 Ancienne valeur : Valeurs à recoder. . „ Valeur : Valeur dans laquelle une ou plusieurs valeurs anciennes devront être recodées. Les nouvelles valeurs peuvent être numériques ou alphanumériques. ou comportant des valeurs inconnues et auxquelles ont été attribuées des valeurs par défaut. „ Manquant par défaut : Valeurs affectées par le programme lorsque certaines valeurs de vos données sont non définies d'après le type de format spécifié. Les valeurs manquantes par défaut numériques sont affichées sous forme de points. et des valeurs manquantes. „ Valeur : Les anciennes valeurs individuelles doivent être recodées par de nouvelles valeurs. car aucun de ces concepts ne s'applique à ce type de variable.

Convertir les chaînes numériques en nombres : Convertit les variables de chaîne contenant des chiffres en valeurs numériques. Non disponible pour les variables de chaîne. La liste est triée automatiquement. „ Copier les anciennes valeurs : Conserve les anciennes valeurs. Vous pouvez ajouter. selon l'ordre suivant : valeurs uniques. Les valeurs manquantes par défaut ne sont pas utilisées dans les calculs. Toute ancienne valeur non spécifiée n'est pas incluse dans la nouvelle variable. Ancienne—>Nouvelle : Liste les spécifications qui seront utilisées pour recoder la ou les variables. modifier et supprimer des spécifications dans la liste. Si certaines valeurs n'ont pas besoin d'être recodées. en fonction de la spécification de l'ancienne valeur. si nécessaire. intervalles. utilisez cette option pour inclure les anciennes valeurs. L'ancienne variable peut être numérique ou chaîne. puis toutes les autres valeurs. valeurs manquantes. et les observations avec ces valeurs se verront affecter la valeur manquante par défaut de la nouvelle variable.155 Transformations de données „ Manquant par défaut : Recode les anciennes valeurs spécifiées en valeurs manquantes par défaut. Variables destination sont des chaînes : Définit la nouvelle variable recodée comme une variable chaîne (alphanumérique). Si vous changez une spécification de recodage dans la liste. Figure 7-10 Boîte de dialogue Anciennes et nouvelles valeurs . Les chaînes de caractères contenant autre chose que des nombres et des signes (+ ou -) sont considérées comme des valeurs manquantes par défaut. et les observations avec des valeurs manquantes par défaut sont exclues de nombreuses procédures. pour conserver cet ordre. SPSS trie de nouveau la liste automatiquement.

Les rangs sont calculés à l'intérieur de chaque groupe.. vous pouvez : „ „ Ordonner les observations en ordre croissant ou décroissant. en fonction du nom d'origine de la variable et des mesures sélectionnées. Un tableau récapitulatif liste les variables d'origine. les rangs seront calculés pour chaque combinaison de sexe et minorité. . Séparez les rangs en sous-groupes en sélectionnant des variables de regroupement pour la liste Par.156 Chapitre 7 Ordonner les observations Ordonner les observations crée de nouvelles variables contenant des rangs. Les groupes sont définis par combinaison des valeurs des variables de regroupement.. De nouveaux noms de variables et des étiquettes de variable descriptives sont automatiquement générées par SPSS. Figure 7-11 Boîte de dialogue Ordonner les observations. les nouvelles variables et les étiquettes de variable. Par exemple. Sinon. des scores normaux et de Savage et des valeurs de centiles pour les variables numériques. si vous sélectionnez sexe et minorité comme variables de regroupement.

E Sélectionnez des variables à ordonner. de 2 à celles situées entre les 25e et 50e centiles. Rang fractionnaire : La valeur de la nouvelle variable est égale au rang divisé par la somme des pondérations des observations non manquantes. sélectionnez : Transformer Ordonner les observations. Vous pouvez aussi créer des ordonnancements basés sur des estimations de la proportion et des scores normaux. En option. vous pouvez ordonner les observations en ordre croissant ou décroissant et séparer les rangs en sous-groupes. de 3 à celles situées entre les 50e et 75e centiles. Vous ne pouvez ordonner que des variables numériques. les rangs fractionnaires et les centiles. une spécification de 4 fractiles affectera une valeur de 1 aux observations inférieures au 25e centile. Une variable d'ordonnancement distincte est créée pour chaque méthode.157 Transformations de données Pour ordonner les observations E A partir du menu. Fractiles : Les rangs sont basés sur des groupes de centiles. Par exemple. les scores de Savage. Ordonner les observations : Types (de rangs) Vous pouvez sélectionner plusieurs méthodes d'ordonnancement. Score de Savage : La nouvelle variable contient des scores de Savage reposant sur une distribution exponentielle. et de 4 à celles supérieures au 75e centile.. Les méthodes d'ordonnancement comprennent les rangs simples. Rang : Rang simple. . La nouvelle variable est une constante pour toutes les observations du même groupe. chaque groupe contenant à peu près le même nombre d'observations. Rang en pourcentage : Chaque rang est divisé par le nombre d'observations ayant des valeurs valides et multiplié par 100. La valeur de la nouvelle variable est égale à son rang.. Somme des poids : La valeur de la nouvelle variable est égale à la somme des pondérations d'observation.

vous pouvez sélectionner la formule d'estimation d'une proportion : Blom.158 Chapitre 7 Estimations de la proportion : Estimations de la proportion cumulée de la distribution correspondant à un rang particulier. de 1 à w. dans laquelle r est le rang et w la somme des pondérations d'observation. Rankit : Utilise la formule (r-1/2) / w. Rankit ou Van der Waerden. définie par la formule r/(w+1). compris entre 1 et w. Scores normaux : Ecarts z correspondant à la proportion cumulée estimée. Formule d'estimation d'une proportion : Pour les estimations de la proportion et les scores normaux. „ „ „ Tukey : Utilise la formule (r-1/3) / (w+1/3). w représentant le nombre d'observations et r le rang. Van der Waerden : Transformation de Van der Waerden. Tukey. „ Blom : Crée une variable d'ordonnancement sur la base des estimations de la proportion. qui utilise la formule (r-3/8) / (w+1/4). où r est le rang et w la somme des pondérations d'observation. . Figure 7-12 Boîte de dialogue Ordonner les observations : Types Ordonner les observations : Ex aequo Cette boîte de dialogue détermine la méthode d'affectation pour ordonner les observations ayant la même valeur que la variable d'origine. dans laquelle w est la somme des pondérations d'observation et r le rang.

les cellules vides qui en résultent réduisent les performances et augmentent les besoins en mémoire de nombreuses procédures SPSS. De plus. Recoder automatiquement Le recodage automatique convertit les valeurs numériques et les valeurs alphanumériques en entiers consécutifs. Lorsque les codes de modalité ne sont pas séquentiels. et certaines ont besoin de valeurs entières consécutives pour les niveaux de facteurs. . certaines procédures ne peuvent utiliser des variables chaîne.159 Transformations de données Figure 7-13 Boîte de dialogue Ordonner les observations : Ex aequo Le tableau suivant montre comment les différentes méthodes affectent des rangs à des valeurs ex aequo.

si la variable d'origine comporte 10 valeurs non manquantes. Un tableau affiche les anciennes et les nouvelles valeurs et les étiquettes de valeurs. .. Pour toute valeur sans étiquette de définition de valeur. E Pour chaque variable sélectionnée. sélectionnez : Transformer Recoder automatiquement E Sélectionnez des variables à recoder. les majuscules précédant leurs équivalents minuscules.160 Chapitre 7 Figure 7-14 Boîte de dialogue Recoder automatiquement. la valeur d'origine est utilisée comme étiquette pour la valeur recodée. Par exemple. puis cliquez sur Nouveau nom. entrez un nom pour la nouvelle variable. en conservant leur ordre. Les valeurs manquantes sont recodées en valeurs manquantes supérieures à toutes valeurs non manquantes. Les valeurs de chaîne sont recodées dans l'ordre alphabétique. Pour recoder des variables numériques ou alphanumériques en nombres entiers consécutifs E A partir du menu. la valeur manquante la plus faible serait recodée en 11 et la valeur 11 serait une valeur manquante pour la nouvelle variable. Les nouvelles variables créées par le Recodage automatique conservent toute variable définie et les étiquettes de valeurs de l'ancienne variable..

et faire la distinction entre les périodes historiques. Remplacement des valeurs manquantes spécifiées et des valeurs manquantes par défaut par des estimations basées sur une méthode parmi plusieurs. . Figure 7-15 Boîte de dialogue Définir des dates.161 Transformations de données Transformation de données pour série chronologique Plusieurs transformations de données utiles pour les analyses de séries chronologiques sont fournies : „ „ „ Génération de variables de date pour établir une périodicité.. de validation et de prévision. Définir des dates La définition des dates génère des variables de date pouvant être utilisées pour établir la périodicité d'une série chronologique et pour étiqueter le résultat d'analyses de séries chronologiques. Une série chronologique est obtenue par mesure régulière d'une variable (ou d'un groupe de variables) sur une certaine période. et l'intervalle de temps entre les observations est uniforme. Les transformations de données de séries chronologiques exigent une structure de fichier de données dans laquelle chaque ligne représente un groupe d'observations à une heure différente. Création de nouvelles variables de séries chronologiques sous forme de fonctions de variables de séries chronologiques existantes..

Pour définir des dates pour des données de séries chronologiques E A partir du menu. Des valeurs séquentielles. mois_. jour_. Une nouvelle variable numérique est créée pour chaque composant utilisé pour définir la date. semaine_. sont affectées aux observations ultérieures. jour_. Cet élément reflète simplement l'état actuel du fichier de travail. elles sont remplacées lorsque vous définissez de nouvelles variables de date portant le même nom que les variables de date existantes. sélectionnez : Données Définir des dates E Sélectionnez un intervalle de temps dans la liste Les observations sont. telle que le nombre de mois dans une année ou le nombre de jours de la semaine. seconde_ et date_. date_. La valeur affichée indique la valeur maximale que vous pouvez entrer. „ Non daté supprime toutes les variables de date précédemment définies. qui est affectée à la première observation. Les noms des nouvelles variables se terminent par un trait de soulignement. heures. si vous avez sélectionné semaines. jours. Par exemple. est également créée à partir des composants. „ Autres indique la présence de variables de date personnalisées créées avec la syntaxe de commande (par exemple. Si des variables de date ont été déjà définies.) Les variables de date personnalisées ne sont pas disponibles avec la version Student.162 Chapitre 7 Les observations sont : Définit l'intervalle de temps utilisé pour générer des dates. La première observation est : Définit la valeur de la date de départ. heure_. basées sur l'intervalle de temps. Une variable descriptive chaîne. heure_ et date_. trimestre_. . (Consultez le manuel SPSS Command Syntax Reference pour obtenir des informations sur l'utilisation de la commande DATE pour créer des variables de date personnalisées. minute_. quatre nouvelles variables sont créées : semaine_. Toutes les variables portant les noms suivants sont supprimées : année_. Sa sélection dans la liste est sans effet. Périodicité au niveau supérieur : Indique une variation cyclique répétitive. une semaine de travail de quatre jours).

pour la variable prix. Par exemple. En interne. la plupart des variables de format date sont stockées sous la forme du nombre de secondes écoulées depuis le 14 octobre 1582. les noms de nouvelles variables reprennent les six premiers caractères de la variable existante utilisée pour les créer. à partir d'un point de départ spécifié par l'utilisateur. Les variables de format date représentent des dates et/ou des heures affichées selon divers formats de date/heure. de médianes mobiles. suivis d'un trait de soulignement et d'un numéro séquentiel. Créer la série chronologique L'option Créer la série chronologique permet de créer des variables sur la base des fonctions de variables numériques de séries chronologiques existantes. de semaines. permettant de créer des variables de séries chronologiques. définies dans l'affichage des variables de l'éditeur de données. Les nouvelles variables conservent toute étiquette de valeur définie des variables d'origine. Les variables de date sont de simples entiers représentant un nombre de jours.. .163 Transformations de données E Entrez les valeurs définissant la date de départ. Par défaut. Les variables de date sont utilisées pour créer une périodicité pour les données de séries chronologiques. qui détermine la date affectée à la première observation. de décalages et de décalage négatif. Ces valeurs transformées sont utiles dans de nombreuses procédures d'analyse de séries chronologiques. Les fonctions disponibles. incluent les fonctions de différences. le nom de la nouvelle variable serait prix_1. etc. d'heures. de moyennes mobiles. Variables de date versus variables de format date Les variables de date créées avec Définir les dates ne doivent pas être confondues avec les variables de format date.

. Sinon. Remplacer la fonction par une variable sélectionnée. vous pouvez : „ „ Entrer des noms de variables pour remplacer les noms des nouvelles variables par défaut.164 Chapitre 7 Figure 7-16 Boîte de dialogue Créer la série chronologique.. Pour créer des variables chronologiques E A partir du menu. sélectionnez : Transformer Créer la série chronologique E Sélectionnez la fonction de séries chronologiques que vous désirez utiliser pour transformer les variables d'origine. Seules des variables numériques peuvent être utilisées.. E Sélectionnez les variables à partir desquelles vous désirez créer de nouvelles variables de séries chronologiques.

Moyenne mobile précédente : Moyenne de l'intervalle de valeurs des séries précédant la valeur courante. Si l'intervalle est pair. Si l'intervalle est pair. Médianes mobiles : Médiane d'un intervalle de valeurs de séries entourant et incluant la valeur courante. Définir les dates) qui incluent une composante périodique (telle que les mois de l'année). les 24 premières observations auront la valeur manquante par défaut pour nouvelle variable. la médiane est calculée en faisant la moyenne de chaque paire de médianes non centrées. L'intervalle est basé sur la périodicité actuellement définie. Pour calculer des différences saisonnières. vous devez disposer de variables de date définies (Menu Données. les valeurs manquantes par défaut apparaissent au début des séries. Par exemple. Le nombre d'observations avec la valeur manquante par défaut au début et à la fin des séries pour un intervalle de n est égal à n/2 pour des valeurs d'intervalles paires et impaires. si la périodicité courante est 12 et l'ordre 2. Par exemple. si l'intervalle est 5. Le nombre d'observations avec la valeur manquante par défaut au début des séries est égal à la périodicité multipliée par l'ordre. Différence saisonnière : Différence entre des valeurs de séries séparées par un intervalle constant. Comme une observation est perdue pour chaque ordre de différence. la moyenne mobile est calculée en faisant la moyenne de chaque paire de moyennes non centrées. si l'ordre de différence est 2.165 Transformations de données Fonctions de transformation de séries chronologiques Différence : Différence non saisonnière entre les valeurs successives dans les séries. Le nombre d'observations avec la valeur manquante par défaut au début et à la fin des séries pour un intervalle de n est égal à n/2 pour des valeurs d'intervalles paires et impaires. L'intervalle est le nombre de valeurs de séries précédentes utilisé pour calculer la moyenne. le nombre d'observations avec la valeur manquante par défaut au début et à la fin des séries est 2. L'intervalle est le nombre de valeurs de séries utilisé pour calculer la médiane. Moyenne mobile centrée : Moyenne d'un intervalle de valeurs de séries entourant et incluant la valeur courante. L'intervalle est le nombre de valeurs de séries utilisé pour calculer la moyenne. les deux premières observations contiendront la valeur manquante par défaut pour la nouvelle variable. Le nombre d'observations avec la valeur manquante par défaut au début des séries est égal à la valeur de l'intervalle. Par exemple. Par exemple. L'ordre est le nombre de périodes saisonnières utilisé pour calculer la différence. si l'intervalle . L'ordre est le nombre des valeurs précédentes utilisé pour calculer la différence.

Lissage : Nouvelles valeurs des séries basées sur un lisseur de données composées. centrée par une médiane mobile de 2. basée sur l'ordre de décalage spécifié. le nombre d'observations avec la valeur manquante par défaut au début et à la fin des séries est 2. suivis d'un trait de soulignement et d'un numéro séquentiel. basée sur l'ordre de décalage négatif spécifié. les résidus lissés sont calculés par soustraction des valeurs lissées obtenues la première fois par le processus. Par défaut. Somme cumulée : Somme cumulée des valeurs des séries à concurrence de la valeur courante. Décalage négatif : Valeur d'une observation ultérieure. le nom de la nouvelle variable serait prix_1. Décalage positif : Valeur d'une observation précédente. et du hanning (exécution de moyennes pondérées). Le nombre d'observations avec la valeur manquante par défaut à la fin des séries est égal à la valeur de l'ordre. L'ordre est le nombre d'observations antérieures à l'observation courante à partir de laquelle la valeur est obtenue. Remplacer les valeurs manquantes Les observations manquantes peuvent constituer un problème dans le cadre d'analyses. et il arrive que des mesures de séries ne puissent être calculées si des valeurs manquent dans les séries. pour la variable prix. y compris celle-ci. Tout ce processus est ensuite répété sur les résidus calculés.166 Chapitre 7 est 5. Il relisse ensuite ces valeurs en appliquant une médiane mobile de 5. On parle parfois de lissage T4253H. les noms de nouvelles variables reprennent les six premiers caractères de la variable existante utilisée pour les créer. Le lisseur commence avec une médiane mobile de 4. puis une de 3. Pour finir. Le remplacement des valeurs manquantes crée des variables de séries chronologiques à partir de variables existantes. . Par exemple. en remplaçant les valeurs manquantes par des estimations calculées selon une méthode. Le nombre d'observations avec la valeur manquante par défaut au début des séries est égal à la valeur de l'ordre. Les nouvelles variables conservent toute étiquette de valeur définie des variables d'origine. Les résidus sont calculés par soustraction des séries lissées des séries d'origine. L'ordre est le nombre d'observations après l'observation courante à partir de laquelle la valeur est obtenue.

Pour remplacer les valeurs manquantes par des variables de séries chronologiques E A partir du menu..167 Transformations de données Figure 7-17 Boîte de dialogue Remplacer les valeurs manquantes.. sélectionnez : Transformer Remplacer les valeurs manquantes.. Changer la méthode d'estimation pour une variable sélectionnée. Sinon. Méthodes d'estimation pour le remplacement de valeurs manquantes Moyenne de la série : Remplace les valeurs manquantes par la moyenne de toute la série.. E Sélectionnez la méthode d'estimation que vous désirez utiliser pour remplacer les valeurs manquantes. vous pouvez : „ „ Entrer des noms de variables pour remplacer les noms des nouvelles variables par défaut. E Sélectionnez les variables dont vous voulez remplacer les valeurs manquantes. .

celle-ci n'est pas remplacée. Si la première ou la dernière observation de la série comporte une valeur manquante. . Une régression est effectuée sur la série existante selon une variable d'index d'une échelle de 1 à n. Tendance linéaire au point : Remplace les valeurs manquantes par la tendance linéaire de ce point. L'intervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilisée pour calculer la médiane.168 Chapitre 7 Moyenne des points voisins : Remplace les valeurs manquantes par la moyenne des valeurs valides qui les entourent. Médiane des points voisins : Remplace les valeurs manquantes par la médiane des valeurs valides qui les entourent. L'intervalle des points voisins est le nombre de valeurs valides au-dessus et au-dessous de la valeur manquante utilisée pour calculer la moyenne. La dernière valeur valide avant la valeur manquante et la première valeur valide après la valeur manquante sont utilisées pour l'interpolation. Interpolation linéaire : Remplace les valeurs manquantes au moyen d'une interpolation linéaire. Les valeurs manquantes sont remplacées par les prévisions correspondantes.

par exemple.Chapitre Gestion et transformations de fichiers 8 L'organisation des fichiers de données ne répond pas toujours idéalement à vos besoins. Sélectionner des sous-ensembles d'observations : Vous pouvez limiter votre analyse à un sous ensemble d'observations ou effectuer des analyses simultanées sur différents sous ensembles. Vous pouvez. Fusionner des fichiers : Vous pouvez fusionner des fichiers de données (au moins deux). combiner des fichiers. Pondérer les données : La pondération des données concerne les analyses fondées sur la valeur d'une variable pondérée. Vous pouvez associer des fichiers disposant des mêmes variables mais présentant des observations différentes. y compris la possibilité de : Trier les données : Vous pouvez trier les observations en fonction de la valeur de certaines variables. De nombreuses possibilités de transformation de fichier sont disponibles. sélectionner des sous-ensembles d'observations ou modifier l'unité d'analyse en regroupant les observations. trier des données dans un ordre différent. ou l'inverse. 169 . Transposer des observations et des variables : Le format des fichiers de données SPSS lit les lignes comme des observations et les colonnes comme des variables. Agréger les données : Vous pouvez modifier l'unité d'analyse en agrégeant des observations en fonction de la valeur d'une ou plusieurs variables de regroupement. Vous pouvez inverser les lignes et les colonnes et lire les données selon le bon format pour les fichiers qui présentent les informations dans l'autre sens.

Par exemple. . les observations seront triées en fonction de la culture de chaque individu au sein de chaque modalité de la variable sexe. sélectionnez : Données Trier les observations.. les lettres en majuscules précèdent les minuscules dans l'ordre de tri. „ Si vous sélectionnez plusieurs variables de tri. „ Figure 8-1 Boîte de dialogue Trier les observations Pour trier les observations E A partir du menu.170 Chapitre 8 Restructurer les données : Vous pouvez restructurer des données pour créer une observation (un enregistrement) à partir de plusieurs observations ou créer plusieurs observations à partir d'une seule.. la valeur « Oui » précède « oui »dans l'ordre de tri. les observations sont triées pour chaque variable au sein des modalités de la variable précédente dans la liste Tri. Trier les observations Cette boîte de dialogue permet de trier les observations (lignes) du fichier en fonction des valeurs d'une ou plusieurs variables de tri. Vous pouvez trier les observations par ordre croissant ou décroissant. Pour les variables alphanumériques. Par exemple. si vous sélectionnez Sexe comme première variable de tri et Culture comme seconde variable de tri.

Transposer La transposition permet de créer un nouveau fichier dans lequel les lignes et les colonnes du fichier initial sont inversées pour que les observations (lignes) deviennent des variables (colonnes). .171 Gestion et transformations de fichiers E Sélectionnez au moins une variable de tri. suivie de la valeur numérique. et vice versa. Pour conserver certaines de ces valeurs. SPSS génère automatiquement de nouveaux noms pour les variables et affiche une liste de ces nouveaux noms. sélectionnez : Données Transposer. vous pouvez l'utiliser comme Variable de nom et employer ses valeurs comme noms de variable dans le fichier transposé. „ „ Une nouvelle variable de type chaîne contenant le nom de variable d'origine. E Sélectionnez au moins une variable à transposer en observation. case_lbl. est automatiquement créée. S'il s'agit d'une variable numérique. les noms de variables commencent par la lettre V. „ Pour transposer des variables et des observations E A partir du menu. modifiez la définition des valeurs manquantes dans l'affichage des variables de l'éditeur de données. Les valeurs manquantes à l'utilisateur sont converties en valeurs manquantes par défaut dans le fichier transposé. Si le fichier de travail contient un ID (identifiant) ou une variable de nom dont les valeurs sont univoques..

Par exemple. Fusionner des fichiers contenant les mêmes observations mais des variables différentes. Vous pouvez: „ „ Fusionner des fichiers contenant les mêmes variables mais des observations différentes.172 Chapitre 8 Fusionner des fichiers de données SPSS vous permet de fusionner des données à partir de deux fichiers et de deux façons différentes. vous pouvez enregistrer la même information sur des clients de deux secteurs de vente et gérer ces données dans des fichiers séparés pour chaque région. Ajouter des observations Ajouter des observations permet de fusionner le fichier de travail actif avec un autre fichier de données SPSS qui contient les mêmes variables mais des observations différentes. Figure 8-2 Boîte de dialogue Ajouter des observations .

Cette variable a une valeur de 0 pour les observations du fichier de travail et une valeur de 1 pour les observations du fichier de données externe.. Les observations de ce fichier apparaissent en premier dans le nouveau fichier fusionné. Des variables alphanumériques de longueur différente. E Supprimez les variables que vous ne souhaitez pas faire apparaître dans la liste des variables du nouveau fichier de travail. Vous pouvez créer des paires avec les variables non communes et les inclure dans le nouveau fichier fusionné. Indiquer le fichier source dans la variable : Indique le fichier de données source pour chaque observation. Les variables du fichier de travail sont identifiées par un astérisque (*). Les variables non communes incluses dans le fichier fusionné contiendront des données manquantes pour les observations du fichier qui ne les contient pas. Il est impossible de fusionner des variables numériques avec des variables alphanumériques. toutes les variables dont le nom et le type correspond sont ajoutées à la liste. sélectionnez : Données Fusionner des fichiers Ajouter des observations. Les variables du fichier externe sont identifiées par un signe (+). „ „ Variables du nouveau fichier actif : Variables à inclure dans le nouveau fichier actif. Par défaut.. E A partir du menu. . La longueur définie pour une variable alphanumérique doit être la même dans les deux fichiers. „ „ Vous pouvez supprimer des variables de la liste si vous ne les souhaitez pas dans le fichier fusionné. Des variables contenant des données numériques dans l'un des fichiers et des données alphanumériques dans l'autre. Pour fusionner des fichiers de données avec les mêmes variables mais des observations différentes : E Ouvrez l'un des fichiers de données. Par défaut. E Sélectionnez le fichier à fusionner avec le fichier ouvert.173 Gestion et transformations de fichiers Variables non communes : Variables à exclure du nouveau fichier fusionné. la liste contient : „ Des variables sans correspondance dans l'autre fichier.

(Le nom de variable du fichier de travail est utilisé comme nom de variable dans le fichier fusionné. la date de naissance peut être enregistrée sous datenais dans un fichier et né_le dans l'autre. E Tout en maintenant la touche Ctrl enfoncée. Sélectionner une paire de variables non communes E Cliquez sur l'une des variables dans la liste Variables non communes. (Appuyez sur la touche Ctrl et cliquez en même temps sur le bouton gauche de la souris.) Figure 8-3 Sélectionner des paires de variables à l'aide du Ctrl/click .) E Cliquez sur Apparier pour déplacer la paire de variables dans la liste Variables du nouveau fichier de travail. Par exemple. cliquez sur l'autre variable dans la liste.174 Chapitre 8 E Ajouter des paires de variables de la liste des variables non communes qui représentent les mêmes informations mais enregistrées sous des noms différents dans les deux fichiers.

ne sont pas définies dans le fichier de travail. Inclure deux variables portant le même nom mais de type différent ou de longueur différente. Par exemple. vous souhaitez fusionner un fichier de données contenant les résultats d'un test préalable avec un autre fichier contenant les résultats d'un test final. relatives à une variable. valeurs manquantes de type utilisateur. Ajout d'observations : Informations du dictionnaire Tous les informations du dictionnaire existantes (étiquettes de variable et de valeurs. vous devez d'abord les renommer. formats d'affichage) dans le fichier de travail sont appliquées au fichier fusionné. Si le fichier de travail contient des étiquettes de valeurs non définies ou des valeurs manquantes de type utilisateur. „ Ajouter des variables Ajouter des variables permet de fusionner le fichier de travail avec un fichier de données SPSS externe qui contient les mêmes observations mais pas les mêmes variables. Renommer des variables vous permet de : „ „ Utiliser le nom de la variable du fichier externe plutôt que celui du fichier de travail pour les paires de variables. „ Si certaines informations du dictionnaire. les informations du dictionnaire du fichier externe s'appliquent. „ Si une ou plusieurs clés d'appariement sont utilisées pour apparier les .175 Gestion et transformations de fichiers Ajout d'observations : Renommer Vous pouvez renommer les variables du fichier de travail ou du fichier externe avant de les déplacer de la liste des variables non communes dans la liste des variables à ajouter au fichier fusionné. Par exemple. toutes les autres étiquettes de valeurs ou les valeurs manquantes de type utilisateur pour cette variable dans le fichier externe sont ignorées. pour inclure à la fois la variable numérique sexe du fichier de travail et la variable alphanumérique sexe du fichier externe. „ Les observations doivent être présentées dans le même ordre dans les deux fichiers.

SPSS part du principe que ces variables contiennent des informations redondantes. vous pouvez le renommer puis l'ajouter à la liste des variables à inclure. Si vous souhaitez inclure une variable exclue avec un nom redondant dans le fichier fusionné. „ Les noms de variable du second fichier. Par défaut.176 Chapitre 8 observations. En effet. Par défaut. Variables du nouveau fichier actif : Variables à inclure dans le nouveau fichier actif. . cette liste contient tous les noms de variable du fichier externe qui sont redondants avec ceux du fichier de travail. les deux fichiers de données doivent présenter ces clés d'appariement par ordre croissant. redondants avec les noms du fichier de travail. Les variables du fichier externe sont identifiées par un signe (+). Indiquer le fichier source dans la variable : Indique le fichier de données source pour chaque observation. Les variables du fichier de travail sont identifiées par un astérisque (*). Figure 8-4 Boîte de dialogue Ajouter des variables Variables exclues : Variables à exclure du nouveau fichier fusionné. sont exclus par défaut. tous les noms de variables uniques dans les deux fichiers sont inclus dans la liste. Cette variable a une valeur de 0 pour les observations du fichier de travail et une valeur de 1 pour les observations du fichier de données externe.

177 Gestion et transformations de fichiers Clés d'appariement : Si certaines observations dans un fichier n'ont pas de concordance dans l'autre fichier (c'est-à-dire que certaines observations manquent dans un fichier). „ „ Les clés d'appariement doivent avoir le même nom dans les deux fichiers de données. sélectionnez : Données Fusionner des fichiers Ajouter des variables. Pour fusionner des fichiers avec les mêmes observations mais des variables différentes E Ouvrez l'un des fichiers de données. vous pouvez utiliser le fichier sur la famille comme fichier de consultation et appliquer les informations générales à chaque membre de la famille dans le fichier fusionné. niveau scolaire) et l'autre des informations générales sur la famille (revenu global. „ Le fichier externe ou fichier actif est une table codée : Une table codée ou un fichier de consultation de table. Les variables de l'autre fichier contiennent la valeur manquante par défaut. utilisez les clés d'appariement pour identifier et correctement apparier les observations des deux fichiers. E Sélectionnez le fichier à fusionner avec le fichier ouvert. Vous pouvez également utiliser ces clés avec des fichiers de consultation de table. E A partir du menu. est un fichier dans lequel les données de chaque observation peuvent s'appliquer à plusieurs observations de l'autre fichier.. . Par exemple. Les observations qui n'ont pas de correspondance dans les clés d'appariement sont inclus dans le fichier fusionné mais elles sont fusionnées avec les observations de l'autre fichier. Les observations sans correspondance contiennent des valeurs uniquement pour les variables du fichier duquel elles sont issues. Les deux fichiers de données doivent présenter les variables par ordre croissant ou décroissant et l'ordre des variables de la liste clés d'appariement doit être le même que l'ordre de tri. âge. habitat). si un des fichiers contient des informations sur les différents membres d'une famille (sexe. taille..

Les clés d'appariement doivent exister dans les deux fichiers. vous pouvez agréger les données de cantons par département et créer un nouveau fichier dans lequel le département est l'unité d'analyse. Le nouveau fichier de données contient une observation pour chaque classe. Par exemple. Ceci est particulièrement important si vous souhaitez inclure deux variables portant le même nom mais contenant des informations différentes. . E Sélectionnez Apparier les observations sur les clés des fichiers triés.178 Chapitre 8 Sélectionnez des clés d'appariement : E Sélectionnez les variables du fichier externe (+) dans la liste des Variables exclues. Agréger les données Agréger les données permet de combiner les classes d'observations sous forme d'observations récapitulatives et crée un nouveau fichier de données agrégées. Les deux fichiers de données doivent présenter les variables par ordre croissant ou décroissant et l'ordre des variables de la liste clés d'appariement doit être le même que l'ordre de tri. de données de travail et externe. Les observations sont agrégées en fonction de la valeur d'une ou plusieurs variables de regroupement. E Ajoutez des variables à la liste des clés d'appariement. Ajouter des variables: Renommer Vous pouvez renommer les variables du fichier de travail ou du fichier externe avant de les déplacer de la liste des variables à inclure dans le fichier fusionné.

SPSS crée les noms des variables d'agrégation à l'aide des premiers caractères de la variable source. le nom de la fonction d'agrégation et du nom de la variable source entre parenthèses. Tous les critères d'agrégation sont enregistrés dans le nouveau fichier avec leurs noms et les informations du dictionnaire. suivis d'un tiret de soulignement et d'un numéro séquentiel à deux chiffres. Les variables source pour les fonctions d'agrégation doivent être numériques. . Le nom de la variable d'agrégation est suivi éventuellement d'une étiquette de variable entre guillemets. Le critères d'agrégation peut être numérique ou alphanumérique. Par défaut.179 Gestion et transformations de fichiers Figure 8-5 Boîte de dialogue Agréger les données Critère(s) d'agrégation : Les observations sont regroupées selon les valeurs des critères d'agrégation. Variable(s) agrégée(s) : Les variables sont utilisées avec des fonctions d'agrégation pour créer les nouvelles variables du fichier agrégé. Chaque combinaison de valeurs du critère d'agrégation définit une classe et génère une observation dans le nouveau fichier agrégé.

Agrégation de données : fonction d'agrégation Cette boîte de dialogue indique la fonction à utiliser pour calculer la valeur des données agrégées pour les variables sélectionnées dans la liste des variables agrégées de la Boîte de dialogue Agréger des données. Le pourcentage ou la proportion des valeurs inférieures ou supérieures à une valeur donnée. la médiane. Vous pouvez également créer une variable qui contienne le nombre d'observations dans chaque agrégat. manquantes et non manquantes).180 Chapitre 8 Vous pouvez également passer outre les noms de variables d'agrégation par défaut. sélectionnez : Données Agréger. notamment la moyenne. .. Le pourcentage ou la proportion des valeurs appartenant ou n'appartenant pas à un intervalle donné. Les fonctions d'agrégation comprennent : „ „ „ „ Des fonctions récapitulatives. E Sélectionnez une fonction d'agrégation pour chaque variable d'agrégation. E Sélectionnez une ou plusieurs variables d'agrégation à inclure dans le nouveau fichier de données.. Pour agréger un fichier de données E A partir du menu. ajouter des étiquettes de variable descriptive et modifier les fonctions utilisées pour calculer la valeur des données agrégées. l'écart type et la somme. Le nombre d'observations (pondérées et non pondérées. E Sélectionnez un ou plusieurs critères d'agrégation qui définissent la façon dont les observations sont groupées pour créer des données agrégées.

Pour plus d'informations. reportez-vous à « Noms de variable » dans Chapitre 5 . Figure 8-7 Boîte de dialogue Nom et étiquette de variable . page 84. Cette boîte de dialogue vous permet de changer le nom des variables sélectionnées dans la liste des variables d'agrégation et vous propose une étiquette descriptive des variables.181 Gestion et transformations de fichiers Figure 8-6 Boîte de dialogue Fonction d'agrégation Agrégation de données : nom et étiquette de variable SPSS attribue par défaut des noms aux variables agrégées dans le nouveau fichier de données.

182 Chapitre 8 Scinder un fichier Scinder un fichier vous permet de scinder un fichier de données en plusieurs classes. Par exemple. Si vous sélectionnez plusieurs variables de regroupement. „ „ Vous pouvez spécifier jusqu'à 8 variables de regroupement. les observations seront classées en fonction de l'origine culturelle au sein de chaque modalité de la variable sexe. Chaque bloc de huit caractères dans une variable alphanumérique longue (plus de 8 caractères) est considéré comme une variable par rapport à la limite de 8 variables de regroupement. „ Figure 8-8 Boîte de dialogue Scinder un fichier . en fonction des valeurs d'une ou plusieurs variables de regroupement. Les observations doivent être triées en fonction des valeurs des variables de regroupement. si vous sélectionnez sexe comme première variable de regroupement et culture comme seconde. sélectionnez Tri suivant les variables de regroupement. les observations sont regroupées pour chaque variable au sein des modalités de la variable précédente dans la liste des variables de regroupement. suivant l'ordre dans lequel les variables sont présentées dans la liste des variables de regroupement. Si le fichier de données n'est pas trié.

. En ce qui concerne les tableaux pivotants. Quant aux diagrammes. un diagramme distinct est créé pour chaque groupe du fichier scindé et ces diagrammes sont affichés ensemble dans le Viewer.. Vous pouvez également sélectionner un échantillon aléatoire d'observations. Séparer résultats par groupes : Tous les résultats de chaque procédure sont affichés séparément pour chaque classe du fichier scindé. un seul d'entre eux est créé et chaque variable du fichier scindé peut être déplacée entre les dimensions du tableau. Pour scinder un fichier de données pour analyse E A partir du menu. sélectionnez : Données Scinder un fichier.183 Gestion et transformations de fichiers Comparer les classes : Les classes du fichier scindé sont présentées ensemble pour permettre la comparaison. Sélectionner des observations Sélectionner les observations propose une série de méthodes pour sélectionner un sous-groupe d'observations en fonction de certains critères qui incluent variables et expressions complexes. E Sélectionnez Comparer les groupes ou Séparer résultats par groupes. E Sélectionnez une ou plusieurs variables de regroupement. Les critères utilisés pour définir un sous groupe comprennent : „ „ „ „ „ „ Plages et valeurs de variables Plages de dates et d'heures Nombres d'observations (lignes) Expressions arithmétiques Expressions logiques Fonctions .

filter_$. Les observations filtrées restent dans le fichier de données mais sont exclues de l'analyse. les autres 0. Si le résultat est faux ou manquant. Selon une variable filtre : Utilise comme filtre la variable numérique sélectionnée dans le fichier de données. Sélectionner les observations crée une variable de filtre.184 Chapitre 8 Figure 8-9 Boîte de dialogue Sélectionner des observations Toutes les observations : Désactive le filtrage et utilise toutes les observations. Les observations filtrées sont également indiquées par une . Les observations sélectionnées ont la valeur 1. l'observation est sélectionnée. Dans un intervalle de temps ou d'observations : Permet de sélectionner des observations à partir d'un intervalle d'observations ou d'un intervalle de date/temps. Observations exclues : Vous pouvez filtrer ou supprimer les observations qui ne répondent pas à ces critères. Si le résultat de l'expression conditionnelle est vrai. Selon une condition logique : Utilisez une expression conditionnelle pour sélectionner des observations. Par échantillonnage aléatoire : Sélectionne un échantillon aléatoire basé sur un pourcentage approximatif ou un nombre exact d'observations. pour indiquer l'état du filtre. l'observation n'est pas sélectionnée. Les observations dont la valeur de la variable filtre est autre que manquante ou nulle sont sélectionnées.

Figure 8-10 Boîte de dialogue Sélectionner des observations : Si . sélectionnez : Données Sélectionner des observations. Les observations supprimées sont retirées du fichier de données et ne peuvent pas être récupérées si vous enregistrez le fichier de données après cette suppression. Une expression conditionnelle renvoie la valeur True (vrai). False (faux) ou manquant pour chaque observation.. E Spécifiez les critères de sélection des observations. E Sélectionnez une des méthodes de sélection d'observations. sélectionnez Toutes les observations. Sélection d'un sous-groupe d'observations E A partir du menu.185 Gestion et transformations de fichiers barre oblique à travers le numéro de ligne dans l'éditeur de données.. Sélectionner observations : Si La boîte de dialogue vous permet de sélectionner des sous-ensembles d'observations à l'aide d'expressions conditionnelles. Pour désactiver le filtrage et réintégrer toutes les observations dans vos analyses.

Comme cette routine génère une décision indépendante pseudo-aléatoire pour chaque observation. Figure 8-11 Boîte de dialogue Sélectionner observations : Echantillon aléatoire Environ : SPSS génère un échantillon aléatoire d'observations dont le nombre correspond approximativement au pourcentage indiqué. l'observation n'est pas sélectionnée. = et ~=) du pavé numérique. >=. des variables logiques et des opérateurs relationnels. des fonctions. numériques ou non. le pourcentage d'observations sélectionnées peut seulement approcher le pourcentage spécifié. L'échantillonnage est réalisé sans remplacement . plus le pourcentage des observations sélectionnées sera proche de la valeur indiquée. >. des opérateurs arithmétiques. La plupart des expressions conditionnelles utilisent un ou plus des six opérateurs relationnels (<. Ces expressions conditionnelles peuvent comprendre des noms de variable. des constantes. Si le résultat d'une expression conditionnelle est Faux ou Manquant.186 Chapitre 8 „ „ „ „ Si le résultat d'une expression conditionnelle est Vrai. l'observation est sélectionnée. . vous ne pouvez donc sélectionner une même observation qu'une seule fois. Plus il y a d'observations dans le fichier de données. <=. Sélectionner observations : Echantillon aléatoire Cette boîte de dialogue vous permet de sélectionner un échantillon aléatoire à partir d'un pourcentage approximatif ou un nombre précis d'observations.

Ce deuxième nombre doit être inférieur ou égal au nombre total d'observations dans le fichier de données. Vous devez également indiquer le nombre d'observations à partir duquel l'échantillon sera généré. Sélectionner observations : Plage Cette boîte de dialogue vous permet de sélectionner des observations à partir d'un intervalle de numéros d'observation ou d'un intervalle de date ou de temps. affiché dans l'éditeur de données. Définir dates). Les intervalles de dates et de temps sont valables uniquement pour les séries chronologiques disposant de variables de date (menu Données. Figure 8-12 Sélectionnez la boîte de dialogue Intervalle d'observations pour un intervalle d'observations (aucune variable de date définie) . „ „ Les intervalles d'observations sont fondés sur un numéro de ligne. Si ce nombre dépasse le nombre total d'observations dans le fichier de données.187 Gestion et transformations de fichiers Exactement : Nombre d'observations spécifié par l'utilisateur. l'échantillon contiendra proportionnellement moins d'observations que le nombre demandé.

„ Les valeurs de la variable de pondération doivent indiquer le nombre d'observations représentées par des observations uniques de données. et le plus souvent lorsque les observations sont tabulées (tableaux croisés). . Pondérer les observations Pondérer les observations permet de pondérer différemment les observations (par réplication simulée) dans le cadre de l'analyse statistique. une valeur négative ainsi que les variables manquantes pour la variable de pondération sont exclues de l'analyse. „ Vous pouvez utiliser des fractions. „ Les observations avec zéro. Elles sont utilisées à leur juste valeur lorsque cela est significatif.188 Chapitre 8 Figure 8-13 Sélectionnez la boîte de dialogue Intervalle d'observations pour les séries chronologiques (variable de date définie).

les informations de pondération sont également enregistrées. sélectionnez : Données Pondérer les observations E Sélectionnez Pondérer les observations par. ou une valeur manquante pour la variable de pondération. . Pondération dans des tableaux croisés : Plusieurs options de la procédure Tableaux croisés permettent de gérer la pondération des observations. page 337. même après l'enregistrement du fichier avec sa pondération. Ces observations sont toujours exclues du diagramme même lorsque la pondération est désactivée depuis ce diagramme. Si vous enregistrez un fichier de données pondérées. Pour pondérer des observations E A partir du menu.189 Gestion et transformations de fichiers Figure 8-14 Boîte de dialogue Pondérer les observations Une fois que vous avez appliqué une variable de pondération. celle-ci est effective jusqu'à ce que vous sélectionniez une autre variable de pondération ou que vous désactiviez cette pondération. Pour plus d'informations. reportez-vous à « Affichage de cellules (cases) de tableaux croisés » dans Chapitre 16 . Vous pouvez désactiver la pondération à n'importe quel moment. mais cela n'affecte pas les observations avec des valeurs négatives. Pondération des diagrammes de dispersion et histogrammes : Les diagrammes de dispersion et les histogrammes disposent d'une option d'activation/désactivation de la pondération des observations. des zéros.

. Restructuration des données Utilisez l'Assistant de restructuration des données pour restructurer les données qui sont nécessaires à la procédure SPSS choisie. L'Assistant vous permet de : „ „ „ Restructurer les variables sélectionnées en observations Restructurer les observations sélectionnées en variables Transposer toutes les données Restructuration des données E A partir du menu. restructuré. Par exemple.. L'Assistant remplace le fichier actuel par un nouveau fichier.190 Chapitre 8 E Sélectionnez une variable de fréquence. vous pouvez : „ „ „ „ Créer des variables d'identification qui vous permettent de faire correspondre une valeur du nouveau fichier avec la valeur du fichier d'origine Trier les données avant leur restructuration Définir les options du nouveau fichier Coller la syntaxe de la commande dans une fenêtre de syntaxe . E Sélectionnez les données à restructurer. E Sélectionnez le type de restructuration à effectuer. sélectionnez : Données Restructurer. Les valeurs de la variable de fréquence servent à la pondération des observations. Sinon. une observation ayant la valeur 3 dans la table de fréquence représente 3 observations dans le fichier des données pondérées.

191 Gestion et transformations de fichiers Assistant de restructuration des données : Sélectionner un type Servez-vous de l'Assistant de restructuration des données pour restructurer vos données. . Figure 8-15 Assistant de restructuration des données „ Restructurer les variables sélectionnées en observations : Sélectionnez cette option lorsque vos données comportent des groupes de colonnes apparentées que vous souhaitez faire apparaître dans des groupes de lignes du nouveau fichier de données. sélectionnez le type de restructuration à effectuer. Dans la première boîte de dialogue.

192 Chapitre 8

Si vous choisissez cette option, l'Assistant affiche les étapes relatives à l'opération de restructuration des variables en observations.
„

Restructurer les observations sélectionnées en variables : Sélectionnez cette option

lorsque vos données comportent des groupes de lignes apparentées que vous souhaitez faire apparaître dans des groupes de colonnes du nouveau fichier de données. Si vous choisissez cette option, l'Assistant affiche les étapes relatives à l'opération de restructuration des observations en variables.
„

Transposer toutes les données : Choisissez cette option pour transposer vos

données. Dans les nouvelles données, toutes les lignes vont être transformées en colonnes et les colonnes en lignes. La sélection de cette option entraîne la fermeture de l'Assistant de restructuration des données et l'ouverture de la boîte de dialogue Transposer les données.
Choix du mode de restructuration des données

Une variable contient les informations à analyser, comme une mesure ou un résultat. Une observation correspond, par exemple, à un individu. Dans une structure de données simple, chaque variable correspond à une colonne de vos données et chaque observation à une ligne. Supposez que vous mesuriez les résultats obtenus à un test par tous les étudiants d'une classe. Dans ce cas, tous les résultats apparaissent dans une même colonne et une ligne est associée à chaque étudiant. Lors de l'analyse des données, vous êtes souvent amené à analyser la manière dont une variable évolue en fonction de certaines conditions. Ces conditions peuvent correspondre à un traitement expérimental précis, à une population, à un moment en particulier, etc. Dans l'analyse des données, les conditions qui vous intéressent sont souvent appelées facteurs. Lorsque vous analysez des facteurs, vous obtenez une structure de données complexe. Vous pouvez disposer d'informations sur une variable dans plusieurs colonnes de vos données (par exemple, une colonne pour chaque niveau d'un facteur) ou d'informations sur une observation dans plusieurs lignes (par exemple, une ligne pour chaque niveau d'un facteur). L'Assistant de restructuration des données vous aide à restructurer les fichiers dont la structure de données est complexe. Les options que vous sélectionnez dans l'Assistant dépendent de la structure du fichier actuel et de celle du nouveau fichier.

193 Gestion et transformations de fichiers

Organisation des données dans le fichier actuel : Vous pouvez organiser les données actuelles de telle sorte que les facteurs soient enregistrés dans une variable distincte (dans des groupes d'observations) ou avec la variable (dans des groupes de variables).
„

Groupes d'observations : Dans le fichier actuel, les variables et les conditions

sont-elles enregistrées dans des colonnes distinctes ? Par exemple :
var 8 9 3 1 facteur 1 1 2 2

Dans cet exemple, les deux premières lignes constituent un groupe d'observations car elles sont apparentées. Elles contiennent des données relatives au même niveau de facteur. Dans les analyses de données SPSS, le facteur est souvent appelé variable de regroupement lorsque les données sont structurées de cette manière.
„

Groupes de colonnes : Dans le fichier actuel, les variables et les conditions

sont-elles enregistrées dans la même colonne ? Par exemple :
var_1 8 9 var_2 3 1

Dans cet exemple, les deux colonnes constituent un groupe de variables car elles sont apparentées. Elles contiennent des données concernant la même variable (var_1 pour le niveau de facteur 1 et var_2 pour le niveau de facteur 2). Dans les analyses de données SPSS, le facteur est souvent appelé mesure répétée lorsque les données sont structurées de cette manière.
Organisation des données dans le nouveau fichier : La procédure d'analyse des données

détermine généralement l'organisation des données.
„

Procédures nécessitant des groupes d'observations : Vous devez structurer vos

données en groupes d'observations pour procéder à des analyses qui requièrent une variable de regroupement. A titre d'exemple, il est possible de citer le modèle linéaire général pour les composantes univariées, multivariées et de variance, les modèles linéaires généraux, les modèles mixtes, les cubes OLAP, ainsi que le test T ou les tests non paramétriques pour les échantillons indépendants. Si

194 Chapitre 8

vos données actuelles sont structurées en groupes de variables, sélectionnez Restructurer les variables sélectionnées en observations pour procéder à ces analyses.
„

Procédures nécessitant des groupes de variables : Vous devez structurer vos

données en groupes de variables pour procéder à des analyses de mesures répétées. A titre d'exemple, il est possible de citer le modèle linéaire général pour les mesures répétées, l'analyse par la régression de Cox à prédicteurs chronologiques, le test T pour les échantillons appariés ou les tests non paramétriques pour les échantillons apparentés. Si vos données actuelles sont structurées en groupes d'observations, sélectionnez Restructurer les observations sélectionnées en variables pour procéder à ces analyses.

Exemple de restructuration de variables en observations
Dans cet exemple, les résultats d'un test sont enregistrés dans des colonnes distinctes pour chacun des facteurs A et B.
Figure 8-16 Données actuelles utilisées pour la restructuration de variables en observations

Vous voulez réaliser un test t pour des échantillons indépendants. Vous disposez d'un groupe de colonnes comprenant score_a et score_b, mais pas de la variable de regroupement requise par la procédure. Sélectionnez Restructurer les variables sélectionnées en observations dans l'Assistant de restructuration des données, restructurez un groupe de variables dans une nouvelle variable intitulée résultat, puis créez un index appelé groupe. Le nouveau fichier de données est illustré dans la figure suivante.

195 Gestion et transformations de fichiers Figure 8-17 Nouvelles données restructurées utilisées pour la restructuration de variables en observations

Lorsque vous exécutez le test t pour des échantillons indépendants, vous pouvez désormais utiliser l'index groupe en tant que variable de regroupement.

Exemple de restructuration d'observations en variables
Dans cet exemple, les résultats du test sont enregistrés deux fois pour chaque sujet, avant et après le traitement.
Figure 8-18 Données actuelles utilisées pour la restructuration d'observations en variables

Vous voulez réaliser un test t pour des échantillons appariés. Vos données sont structurées en groupes d'observations, mais vous ne disposez pas des mesures répétées des variables appariées requises par la procédure. Sélectionnez Restructurer les observations sélectionnées en variables dans l'Assistant de restructuration des données, utilisez id pour identifier les groupes de lignes dans les données actuelles, et temps pour créer le groupe de variables dans le nouveau fichier.

196 Chapitre 8 Figure 8-19 Nouvelles données restructurées utilisées pour la restructuration d'observations en variables

Pour l'exécution du test t pour échantillons appariés, vous pouvez désormais utiliser ava et apr comme paire de variables.

Assistant de restructuration des données (Restructurer les variables en observations) : Nombre de groupes de variables
Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes. Lors de cette étape, vous déterminez le nombre de groupes de variables du fichier actuel à restructurer dans le nouveau fichier.
Nombre de groupes de variables présents dans le fichier actuel ? Déterminez le nombre de groupes de variables présents dans les données actuelles. Un groupe de colonnes apparentées, appelé groupe de variables, permet d'enregistrer les mesures répétées d'une même variable dans des colonnes distinctes. Supposez que parmi les données dont vous disposez, trois colonnes, l1, l2 et l3, enregistrent la largeur. Dans ce cas, vous avez un groupe de variables. Si trois autres colonnes, h1, h2 et h3, enregistrent la hauteur, vous disposez de deux groupes de variables. Nombre de groupes de variables à créer dans le nouveau fichier? Déterminez le nombre

de groupes de variables à représenter dans le nouveau fichier. Il n'est pas nécessaire de restructurer tous les groupes de variables dans le nouveau fichier.

197 Gestion et transformations de fichiers Figure 8-20 Assistant de restructuration des données : Nombre de groupes de variables

„ „

Une : L'Assistant crée une variable restructurée dans le nouveau fichier à partir

d'un groupe de variables du fichier actuel.
Plusieurs : L'Assistant crée plusieurs variables restructurées dans le nouveau

fichier. Le nombre spécifié est utilisé à l'étape suivante, au cours de laquelle l'Assistant crée automatiquement le nombre de variables indiqué.

Assistant de restructuration des données (Restructurer les variables en observations) : Sélectionnez Variables
Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes.

198 Chapitre 8

A cette étape, décrivez le mode d'utilisation des variables du fichier actuel dans le nouveau fichier. Vous pouvez également créer une variable qui identifie les lignes du nouveau fichier.
Figure 8-21 Assistant de restructuration des données : Sélectionnez Variables

Identification des nouvelles lignes : Vous pouvez créer une variable dans le nouveau fichier de données afin d'identifier la ligne du fichier actuel qui a servi à créer un groupe de nouvelles lignes. L'identificateur peut être un numéro d'observation séquentiel ; il peut également s'agir des valeurs de la variable. Utilisez les contrôles de l'option Identification du groupe d'observations pour définir la variable d'identification dans le nouveau fichier. Cliquez sur une cellule pour modifier le nom de la variable par défaut et attribuer une étiquette descriptive à la variable d'identification.

199 Gestion et transformations de fichiers

Eléments à restructurer dans le nouveau fichier : A l'étape précédente, vous avez

indiqué à l'Assistant le nombre de groupes de variables à restructurer. L'Assistant a créé une variable pour chaque groupe. Les valeurs du groupe de variables apparaîtront dans cette variable, dans le nouveau fichier. Utilisez les contrôles de l'option Variables à transposer pour définir la variable restructurée dans le nouveau fichier.
Pour spécifier une variable structurée
E Placez dans la liste Variables à transposer les variables comprenant le groupe de

variables à transformer. Toutes les variables du groupe doivent être du même type (numérique ou alphanumérique). Vous pouvez inclure une même variable plusieurs fois dans le groupe de variables (au lieu d'être déplacées, les variables sont copiées à partir de la liste des variables source) ; ses valeurs sont répétées dans le nouveau fichier.
Pour spécifier plusieurs variables structurées
E Dans la liste déroulante, sélectionnez la première variable cible à définir. E Placez dans la liste Variables à transposer les variables comprenant le groupe de

variables à transformer. Toutes les variables du groupe doivent être du même type (numérique ou alphanumérique). Vous pouvez inclure la même variable plusieurs fois dans le groupe de variables. (Une variable est copiée au lieu d'être déplacée à partir de la liste des variables source et ses valeurs sont répétées dans le nouveau fichier.)
E Sélectionnez la variable cible suivante à définir et recommencez le processus de

sélection de la variable pour toutes les variables cible disponibles.
„

Bien que vous puissiez inclure plusieurs fois une même variable dans un groupe de variables cible, vous ne pouvez pas l'inclure dans plusieurs groupes de variables cible. Chaque liste de groupes de variables cible doit contenir le même nombre de variables. (Les variables répertoriées plusieurs fois sont comptées.)

„

200 Chapitre 8 „

Le nombre de groupes de variables cible est déterminé par le nombre de groupes de variables que vous avez indiqué à l'étape précédente. Vous pouvez modifier le nom par défaut des variables ici, mais pour modifier le nombre de groupes de variables à restructurer, vous devez retourner à l'étape précédente. source) pour chaque variable cible disponible avant de passer à l'étape suivante.

„ Vous devez définir les groupes de variables (sélectionnez les variables dans la liste

Eléments à copier dans le nouveau fichier Les variables non restructurées peuvent être copiées dans le nouveau fichier. Leurs valeurs seront répercutées dans les nouvelles lignes. Déplacez vers la liste Variable(s) fixe(s) les variables à copier dans le nouveau fichier.

Assistant de restructuration des données (Restructurer les variables en observations) : Créer des variables d'index
Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes. A cette étape, indiquez si vous voulez créer des variables d'index. Un index est une nouvelle variable qui identifie de manière séquentielle un groupe de lignes d'après la variable d'origine à partir de laquelle la nouvelle ligne a été créée.

201 Gestion et transformations de fichiers Figure 8-22 Assistant de restructuration des données : Créer des variables d'index

Nombre de variables d'index à créer dans le nouveau fichier ? Vous pouvez utiliser les

variables d'index en tant que variables de regroupement dans les procédures SPSS. Dans la plupart des cas, une variable d'index suffit. Toutefois, si les groupes de variables de votre fichier actuel font apparaître plusieurs niveaux de facteur, il est recommandé de créer plusieurs index.
„ „

Une : L'Assistant crée une seule variable d'index. Plusieurs : L'Assistant crée plusieurs index. Entrez le nombre d'index à créer.

Le nombre spécifié est utilisé à l'étape suivante, au cours de laquelle l'Assistant crée automatiquement le nombre d'index indiqué.
„

Aucune : Sélectionnez cette option pour ne créer aucune variable d'index dans le

nouveau fichier.

202 Chapitre 8

Exemple d'index unique lors de la restructuration de variables en observations
Parmi les données actuelles figurent un groupe de variables, largeur, et un facteur, temps. La largeur a été mesurée trois fois et enregistrée dans l1, l2 et l3.
Figure 8-23 Données actuelles utilisées pour un index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et créer un index numérique. Les nouvelles données sont illustrées dans le tableau suivant.
Figure 8-24 Nouvelles données restructurées avec un index

La valeur Index débute à 1 et s'incrémente pour chacune des variables du groupe. Elle se réinitialise sur 1 dès qu'une nouvelle ligne est détectée dans le fichier d'origine. Vous pouvez désormais utiliser la valeur index dans les procédures SPSS qui requièrent une variable de regroupement.

Exemple de deux index lors de la restructuration de variables en observations
Lorsqu'un groupe de variables enregistre plusieurs facteurs, vous pouvez créer plusieurs index. Toutefois, vous devez organiser les données utilisées de façon à ce que les niveaux du premier facteur correspondent à un index principal qui inclut les niveaux des facteurs suivants. Les données actuelles comprennent un groupe de variables, largeur et deux facteurs, A et B. Les données sont organisées de telle sorte que les niveaux du facteur B sont inclus dans les niveaux du facteur A.

203 Gestion et transformations de fichiers Figure 8-25 Données actuelles utilisées pour deux index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et créer deux index. Les nouvelles données sont illustrées dans le tableau suivant.
Figure 8-26 Nouvelles données restructurées avec deux index

Assistant de restructuration des données (Restructurer les variables en observations) : Créer une variable d'index
Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la création d'une variable d'index. A cette étape, indiquez les valeurs à affecter à la variable d'index. Vous pouvez utiliser des nombres séquentiels ou le nom des variables d'un groupe de variables d'origine. Vous pouvez également attribuer un nom et une étiquette à la nouvelle variable d'index.

204 Chapitre 8 Figure 8-27 Assistant de restructuration des données : Créer une variable d'index

Pour plus d'informations, reportez-vous à « Exemple d'index unique lors de la restructuration de variables en observations » , page 202.
„ „

Nombres séquentiels : L'Assistant affecte automatiquement des numéros

séquentiels en tant que valeurs d'index.
Noms des variables : L'Assistant utilise les noms du groupe de variables

sélectionné en tant que valeurs d'index. Choisissez un groupe de variables dans la liste proposée.
„ Noms et étiquettes : Cliquez sur une cellule pour modifier le nom de la variable par

défaut et attribuer une étiquette descriptive à la variable d'index.

205 Gestion et transformations de fichiers

Assistant de restructuration des données (Restructurer les variables en observations) : Créer plusieurs variables d'index
Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes et pour la création de plusieurs variables d'index. A cette étape, indiquez le nombre de niveaux de chaque variable d'index. Vous pouvez également attribuer un nom et une étiquette à la nouvelle variable d'index.
Figure 8-28 Assistant de restructuration des données : Créer plusieurs variables d'index

Pour plus d'informations, reportez-vous à « Exemple de deux index lors de la restructuration de variables en observations » , page 202.

Il va comparer le produit des niveaux créés au nombre de variables figurant dans vos groupes de variables. l'Assistant vérifie le nombre de niveaux que vous créez.206 Chapitre 8 Nombre de niveaux enregistrés dans le fichier actuel ? Déterminez le nombre de niveaux de facteur enregistrés dans les données actuelles. Niveaux combinés (total) : Vous ne pouvez pas créer plus de niveaux que dans les données actuelles. Noms et étiquettes : Cliquez sur une cellule pour modifier le nom de la variable par défaut et attribuer une étiquette descriptive aux variables d'index. . Assistant de restructuration des données (Restructurer les variables en observations) : Options Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes de variables en lignes. précisez les options du nouveau fichier restructuré. Etant donné que les données restructurées vont contenir une ligne pour chaque combinaison de traitements. Ils doivent être identiques. Nombre de niveaux à créer dans le nouveau fichier ? Entrez le nombre de niveaux pour chaque index. Un niveau définit un groupe d'observations ayant été soumis à des conditions identiques. vous devez organiser les données actuelles de façon à ce que les niveaux du premier facteur correspondent à un index principal qui inclut les niveaux des facteurs suivants. En cas de facteurs multiples. Les valeurs des variables d'index multiples sont toujours des nombres séquentiels. L'incrémentation du premier index est la plus lente . Les valeurs débutent à 1 et s'incrémentent à chaque niveau. celle du dernier index est la plus rapide. A cette étape.

Les données des variables sélectionnées vont figurer dans le nouveau fichier. Une valeur nulle est une valeur manquante par défaut ou vide.207 Gestion et transformations de fichiers Figure 8-29 Assistant de restructuration des données : Options Suppression des variables non sélectionnées ? Lors de la phase de sélection des variables (étape 3). Si d'autres variables figurent dans les données actuelles. vous pouvez les supprimer ou les conserver. Vous pouvez conserver ou supprimer les lignes qui contiennent uniquement des valeurs nulles. vous avez indiqué les groupes de variables à restructurer. Conservation des données manquantes ? L'Assistant recherche des valeurs nulles dans chacune des nouvelles lignes potentielles. . les variables à copier et une variable d'identification parmi les données actuelles.

Elle contient le nombre de nouvelles lignes générées par une ligne des données actuelles. . Assistant de restructuration des données (Restructurer les observations en variables) : Sélectionnez Variables Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. Il est en effet alors possible de créer un nombre de lignes différent pour une ligne précise des données actuelles. Cliquez sur une cellule pour modifier le nom de la variable par défaut et attribuer une étiquette descriptive à la variable de décompte.208 Chapitre 8 Création d'une variable de décompte ? L'Assistant peut créer une variable de décompte dans le nouveau fichier. Une variable de décompte peut s'avérer utile lorsque vous choisissez de supprimer les valeurs nulles du nouveau fichier. décrivez le mode d'utilisation des variables du fichier actuel dans le nouveau fichier. A cette étape.

comme un individu ou une institution. Chaque fois que l'Assistant détecte une nouvelle combinaison de valeurs d'identification. Vous pouvez trier le fichier actuel à l'étape suivante. ces dernières mesurent la même unité d'observation. il crée une ligne. dans le même ordre que les variables qui figurent dans la liste Variable(s) de l'identificateur. En effet. Déplacez vers la liste Variable(s) de l'identificateur les variables qui identifient les groupes d'observations dans le nouveau fichier. . Les variables qui servent à diviser le fichier de données actuel sont automatiquement affectées à l'identification des groupes.209 Gestion et transformations de fichiers Figure 8-30 Assistant de restructuration des données : Sélectionnez Variables Eléments d'identification des groupes d'observations dans les données actuelles ? Un groupe d'observations est un groupe de lignes apparentées. L'Assistant doit pouvoir repérer les variables du fichier actuel qui identifient les groupes d'observations afin d'intégrer chacun d'entre eux dans une ligne du nouveau fichier. Vous devez par conséquent trier les observations du fichier actuel sur la base des valeurs des variables d'identification.

une variable apparaît dans une seule colonne. Dans le nouveau fichier de données. Les données restructurées contiendront une nouvelle variable pour chacune des valeurs uniques figurant dans ces colonnes. Vous devez par conséquent trier les données d'après les variables identifiant les groupes d'observations. cette variable apparaît dans plusieurs colonnes. Devenir des autres colonnes ? L'Assistant détermine automatiquement ce que vont devenir les variables qui demeurent dans la liste Fichier actuel. . l'Assistant restructure. Il vérifie pour chaque variable si les valeurs des données varient au sein d'un groupe d'observations. Assistant de restructuration des données (Restructurer les observations en variables) : Trier Données Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. A cette étape. l'Assistant copie les valeurs dans le nouveau fichier. Parmi les possibilités offertes par l'Assistant. Chaque fois que l'Assistant détecte une nouvelle combinaison de valeurs d'identification. dans le nouveau fichier. il crée une ligne. Déplacez vers la liste Variable(s) d'index les variables qui doivent servir à la création des groupes de variables. indiquez si vous voulez trier le fichier actuel avant de le restructurer. Si tel est le cas. Dans le cas contraire. les valeurs dans un groupe de variables. vous pouvez également opter pour le tri des nouvelles colonnes par index. Les variables d'index correspondent aux variables incluses dans les données actuelles dont l'Assistant se sert pour créer des colonnes.210 Chapitre 8 Mode de création des groupes de variables dans le nouveau fichier ? Dans les données d'origine.

„ Oui : L'Assistant trie automatiquement les données actuelles par variable d'identification. dans le même ordre que les variables qui figurent dans la liste Variable(s) de l'identificateur présentée à l'étape précédente. Cette option implique un passage . Sélectionnez cette option lorsque les données ne sont pas triées par variable d'identification ou lorsque vous avez des doutes à ce propos.211 Gestion et transformations de fichiers Figure 8-31 Assistant de restructuration des données : Trier Données Organisation des lignes dans le fichier actuel ? Déterminez le mode de tri des données actuelles et les variables qui servent à identifier les groupes de variables (définis à l'étape précédente).

Assistant de restructuration des données (Restructurer les observations en variables) : Options Remarque : L'Assistant vous propose cette étape lorsque vous optez pour la restructuration des groupes d'observations en colonnes. „ Non : L'Assistant ne trie pas les données actuelles.212 Chapitre 8 distinct des données. précisez les options du nouveau fichier restructuré. . Sélectionnez cette option lorsque vous êtes certain que les données actuelles sont triées sur la base des variables qui identifient les groupes d'observations. A cette étape. mais elle assure un tri adéquat des lignes dans l'optique de la restructuration.

213 Gestion et transformations de fichiers Figure 8-32 Assistant de restructuration des données : Options Mode de tri des groupes de variables dans le nouveau fichier „ „ Par variable : L'Assistant regroupe les variables créées à partir d'une variable d'origine.jan .jan l. Par index : L'Assistant regroupe les variables en fonction des valeurs des variables d'index.fév h. et l'index est mois : l h mois Le résultat du regroupement par variable est le suivant : l. Exemple : Les variables à restructurer sont l et h.

Créer des variables indicatrices : L'assistant peut utiliser les variables d'index pour créer des variables indicatrices dans le nouveau fichier de données.jan h. Une variable indicatrice a la valeur 1 si l'observation a une valeur .fév Création d'une variable de décompte : L'Assistant peut créer une variable de décompte dans le nouveau fichier. Les variables indicatrices signalent la présence ou l'absence d'une valeur pour une observation. les données restructurées pourraient être utilisées pour obtenir des effectifs des produits achetés par le client. sinon. Assistant de restructuration des données : Terminer Il s'agit de la dernière étape de l'Assistant de restructuration de données. Elle contient le nombre de lignes des données actuelles qui a permis de créer une ligne dans le nouveau fichier de données. . elle a la valeur 0.214 Chapitre 8 Le résultat du regroupement par index est le suivant : l.jan l. Les données d'origine sont les suivantes : client 1 1 2 3 produit poussin oeufs oeufs poussin La création d'une variable indicatrice entraîne la création d'une variable pour chaque valeur unique de produit. Les données restructurées sont les suivantes : client 1 2 3 poussin indicateur 1 0 1 oeufs indicateurs 1 1 0 Dans cet exemple. Définissez l'objet de vos spécifications. Il crée une variable pour chaque valeur unique de la variable d'index. Exemple : La variable d'index est produit. Elle enregistre les produits achetés par un client.

Sélectionnez cette option si vous n'êtes pas prêt à remplacer le fichier actuel. . Choisissez cette option pour remplacer immédiatement le fichier actuel. lorsque vous voulez modifier sa syntaxe ou lorsque vous souhaitez l'enregistrer en vue d'une utilisation ultérieure. Remarque : Si les données d'origine sont pondérées.215 Gestion et transformations de fichiers Figure 8-33 Assistant de restructuration des données : Terminer „ Restructurer : L'assistant crée le fichier restructuré. „ Coller la syntaxe : L'assistant colle la syntaxe générée dans une fenêtre de syntaxe. les nouvelles données sont également pondérées à moins que la variable qui sert de pondération ne soit restructurée ou supprimée du nouveau fichier.

.

Viewer Les résultats sont affichés dans le Viewer. les résultats sont affichés dans une fenêtre appelée le Viewer. Vous pouvez utiliser le Viewer pour : „ „ „ „ parcourir les résultats . Vous pouvez également manipuler le résultat et créer un document contenant précisément le résultat voulu. Dans cette fenêtre. afficher ou masquer les tableaux et diagrammes sélectionnés . déplacer des éléments entre le Viewer et d'autres applications. 217 . avec la disposition et le formatage appropriés. modifier l'ordre d'affichage des résultats en déplaçant les éléments sélectionnés .Chapitre Utilisation du résultat 9 Lorsque vous lancez une procédure. vous pouvez facilement naviguer vers toutes les parties du résultat que vous voulez voir.

Pour utiliser le Viewer en mode brouillon : . Le panneau droit contient les tableaux statistiques. vous pouvez utiliser le Viewer en mode brouillon. les diagrammes et les textes.218 Chapitre 9 Figure 9-1 Viewer Le Viewer est divisé en deux panneaux : „ „ Le panneau de gauche du Viewer contient une légende du contenu du résultat. Utilisation du Viewer en mode brouillon Si vous préférez les sorties en texte simple plutôt que les tableaux pivotants interactifs. Vous pouvez cliquer et faire glisser le bord droit de la fenêtre de légende pour modifier la largeur de la fenêtre. Vous pouvez utiliser les barres de défilement pour parcourir les résultats ou cliquer sur un élément de la ligne de légende pour aller directement au tableau ou diagramme correspondant.

. cliquez sur Viewer en mode brouillon comme type de résultat. cliquez sur l'onglet Viewer en mode Brouillon. sélectionnez : Edition Options. E Dans l'onglet Général. page 251. Affichage et masquage des résultats Dans le Viewer. E Tapez Viewer en mode brouillon et double-cliquez sur l'entrée d'index.. E A partir du menu de n'importe quelle fenêtre. . sélectionnez : Aide Rubriques E Cliquez sur l'onglet Index dans la fenêtre Rubriques d'aide. reportez-vous à « Viewer en mode brouillon » dans Chapitre 10 .219 Utilisation du résultat E A partir du menu de n'importe quelle fenêtre. ou E Cliquez sur l'élément pour le sélectionner. vous pouvez sélectionner individuellement des tableaux ou les résultats d'une procédure pour les afficher ou les masquer. E Pour modifier les options de format de sortie du Viewer en mode brouillon. Masquage des tableaux et diagrammes E Double-cliquez sur l'icône Livre dans le panneau de légende du Viewer. Pour plus d'informations. Cette option est utile si vous voulez limiter la proportion de résultats visibles dans le panneau de contenu.

E Relâchez le bouton de la souris lorsque le curseur se trouve sur l'élément situé juste au-dessus de l'emplacement où vous voulez placer les éléments sélectionnés.220 Chapitre 9 E A partir du menu. Pour masquer les résultats d'une procédure E Cliquez sur la boîte à gauche du nom de la procédure dans le panneau de légende. Déplacement. Cela masque tous les résultats de la procédure et réduit l'affichage de la légende. ou Ctrl-clic pour sélectionner des éléments non contigus) E Utilisez la souris pour cliquer et faire glisser les éléments sélectionnés (maintenir le bouton enfoncé pendant que vous faites glisser les éléments sélectionnés). Vous pouvez également déplacer les éléments à l'aide des commandes Couper et Coller après du menu Edition. . suppression et copie de résultats Vous pouvez réarranger les résultats en copiant. L'icône Livre ouvert (Montrer) devient l'icône active. indiquant que l'élément est désormais masqué. sélectionnez : Affichage Masquer ou E Cliquez sur l'icône Livre fermé (Masquer) dans la barre d'outils Légende. en déplaçant ou en effaçant un élément ou un groupe d'éléments. Déplacement des résultats dans le Viewer E Cliquez sur un élément du panneau de légende ou de contenu pour le sélectionner. (Maj-Clic pour sélectionner plusieurs éléments.

(Maj-Clic pour sélectionner plusieurs éléments. ou vous pouvez modifier l'alignement des éléments sélectionnés à tout moment. sélectionnez : Edition Supprimer Pour copier des résultats dans le Viewer E Cliquez sur des éléments du panneau de légende ou de contenu pour les sélectionner. Vous pouvez également copier les éléments à l'aide des commandes Copier et Coller après du menu Edition ou du menu contextuel. ou E A partir du menu. (Maj-Clic pour sélectionner plusieurs éléments. E Relâchez le bouton de la souris pour déposer les éléments à l'endroit désiré. ou Ctrl-clic pour sélectionner des éléments non contigus). Vous pouvez modifier l'alignement initial (dans le menu Edition. choisissez Options. tous les résultats sont initialement alignés à gauche. ou Ctrl-clic pour sélectionner des éléments non contigus). E Appuyez sur la touche Supprimer. .221 Utilisation du résultat Pour supprimer des résultats dans le Viewer E Cliquez sur un élément du panneau de légende ou de contenu pour le sélectionner. puis l'onglet Viewer). Modification de l'alignement Par défaut. E Maintenez la touche Ctrl enfoncée pour cliquer et faire glisser les éléments sélectionnés (maintenez le bouton de la souris enfoncé pendant que vous faites glisser les éléments sélectionnés).

pour sélectionner plusieurs éléments. Remarque : Tous les résultats sont affichés dans le Viewer avec alignement à gauche. Les éléments centrés et alignés à droite sont identifiés par un symbole situé au-dessus et à gauche des éléments en question. Légende du Viewer Le panneau de légende fournit une table des matières du document Viewer. Seul l'alignement des résultats imprimés est affecté par les paramètres d'alignement. Réduire la ligne de légende masque le résultat de tous les éléments des niveaux réduits. sélectionnez : Format Aligner à gauche Les autres options d'alignement incluent Centrer et Aligner à droite. cliquez dessus tout en appuyant sur la touche Maj ou Ctrl). La plupart des actions dans le panneau de légende ont un effet correspondant sur le panneau de contenu.222 Chapitre 9 Modification de l'alignement des résultats E Sélectionnez les éléments à aligner (cliquez sur les éléments dans le panneau de légende ou de contenu . E A partir du menu. „ „ „ Sélectionner un élément dans le panneau de légende sélectionne et affiche l'élément correspondant dans le panneau de contenu. Déplacer un élément dans le panneau de légende déplace l'élément correspondant dans le panneau de contenu. . Vous pouvez utiliser le panneau de légende pour naviguer dans votre résultat et contrôler l'affichage du résultat.

Réduction et développement de la vue de la ligne de légende E Cliquez sur la boîte à gauche de l'élément de ligne de légende à réduire ou à étendre. .223 Utilisation du résultat Figure 9-2 Panneau de légende réduit et résultats masqués Contrôler l'Affichage du Résultat : Pour contrôler l'affichage du résultat. ou E Cliquez sur l'élément dans la ligne de légende. Modifier le niveau de ligne de légende pour les éléments sélectionnés. Modifier la taille des éléments dans l'affichage de la ligne de légende. vous pouvez : „ „ „ „ Maximiser et Réduire l'affichage de la ligne de légende. Modifier la police utilisée dans l'affichage de la ligne de légende.

sélectionnez : Edition Bordure Développer ou Edition Bordure Réduire Modifier le niveau de légende est particulièrement utile après avoir déplacé des éléments dans un niveau de légende. E Cliquez sur la flèche droit de la barre d'outil de la Ligne de légende pour rétrograder l'élément (déplacer l'élément vers la droite). E Cliquez sur la flèche gauche de la barre d'outil de la Ligne de légende pour promouvoir l'élément (le déplacer vers la gauche). sélectionnez : Affichage Plier ou Affichage Développer Modification du niveau de légende E Cliquez sur l'élément du panneau de légende pour le sélectionner.224 Chapitre 9 E A partir du menu. ou A partir du menu. Déplacer des éléments peut modifier le niveau de légende des éléments sélectionnés. . et vous pouvez utiliser les boutons de flèche gauche et de flèche droite dans la barre d'outils de la Ligne de légende pour restaurer le niveau d'origine.

E A partir du menu. diagramme ou autre objet qui précédera le titre ou texte.225 Utilisation du résultat Pour modifier la taille des éléments dans la légende E A partir du menu. sélectionnez : Insérer Nouveau titre ou Insérer Nouveau texte E Double-cliquez sur le nouvel objet. des diagrammes ou des données provenant d'autres applications. vous pouvez ajouter des éléments tels que des titres. E Cliquez sur le tableau. sélectionnez : Affichage Police de la ligne de légende E Sélectionnez une police. Les icônes et les textes associés changent de taille. sélectionnez : Affichage Taille de la ligne de légende Petit D'autres options incluent Moyen et Grand. Ajout d'éléments au Viewer Dans le Viewer. . du nouveau texte. Pour ajouter un nouveau titre ou texte Des éléments textes qui ne sont pas liés à un tableau ou un diagramme peuvent être ajoutés au Viewer. Pour modifier la police dans la légende E A partir du menu.

Ajout d'un fichier texte E Dans le panneau de légende ou de contenu du Viewer. Vous pouvez coller les tableaux pivotants ou les graphiques dans l'un des divers formats suivants : Objet imbriqué : Pour des applications supportant les objets ActiveX. E A partir du menu. diagramme ou autre objet qui précédera le diagramme.. Après avoir collé le tableau. double-cliquez dessus. vous pouvez imbriquer des tableaux pivotants et des diagrammes interactifs. sélectionnez : Insérer Fichier texte. Pour modifier le texte.. Utilisation de résultats dans d'autres applications Les tableaux pivotants et graphiques SPSS peuvent être copiés et collés dans d'autres applications Windows telles que les traitements de texte ou les tableurs. Pour insérer un diagramme Des graphiques de versions antérieures de SPSS peuvent être insérés dans le Viewer. E Sélectionnez un fichier diagramme. diagramme ou autre objet qui précédera le texte. E A partir du menu. cliquez sur le tableau. Pour insérer un diagramme : E Cliquez sur le tableau.226 Chapitre 9 E Entrez le texte souhaité à cet emplacement... . vous pouvez l'activer sur place en double-cliquant dessus puis le modifier comme dans le Viewer. E Sélectionnez un fichier texte. sélectionnez : Insérer Ancien diagramme.

RTF (texte enrichi) : Les tableaux pivotants peuvent être collés dans d'autres applications au format RTF.227 Utilisation du résultat Image (métafichier) : Vous pouvez coller des tableaux pivotants. et quelquefois édité dans une mesure limitée à l'aide des outils de l'autre application. Dans la plupart des applications. des résultats texte et des diagrammes en tant qu'images (métafichiers).. E Dans les menus de l'application cible. cette procédure colle le tableau pivotant en tant que tableau pouvant être modifié dans une autre application. sélectionnez : Edition Copier Copie et collage des résultats dans une autre application E Copiez les résultats dans le Viewer. Pour copier un tableau ou un diagramme E Sélectionnez le tableau ou diagramme à copier. BIFF : Le contenu d'un tableau peut être collé dans une feuille de calcul et conserver sa précision numérique. Les tableaux pivotants collés comme images conservent toutes leurs caractéristiques de bordures et de polices. où l'application ne peut accepter ou transmettre que du texte. Bitmap : Les diagrammes peuvent être collés dans d'autres applications en tant que bitmaps. . Cette option peut être utile pour les applications telles que le courrier électronique. Texte : Le contenu d'un tableau peut être copié et collé comme texte. E A partir du menu. Le format image peut être redimensionné dans l'autre application.. choisissez : Edition Coller ou Edition Collage spécial.

Coller collera les résultats en tant qu'image (métafichier).bat situé dans le répertoire d'installation du programme. E Dans la liste. Coller collera les tableaux pivotants au format RTF. sélectionnez Objet tableau pivotant SPSSouSPSS Graphics Control Object. Pour incorporer un tableau pivotant ou un diagramme interactif dans une autre application : E Dans le Viewer. Pour les tableurs. ce qui collera le tableau pivotant comme un tableau. Coller colle les tableaux pivotants au format BIFF. copiez le tableau. . Si vous avez des applications prenant en charge les objets Active-X : E Exécutez le fichier objs-on. Collage spécial vous permet de sélectionner le format voulu dans la liste des formats disponibles pour l'application cible. Dans beaucoup d'applications. Chaque application détermine le « meilleur » format à utiliser pour Coller. Pour les applications de traitement de texte.bat désactive l'incorporation des objets ActiveX. Collage spécial : Les résultats sont copiés dans le Presse-papiers dans de multiples formats.. Un objet imbriqué peut être activé sur place en double cliquant dessus puis en le modifiant et le faisant pivoter comme dans le Viewer. (Double-cliquez sur le fichier pour l'exécuter.) Ceci active l'incorporation ActiveX pour les tableaux pivotants. E Dans les menus de l'application cible. Incorporation d'un tableau dans une autre application Vous pouvez imbriquer des tableaux pivotants et des diagrammes interactifs dans d'autres applications au format ActiveX. choisissez : Edition Collage spécial. Les diagrammes sont collés en tant que métafichiers. Le fichier objs-off.228 Chapitre 9 Coller : Les sorties sont copiées vers le Presse-papiers dans un certain nombre de formats..

sélectionnez Image. Certaines applications qui ne prennent pas en charge ActiveX pourront initialement accepter des tableaux pivotants ActiveX mais faire preuve ensuite d'instabilité. Les autres strates et colonnes masquées ne sont pas disponibles. Vous pouvez copier et coller un seul tableau pivotant à la fois à ce format. Seule la strate et les colonnes visibles lorsque l'élément a été copié sont collées dans le tableau. E Dans la liste. Collage d'un tableau pivotant ou d'un diagramme en tant qu'image (métafichier) E Dans le Viewer..229 Utilisation du résultat L'application cible doit prendre en charge les objets ActiveX. Les autres strates et colonnes masquées ne sont pas disponibles.. Collage d'un tableau pivotant en tant que tableau (RTF) E Dans le Viewer. E Dans la liste.. sélectionnez Texte formaté (RTF) ou Texte enrichi. L'élément est collé comme métafichier. copiez le tableau pivotant. . E Dans les menus de l'application cible. E Dans les menus de l'application cible.. Le tableau pivotant est collé en tant que tableau. Ne vous fiez pas aux objets imbriqués jusqu'à ce que vous ayez testé la stabilité de votre application avec les objets Active-X imbriqués. Voir la documentation de l'application pour plus d'informations sur la prise en charge de ActiveX. choisissez : Edition Collage spécial. copiez le tableau ou le diagramme. Seule la strate et les colonnes visibles lorsque l'élément a été copié sont disponibles dans le métafichier. choisissez : Affichage Collage spécial.

Collage d'objets dans le Viewer Des objets provenant d'autres applications peuvent être collés dans le Viewer. Les deux types de collage placent le nouvel objet à la suite de l'objet actuellement sélectionné dans le Viewer. copiez le tableau.. Copie et collage de plusieurs éléments dans une autre application E Sélectionnez les tableaux et/ou graphiques à copier. choisissez Texte non formaté. Vous pouvez aligner des colonnes en ajustant les marques de tabulation dans l'autre application. sélectionnez : Edition Copier les objets E Dans l'application cible. Utilisez Collage spécial lorsque vous voulez choisir le format de l'objet à coller. à partir du menu. utilisez Copier dans le menu Edition. Pour copier et coller dans SPSS (par exemple. . choisissez : Affichage Collage spécial.. sélectionnez : Edition Coller Remarque : Utiliser Copier les objets pour copier plusieurs éléments du Viewer vers une autre application seulement. soit Collage spécial. (Maj-clic ou Ctrl-clic pour sélectionner plusieurs éléments) E A partir du menu. E Dans les menus de l'application cible. entre deux fenêtres du Viewer). E Dans la liste. Le texte du tableau pivotant non formaté contient des tabulations entre les colonnes.230 Chapitre 9 Collage d'un tableau pivotant en tant que texte E Dans le Viewer. Vous pouvez utiliser soit Coller après.

diagramme ou autre objet qui précédera l'objet à coller. sélectionnez le format de l'objet. Les types de fichier possibles pour l'objet dans le Presse-papiers sont listés.231 Utilisation du résultat Collage spécial Collage spécial vous permet de sélectionner le format de l'objet copié à coller dans le Viewer. E Dans le panneau de légende ou de contenu du Viewer. cliquez sur le tableau. L'objet sera inséré dans le Viewer à la suite de l'objet actuellement sélectionné. sélectionnez : Edition Collage spécial. .. Figure 9-3 Boîte de dialogue Collage spécial Collage d'objets d'une autre application dans le Viewer E Copiez l'objet dans l'autre application. E A partir du menu. E Dans la liste..

Format d'exportation : Pour les documents de résultat. les tableaux pivotants et le texte sont exportés de la façon suivante : „ „ Fichier HTML (*. Word/RTF et Excel . „ Pour les formats HTML et texte. Pour le format document HTML. TIFF.txt) : Les tableaux pivotants peuvent être exportés en format tabulé ou avec espaces. les diagrammes sont exportés dans le format d'exportation du diagramme sélectionné. Exporter quoi : Vous pouvez exporter tous les objets du Viewer. Pour le format document texte. Les résultats texte sont publiés au format HTML pré-formaté. JPEG. Les diagrammes ne sont pas inclus dans les documents Excel.htm) : Les tableaux pivotants sont exportés comme des tableaux HTML. tous les objets visibles ou seulement les objets sélectionnés. PostScript encapsulé (EPS). Pour Graphiques Seulement. résultat texte et diagrammes. Word/RTF et Excel. . Graphiques uniquement : Les formats d'exportation disponibles sont les suivants : métafichier Windows (WMF). Document résultat : Exporte toute combinaison de tableaux pivotants. les diagrammes sont exportés au format métafichier Windows et incorporés dans le document Word. une ligne est insérée dans le fichier texte pour chaque diagramme. Tous les résultats texte sont exportés en format avec espaces. texte. Pour le format Word/RTF. les tableaux sont intégrés par référence. bitmap Windows (BMP). Les diagrammes du Viewer sont ignorés. Pour les documents de résultat. les options disponibles sont HTML. texte. et vous devez exporter les tableaux sous un format adapté pour permettre leur intégration dans des documents HTML. PNG ou PICT Macintosh. pour les formats HTML et texte. les diagrammes sont exportés au format du diagramme sélectionné dans la boîte de dialogue Options. Fichier texte (*.232 Chapitre 9 Exporter résultats L'option Exporter le résultat enregistre les tableaux pivotants SPSS et les éléments texte au format HTML. „ „ Document Résultat (sans Graphiques) : Exporte les tableaux pivotants et les résultats texte. indiquant le nom de fichier du diagramme exporté. et enregistre les diagrammes sous divers formats communément utilisés par d'autres applications. sélectionnez un format d'exportation de graphiques dans la liste déroulante.

Le résultat texte est exporté avec tous les attributs de police. Le résultat texte dans SPSS apparaît toujours dans une police à espacement fixe et est exporté avec les mêmes attributs de police. reportez-vous à « Système de gestion des résultats » dans Chapitre 47 . colonnes et cellules des tableaux pivotants sont exportées comme des lignes. E A partir du menu.doc) : Les tableaux pivotants sont exportés comme des tableaux Word avec tous les attributs de formatage (bordures de cellule. Pour plus d'informations.xls) : Les lignes. XML et SPSS. Chaque ligne du résultat texte est une ligne dans le fichier Excel. avec le contenu de toute la ligne dans une seule cellule.). styles de police. etc. Exportation des résultats E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). Système de gestion des résultats : Vous pouvez également exporter automatiquement tous les résultats ou tous les types de résultat définis par l'utilisateur. avec tous les attributs de formatage (bordures de cellule. sélectionnez : Fichier Exporter. tels que les fichiers texte et les fichiers de données au format HTML. styles de police. couleurs d'arrière-plan. E Entrez un nom de fichier (ou un préfixe pour les graphiques) et sélectionnez un format d'exportation. Le résultat texte est exporté en tant que fichier RTF. page 689.233 Utilisation du résultat „ Fichier Excel (*.)... colonnes et cellules Excel. Une police à espacement fixe est nécessaire pour le bon alignement des résultats texte séparés par des espaces. couleurs d'arrière-plan. etc. „ Fichier Word/RTF (*. .

234 Chapitre 9 Figure 9-4 Boîte de dialogue Exporter résultats .

Word/RTF et Excel Cette boîte de dialogue contrôle l'inclusion de notes de bas de page et de légendes pour les documents exportés aux formats HTML.235 Utilisation du résultat Figure 9-5 Résultat exporté en format HTML Options HTML. Word/RTF et Excel. et les options d'exportation des diagrammes pour les documents HTML. .

..236 Chapitre 9 Format Image : Contrôle le format d'exportation des diagrammes et les paramètres facultatifs. les diagrammes sont exclus. comme la taille pour les documents HTML. . Word/RTF et Excel E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). Pour le format Word/RTF. Fichier Word/RTF ou Fichier Excel comme format d'exportation. Définition des options d'exportation HTML. Options texte Options texte contrôle les options de format des tableaux pivotants. E A partir du menu. des éléments textes et des graphiques ainsi que l'insertion de notes de bas de page et de légendes pour les documents exportés en format texte. tous les diagrammes sont exportés au format métafichier (WMF) Windows. E Sélectionnez Fichier HTML. E Cliquez sur Options. sélectionnez : Fichier Exporter. Pour Excel.

Formatage de cellule : Pour les tableaux pivotants avec espaces. si une cellule n'est pas vide. Séparateurs de cellules : Pour les sorties de tableaux pivotants avec espaces. Format Image : Contrôle le format d'exportation des graphiques et les paramètres facultatifs. un caractère de tabulation seul est imprimé.237 Utilisation du résultat Figure 9-6 Boîte de dialogue Options texte Les tableaux pivotants peuvent être exportés en format tabulé ou avec espaces. Tous les résultats avec espaces nécessitent une police à point fixe (espacement unique) pour un alignement correct. Ce réglage n'affecte que les tableaux pivotants. . vous pouvez spécifier les caractères utilisés pour créer les bordures de cellules. Pour le format tabulé. par défaut tous les sauts de lignes sont supprimés et chaque colonne est fixée à la largeur de la plus longue étiquette ou valeur de la colonne. spécifiez un nombre de caractères pour la largeur de la colonne. comme la taille. son contenu et un caractère de tabulation sont imprimés. Pour limiter la largeur des colonnes et insérer des sauts de ligne dans les longues étiquettes. Tous les résultats texte sont exportés en format avec espaces. Si une cellule est vide.

sélectionnez le format d'exportation. . Les spécifications de pourcentage personnalisées vous permettent de diminuer ou d'augmenter la taille du diagramme exporté jusqu'à 200 pour cent. cliquez sur Options. sélectionnez : Fichier Exporter. E Sélectionnez Fichier texte comme format d'exportation. E Cliquez sur Options. E A partir du menu.. Taille du diagramme L'option Taille du diagramme contrôle la taille des diagrammes exportés.238 Chapitre 9 Pour définir les options d'exportation de texte E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre).. E Pour les documents de résultat... puis cliquez sur Taille graphique. E A partir du menu. Figure 9-7 Boîte de dialogue Taille d'export des graphiques Définition de la taille des diagrammes exportés E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). sélectionnez : Fichier Exporter.

Les composants U et V définissent la chrominance (informations de couleur). Espace de couleurs : Cette option fait référence au codage des couleurs dans l'image.10 (le plus foncé) et 6. Si le paramétrage YUV 4:4:4 n'entraîne aucune perte. Cette option permet principalement d'éclaircir ou d'assombrir l'image bitmap. Plus la qualité de l'image est élevée. Le composant Y détermine le niveau de gris ou luminance. Sa valeur peut être comprise entre 0. Opérations de couleur : Les opérations suivantes sont disponibles : „ „ Inverser : Chaque pixel est enregistré dans la couleur inverse de sa couleur d'origine. Paramètre de qualité de compression : Contrôle le taux de compression en fonction de la qualité de l'image. les configurations YUV 4:2:2 et YUV 4:1:1 constituent un compromis entre la réduction de la taille du fichier (espace disque) et la baisse de la qualité des couleurs affichées. Les lettres de ce sigle identifient les signaux Y. Encodage progressif : Permet le chargement progressif de l'image. puis sa qualité augmente au fur et à mesure de son chargement. sélectionnez le format d'exportation. Correction Gamma : Ajuste l'intensité des couleurs dans le diagramme exporté en modifiant la constante gamma utilisée pour faire correspondre les valeurs d'intensité. Les ratios correspondent au taux d'échantillonnage de chaque composant. L'image apparaît tout d'abord dans une faible résolution. puis cliquez sur Taille graphique. L'option Espace de couleurs détermine le degré de « perte » des couleurs dans l'image exportée. Options d'exportation de diagrammes au format JPEG Profondeur des couleurs : Vous pouvez exporter les graphiques JPEG en mode Couleurs vraies 24 bits ou 256 niveaux de gris. .5 (le plus clair). U et V. Si vous réduisez les taux d'échantillonnage U et V. vous réduisez la taille du fichier (mais également sa qualité). plus le fichier exporté est volumineux.239 Utilisation du résultat E Pour Diagrammes seuls. Le modèle de couleurs YUV est l'un des modes de codage des couleurs. Il est couramment utilisé pour la transmission de données au format vidéo numérique ou MPEG.

les couleurs sont converties de manière à reproduire celles du diagramme. Il s'agit d'une technique de compression sans perte qui est prise en charge par les formats de fichiers Windows standard. blanc et noir) en mode 16 couleurs.10 (le plus foncé) et 6.240 Chapitre 9 Options d'exportation de diagrammes aux formats BMP et PICT Profondeur des couleurs : Détermine le nombre de couleurs du diagramme exporté. . „ Opérations de couleur : Les opérations suivantes sont disponibles : „ „ Inverser : Chaque pixel est enregistré dans la couleur inverse de sa couleur d'origine. blanc et noir) en mode 16 couleurs. Quelle que soit la profondeur de couleur utilisée lors de l'enregistrement d'un diagramme. Cette option permet principalement d'éclaircir ou d'assombrir l'image bitmap. ce diagramme conserve ses trois couleurs. Utiliser la compression RLE : (BMP uniquement). L'expression « compression sans perte » signifie que la réduction de la taille des fichiers n'est pas effectuée aux dépens de la qualité de l'image. le nombre de couleurs du diagramme est compris entre le nombre de couleurs réellement utilisées et le nombre maximal de couleurs autorisé par la profondeur. Correction Gamma : Ajuste l'intensité des couleurs dans le diagramme exporté en modifiant la constante gamma utilisée pour faire correspondre les valeurs d'intensité. ce diagramme conserve ses trois couleurs. „ Lorsque le nombre de couleurs du diagramme est supérieur au nombre prévu pour cette profondeur. si vous enregistrez un diagramme contenant trois couleurs (rouge. si vous enregistrez un diagramme contenant trois couleurs (rouge. Quelle que soit la profondeur de couleur utilisée lors de l'enregistrement d'un diagramme. Par exemple.5 (le plus clair). Sa valeur peut être comprise entre 0. Par exemple. L'option Profondeur d'écran actuelle correspond au nombre de couleurs affichées sur votre écran. Options d'exportation de diagrammes aux formats PNG et TIFF Profondeur des couleurs : Détermine le nombre de couleurs du diagramme exporté. le nombre de couleurs du diagramme est compris entre le nombre de couleurs réellement utilisées et le nombre maximal de couleurs autorisé par la profondeur.

les couleurs sont converties de manière à reproduire celles du diagramme. „ Opérations de couleur : Les opérations suivantes sont disponibles : „ „ Inverser : Chaque pixel est enregistré dans la couleur inverse de sa couleur d'origine. elles peuvent en revanche afficher l'aperçu enregistré avec l'image. seul le mode Couleurs vraies 24 bits est disponible. La valeur par défaut de chaque couleur est 255. Entrez une valeur entière comprise entre 0 et 255 pour chacune des couleurs. Cette option est disponible uniquement pour les exportations en mode Couleurs vraies 32 bits. Correction Gamma : Ajuste l'intensité des couleurs dans le diagramme exporté en modifiant la constante gamma utilisée pour faire correspondre les valeurs d'intensité. De ce fait. L'option Profondeur d'écran actuelle correspond au nombre de couleurs affichées sur votre écran. Si de nombreuses applications ne peuvent pas afficher une image EPS. Cette option permet principalement d'éclaircir ou d'assombrir l'image bitmap. Avec l'option YCbCr. Vérifiez dans l'application de destination du graphique EPS les formats d'aperçu pris en charge. la couleur de transparence par défaut est le blanc. Vous disposez de toutes les profondeurs de couleur en mode RVB. Seuls les modes Couleurs vraies 24 et 32 bits sont disponibles avec les couleurs CMJN. Options d'exportation de diagrammes au format EPS Aperçu de l'image : Permet d'enregistrer l'aperçu d'une image dans l'image EPS. L'aperçu de l'image peut être au format WMF (plus petit et plus facilement redimensionnable) ou TIFF (plus souple et pris en charge par un plus grand nombre de plateformes). Sa valeur peut être comprise entre 0. Un aperçu sert principalement en cas d'insertion d'un fichier EPS dans un autre document. Transparence : Permet de sélectionner la couleur qui sera transparente dans le diagramme exporté. Format : (TIFF uniquement) Permet de définir l'espace de couleurs et de compresser le diagramme exporté. .5 (le plus clair).10 (le plus foncé) et 6.241 Utilisation du résultat „ Lorsque le nombre de couleurs du diagramme est supérieur au nombre prévu pour cette profondeur.

Remarque : Toutes les imprimantes PostScript ne disposent pas d'un pilote de niveau 3 pouvant lire les polices Type 42). ce format n'est pas pris en charge par certaines applications. comme des marques dans des diagrammes de dispersion interactifs. Cette option s'avère toutefois utile lorsque votre imprimante PostScript ne prend pas en charge les polices Type 42. Options d'exportation de diagrammes au format WMF Aldus placeable : Fournit un degré d'indépendance par rapport au périphérique (taille physique identique en cas d'ouverture à 96 ou 120 ppp) . „ Convertir en polices PostScript : Convertit les polices TrueType en polices PostScript (Type 1) en fonction de la famille de polices. Windows standard : Option prise en charge par la plupart des applications pouvant afficher des métafichiers Windows.242 Chapitre 9 Polices TrueType : Permet à l'utilisateur d'indiquer le mode d'enregistrement des polices TrueType dans l'image EPS. la police Times New Roman est convertie en Times et Arial est convertie en Helvetica. . Vous ne pouvez plus modifier le texte en tant que tel dans les applications de retouche des graphiques EPS. La qualité est également amoindrie. La police PostScript résultante est appelée police Type 42. Remarque : Ce format est déconseillé pour les graphiques interactifs qui utilisent la police SPSS Marker (comme les diagrammes de dispersion) car il n'existe aucun équivalent PostScript significatif aux marques SPSS TrueType. Définir des options d'exportation des diagrammes E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). Par exemple. mais qu'il vous faut conserver des symboles spéciaux TrueType. „ Remplacer les polices TrueType en courbes : Transforme les polices TrueType en données de courbe PostScript. „ Incorporer en tant que TrueType natif (niveau 3) : Incorpore la plupart des données de police dans le fichier EPS. notamment les informations de lissage des polices (utiles par exemple pour la mise à l'échelle à de petites tailles).

cliquez sur Options. Impression de documents du Viewer Il existe plusieurs moyens de contrôler les éléments du Viewer à imprimer: Tous les résultats affichés : Seuls s'impriment les éléments affichés dans le panneau de contenu. Tous les résultats : Tous les résultats. sélectionnez le format d'exportation. Figure 9-8 Boîte de dialogue d'impression du Viewer . sélectionnez le format d'exportation. sélectionnez : Fichier Exporter.. Les éléments masqués (éléments accompagnés d'une icône représentant un livre fermé dans le panneau de ligne de légende ou masqués dans les strates réduites des lignes de légende) ne s'impriment pas. puis cliquez sur Options. Sélection : Seuls s'impriment les éléments sélectionnés dans les panneaux de ligne de légende et/ou de contenu.. E Pour les documents de résultat. y compris les éléments masqués. s'impriment. puis cliquez sur Options de diagramme. E Pour Diagrammes seuls.243 Utilisation du résultat E A partir du menu.

E Cliquez sur OK pour imprimer. Il est conseillé d'utiliser l'Aperçu avant impression avant d'imprimer un document du Viewer car cela permet de voir les éléments qui ne sont peut être pas visibles en regardant tout simplement le panneau de contenu du Viewer. sélectionnez : Fichier Imprimer..244 Chapitre 9 Impression de résultat et de diagrammes E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre).. E Choisissez les paramètres d'impression voulus. notamment : „ „ „ „ „ Les sauts de page Les strates masquées des tableaux pivotants Les ruptures dans les tableaux de grande largeur Les résultats complets des grands tableaux Les en-têtes et pieds de page imprimés sur chaque page . E A partir du menu. Aperçu avant impression L'Aperçu avant impression vous montre ce qui va s'imprimer sur chaque page des documents du Viewer.

sélectionnez : Fichier Aperçu avant impression .245 Utilisation du résultat Figure 9-9 Aperçu avant impression Si des résultats sont sélectionnés dans le Viewer. Pour avoir un aperçu de tous les résultats. vérifiez que rien n'est sélectionné dans le Viewer. Pour afficher un aperçu avant impression E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). E A partir du menu. l'aperçu n'affiche que les résultats sélectionnés.

Ces paramètres n'ont aucun effet sur l'impression des données de l'éditeur de données ou de la syntaxe d'une fenêtre de syntaxe. .246 Chapitre 9 Mise en page La Mise en page vous permet de contrôler : „ „ „ „ „ La taille et l'orientation du papier Les marges Les en-têtes et pieds de page La numérotation des pages La taille imprimée pour les graphiques Figure 9-10 Boîte de dialogue Mise en page Les paramètres de mise en page sont enregistrés dans le document du Viewer. Pour modifier la mise en page E Activez la fenêtre du Viewer (cliquez n'importe où dans la fenêtre). La Mise en page affecte uniquement les paramètres des documents du Viewer.

Vous pouvez également utiliser la barre d'outils qui se trouve au milieu de la boîte de dialogue pour insérer : „ „ „ „ „ La date et l'heure Des numéros de page Le nom du fichier du Viewer Les étiquettes des en-têtes de lignes de légende Les titres et les sous-titres Figure 9-11 Options Mise en page onglet En-tête/pied de page . E Modifiez les paramètres et cliquez sur OK.247 Utilisation du résultat E A partir du menu. sélectionnez : Fichier Mise en page... Vous pouvez saisir le texte à afficher dans les en-têtes et les pieds de page. Mise en page : En-têtes et pieds de page Les en-têtes et pieds de page sont les informations qui s'impriment en haut et en bas de chaque page.

ainsi que la numérotation des pages. Chaque tableau pivotant. La taille globale d'un diagramme imprimé est limitée par sa hauteur et par sa largeur. Espace entre items : Contrôle l'espace entre des éléments imprimés. diagramme et objet de texte constitue un élément distinct. ce paramètre est ignoré. Taille imprimée diagramme : Contrôle la taille du diagramme imprimé par rapport à la taille définie pour la page. Les titres et sous-titres sont créés avec les options Insérer titre de page et Insérer sous-titre de page du menu Insérer du Viewer ou avec les commandes TITRE et SOUS-TITRE de la syntaxe de commande. Si vous n'avez indiqué aucun titre ou sous-titre de page. Le rapport hauteur/largeur du diagramme n'est pas affecté par la taille du diagramme imprimé. deuxième. l'espace entre les éléments de résultat imprimés. troisième et/ou quatrième niveau pour le premier élément de chaque page. Sélectionnez Aperçu avant impression dans le menu Fichier pour voir comment apparaîtront vos en-têtes et pieds de page sur la page imprimée.248 Chapitre 9 Les étiquettes d'en-tête des lignes de légende indiquent l'en-tête de ligne de légende de premier. la taille du diagramme ne peut plus augmenter pour occuper plus de hauteur. Lorsque les bordures extérieures d'un tableau atteignent les bordures de gauche et de droite de la page. Les caractéristiques de police des titres de page et des sous-titres existants peuvent être modifiées en changeant les titres à l'aide du Viewer. . Ce paramètre n'affecte pas l'affichage des éléments dans le Viewer. Commencer page : Numéros de page consécutifs commençant à partir d'un numéro spécifié. Les titres et sous-titres de page impriment les titres et sous-titres de la page courante. Remarque : Les caractéristiques de police des nouveaux titres de page et des sous-titres sont vérifiées dans l'onglet Viewer de la boîte de dialogue Options (Menu Edition). Mise en page : Options Cette boîte de dialogue contrôle la taille du diagramme imprimé.

utilisez Exporter dans le menu Fichier. sélectionnez : Fichier Enregistrer E Entrez le nom du document et cliquez sur Enregistrer. Pour enregistrer le résultat dans un format externe (par exemple HTML ou texte). . Le document enregistré contient les deux panneaux du Viewer (légende et contenu). Enregistrement d'un document du Viewer E A partir du menu du Viewer.249 Utilisation du résultat Figure 9-12 Mise en page onglet Options Enregistrement des résultats Le contenu du Viewer peut être enregistré comme un document du Viewer. (Non disponible dans la version autonome du SmartViewer).

pour distribuer le Smart Viewer. . Code OEM : Laissez ce champ vide à moins que vous n'ayez un accord contractuel avec SPSS Inc. E Entrez de nouveau le mot de passe pour le confirmer et cliquez sur OK. Mot de passe : Le mot de passe respecte la casse et peut comporter jusqu'à 16 caractères... E Entrez un nom de fichier dans la boîte de dialogue Enregistrer sous. pour distribuer le Smart Viewer. Si vous décidez d'affecter un mot de passe. E Saisissez le mot de passe. E Cliquez sur Enregistrer. sélectionnez : Fichier Enregistrer avec mot de passe. Le code de licence OEM est fourni avec le contrat. Remarque : Laissez le code OEM vide à moins que vous n'ayez un accord contractuel avec SPSS Inc. Pour enregistrer les fichiers du Viewer avec un mot de passe E A partir du menu du Viewer. le fichier ne peut pas être ouvert sans.250 Chapitre 9 Option Publier L'option Enregistrer avec mot de passe vous permet de protéger par mot de passe vos fichiers Viewer.

Figure 10-1 Fenêtre du Viewer en mode brouillon 251 . et coller les résultats texte et les diagrammes dans d'autres applications. et les fonctionnalités interactives des tableaux pivotants et des diagrammes ne sont pas disponibles. redimensionner les diagrammes.Viewer en mode brouillon 10 Chapitre Le Viewer en mode brouillon fournit des résultats sous forme de « brouillons ». des diagrammes comme images métafichiers (au lieu d'objets diagramme). vous ne pouvez pas modifier les diagrammes. Vous pouvez modifier les résultats texte du Viewer en mode brouillon. Cependant. avec : „ „ un résultat texte simple (au lieu de tableaux pivotants) .

onglet Viewer en mode brouillon).252 Chapitre 10 Pour créer un résultat en mode brouillon E A partir du menu. Contrôle du format du résultat en mode brouillon La sortie qui serait affichée sous forme de tableaux pivotants dans le Viewer est convertie en sortie texte pour le Viewer en mode brouillon. E Cliquez sur l'onglet Général.. sélectionnez : Fichier Nouveau Résultat mode brouillon E Pour faire du résultat en mode brouillon le type de résultat par défaut à partir du menu. les caractères verticaux (|) sont utilisés comme séparateurs de colonnes et les tirets (–) comme séparateurs de lignes. sélectionnez : Affichage Options. Si les caractères de cette zone sont désactivés. Remarque : Le nouveau résultat est toujours affiché dans la fenêtre de Viewer désigné. Les caractères de la zone de la police SPSS Marker Set sont utilisés comme des séparateurs de lignes et de colonnes. la fenêtre désignée est celle qui a été la dernière ouverte ou celle désignée à l'aide de l'outil Fenêtre désignée (le point d'exclamation) dans la barre d'outils. Les paramètres par défaut pour une sortie de tableaux pivotants convertie sont définis comme suit : „ „ „ „ Chaque colonne est ajustée en fonction de la largeur de l'étiquette de colonne et les étiquettes ne s'étalent pas sur plusieurs lignes. L'alignement est contrôlé par des espaces (à la place des tabulations). Options. Si vous avez ouvert une fenêtre de Viewer ou de Viewer en mode brouillon. E Sélectionnez Brouillon sous Type de navigateur au démarrage.. Vous pouvez contrôler le format du nouveau résultat en mode brouillon en utilisant les options du Viewer en mode brouillon (menu Edition. .

Les étiquettes plus longues que la largeur spécifiée sont adaptées pour s'ajuster à la largeur maximale. sélectionnez Maximum caractères sous Largeur de colonne. .253 Viewer en mode brouillon Figure 10-2 Options du Viewer en mode brouillon Largeur de colonne : Pour réduire la largeur des tableaux contenant des étiquettes longues.

.254 Chapitre 10 Figure 10-3 Résultat en mode brouillon avant et après le paramétrage de la largeur de colonne maximale Séparateurs de lignes et de colonnes : Comme autre choix de caractères de la boîte pour les bordures de lignes et de colonnes. vous pouvez utiliser les paramètres des séparateurs de cellules pour vérifier que les séparateurs de lignes et de colonnes s'affichent dans le nouveau résultat en mode brouillon. Vous pouvez spécifier différents séparateurs de cellules ou entrer des espaces vides si vous ne voulez utiliser aucun caractère pour repérer les lignes et colonnes. Vous devez désélectionner la case Afficher les caractères pour indiquer les séparateurs de cellules.

Si vous sélectionnez les tabulations comme séparateurs de colonnes. vous pouvez utiliser la police de votre choix dans l'autre application et définir les tabulations pour aligner le résultat correctement. vous devez utiliser une police à espacement fixe pour aligner correctement les colonnes avec un espace de séparation.255 Viewer en mode brouillon Figure 10-4 Résultat en mode brouillon avant et après le paramétrage des séparateurs de cellules Séparer colonnes avec Espaces / Tabulations : Le Viewer en mode brouillon est conçu pour afficher une sortie dans laquelle les séparations sont des espaces dans une police à espacement fixe (non proportionnelle). Si vous souhaitez coller un résultat en mode brouillon dans une autre application. la sortie avec des tabulations de séparation ne s'alignera pas correctement dans le Viewer en mode brouillon. Cependant. .

E Cliquez sur l'onglet Viewer en mode brouillon. . E Sélectionnez les paramètres souhaités.256 Chapitre 10 Figure 10-5 Résultat avec des tabulations de séparation dans le Viewer en mode brouillon puis formatée dans un traitement de texte Définition des options du Viewer en mode brouillon E A partir du menu. E Cliquez sur OK ou sur Appliquer... sélectionnez : Affichage Options.

d'autres modifications de police. Bordures de lignes et de colonnes : Les bordures de lignes et de colonnes pleines par défaut utilisent la police SPSS Marker Set. E A partir des menus du Viewer en mode brouillon. E Sélectionnez les attributs de police à appliquer au texte sélectionné. si vous utilisez les caractères de la boîte pour les bordures de lignes et de colonnes. italique).... taille.. Cependant. comme la taille et le style (par exemple gras. E Pour imprimer uniquement la partie sélectionnée du résultat en mode brouillon.257 Viewer en mode brouillon Les options d'affichage des résultats dans le Viewer affectent seulement le nouveau résultat produit après modification des paramètres Un résultat déjà affiché dans le Viewer n'est pas affecté par les changements de ces paramètres. style) du résultat texte dans le Viewer en mode brouillon. De plus. sélectionnez le résultat à imprimer. Les caractères de traçage de lignes utilisés pour tracer les bordures ne sont pas pris en charge par d'autres polices. sélectionnez : Format Police. Pour modifier les polices dans le Viewer en mode brouillon E Sélectionnez le texte auquel vous voulez appliquer la modification de police. appliquées à une partie seulement d'un tableau peuvent affecter l'alignement de colonne. Attributs de polices Vous pouvez modifier les attributs de polices (police. Pour imprimer un résultat en mode brouillon E A partir des menus du Viewer en mode brouillon. telle que Courier. l'alignement approprié de la colonne pour du texte séparé par des espaces nécessite l'utilisation d'une police à espacement fixe (monoespacée). . sélectionnez : Fichier Imprimer.

Saut de Page) pour contrôler les endroits où le tableau passe sur une autre page. Aperçu avant impression L'Aperçu avant impression vous montre ce qui va s'imprimer sur chaque page pour les documents brouillons. sélectionnez : Fichier Aperçu avant impression . Il existe plusieurs méthodes permettant d'éviter qu'un résultat trop volumineux soit tronqué : „ „ „ Utilisez une taille de police plus petite (menu Format. Nous vous conseillons d'utiliser l'Aperçu avant impression avant d'imprimer réellement un document du Viewer car cela vous permet de visualiser les éléments qui peuvent ne pas avoir été ajustés pour tenir sur une page. sélectionnez : Fichier Imprimer. utilisez les sauts de page (menu Insertion. Pour les tableaux longs.258 Chapitre 10 E A partir du menu.. E Choisissez Sélection.. Polices). comme : „ „ les tableaux longs les tableaux larges produits par la conversion d'une sortie d'un tableau pivotant sans contrôle de largeur de colonne en mode brouillon) sur une imprimante définie en mode Portrait. Pour une nouvelle sortie. Sélectionnez Paysage pour l'orientation de page (menu Fichier. „ les résultats texte créées avec l'option de largeur de page Large (options du Viewer Une sortie trop large pour la page est alors tronquée et ne s'imprimera pas sur une autre page. Mise en page). Options. onglet Viewer en mode brouillon). spécifiez une largeur de colonne maximum étroite (menu Edition. Pour visualiser un aperçu avant impression du Viewer en mode brouillon E A partir des menus du Viewer en mode brouillon.

259 Viewer en mode brouillon Pour enregistrer une sortie du Viewer en mode brouillon E A partir des menus du Viewer en mode brouillon. Les diagrammes ne sont pas inclus.. Pour enregistrer le résultat en mode brouillon en tant que texte E A partir des menus du Viewer en mode brouillon. sélectionnez : Fichier Exporter. Vous pouvez exporter tout le texte ou juste le texte sélectionné Seul le résultat texte (sortie de tableau pivotant convertie et sortie texte) est enregistrée dans les fichiers exportés.. . sélectionnez : Fichier Enregistrer La sortie du Viewer en mode brouillon est enregistrée au format RTF (texte enrichi).

.

Montrer et masquer des cellules. Trouver des définitions de termes. Manipulation d'un tableau pivotant Les options de manipulation des tableaux pivotants comprennent les éléments suivants : „ „ „ „ „ „ „ Transposer des lignes et des colonnes. Edition de deux tableaux pivotants ou plus en une fois E Cliquez sur le tableau pivotant avec le bouton de droite. Grouper et séparer des lignes et des colonnes. 261 . Cela signifie que vous pouvez réarranger les lignes. Faire pivoter des étiquettes de lignes et de colonnes. colonnes et strates.Tableaux pivotants 11 Chapitre Beaucoup de résultats sont présentés dans le Viewer sous forme de tableaux pouvant être pivotés de manière interactive. Créer des strates multidimensionnelles. Déplacer des lignes et des colonnes. Cela active l'éditeur de tableaux pivotants. Pour modifier un tableau pivotant E Double-cliquez sur le tableau.

. choisissez : Tableau pivotant Structure pivotante E Déplacez le pointeur de la souris au dessus de chaque icône pour faire apparaître une Note d'aide qui vous indique quelle dimension du tableau cette icône représente. Figure 11-1 Structure pivotante Cette action modifie la disposition du tableau.262 Chapitre 11 E A partir du menu contextuel. Pour faire pivoter un tableau à l'aide d'icônes E Activez le tableau pivotant. Chaque tableau pivotant est prêt à être édité dans sa propre fenêtre. Après le déplacement. supposez que l'icône représente une variable possédant les modalités Oui et Non et que vous faites glisser l'icône du plateau Ligne vers le plateau Colonne. Oui et Non étaient des étiquettes de ligne. Par exemple. sélectionnez : Objet tableau pivotant SPSS Ouvrir E Répétez l'opération pour chaque tableau pivotant que vous voulez modifier. E A partir des menus du tableau pivotant. E Faites glisser une icône d'une dimension à l'autre. Avant le déplacement. ce sont des étiquettes de colonne.

263 Tableaux pivotants Pour identifier des dimensions dans un tableau pivotant E Activez le tableau pivotant. Cette action met en surbrillance les étiquettes de dimension dans le tableau pivotant. . choisissez : Tableau pivotant Structure pivotante E Faites glisser les icônes de chaque plateau pour les placer dans l'ordre désiré (de gauche à droite ou de haut en bas). Pour modifier l'ordre d'affichage des éléments dans une dimension : E Activez le tableau pivotant. à partir des menus du tableau pivotant. choisissez : Tableau pivotant Structure pivotante E Cliquez sur une icône et maintenez le bouton enfoncé. E Si la structure pivotante n'est pas déjà activée. choisissez : Tableau pivotant Transposer lignes et colonnes Cette action a le même effet que faire glisser toutes les icônes de lignes dans la dimension Colonne et les icônes de colonnes dans la dimension Lignes. Pour modifier l'ordre d'affichage L'ordre des icônes de rotation dans un plateau de dimension reflète l'ordre d'affichage des éléments dans le tableau pivotant. Transposition des lignes et des colonnes E A partir des menus du tableau pivotant. E Si la structure pivotante n'est pas déjà activée. à partir des menus du tableau pivotant.

E Cliquez sur l'étiquette de la ligne ou colonne que vous voulez déplacer. Remarque : Assurez-vous que l'option Faire glisser pour Copier du menu Edition n'est pas activée (cochée). E Sélectionnez les étiquettes des lignes ou des colonnes que vous voulez grouper (cliquez et faites glisser ou Maj-Clic pour sélectionner plusieurs étiquettes). Double-cliquez sur l'étiquette de groupe pour modifier le texte de l'étiquette. E A partir du menu. Figure 11-2 Groupes et étiquettes de lignes et de colonnes Etiquette de groupe de colonnes Femmes Etiquette de groupe de lignes Employé de bureau Agent de sécurité Manager 206 10 Hommes 157 27 74 Total 363 27 84 Remarque : Pour ajouter des lignes ou des colonnes à un groupe existant. E Dans le menu contextuel. Si l'option Faire glisser pour Copier est activée. puis créer un nouveau groupe incluant les éléments supplémentaires. . E Cliquez et faites glisser l'étiquette vers sa nouvelle position. sélectionnez : Affichage Group Une étiquette de groupe est insérée automatiquement. choisissez Insérer Avant ou Permuter.264 Chapitre 11 Pour déplacer des lignes et des colonnes dans un tableau pivotant E Activez le tableau pivotant. désactivez-la. vous devez d'abord dissocier les éléments du groupe. Pour grouper des lignes ou des colonnes et insérer des étiquettes de groupe E Activez le tableau pivotant.

265 Tableaux pivotants Pour dissocier des lignes ou des colonnes et supprimer des étiquettes de groupe E Activez le tableau pivotant. E A partir du menu. sélectionnez : Format Pivoter Etiquettes de colonnes internes ou Pivoter Etiquettes de lignes externes . E Sélectionnez l'étiquette de groupe (cliquez n'importe où dans l'étiquette) des lignes ou des colonnes que vous voulez dissocier. Pour faire pivoter des étiquettes de tableaux pivotants E Activez le tableau pivotant. sélectionnez : Affichage Ungroup Dissocier supprime automatiquement l'étiquette de groupe. E A partir du menu.

. Rétablissement des pivots aux valeurs par défaut Après avoir exécuté une ou plusieurs opérations de pivot. E A partir du menu Tableau pivotant. dissocier ou déplacer des lignes ou des colonnes. Par exemple. Pour rechercher la définition d'une étiquette dans un tableau pivotant Vous pouvez obtenir de l'Aide contextuelle sur les étiquettes de cellules dans les tableaux pivotants.266 Chapitre 11 Figure 11-3 Etiquettes de colonnes pivotées Seules les étiquettes des colonnes les plus internes et les étiquettes des lignes les plus externes peuvent être pivotées. de colonnes ou de strates entre les dimensions. choisissez Remettre pivots à leur valeur par défaut. vous pouvez rétablir la disposition d'origine du tableau pivotant. si Moyenne apparaît comme une étiquette. Cette action ne rétablit que les changements résultant d'une rotation des éléments de lignes. vous pouvez obtenir une définition de la moyenne. Elle n'affecte pas les changements tels que grouper.

267 Tableaux pivotants E Cliquez sur une cellule d'étiquette avec le bouton droit de la souris. dont seule la strate supérieure est visible. . Le tableau peut être imaginé comme un empilement de strates. L'aide contextuelle n'est pas disponible pour les étiquettes définies par l'utilisateur telles que les noms de variable ou les étiquettes de valeurs. Pour créer et afficher des strates E Activez le tableau pivotant et sélectionnez Structure pivotante dans le menu Tableau pivotant si vous ne l'avez pas encore fait. E A partir du menu contextuel. sélectionnez Qu'est-ce que c'est ? Vous devez cliquer avec le bouton droit de la souris sur la cellule d'étiquette elle-même plutôt que sur les cellules de données de la ligne ou de la colonne. E Faites glisser une icône du plateau Ligne ou du plateau Colonne vers le plateau Strate. Utilisation des strates Vous pouvez afficher un tableau bidimensionnel séparé pour chaque modalité ou combinaison de modalités.

268 Chapitre 11 Figure 11-4 Déplacer des modalités dans des strates Chaque icône de strate possède des flèches à gauche et à droite. Le tableau visible est celui de la strate supérieure. Figure 11-5 Modalités en strates séparées Classification minoritaire : oui Classification minoritaire : non Total Catégorie Employé de bureau d'emploi Agent de sécurité Manager Total 194 176 Sexe Homme Femme Total 40 87 47 13 13 4 4 64 40 104 .

Atteindre la modalité de la strate Aller à Modalité de Strate vous permet de modifier les strates d'un tableau pivotant... choisissez : Tableau pivotant Aller à la strate. Pour aller à une strate d'un tableau E A partir des menus du tableau pivotant.269 Tableaux pivotants Pour modifier des strates E Cliquez sur l'une des flèches de l'icône de strate. Cette boîte de dialogue est particulièrement utile lorsqu'il existe un grand nombre de strates ou lorsqu'une strate possède de nombreuses modalités. Figure 11-6 Sélectionnez des strates à partir des listes déroulantes. ou E Sélectionnez une modalité à partir de la liste déroulante de strates. .

Il doit y avoir au moins une icône dans le plateau Strate. E Dans le menu Tableau pivotant. Pour afficher une autre strate sans fermer la boîte de dialogue : E Sélectionnez la modalité et cliquez sur Appliquer. soit de gauche à droite (colonnes). soit de haut en bas (lignes).270 Chapitre 11 Figure 11-7 Boîte de dialogue Atteindre la modalité de la strate E Sélectionnez une dimension de strate dans la liste Modalité visible. Cette action change la strate et ferme la boîte de dialogue. Pour déplacer des strates vers des lignes ou des colonnes Si le tableau que vous affichez est empilé en strates dont seule la strate supérieure est visible. vous pouvez afficher toutes les strates en même temps. E Sélectionnez la modalité souhaitée dans la liste Modalités de Strates et cliquez sur OK. ou E Dans le menu Tableau pivotant. La liste Modalités de Strates affiche toutes les modalités de la dimension sélectionnée. choisissez Déplacer Strates vers Lignes. . choisissez Déplacer Strates vers Colonnes.

A l'intérieur d'un tableau pivotant. E A partir du menu. Ligne et Colonne. mais vous pouvez utiliser des noms de signets en double dans des tableaux pivotants différents. Pour obtenir un affichage de tableau pivotant pour lequel un signet a été défini auparavant E Activez le tableau pivotant. Signets Les signets vous permettent d'enregistrer différents affichages d'un tableau pivotant. sélectionnez : Tableau pivotant Signets… E Entrez un nom pour le signet. Les signets incluent : „ „ „ le positionnement des éléments dans les dimensions de ligne. E Cliquez sur Ajouter. Chaque tableau pivotant a son propre jeu de signets. chaque nom de signet doit être unique. E Faites pivoter le tableau vers l'affichage pour lequel vous voulez définir un signet. . Les noms de signets ne font pas la distinction majuscules-minuscules.271 Tableaux pivotants Vous pouvez également déplacer les strates vers les lignes ou les colonnes en faisant glisser leurs icônes dans la structure pivotante Strate. colonne et strate l'ordre d'affichage des éléments dans chaque dimension la strate affichée pour chaque élément de strate Pour définir un signet pour un affichage de tableau pivotant E Activez le tableau pivotant.

Pour masquer des lignes et des colonnes dans un tableau E Ctrl-Alt-Clic sur l'étiquette de modalité de la ligne ou de la colonne à masquer. Modalités.272 Chapitre 11 E A partir du menu. sélectionnez : Tableau pivotant Signets… E Cliquez sur le nom du signet dans la liste. y compris la cellule d'étiquette et les cellules de données d'une ligne ou d'une colonne. Montrer ou masquer des cellules Il est possible de masquer de nombreux types de cellules : „ „ „ „ Etiquettes de dimension. Notes de bas de page. sélectionnez : Tableau pivotant Signets… E Cliquez sur le nom du signet dans la liste. E A partir du menu. Pour renommer un signet de tableau pivotant E Activez le tableau pivotant. E Cliquez sur Atteindre. E Cliquez sur Renommer. Etiquettes de modalité (sans masquer les cellules de données). E Entrez le nouveau nom de signet. . titres et légendes. E Cliquez sur OK.

choisissez : Affichage Montrer Tout Cette action affiche toutes les cellules masquées du tableau. Par exemple.273 Tableaux pivotants E A partir des menus du tableau pivotant. E Dans le menu contextuel. si la modalité Femme de la dimension Sexe est masquée. Pour afficher des colonnes et des lignes masquées dans un tableau E Sélectionnez une autre étiquette dans la même dimension que la ligne ou la colonne masquée. E Sélectionnez l'étiquette de dimension ou toute étiquette de modalité dans la dimension. ou E A partir des menus du tableau pivotant. choisissez Montrer Toutes les Modalités dans Sexe. (Si l'option Masquer les Lignes et Colonnes vides est sélectionnée dans les propriétés de ce tableau. cliquez sur la modalité Homme. choisissez : Affichage Montrer toutes les modalités dans le nom de la dimension Par exemple. une ligne ou une colonne totalement vide reste masquée). Pour masquer ou afficher une étiquette de dimension E Activez le tableau pivotant. choisissez Masquer modalité. E A partir des menus du tableau pivotant. choisissez : Affichage Masquer ou E Cliquez avec le bouton de droite de la souris sur la ligne ou la colonne mise en surbrillance pour afficher le menu contextuel. .

274 Chapitre 11 E A partir du menu. E A partir du menu. Modifier du texte. Vous pouvez : „ „ „ „ „ „ „ Appliquer un modèle de tableau. Copier et Coller le résultat dans d'autres applications. sélectionnez : Affichage Masquer (ou montrer) Etiquette de dimension. . E A partir du menu. sélectionnez : Affichage Masquer (ou montrer) Modification des résultats L'aspect et le contenu de chaque élément texte ou tableau du résultat peuvent être édités. sélectionnez : Affichage Masquer (ou montrer) Pour afficher ou masquer une légende ou un titre dans un tableau E Sélectionnez une légende ou un titre. Ajouter des notes de bas de page et des légendes aux tableaux. Modifier les propriétés du tableau actuel. Pour masquer ou afficher une note de bas de page dans un tableau E Sélectionnez une note de bas de page. Modifier les propriétés des cellules dans le tableau. Ajouter des éléments au Viewer.

Vous pouvez sélectionner l'un des Aspects de tableau prédéfinis ou créer et enregistrer un modèle de tableau personnalisé. les propriétés des notes de bas de page. Les formats de cellule édités demeurent. La colonne précédemment sélectionnée reste en caractères gras tandis que le reste des caractéristiques du modèle BOXED est appliqué. Vous pouvez sélectionner un modèle de tableau prédéfini ou créer votre propre modèle de tableau. vous pouvez restaurer pour toutes les cellules les formats définis par le modèle de tableau actuel. soit en appliquant un modèle de tableau. sélectionnez : Format Modèles de tableaux. E A partir du menu. Chaque modèle de tableau comprend un regroupement de propriétés de tableau. Si l'option Comme Affiché est sélectionnée dans la liste de fichiers de modèle de tableau. toutes les cellules modifiées reprennent les propriétés actuelles du tableau. Par exemple.. même lorsque vous appliquez un nouveau modèle de tableau. Vous modifiez ensuite le modèle de tableau et appliquez l'option BOXED. En option.275 Tableaux pivotants Modification de l'aspect des tableaux Vous pouvez modifier l'aspect d'un tableau soit en éditant les propriétés du tableau. y compris sur l'aspect général. Pour appliquer ou enregistrer un modèle de tableau E Activez un tableau pivotant. vous pouvez commencer par appliquer le modèle de tableau 9POINT. puis sélectionner une colonne de données et utiliser la boîte de dialogue Formats des cellules pour appliquer une police en caractères gras à cette colonne. .. Cette action restaure toutes les cellules qui ont été éditées. Avant ou après avoir appliqué un modèle de tableau. les propriétés des cellules et les bordures. Modèles de tableaux Un modèle de tableau est un ensemble de propriétés définissant l'aspect d'un tableau. vous pouvez modifier les formats de cellules pour des cellules individuelles ou des groupes de cellules à l'aide des propriétés de cellule.

E Cliquez sur Enregistrer aspect pour enregistrer le modèle de tableau modifié ou sur Enregistrer sous pour l'enregistrer comme nouveau modèle. Pour sélectionner un fichier dans un autre répertoire. E Cliquez sur Modifier modèle. Un modèle de tableau modifié n'est pas appliqué à d'autres tableaux utilisant cet Aspect. cliquez sur Parcourir. Pour modifier ou créer un Modèle de tableau E Sélectionnez un modèle de tableau dans la liste de fichiers. Modifier un modèle de tableau n'affecte que le tableau pivotant sélectionné. E Cliquez sur OK pour appliquer le modèle de tableau au tableau pivotant sélectionné.276 Chapitre 11 Figure 11-8 Boîte de dialogue Aspects de tableau E Sélectionnez un modèle de tableau dans la liste de fichiers. sauf si vous sélectionnez ces tableaux et appliquez à nouveau le modèle de tableau. . E Modifiez les propriétés de tableau pour obtenir les attributs souhaités et cliquez sur OK.

. choisissez : Format Propriétés du tableau. Pour appliquer de nouvelles propriétés de tableau à un modèle de tableau au lieu du tableau sélectionné seulement. Bordures ou Impression). Contrôler le format et la position des marques de notes de bas de page. E Cliquez sur OK ou sur Appliquer. modifiez le modèle de tableau (menu Format. E A partir des menus du tableau pivotant. pour les étiquettes de ligne et de colonne et pour les autres zones du tableau. Les nouvelles propriétés sont appliquées au tableau pivotant sélectionné.. E Sélectionnez les options souhaitées. Déterminer des formats spécifiques pour les cellules de données. Contrôler les propriétés d'impression. . Notes de bas de page. Modèle de tableau). vous pouvez : „ „ „ „ „ Contrôler les propriétés générales. Formats de cellule. Contrôler la largeur et la couleur des lignes formant les bordures de chaque zone du tableau. Pour modifier les propriétés d'un tableau pivotant E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau).277 Tableaux pivotants Propriétés du tableau La boîte de dialogue Propriétés de tableau vous permet de fixer les propriétés générales d'un tableau et les styles de cellules pour diverses parties d'un tableau ainsi que d'enregistrer un ensemble de propriété en tant que modèle de tableau. E Sélectionnez un onglet (Général. A l'aide des onglets de cette boîte de dialogue. telles que masquer les lignes ou les colonnes vides et ajuster les propriétés d'impression.

E Cliquez sur OK ou sur Appliquer. . Elles peuvent se placer dans le coin supérieur gauche ou être emboîtées. Contrôler la largeur maximum et minimum de colonne (exprimée en points).278 Chapitre 11 Propriétés de tableau : Général Plusieurs propriétés s'appliquent au tableau dans son ensemble. Figure 11-9 Propriétés de tableau Onglet Général Modification des propriétés générales d'un tableau E Sélectionnez l'onglet Général. E Sélectionnez les options souhaitées. Vous pouvez : „ „ „ Afficher ou masquer des lignes et des colonnes. (Une ligne ou colonne vide ne possède rien dans aucune des cellules de données) Contrôler l'emplacement des étiquettes de ligne.

279 Tableaux pivotants Propriétés de tableau : Notes de bas de page Les propriétés des marques de notes de bas de page comprennent le style et la position par rapport au texte. „ „ Le style des marques de notes de bas de page est soit numérique (1. 2. soit alphabétique (a....). c. b. .). Figure 11-10 Propriétés de tableau Onglet Notes de bas de page Modification des propriétés des marques des notes de bas de page E Sélectionnez l'onglet Notes de bas de page. 3. E Sélectionnez un format pour les marques des notes de bas de page.. Les marques des notes de bas de page peuvent être attachées au texte en indices ou en exposants.

Strates. taille. alignement horizontal et vertical. ombrage des cellules. Cette distinction est importante lorsqu'on fait pivoter un tableau. couleurs de premier plan et d'arrière-plan. Etiquettes de coin. Figure 11-11 Zones d'un tableau Les formats des cellules sont appliqués aux zones (modalités d'informations). vous pouvez modifier les formats des cellules associées. couleur. E Cliquez sur OK ou sur Appliquer. Pour chaque zone d'un tableau. celles-ci apparaîtront en caractères gras quelles que soient les informations affichées dans la dimension de la colonne—et si vous déplacez . Par exemple : „ Si vous spécifiez une police en caractères gras pour un format de cellules dans les étiquettes de colonnes. et marges intérieures des cellules. Ce ne sont pas des caractéristiques des cellules individuelles. Etiquettes de ligne. Les formats de cellule comprennent les éléments suivants : caractéristiques de texte (police.280 Chapitre 11 E Sélectionnez une position pour les marques. un tableau est divisé en zones : Titre. Données. Légende et Notes de bas de page. style). Etiquettes de colonne. Propriétés de tableau : Formats de cellule Pour le formatage.

. E Sélectionnez une zone dans la liste déroulante ou cliquez sur une zone de l'échantillon. Figure 11-12 Propriétés de tableau Onglet Formats de cellule Modification des formats des cellules E Sélectionnez l'onglet Formats de cellule. il ne conserve pas les caractères gras des étiquettes de colonnes. et les étiquettes de colonne ne resteront pas en caractères gras pour d'autres éléments déplacés dans la dimension de colonne. „ Si vous appliquez les caractères gras sur les étiquettes de colonne simplement en mettant en surbrillance les cellules dans un tableau pivotant actif et en cliquant sur le bouton Gras de la barre d'outils. le contenu de ces cellules demeurera en caractères gras quelle que soit la dimension dans laquelle vous les déplacez.281 Tableaux pivotants un élément de la dimension de colonne vers une autre dimension.

Propriétés de tableau : Bordures Pour chaque emplacement de bordure dans un tableau. Si vous sélectionnez Aucun comme style. il n'y aura aucune ligne à l'emplacement sélectionné. . Vos sélections se reflètent dans l'échantillon.282 Chapitre 11 E Sélectionnez des caractéristiques pour la zone. vous pouvez sélectionner un style et une couleur de ligne. E Cliquez sur OK ou sur Appliquer. Figure 11-13 Propriétés de tableau Onglet Bordures Pour modifier les bordures d'un tableau E Cliquez sur l'onglet Bordures.

Les bordures masquées (quadrillage) sont affichées dans le Viewer mais ne sont pas imprimées. E Sélectionnez une couleur.283 Tableaux pivotants E Sélectionnez un emplacement de bordure. Cela peut faciliter des tâches telles que modifier la largeur des colonnes. Pour afficher des bordures masquées dans un tableau pivotant Pour les tableaux possédant peu de bordures visibles. vous pouvez afficher les bordures masquées. E Cliquez sur OK ou sur Appliquer. vous pouvez contrôler les propriétés suivantes : „ Imprimer toutes les strates ou seulement la strate supérieure du tableau. E A partir du menu. (Ceci n'affecte que l'impression. soit en cliquant sur une ligne dans la zone d'échantillon. pas l'affichage des strates dans le Viewer) Rétrécir un tableau horizontalement ou verticalement pour qu'il tienne dans la page lors de l'impression. E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau). sélectionnez : Affichage Quadrillage Propriétés de tableau : Impression Pour les tableaux pivotants imprimés. (Remarque : Si un tableau est trop long pour tenir sur le restant de la page actuelle car il y a un autre résultat au-dessus dans la page. Ctrl-Clic pour sélectionner plusieurs noms non contigus) E Sélectionnez un style de ligne ou Aucun. soit en cliquant sur son nom dans la liste. et imprimer chaque strate sur une page séparée. (Maj-clic pour sélectionner plusieurs noms. mais qu'il tient dans la longueur de page „ „ . Contrôler les lignes veuves et orphelines — le nombre minimal de lignes et de colonnes qui seront contenues dans une section imprimée d'un tableau si le tableau est trop large et/ou trop long pour la taille définie de la page.

Polices Un modèle de tableau vous permet de spécifier des caractéristiques de police pour différentes zones du tableau. ces propriétés s'appliquent dans toutes les strates du tableau possédant la même cellule. Les options de police dans une cellule comprennent le type de police. . E Cliquez sur OK ou sur Appliquer.284 Chapitre 11 définie. Pour contrôler l'impression d'un tableau pivotant E Cliquez sur l'onglet Impression. quel que soit le paramétrage des lignes veuves/orphelines) „ Inclure du texte de suite pour des tableaux qui ne peuvent s'ajuster à une seule page. Si aucune option est sélectionnée. le texte de suite de sera pas affiché. Vous pouvez également masquer le texte ou le souligner. il est automatiquement imprimé sur une nouvelle page. Vous pouvez également changer la police de toute cellule individuellement. Vous pouvez afficher du texte de suite au bas de chaque page et en haut de chaque page. Si vous spécifiez des propriétés de police dans une cellule. E Sélectionnez les options d'impressions souhaitées. le style et la taille.

En option. .. E A partir des menus du tableau pivotant.. vous pouvez sélectionner une police. choisissez : Format Police. spécifier si vous voulez masquer ou souligner le texte ou sélectionner une couleur et un style d'écriture.285 Tableaux pivotants Figure 11-14 Boîte de dialogue Police Modification de la police d'une cellule E Activez le tableau pivotant et sélectionnez le texte que vous voulez modifier. un style de police et une taille. Largeur des cellules de données Fixer la Largeur des Cellules de Données est utilisé pour fixer une même largeur à toutes les cellules de données.

E Entrez une valeur pour la largeur des cellules. . E A partir du menu. E Déplacez le pointeur de la souris dans les étiquettes de modalité jusqu'à ce qu'il soit sur la bordure droite de la colonne que vous voulez modifier. Modification de la largeur d'une colonne de tableau pivotant E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau).. Le pointeur se change en flèche à deux pointes.286 Chapitre 11 Figure 11-15 Boîte de dialogue Fixer la Largeur des Cellules de Données Modification de la largeur des cellules de données E Activez le tableau pivotant. sélectionnez : Format Largeur des cellules. E Maintenez le bouton de la souris enfoncé pendant que vous faites glisser la bordure vers sa nouvelle position..

E A partir du menu. sélectionnez : Format Propriétés de la cellule. les marges et de l'ombrage. donc. Vous pouvez changer le format des valeurs.287 Tableaux pivotants Figure 11-16 Modifier la largeur d'une colonne Vous pouvez modifier les bordures verticales de modalité et de dimension dans la zone des étiquettes de ligne.. l'alignement. E Déplacez le pointeur de la souris à travers les étiquettes de ligne jusqu'à voir apparaître la flèche à deux pointes.. qu'elles soient masquées ou non. vous ne modifierez pas les propriétés de cellules appliquées individuellement. Les Propriétés des cellules supplantent les propriétés de tableau . Modification des propriétés de la cellule E Activez un tableau et sélectionnez une cellule du tableau. si vous changez les propriétés de tableau. . E Faites-la glisser jusqu'à la nouvelle largeur. Propriétés de la cellule Les propriétés de cellules s'appliquent à une cellule sélectionnée.

. E A partir du menu contextuel. sélectionnez Propriétés de la cellule. les heures ou les monnaies et ajuster le nombre de décimales affichées. les dates.288 Chapitre 11 Propriétés des cellules : Valeur Cet onglet de boîte de dialogue contrôle le format des valeurs d'une cellule. E Cliquez avec le bouton droit de la souris sur la colonne en surbrillance. Pour modifier le format des valeurs dans une colonne E Ctrl-Alt-clic sur l'étiquette de colonne. Vous pouvez sélectionner des formats pour les nombres. E Sélectionnez le nombre de décimales. Figure 11-17 Propriétés des Cellules Onglet Valeur Modification des formats des valeurs dans une cellule E Cliquez sur l'onglet Valeur. E Sélectionnez une modalité et un format.

289 Tableaux pivotants E Cliquez sur l'onglet Valeur. Figure 11-18 Propriétés des Cellules Onglet Alignement . le contenu de la cellule est aligné selon son type (nombre. Propriétés des cellules : Alignement Cet onglet de boîte de dialogue fixe l'alignement vertical et horizontal et la direction du texte pour une cellule. E Sélectionnez le format que vous voulez appliquer à la colonne. Vous pouvez utiliser cette méthode pour supprimer ou ajouter des symboles pourcentage ou dollar. Si vous choisissez Mixte. modifier le nombre de décimales affichées et passer de la notation numérique normale à la notation scientifique. date ou texte).

. Lorsque vous sélectionnez les propriétés d'alignement des cellules. elles s'illustrent dans la zone d'échantillon. choisissez : Format Propriétés de la cellule E Cliquez sur l'onglet Alignement. Figure 11-19 Propriétés des Cellules Onglet Marges Modification des marges dans les cellules E Cliquez sur l'onglet Marges. E A partir des menus du tableau pivotant.290 Chapitre 11 Modification de l'alignement dans les cellules E Sélectionnez une cellule dans le tableau. Propriétés des cellules : Marges Cet onglet de boîte de dialogue spécifie la marge à chaque bord d'une cellule.

291 Tableaux pivotants E Sélectionnez la valeur de chacune des quatre marges. Marque de bas de page La Marque de note de bas de page modifie le ou les caractères utilisés pour marquer une note de bas de page. Cela n'affecte pas la couleur du texte. Figure 11-20 Propriétés des cellules onglet Ombrage Modification de l'ombrage des cellules E Cliquez sur l'onglet Ombrage. . Propriétés des cellules : Ombrage Cet onglet de boîte de dialogue spécifie le pourcentage d'ombrage ou un contour de cellule ainsi que les couleurs de premier plan et d'arrière-plan pour une zone de cellules spécifiée. E Sélectionnez les surbrillances et les couleurs de la cellule. Le contour de cellule est sélectionné dans la liste Surbrillances.

et la surbrillance qui indique la ligne ou la colonne sélectionnée peut s'étendre sur des zones non contiguës du tableau. des colonnes et des strates. E Entrez un ou deux caractères. E A partir des menus du tableau pivotant.. choisissez : Format Marque de note de bas de page. Pour renuméroter les notes de bas de page : E Activez le tableau pivotant. . E A partir du menu. les notes de bas de page peuvent être désactivées..292 Chapitre 11 Figure 11-21 Boîte de dialogue Marque de Note de bas de page Modification des caractères des marques des notes de bas de page E Sélectionnez une note de bas de page. Renumérotation des notes de bas de page Lorsque vous avez fait pivoter un tableau en échangeant des lignes. sélectionnez : Format Renuméroter notes de bas de page Sélection des lignes et des colonnes dans les tableaux pivotants La flexibilité des tableaux pivotants place certaines contraintes sur la manière dont vous sélectionnez des lignes et des colonnes.

E Double-cliquez sur la cellule ou appuyez sur F2. E Cliquez sur une étiquette de ligne ou de colonne. E A partir du menu.293 Tableaux pivotants Pour sélectionner une ligne ou une colonne dans un tableau pivotant E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau). Modification des résultats d'un tableau pivotant Le texte qui s'affiche dans le Viewer peut apparaître dans beaucoup d'éléments. la sélection en surbrillance peut s'étendre sur plusieurs cellules non contiguës. . Pour modifier le texte d'une cellule E Activez le tableau pivotant. sélectionnez : Affichage Sélectionnez Cellules de données et d'étiquettes ou E Ctrl-Alt-clic sur l'étiquette de ligne ou de colonne. E Appuyez sur la touche Entrée pour enregistrer vos changements ou appuyez sur la touche Echap pour restaurer le contenu précédent de la cellule. Les tableaux pivotants peuvent être édités en : „ „ Editant du texte dans les cellules du tableau pivotant. Vous pouvez modifier le texte ou ajouter de nouveaux textes. Si le tableau contient plusieurs dimensions dans la zone des lignes ou des colonnes. E Editez le texte. Ajoutant des légendes et des notes de bas de page.

choisissez : Insérer Légende Les mots Légende du tableau s'affichent au bas du tableau. E Sélectionnez les mots Légende du tableau et entrez votre texte par-dessus. E Cliquez sur un titre.294 Chapitre 11 Ajout de légendes à un tableau E A partir des menus du tableau pivotant. Impression des tableaux pivotants Divers facteurs peuvent affecter l'aspect des diagrammes imprimés à partir de tableaux pivotants et ces facteurs peuvent être contrôlés en modifiant les attributs du tableau pivotant. E A partir des menus du tableau pivotant.. soit simplement imprimer la strate supérieure (visible). choisissez : Insérer Note de bas de page. „ Pour des tableaux pivotants multidimensionnels (tableaux avec strates). Pour des tableaux pivotants longs ou larges. vous pouvez automatiquement redimensionner le tableau pour ajuster à la page ou contrôler la position des sauts de tableaux ou des sauts de page.. . E Sélectionnez les mots Note de bas de page et tapez le texte de la note en écrasant le texte présent. une cellule ou une légende dans le tableau pivotant activé. Ajout d'une note de bas de page à un tableau Une note de bas de page peut être attachée à tout élément d'un tableau. vous pouvez soit imprimer toutes les strates. „ Utilisez l'Aperçu avant impression du menu Fichier pour voir à quoi ressembleront les tableaux pivotants imprimés.

sélectionnez : Format Propriétés du tableau E Dans l'onglet Impression. E Cliquez sur l'étiquette de colonne à gauche de l'endroit où vous souhaitez insérer le saut ou sur l'étiquette de ligne au-dessus de l'endroit où vous souhaitez insérer le saut. sélectionnez : Format Séparer ici. Contrôle des sauts de tableau pour les tableaux longs et larges Les tableaux pivotants qui sont soit trop larges soit trop longs pour être imprimés dans la taille de page définie sont automatiquement divisés et sont imprimés en plusieurs sections. sélectionnez Imprimer toutes les strates.. .295 Tableaux pivotants Pour imprimer les strates masquées d'un tableau pivotant E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau). E A partir du menu. les différentes sections s'impriment sur la même page s'il y a de la place). (Pour les tableaux larges. Vous pouvez aussi imprimer chaque strate d'un tableau pivotant sur une page distincte.. Vous pouvez: „ „ Contrôler la position à laquelle les lignes et les colonnes sont divisés les grands tableaux Indiquer les lignes et colonnes qui doivent être conservés ensemble lors de la division de tableaux „ Redimensionner les grands tableaux pour les ajuster à la taille définie pour la page Pour spécifier des sauts de ligne et de colonne dans les tableaux pivotants imprimés E Activez le tableau pivotant. E A partir du menu.

sélectionnez : Format Propriétés du tableau E Cliquez sur l'onglet Impression.296 Chapitre 11 Spécification des lignes ou colonnes à conserver ensemble E Activez le tableau pivotant.) E A partir du menu. sélectionnez : Format Insérer Conserver ensemble Pour redimensionner un tableau pivotant afin de l'ajuster à la page E Activez le tableau pivotant. et/ou E Cliquez sur Redimensionner longueur de tableau. (Cliquez-glissez ou Maj+cliquez pour sélectionner plusieurs étiquettes de ligne ou de colonne. E A partir du menu. E Sélectionnez les étiquettes des lignes ou colonnes que vous souhaitez conserver ensemble. . E Cliquez sur Redimensionner largeur de tableau.

Il est possible d'ouvrir une fenêtre de syntaxe et de taper des commandes. Copie de la syntaxe à partir du fichier-journal. mais il est plus simple de laisser SPSS construire le fichier de syntaxe selon l'une des méthodes suivantes : „ „ „ Copie de la syntaxe de commande à partir des boîtes de dialogue. Pour obtenir une documentation complète sur le langage de commande. cliquez sur le lien de syntaxe de commande dans la liste des rubriques apparentées pour accéder au diagramme de syntaxe de la commande correspondante. Dans l'aide en ligne d'une procédure donnée. certaines options et commandes ne sont disponibles qu'en utilisant le langage de commande. Cependant. Celui-ci vous permet d'enregistrer vos travaux dans un fichier de syntaxe afin de vous permettre de relancer votre analyse à une date ultérieure ou de l'exécuter dans une opération automatisée à l'aide du système de production. reportez-vous au manuel SPSS Command Syntax Reference. Copie de la syntaxe à partir du fichier de résultat. 297 . La plupart des commandes sont accessibles depuis les menus et boîtes de dialogue. Un fichier de syntaxe de commande est un fichier texte simple contenant des commandes.Utilisation de la syntaxe de commande 12 Chapitre SPSS fournit un puissant langage de commande qui vous permet d'enregistrer et d'automatiser de nombreuses tâches. Il fournit également des fonctionnalités qui ne se trouvent ni dans les menus ni dans les boîtes de dialogue.

une abréviation de trois lettres peut être utilisée pour spécifier ces commandes. Il vous est possible d'ajouter des espaces ou des sauts de ligne à presque tous les points d'insertion d'un espace vide. tels que des barres obliques.298 Chapitre 12 Lors de l'installation de SPSS. FREQUENCIES . Pour accéder à la documentation sur la syntaxe: E A partir du menu. des parenthèses. ou les ajouter entre le nom des variables. La plupart des sous-commandes sont séparées par des barres obliques (/). indépendamment des paramètres régionaux définis dans Windows. Par exemple. Règles de syntaxe de commande N'oubliez pas les règles suivantes lorsque vous modifiez et écrivez la syntaxe de commande : „ „ Chaque commande doit commencer sur une nouvelle ligne et se terminer par un point. Vous pouvez utiliser autant de lignes voulues pour spécifier une commande unique. „ „ „ „ „ La syntaxe de commande respectant la casse. Un point (. la documentation complète sur la syntaxe des commandes est automatiquement installée. vous devez donc éviter d'indiquer ces noms. sélectionnez : Aide Command Syntax Reference. Le nom des variables doit être écrit en en toute lettre. Chaque ligne de la syntaxe de commande ne peut dépasser 80 caractères. Le nom des variables finissant par un point peut engendrer des erreurs dans les commandes créées par les boîtes de dialogue. Le texte inclus dans les apostrophes ou les guillemets doit tenir sur une seule ligne. des opérateurs arithmétique. Vous ne pouvez pas créer de tels noms de variable dans les boîtes de dialogue .) doit être utilisé pour indiquer les décimales. La barre oblique figurant avant la première sous-commande de la commande est souvent facultative.

sont deux choix possibles qui génèrent les mêmes résultats. le format des commandes convient à tout mode de production.299 Utilisation de la syntaxe de commande VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART. vous pouvez exécuter la syntaxe qui a été collée. Création d'une syntaxe depuis les boîtes de dialogue La méthode la plus simple pour construire un fichier de syntaxe de commande consiste à effectuer des sélections dans les boîtes de dialogue et à coller la syntaxe dans la fenêtre correspondante. Le point à la fin de la commande est optionnel. . les règles de syntaxe diffèrent légèrement : „ „ „ Chaque commande doit commencer sur la première colonne d'une nouvelle ligne. Dans la fenêtre de syntaxe. Les lignes suites doivent être en retrait d'un espace au moins. vous pouvez construire un fichier de travail vous permettant de relancer l'analyse ultérieurement ou d'exécuter une opération automatisée à l'aide du système de production. Si vous générez une syntaxe de commande en collant les sélections d'une boîte de dialogue dans une fenêtre de syntaxe. En collant la syntaxe à chaque étape d'une longue analyse. la modifier et l'enregistrer dans un fichier de syntaxe. E Cliquez sur Coller. et freq var=jobcat gender /percent=25 50 75 /bar. Collage d'une syntaxe depuis les boîtes de dialogue E Ouvrez la boîte de dialogue et faites vos sélections. Fichiers de syntaxe Système de production et fichiers INCLUDE : Pour des fichiers de commande exécutés à l'aide du système de production ou de la commande INCLUDE.

Pour ce faire. .300 Chapitre 12 La syntaxe de commande est alors collée dans la fenêtre correspondante. Chaque commande apparaît donc dans le Viewer accompagné du résultat de l'analyse. Dans la fenêtre de syntaxe. le code permettant d'exécuter la syntaxe depuis un script est alors collé dans la fenêtre correspondante. la modifier et l'enregistrer dans un fichier de syntaxe. Si vous n'avez pas ouvert de fenêtre. Utilisation de la syntaxe depuis le fichier de résultat Vous pouvez construire un fichier de syntaxe en copiant la syntaxe depuis le fichier apparaissant dans le Viewer. vous pouvez exécuter la syntaxe qui a été collée. une nouvelle fenêtre s'ouvre automatiquement pour pouvoir y coller la syntaxe. Figure 12-1 Syntaxe de commande collée depuis une boîte de dialogue Remarque : Si vous ouvrez une boîte de dialogue à partir des menus d'une fenêtre de script. sélectionnez Afficher commandes dans la boîte de dialogue du Viewer avant de lancer l'analyse.

. sélectionnez : Affichage Options. à partir du menu. à partir du menu. E Ouvrez un fichier de syntaxe précédemment enregistré ou créez-en un nouveau. E Dans l'onglet Viewer. double-cliquez sur un élément du fichier pour le mettre . les commandes des sélections faites dans votre boîte de dialogue sont enregistrées dans le fichier. Pour ce faire.. sélectionnez : Fichier Nouveau Syntaxe E Dans le Viewer. sélectionnez Afficher commandes.301 Utilisation de la syntaxe de commande Figure 12-2 Syntaxe de commande dans le fichier Copier la syntaxe depuis le fichier de résultats E Avant de lancer l'analyse. Au cours de l'analyse.

toutes les commandes exécutées au cours d'une session sont enregistrées dans un fichier-journal nommé spss. E Cliquez et faites glisser la souris pour sélectionner la syntaxe à copier. la tentative d'utilisation du même nom de fichier pour les fichiers de syntaxe et journaux peut générer des résultats inattendus. commande Options). sélectionnez : Edition Copier E Dans la fenêtre de syntaxe. vous devez modifier les messages d'erreur et les avertissements générés avant d'enregistrer le fichier de syntaxe. sélectionnez : Edition Coller Utilisation de la syntaxe dans un fichier-journal Par défaut. .302 Chapitre 12 en surbrillance.jnl (configuré dans le menu Edition. Vous pouvez modifier le fichier-journal et l'enregistrer en tant que fichier de syntaxe que vous pouvez utiliser pour relancer une analyse. Notez toutefois que les erreurs doivent être résolues pour que l'analyse puisse s'effectuer correctement. E A partir du menu du Viewer. Le fichier-journal est un fichier texte pouvant être modifié comme tout autre fichier. Des messages d'erreur et des avertissements étant également enregistrés dans le fichier-journal avec la syntaxe de commande. à partir du menu. Le fichier-journal étant automatiquement ajouté ou écrasé à chaque session. ou l'exécuter dans une opération automatisée à l'aide du système de production. Enregistrez le fichier-journal modifié sous un autre nom.

sps. C'est l'extension par défaut des fichiers de syntaxe. sélectionnez à partir du menu : Fichier Ouvrir Autre… E Ouvrez le fichier-journal (par défaut. E Enregistrez le fichier-journal modifié sous un autre nom.jnl se trouve dans le répertoire temp). Si vous ne parvenez pas à trouver le fichier.jnl dans la zone de texte Nom de fichier pour afficher les fichiers-journaux dans la liste.303 Utilisation de la syntaxe de commande Figure 12-3 Edition du fichier-journal Modification de la syntaxe dans un fichier-journal E Pour ouvrir le fichier-journal. spss. E Modifiez le fichier afin de supprimer tout message d'erreur ou avertissement indiqué par un signe >.) . (Nous vous conseillons d'utiliser un nom avec une extension . utilisez Options du menu Edition pour connaître l'emplacement du journal sur votre système. Sélectionnez Tous les fichiers (*.*) dans la liste des types de fichiers ou entrez *.

„ „ „ Tout : Exécute toutes les commandes dans la fenêtre de syntaxe. Sélection : Exécute les commandes sélectionnées. il est inutile de faire appel à plusieurs commandes EXECUTE.304 Chapitre 12 Exécuter une syntaxe de commande E Mettez en surbrillance les commandes à exécuter dans la fenêtre de syntaxe. Le bouton Exécuter dans la barre d'outils de l'éditeur de syntaxe exécute les commandes sélectionnées ou la commande sélectionnée à l'endroit où le curseur est situé si aucun élément n'est sélectionné. ou E Sélectionnez l'une des options du menu Exécuter. Courant : Exécute la commande à l'endroit où le curseur est situé. E Cliquez sur le bouton Exécuter (en forme de triangle) dans la barre d'outils de la fenêtre de l'éditeur de syntaxe. Vous risquez même de ralentir les performances car cette commande lit l'intégralité du fichier de données. . Lorsque vous exécutez plusieurs commandes à partir d'une fenêtre de syntaxe. y compris les commandes partiellement sélectionnées. Figure 12-4 Barre d'outils Editeur de syntaxe Commandes Execute multiples La syntaxe collée depuis des boîtes de dialogue ou copiée depuis le journal peut contenir des commandes EXECUTE. „ Jusqu'à la fin : Exécute toutes les commandes à partir de l'emplacement du curseur jusqu'à la fin du fichier de syntaxe de commande.

305 Utilisation de la syntaxe de commande „ Si la dernière commande du fichier de syntaxe lit le fichier de données (comme une procédure statistique ou graphique). Dans une série de commandes de transformation ne contenant aucune commande EXECUTE ni aucune autre commande lisant les données. sans tenir compte de l'ordre des commandes. les fonctions Décalage positif sont calculées une fois toutes les autres transformations effectuées. vous pouvez généralement supprimer toutes les commandes EXECUTE du fichier de syntaxe. aucune commande EXECUTE n'est nécessaire . . Si vous n'êtes pas sûr que la dernière commande lise le fichier de données. „ Fonctions Décalage positif Cette exception concerne les commandes de transformation qui contiennent des fonctions Décalage positif. Par exemple : COMPUTE lagvar=LAG(var1) COMPUTE var1=var1*2 et COMPUTE lagvar=LAG(var1) EXECUTE COMPUTE var1=var1*2 génère différents résultats pour la valeur lagvar car la première valeur utilise la valeur transformée var1 alors que la deuxième utilise la valeur d'origine. à l'exception de la dernière. vous pouvez donc supprimer ces commandes.

.

Exemple : Quelle est la répartition de la clientèle d'une société selon le type d'industrie dont elle fait partie ? Le résultat pourrait vous apprendre que votre clientèle est composée à 37. vous pouvez trier les différentes valeurs par ordre croissant ou décroissant. diagrammes en bâtons. centiles choisis par l'utilisateur.576 $ avec un écart type de 1.1 % d'établissements universitaires et à 9. Remarques sur les données de fréquences Données : Utilisez des codes numériques ou alphanumériques courts pour coder les variables qualitatives (mesures de niveau nominal ou ordinal).9 % de sociétés commerciales. vous pourriez constater que la moyenne de vente par produit est de 3. variance. asymétrie et aplatissement (avec leurs erreurs standard). Pour des données continues et quantitatives. intervalle. ou bien classer les modalités en fonction de leurs fréquences. la procédure Fréquences peut jouer un rôle. mode. quartiles.Fréquences 13 Chapitre La procédure Fréquences permet d'obtenir des affichages statistiques et graphiques qui servent à décrire de nombreux types de variables. médiane.4 % du secteur de la santé. comme par exemple les revenus des ventes. 307 .5 % d'organismes d'état. pourcentages. somme. pourcentages cumulés.078 $. valeurs minimale et maximale. Pour obtenir un rapport des fréquences et un diagramme en bâtons. Diagrammes et statistiques : Effectifs de fréquence. Vous pouvez étiqueter les diagrammes avec des fréquences (par défaut) ou des pourcentages. à 28. Dès que vous prenez connaissance de vos données. moyenne. à 24. écart type. Le rapport de fréquences peut être supprimé lorsqu'une variable a plusieurs valeurs distinctes. erreur standard de la moyenne. diagrammes en secteurs et histogrammes.

Les statistiques de base. qu'elles répondent ou non au critère de normalité. Certaines des statistiques récapitulatives facultatives. les quartiles et les centiles. telles que la moyenne et l'écart type. telles que la médiane.308 Chapitre 13 Hypothèses : Les tabulations et les pourcentages fournissent une description utile sur les données de n'importe quelle distribution. sont fondées sur la théorie de normalité et sont appropriées pour des variables quantitatives avec une distribution symétrique. sont appropriées pour les variables quantitatives. particulièrement pour les variables disposant de modalités triées ou non. Echantillon de résultat Figure 13-1 Résultat de fréquences .

. Cliquer sur Diagrammes pour obtenir des diagrammes en bâtons. .. sélectionnez : Analyse Statistiques descriptives Fréquences. Cliquer sur Format pour définir l'ordre de présentation des résultats. vous pouvez : „ „ „ Cliquer sur Statistiques pour obtenir des statistiques descriptives pour des variables quantitatives.309 Fréquences Pour obtenir des tableaux de fréquences E A partir du menu. Sinon. Figure 13-2 Boîte de dialogue Fréquences E Sélectionnez une ou plusieurs variables qualitatives ou quantitatives. des diagrammes en secteurs ou des histogrammes.

chacune d'elles constitue un mode. La procédure Fréquences ne rend compte que du plus petit mode. La médiane est une mesure de tendance centrale et elle n'est pas. à l'inverse de la moyenne. Tendance centrale : Les statistiques décrivant la position de la distribution comprennent la Moyenne. la Médiane. „ Somme : Somme ou total des valeurs. la médiane correspond à la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordre croissant ou décroissant. le Mode et la Somme de toutes les valeurs. . Vous pouvez également spécifier des centiles particuliers (par exemple. Si vous souhaitez un nombre égal de classes différent de quatre. Si le nombre d'observations est pair. sensible aux valeurs éloignées. somme divisée par le nombre d'observations. „ „ Moyenne : Mesure de la tendance centrale. Les quartiles (25ième. pour toutes les observations n'ayant pas de valeur manquante. 50e centile. Médiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moitié des observations . 50ième et 75ième centiles) divisent les observations en quatre classes de taille égale.310 Chapitre 13 Statistiques des fréquences Figure 13-3 Boîte de dialogue Fréquences : Statistiques Fractiles : Valeurs d'une variable quantitative qui divisent les données triées en classes par centième. Si plusieurs valeurs partagent la plus grande fréquence d'occurrence. Moyenne arithmétique . valeur au-dessus de 95 % des observations). „ Mode : Valeur qui revient le plus fréquemment. sélectionnez Partition en n classes égales. le 95ième centile.

„ Ecart type : Mesure de la dispersion des valeurs autour de la moyenne. „ „ „ „ Plage : Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum–minimum). La variance se mesure en unités. l'intervalle. „ Skewness : Mesure de l'asymétrie d'une distribution. divisée par le nombre d'observations moins un. Distribution : L'Asymétrie et l'Aplatissement sont des statistiques qui décrivent la forme et la symétrie de la distribution. „ Variance : Mesure de la dispersion des valeurs autour de la moyenne. Ces statistiques sont présentées avec leurs erreurs standard. qui sont égales au carré des unités de la variable. Dans le cas d'une distribution normale. Par exemple. Minimum : Valeur la plus petite d'une variable numérique. la variance. le maximum et l'erreur standard (ES) de la moyenne. si la moyenne d'âge est de 45 avec un écart type égal à 10. ES Moyenne : Mesure du taux de variation de la valeur de la moyenne sur des échantillons provenant de la même distribution. Pour simplifier. 68 % des observations se situent à un écart type de la moyenne et 95 % à deux écarts types. La distribution normale est symétrique et a une valeur d'asymétrie égale à zéro. vous pouvez conclure que ces deux valeurs sont différentes si le rapport de la différence avec l'erreur standard est inférieur à -2 ou supérieur à +2). comprennent l'écart type. Dans une répartition normale. Un aplatissement positif indique que les observations sont plus regroupées et présentent des extrémités plus longues que . le minimum. une distribution normale verra 95 % des observations se situer entre 25 et 65. Une distribution caractérisée par une importante asymétrie négative présente une extrémité gauche plus allongée. une valeur d'asymétrie deux fois supérieure à l'erreur standard correspond à une absence de symétrie. „ Kurtosis : Mesure de l'étendue du regroupement des observations autour d'un point central.311 Fréquences Dispersion : Les statistiques mesurant la variance ou la dispersion dans les données. Cette mesure permet de comparer approximativement la moyenne observée avec une valeur hypothétique (autrement dit. Une distribution caractérisée par une importante asymétrie positive présente une partie droite plus allongée. la valeur de la statistique d'aplatissement est égale à 0. Maximum : Plus grande valeur d'une variable numérique. égale à la somme des carrés des écarts par rapport à la moyenne.

Un histogramme est également constitué de bâtons mais ils sont répartis à intervalles égaux. les âges des individus trentenaires sont représentés par le code 35). Un aplatissement négatif signifie que les observations sont moins regroupées et présentent des extrémités plus courtes. Chaque secteur du diagramme correspond à un groupe défini par une simple variable de regroupement. ce qui vous permet de comparer les modalités visuellement. La hauteur de chaque bâton représente l'effectif des valeurs d'une variable quantitative appartenant à l'intervalle. vous pouvez déterminer si les données sont distribuées normalement. Valeurs sont des centres de classes : Si les valeurs dans vos données représentent des centres de classes (par exemple.312 Chapitre 13 dans le cas d'une distribution normale. Si vous superposez une courbe normale sur l'histogramme. Un histogramme montre la forme. le centre et la dispersion de la distribution. Un diagramme en bâtons montre l'effectif de chaque valeur ou de chaque modalité sous la forme d'un bâton distinct. Valeurs du diagramme : Dans les diagrammes en bâtons. non regroupées. sélectionnez cette option pour estimer la médiane et les centiles des données originales. l'axe peut être étiqueté par fréquences ou pourcentages de fréquence. . Diagrammes des fréquences Figure 13-4 Boîte de dialogue Fréquences : Diagrammes Type de diagramme : Un diagramme en secteurs montre la participation de chaque partie à l'ensemble.

SPSS part du principe que la variable est quantitative et affiche ses valeurs par ordre croissant. Supprimer les tableaux avec plus de n modalités : Cette option évite l'affichage des tableaux ayant plus que le nombre spécifié de valeurs. Cependant.313 Fréquences Format des fréquences Figure 13-5 Boîte de dialogue Fréquences: Format Ordre d'affichage : Le tableau de fréquences peut être affiché en fonction des valeurs réelles des données ou de l'effectif (fréquence d'occurrence) de ces valeurs. . vous pouvez afficher toutes les variables dans un tableau unique (Comparer variables) ou bien afficher un tableau statistique séparé pour chaque variable (Séparer résultats par variables). par Valeurs croissantes ou Valeurs décroissantes. Variables multiples : Si vous créez des tableaux statistiques pour des variables multiples. si vous demandez un histogramme ou des centiles.

.

minimum. Les variables peuvent être ordonnées en fonction de la taille de leurs moyennes (en ordre ascendant ou descendant). une pour Brian. une transformation en score z place les variables sur une échelle commune pour que la comparaison soit plus facile.) rapportés chaque jour pendant plusieurs mois. produit domestique brut par personne et pourcentage de la population sachant lire et écrire). une entrée pour Bob. ils sont ajoutés aux données dans l'éditeur de données et sont disponibles pour les diagrammes SPSS. et aplatissement et asymétrie avec leurs erreurs standards (ES). écart type. la procédure Caractéristiques peut calculer les ventes quotidiennes moyennes pour chacun des membres du personnel et ordonner les résultats de la moyenne des ventes la plus élevée à la plus basse. intervalle. variance. erreur standard de la moyenne. somme. 315 . Lorsque les scores z sont enregistrés. Statistiques : Taille de l'échantillon. maximum. une pour Kim. moyenne. les valeurs éloignées et les anomalies de distribution. etc.Caractéristiques 14 Chapitre La procédure Descriptive affiche les résumés de statistiques univariées pour plusieurs variables en un seul tableau et calcule les valeurs standardisées (scores z). Remarques sur les données de Caractéristiques Données : Utilisez des variables numériques après les avoir visualisées graphiquement en cherchant des erreurs d'enregistrement. Exemple : Si chaque observation dans vos données contient les totaux des ventes quotidiennes pour chacun des membres du personnel commercial (par exemple. alphabétiquement ou selon l'ordre dans lequel vous avez sélectionné les variables (par défaut). les listes de données et les analyses. Lorsque les variables sont enregistrées avec des unités différentes (par exemple. La procédure Caractéristiques est très efficace pour les gros fichiers (milliers d'observations).

1000 50.6029 21.00 23.316 Chapitre 14 Hypothèses : La plupart des statistiques disponibles (y compris les écarts z) sont basées sur une théorie normale et conviennent pour des variables quantitatives (mesures de niveau d'intervalle ou de rapport) avec distribution symétrique (évitez les variables avec des modalités désordonnées ou des distributions asymétriques).9000 52.00 Maximum 86.00 71.00 45.00 85.0000 52.2657 17.4617 21.8858 16.00 Moyenne 59. le calcul des écarts z n'est pas une solution aux données posant des problèmes.1305 Ventes de Jean Ventes de Nathalie Ventes de Pierre Ventes de Monique Ventes de Michel Ventes de Karine Ventes de Thomas N valide (observation 10 incomplète) Pour obtenir des statistiques descriptives E A partir du menu.00 85..00 89.00 10 10 10 10 10 10 10 23.9000 52. .00 28.00 83. sélectionnez : Analyse Statistiques descriptives Descriptives. Ainsi.6623 8.00 73.2000 56. La distribution des écarts z a la même forme que celle des données d'origine.5000 Ecarttype 14.2000 56.00 25.8819 16..00 34. Echantillon de résultat Figure 14-1 Résultats de la procédure Caractéristiques Statistiques descriptives N Minimum 42.

317 Caractéristiques Figure 14-2 Boîte de dialogue Caractéristiques E Sélectionnez une ou plusieurs variables. Sinon. „ Cliquer sur Options pour les statistiques optionnelles et l'ordre d'affichage. vous pouvez : „ Cliquez sur Enregistrer des valeurs standardisées dans des variables pour enregistrer les écarts z comme nouvelles variables. .

une distribution normale verra 95 % des observations se situer entre 25 et 65. égale à la somme des carrés des écarts par rapport à la moyenne. l'intervalle.318 Chapitre 14 Options Caractéristiques Figure 14-3 Boîte de dialogue Caractéristiques : Options Moyenne et somme : La moyenne ou moyenne arithmétique s'affiche par défaut. le maximum. 68 % des observations se situent à un écart type de la moyenne et 95 % à deux écarts types. . „ Variance : Mesure de la dispersion des valeurs autour de la moyenne. si la moyenne d'âge est de 45 avec un écart type égal à 10. la variance. le minimum. Par exemple. La variance se mesure en unités. Dispersion : Les statistiques qui mesurent l'étendue ou les variations dans les données comprennent l'écart type. Dans une répartition normale. divisée par le nombre d'observations moins un. et l'erreur standard (ES) de la moyenne. „ Plage : Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum–minimum). qui sont égales au carré des unités de la variable. „ Ecart type : Mesure de la dispersion des valeurs autour de la moyenne.

Cette mesure permet de comparer approximativement la moyenne observée avec une valeur hypothétique (autrement dit. „ Skewness : Mesure de l'asymétrie d'une distribution.319 Caractéristiques „ „ „ Minimum : Valeur la plus petite d'une variable numérique. la valeur de la statistique d'aplatissement est égale à 0. Une distribution caractérisée par une importante asymétrie positive présente une partie droite plus allongée. Dans le cas d'une distribution normale. vous pouvez afficher les variables alphabétiquement. les variables s'affichent dans l'ordre dans lequel vous les avez sélectionnées. En option. Distribution : L'aplatissement et l'asymétrie sont des statistiques qui caractérisent la forme et la symétrie de la distribution. Maximum : Plus grande valeur d'une variable numérique. Pour simplifier. . Une distribution caractérisée par une importante asymétrie négative présente une extrémité gauche plus allongée. Erreur standard de la moyenne : Mesure du taux de variation de la valeur de la moyenne sur des échantillons provenant de la même distribution. La distribution normale est symétrique et a une valeur d'asymétrie égale à zéro. „ Kurtosis : Mesure de l'étendue du regroupement des observations autour d'un point central. Elles sont affichées avec leurs erreurs standards. Un aplatissement négatif signifie que les observations sont moins regroupées et présentent des extrémités plus courtes. par moyennes croissantes ou par moyennes décroissantes. une valeur d'asymétrie deux fois supérieure à l'erreur standard correspond à une absence de symétrie. Ordre d'affichage : Par défaut. vous pouvez conclure que ces deux valeurs sont différentes si le rapport de la différence avec l'erreur standard est inférieur à -2 ou supérieur à +2). Un aplatissement positif indique que les observations sont plus regroupées et présentent des extrémités plus longues que dans le cas d'une distribution normale.

.

maximum. M-estimateur de Huber. Le filtrage de données peut vous indiquer les valeurs inhabituelles. la vérification d'hypothèses et la caractérisation des différences parmi les sous populations (groupes d'observations). moyenne tronquée à 5 %. intervalle. Tukey. L'exploration peut indiquer que vous avez besoin de transformer les données si la technique nécessite une répartition gaussienne. Hampel. les cinq plus grandes et cinq plus petites valeurs. Diagrammes et statistiques : Moyenne. Boîtes à moustaches. erreur standard. Vous pouvez également choisir d'utiliser des tests non paramétriques. asymétrie et aplatissement avec leurs erreurs standard. L'exploration des données peut vous aider à déterminer si les techniques statistiques que vous envisagez d'utiliser pour l'analyse de vos données sont appropriées. centiles. Pour chacun des quatre groupes. histogrammes. écart type. diagrammes de répartition gaussienne. les trous dans les données ou d'autres particularités. diagrammes tige et feuille. le Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour tester la normalité.Explorer 15 Chapitre La procédure Explorer produit des résumés statistiques et des affichages graphiques pour toutes vos observations ou séparément pour des groupes d'observations. et la statistique Shapiro-Wilk. Il existe plusieurs raisons pour utiliser la procédure Explorer : le filtrage de données. Andrews. Les boîtes à moustaches et les diagrammes tige et feuille résument graphiquement la répartition des temps d'apprentissage pour chacun des groupes. la description. Exemple : Examiner la distribution des temps d'apprentissage pour les souris dans un labyrinthe avec quatre programmes de renforcement. intervalle de confiance pour la moyenne (et niveaux de confiance spécifiés). intervalle interquartile. vous pouvez voir si la répartition des temps est approximativement gaussienne et si les quatre variances sont égales. l'identification des valeurs éloignées. variance. minimum. les valeurs extrêmes. et dispersion/niveaux avec le test de Levene et les transformations. Vous pouvez aussi identifier les observations avec les cinq plus grands et les cinq plus petits temps. 321 . médiane.

0 3.334 2 4.5 .000 .7 4.805 4.913 7. 1 2.272 .900 .907 6.289 8.210 1. Ces valeurs peuvent être des chaînes de caractères courtes ou numériques.116 .925 -.350 1.895 5. peut être de courtes chaînes de caractères.1 4.422 3.408 4.445 5.663 8.165 2. Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Statistique Erreur std.5 2.5 1.687 -.559 .0 % Limite supérieure Moyenne tronquée à 5 % Médiane Variance Ecart-type Minimum Maximum Plage Intervalle interquartile Asymétrie Kurtosis Statistique Erreur std. Hypothèses : La distribution de vos données ne doit pas obligatoirement être symétrique ou gaussienne.893 7.982 1.521 2.783 1.250 -. Statistique Erreur std.050 1. de longues chaînes de caractères (15 premiers caractères) ou numériques.889 4.219 .334 .687 -1. Une variable active (utilisée pour répartir les données en groupes d'observations) doit avoir un nombre raisonnable de valeurs distinctes (modalités).900 1.133 2.911 7. La variable d'étiquette par observation.357 9.687 -.760 .334 4 9.197 . Echantillon de résultat Figure 15-1 Résultats d'Explorer Descriptifs Temps Planning Moyenne Intervale de confiance Limite inférieure pour la moyenne à 95.104 1.994 9.761 2.650 .687 -1.850 .606 1.4 2.5 9.322 Chapitre 15 Remarques sur les Données d'Explorer Données : La procédure d'Explorer peut être utilisée pour les variables quantitatives (Mesures de niveaux d'intervalle ou de rapport).387 3.6 2.010 .834 .400 -.335 2.8 10.850 .334 3 6.7 1.3 6. utilisée pour étiqueter les valeurs extrêmes dans les boîtes à moustache.

00 1.1 2..00 3. 568 5 .5 9. 268 8 .00 2 .323 Explorer Valeurs extrêmes Nombre d'observations Chaîne Temps Plus élevé Valeur Plus bas 1 2 3 4 5 1 2 3 4 5 31 33 39 32 36 2 7 1 11 3 4 4 4 4 4 1 1 1 2 1 10.00 3. sélectionnez : Analyse Statistiques descriptives Explorer.3 2.5 9.0 Chaque feuille 1 observation(s) Pour explorer vos données E A partir du menu.0 2..00 4.5 Time Stem-and-Leaf Plot Diagramme Tige et feuille (dans le temps) 7. 13589 10 . 012237 9 . 014577 4 .9 9.8 9. 1379 7 . . 0133589 3 . 5 Largeur de tige 1.3 2.00 5.00 6.00 6.00 5.3 2. 05779 6 .

Cliquez sur Diagrammes pour les histogrammes. les diagrammes de répartition gaussiens avec tests et la dispersion/niveau avec test de Levene. dont les valeurs définiront les groupes d'observations. . Cliquez sur Options pour le traitement des valeurs manquantes. Sélectionner une variable d'identification pour étiqueter les observations. les Valeurs éloignées. vous pouvez : „ „ „ „ „ Sélectionner une ou plusieurs variables actives. les Centiles et les tableaux de fréquences. Cliquer sur Statistiques pour les M-estimateurs. Sinon.324 Chapitre 15 Figure 15-2 Boîte de dialogue Explorer E Sélectionnez au moins une variable dépendante.

M-estimateur de Huber. et 95ième centiles. l'intervalle. 25ième. L'asymétrie et l'aplatissement s'affichent avec leurs erreurs standard. L'intervalle du niveau de confiance à 95 % pour la moyenne s'affiche aussi. Valeurs éloignées : Affiche les cinq plus grandes et cinq plus petites valeurs. Moyennes pondérées : Estimations de la moyenne et de la médiane de l'échantillon pour estimer une localisation du centre. Andrew. Les estimateurs calculés diffèrent selon les pondérations qu'ils appliquent aux observations. 90ième. Centiles : Affiche les valeurs pour le 5ième. Les mesures de dispersion montrent la dissimilarité des valeurs . le maximum. On y trouve la moyenne. 75ième. et l'intervalle interquartile. Hampel. et Tukey apparaissent. Les statistiques descriptives comprennent aussi les mesures de la forme des répartitions. Vous pouvez spécifier un niveau de confiance différent. avec les étiquettes d'observations. la variance. 10ième. le minimum. 50ième. l'écart type. la médiane et la moyenne tronquée à 5 %.325 Explorer Statistiques d'Explorer Figure 15-3 Boîte de dialogue Statistiques Explorer Descriptives : Ces mesures de tendance centrale et de dispersion s'affichent par défaut. on y trouve l'erreur standard. . Les mesures de tendance centrale indiquent la position de la répartition.

La statistique de Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour le test de normalité s'affiche. Dans un affichage. Si des pondérations non entières sont spécifiées. la statistique Shapiro-Wilk est calculée lorsque la taille d'échantillon pondérée est comprise entre 3 et 50. Graphes de répartition gaussiens avec tests : Affiche les diagrammes de répartition gaussiens et les résidus. Cet affichage est particulièrement utile lorsque les différentes variables représentent une seule caractéristique mesurée à des moments différents. le calcul est effectué lorsque la taille d'échantillon pondérée est comprise entre 3 et 5 000. Dépendantes génère un affichage séparé pour chaque groupe défini par une variable active.326 Chapitre 15 Diagrammes d'Explorer Figure 15-4 Boîte de dialogue Explorer : Diagrammes Boîtes à moustaches : Ces alternatives contrôlent l'affichage de boîtes à moustaches quand vous avez plus d'une variable dépendante. Caractéristique : Le groupe caractéristiques vous permet de choisir les diagrammes tige et feuille et les histogrammes. En cas de pondérations entières ou en l'absence de pondération. Niveaux de critère génère un affichage séparé pour chaque variable dépendante. les boîtes à moustache sont données pour chacun des groupes définis par une variable active. les boîtes à moustaches s'affichent côte à côte pour chaque variable dépendante. . Dans un affichage.

en même temps qu'une estimation de la transformation de l'exposant pour arriver à des variances égales dans les cellules. Racine carrée : La racine carrée de chaque valeur des données est calculée. Sans transformation produit des diagrammes de données brutes. Cube : Chaque valeur des données est élevée au cube. Pour transformer les données. Si aucune variable active n'est sélectionnée. Pour tous les diagrammes de dispersion par niveau. 1/racine carrée : La réciproque de la racine carrée est calculée pour chaque valeur des données. Réciproque : La réciproque de chaque valeur des données est calculée. Estimation d'exposants produit un diagramme des logs naturels des intervalles interquartile opposés au logs naturels des médianes pour toutes les cellules. en suivant éventuellement les recommandations de l'estimation de l'exposant et de produire les diagrammes des données transformées. Vous avez le choix entre les options suivantes : „ „ „ „ „ „ Log népérien : Transformation par log naturel. Transformation Exposant vous permet de sélectionner une des alternatives de l'exposant. vous devez sélectionner un exposant pour la transformation. Carré : Chaque valeur des données est élevée au carré. .327 Explorer Dispersion/niveau avec test de Levene : Contrôle les transformations de données pour les diagrammes de dispersion par niveau. Ceci est équivalent à une transformation avec une puissance de 1. Transformations de l'exposant d'Explorer Voici les transformations de l'exposant pour les diagrammes de dispersion par niveau. L'intervalle interquartile et la médiane des données transformées sont dessinés. les tests de Levene sont basés sur les données transformées. la pente de la ligne de régression et les tests de Levene portant sur l'homogénéité de la variance s'affichent. les diagrammes de dispersion par niveau ne sont pas produits. Un diagramme de dispersion par niveau aide à déterminer l'exposant pour qu'une transformation stabilise (rende plus égales) les variances entre groupes. Si vous sélectionnez une transformation. Il s'agit de la valeur par défaut.

„ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre des variables dépendantes ou actives sont exclues de toutes les analyses.328 Chapitre 15 Options d'Explorer Figure 15-5 Boîte de dialogue Explorer : Options Valeurs manquantes : Contrôle le traitement des valeurs manquantes. . „ Signaler les valeurs manquantes : Les valeurs manquantes pour les variables actives sont traitées comme une modalité séparée. Tout résultat est produit pour cette modalité supplémentaire. L'observation peut avoir des valeurs manquantes pour les variables utilisées dans d'autres groupes. mais étiquetées comme manquantes. Les valeurs manquantes pour une variable active sont inclues. Les tableaux de fréquences contiennent les modalités pour les valeurs manquantes. „ Exclure seulement les composantes non valides : Les observations sans valeur manquante pour une variable dans un groupe (cellule) sont inclues dans l'analyse de ce groupe. Il s'agit de la valeur par défaut.

tau de Goodman et Kruskal. phi. Khi-deux corrigé de Yates. coefficient de contingence. gamma. vous pourriez apprendre que la majorité des PME (moins de 500 salariés) génèrent des bénéfices de services élevés. r de Pearson. Kappa de Cohen. alors que la majorité des grandes sociétés (plus de 2 500 salariés) rapportent des bénéfices de services bas. Statistiques et mesures d'association : Khi-deux de Pearson. V de Cramer. d de Somer. routinière ou ennuyeuse). test d'association linéaire par linéaire. Si vous spécifiez une ligne. coefficient d'incertitude. lambdas symétriques et asymétriques. odds ratio. estimation de risque relatif. une colonne et une strate de facteur (variable de contrôle). Khi-deux du rapport de vraisemblance. test de McNemar. tau-b de Kendall. SPSS forme un tableau de statistiques et de mesures pour chaque valeur de la strate de facteur (ou une combinaison de valeurs pour deux variables de contrôle ou plus). si le sexe est un facteur de strate pour un tableau marié (oui. non) face à la vie (est excitante. 329 . et statistiques de Cochran et Mantel-Haenszel. rho de Spearman. coefficient êta. Exemple : Les clients de PME ont-ils plus de probabilités d'être rentables en ventes de services (par exemple. test exact de Fisher. La structure du tableau et l'ordre des modalités déterminent quels test ou mesures effectuer. tau-c de Kendall. Par exemple. Les statistiques et les mesures d'association de tableaux croisés ne sont calculées que pour les tableaux à deux entrées. formation et conseil) que ceux de grandes sociétés ? A partir d'une tabulation croisée.Tableaux croisés 16 Chapitre La procédure de tableaux croisés établit des tableaux à deux entrées ou à entrées multiples et permet 22 tests et mesures d'associations pour les tableaux à deux entrées. les résultats d'un tableau à deux entrées pour les femmes sont calculés séparément de ceux des hommes et affichés sous forme de tableaux consécutifs.

Remarque : Les variables ordinales peuvent être des codes numériques représentant des modalités (par exemple. 3 = élevé) ou des valeurs de chaîne. Faible ou Moyen. il est recommandé d'utiliser les codes numériques pour représenter les données ordinales. 1 = faible. Par exemple. tel que décrit dans la section sur les statistiques. Toutefois. pour sexe. coefficient de contingence). l'ordre des modalités est interprété comme Elevé. pour une variable chaîne comportant des valeurs Faible. Par exemple. utilisez des variables numériques ou des variables sous forme de chaînes de caractères courtes (huit caractères ou moins). vous pouvez codifier les données avec 1 et 2. ce qui ne correspond pas à l'ordre correct. Pour les statistiques basées sur le test Khi-deux (phi. 2 = moyen. ou avec homme et femme. D'autres sont valides lorsque les variables du tableau ont des modalités désordonnées (données nominales). V de Cramer. les données doivent provenir d'un échantillon aléatoire avec une répartition multinomiale. Elevé. Hypothèses : Des statistiques et des mesures partent du principe de modalités ordonnées (données ordinales) ou de valeurs quantitatives (données d'intervalle ou données de type ratio). En règle générale. . l'ordre alphabétique des valeurs de chaîne est supposé refléter l'ordre réel des modalités. Moyen.330 Chapitre 16 Remarques sur les Données pour tableau croisé Données : Pour définir les modalités de chaque variable du tableau.

sélectionnez : Analyse Statistiques descriptives Tableaux croisés... .331 Tableaux croisés Echantillon de résultat Figure 16-1 Résultats de tableau croisé Rentabilité du service * Tabulation croisée de l'entreprise Rentabilité du service Bas Elevé Taille de l'entreprise Tests du Khi-deux Signification asymptotique (bilatérale) Valeur Chi-deux de Pearson Rapport de vraissemblance Association linéaire par linéaire N d'observations valides Pour obtenir des tableaux croisés E A partir du menu.

„ Cliquer sur Statistiques pour les tests et les mesures d'association pour les tableaux „ „ Cliquez sur Cellules pour les valeurs observées et théoriques.332 Chapitre 16 Figure 16-2 Boîte de dialogue Tableaux croisés E Sélectionnez des lignes de variables et des colonnes de variables. les pourcentages et les résidus. une variable de colonne. vous pouvez : „ Sélectionner des variables de contrôle. si vous avez une variable de ligne. un tableau croisé séparé est produit pour chacune des modalités de variable de strate (variable de contrôle). Cliquez sur Format pour contrôler l'ordre des modalités. et une variable de strate avec deux modalités. à deux entrées ou les sous-tableaux. vous obtenez un tableau à deux entrées pour chacune des modalités de la variable de strate. Sinon. Les sous-tableaux sont produits pour chaque combinaison de modalités . Pour créer une autre strate de variables de contrôle. cliquez sur Suivant. Par exemple. Strates de tableaux croisés Si vous sélectionnez des variables de strate.

Statistiques de tableaux croisés Figure 16-3 Boîte de dialogue Tableaux croisé : Statistiques Khi-deux : Pour les tableaux avec deux lignes et deux colonnes. Si les statistiques et les mesures d'association sont requises. le Khi-deux du rapport de vraisemblance.333 Tableaux croisés pour chaque variable de premier niveau avec chaque variable de second niveau et ainsi de suite. Si vous spécifiez plus d'une variable dans Colonnes ou Lignes. elles ne s'appliquent qu'aux sous-tableaux à deux entrées. La variable qui définit les bâtons dans chaque regroupement est la variable que vous avez spécifiée dans Colonne(s). sélectionnez Khi-deux pour calculer le Khi-deux de Pearson. Diagrammes en bâtons juxtaposés de tableaux croisés Affichage de diagrammes en bâtons juxtaposés : Un diagramme en bâtons juxtaposés vous permet de résumer vos données pour des groupes d'observations. Il y a un regroupement de bâtons pour chaque valeur de la variable que vous avez spécifiée dans Ligne(s). . un diagramme en bâtons juxtaposés est produit pour chaque combinaison de deux variables. le test exact de Fisher et le test du Khi-deux de Yates corrigé (correction de continuité). Il y a un ensemble de bâtons de couleurs ou de motifs différents pour chaque valeur de cette variable.

La valeur 1 signifie que la variable indépendante prévoit parfaitement la variable dépendante. comme Catholique. le test exact de Fisher est calculé lorsqu'un tableau qui ne provient pas de lignes ou de colonnes manquantes dans un tableau plus grand présente une cellule avec une fréquence attendue inférieure à 5. Par exemple. sélectionnez Khi-deux pour calculer le Khi-deux de Pearson et le rapport de vraisemblance du Khi-deux. Lorsque les deux variables du tableau sont quantitatives. La valeur 0 signifie que la variable indépendante ne prévoit pas du tout la variable dépendante. vous pouvez sélectionner le coefficient Phi et V de Cramér. „ Coefficient de contingence : Mesure d'association basée sur le Khi-deux. rho (données numériques seulement). Protestant. les corrélations donnent le coefficient de corrélation de Spearman. Nominal : Pour les données nominales (sans ordre intrinsèque. le Khi-deux donne le test d'association linéaire par linéaire. Corrélations : Pour les tableaux dans lesquels les lignes et les colonnes contiennent des valeurs ordonnées. Le Spearman rho est une mesure d'association entre les ordres de rang. et les valeurs proches de 1 indiquant un degré d'association élevé entre les variables.334 Chapitre 16 Pour les tableaux 2 × 2. „ Phi et V de Cramer : Mesure d'association calculée à partir du Khi-deux. Lorsque les deux variables (facteurs) du tableau sont quantitatives. une mesure de l'association linéaire entre les variables. La valeur maximale possible dépend du nombre de lignes et de colonnes dans le tableau. et tau de Goodman et Kruskal) et le coefficient d'incertitude. Le V de Cramer est également une mesure d'association basée sur le Khi-deux. r. le coefficient de contingence. „ Coefficient d'incertitude : Mesure d'association qui indique la réduction proportionnelle de l'erreur lorsque les valeurs d'une variable sont utilisées pour prévoir celles d'une autre. Lambda (lambdas symétriques et asymétriques. la valeur 0. les corrélations donnent le coefficient de corrélation de Pearson. Juif). Les valeurs sont toujours comprises entre 0 et 1. „ Lambda : Mesure d'association reflétant la réduction proportionnelle de l'erreur lorsque les valeurs de la variable indépendante sont utilisées pour prévoir la variable dépendante. Le Khi-deux corrigé de Yates est calculé pour tous les autres tableaux 2 × 2. puis en prenant la racine carrée du résultat. Pour les tableaux avec n'importe quel nombre de lignes ou de colonnes.83 indique que la connaissance d'une variable réduit de 83 % l'erreur dans les prévisions de . zéro indiquant l'absence d'association entre les variables de ligne et de colonne. Elle est obtenue en divisant la statistique du Khi-deux par la taille de l'échantillon.

Les valeurs proches d'une valeur absolue de 1 indiquent une relation forte entre les deux variables. „ Gamma : Mesure d'association symétrique entre deux variables ordinales. les gammas conditionnels apparaissent. Pour les tableaux d'ordre 3 et les tableaux d'ordre n. les valeurs absolues les plus grandes indiquant les relations les plus fortes. Les valeurs proches de zéro indiquent une relation faible ou inexistante. les gammas d'ordre 0 (zéro) apparaissent.335 Tableaux croisés l'autre variable. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force. Pour les tableaux d'ordre 2. les valeurs absolues les plus grandes indiquant les relations les plus fortes. Le programme calcule également une version symétrique de cette statistique. le tau-b de Kendall et le tau-c de Kendall. Cette mesure est située entre -1 et 1. Les valeurs peuvent varier de -1 à +1 mais une valeur de -1 ou de +1 ne peut toutefois être obtenue que dans des tableaux carrés. Le d de Somer est une extension asymétrique du gamma. . Ordinal : Pour les tableaux dont les lignes et les colonnes contiennent des valeurs ordonnées. Le signe du coefficient indique la direction de la relation et sa valeur absolue indique sa force. et celles proches de zéro indiquent une relation faible ou inexistante entre les variables. sélectionnez le d de Somers. „ D de Somers : Mesure d'intensité de la relation entre deux variables ordinales. Le programme calcule à la fois des versions symétriques et asymétriques de ce coefficient. qui ne diffère de celui-ci que par l'inclusion du nombre de paires non liées à la variable indépendante. Les valeurs peuvent varier de -1 à +1 mais une valeur de -1 ou de +1 ne peut toutefois être obtenue que dans des tableaux carrés. sélectionnez Gamma (ordre zéro pour les tableaux à 2 entrées et conditionnel pour les tableaux de 3 à 10 entrées). qui s'étend de -1 à 1. Les valeurs proches de 1 indiquent une forte relation entre les deux variables. Pour prévoir les modalités de colonnes à partir des modalités de lignes. „ Tau-b de Kendall : Mesure de corrélation non paramétrique pour variables ordinales ou classées qui prend en considération les ex aequo. „ Tau-c de Kendall : Mesure d'association non paramétrique pour variables ordinales qui ne prend pas en considération les ex aequo.

Si l'intervalle de confiance de la statistique inclut une valeur de 1. Il recherche les changements de réponse en utilisant la répartition Khi-deux. La variable qualitative doit être codée numériquement.336 Chapitre 16 Données nominales x intervalle : Lorsqu'une variable est qualitative et l'autre quantitative. . L'odds ratio peut être utilisé comme estimation du risque relatif dans le cas où la réalisation du facteur est rare. les statistiques de Cochran et de Mantel-Haenszel sont calculées une seule fois pour toutes les strates. le revenu) et une variable indépendante ayant un nombre limité de modalités (par exemple. Pour les tableaux carrés plus volumineux. le test McNemar-Bowker de symétrie est reporté. „ Eta : Mesure d'association dont les valeurs sont comprises entre 0 et 1. La valeur 0 indique que la concordance ne dépasse pas celle due au hasard. Eta convient à une variable dépendante continue mesurée sur une échelle d'intervalle (par exemple. et les valeurs proches de 1 indiquant un degré d'association élevé. Le Kappa n'est disponible que pour les tableaux dans lesquels les deux variables utilisent les mêmes valeurs de modalité et possèdent le même nombre de modalités. Remarque alors que les autres statistiques sont calculées strate par strate. le sexe). 0 indiquant l'absence d'association entre les variables de ligne et de colonne. mesure de la force de l'association entre la présence d'un facteur et la réalisation d'un événement. Ce test est utile pour détecter les changements avant-après dans les réponses dus à une intervention expérimentale dans les plans. Statistiques de Cochran et de Mantel-Haenszel : Les statistiques de Cochran et de Mantel-Haenszel peuvent être utilisées pour tester l'indépendance présente entre une variable active dichotomique et une variable de réponse dichotomique. sélectionnez Eta. Deux valeurs eta sont calculées L'une traite la variable de ligne comme variable d'intervalle et l'autre traite la variable de colonne comme variable d'intervalle. McNemar : Test non paramétrique pour deux variables dichotomiques liées. il n'existe aucune association entre le facteur et l'événement. Risque : Pour les tableaux 2 x 2. La valeur 1 indique une concordance parfaite. conditionnelle à des modèles covariés définis par une ou plusieurs variables de strate (de contrôle). Kappa : Le Kappa de Cohen mesure la concordance entre deux indicateurs lorsque les deux servent à évaluer le même objet.

Effectif : Nombre d'observations effectivement observées et nombre d'observations attendues si les variables de ligne et de colonne sont indépendantes l'une de l'autre. „ Non standardisés : Différence entre une valeur observée et la valeur théorique. . Les pourcentages du nombre total d'observations représentées dans le tableau (une strate) sont également disponibles. Les résidus standardisés et standardisés ajustés sont également disponibles. Chaque cellule du tableau peut contenir toute combinaison d'effectifs. Pourcentages : Les pourcentages peuvent s'additionner par ligne ou par colonne. Résidus : Les résidus non standardisés donnent la différence entre les valeurs observées et les valeurs théoriques. La valeur théorique correspond au nombre d'observations attendues dans la cellule quand il n'existe pas de relation entre les deux variables. Un résidu positif indique que la cellule contient plus d'observations que si les variables de ligne et de colonne étaient indépendantes. de pourcentages et de résidus sélectionnés.337 Tableaux croisés Affichage de cellules (cases) de tableaux croisés Figure 16-4 Boîte de dialogue Tableaux croisés : Contenu des cases (cellules) Pour vous aider à découvrir des types dans les données qui contribuent à un test du Khi-deux significatif. la procédure de Tableaux croisés affiche les fréquences attendues et trois types de résidus (déviations) qui mesurent la différence entre les fréquences observées et les fréquences attendues.

„ des effectifs de cellules non entiers sont également utilisés. „ Poids des observations tronqués : Les pondérations sont tronquées avant utilisation. les résidus standardisés ont une moyenne de 0 et un écart type de 1. Toutefois. si le fichier de données est pondéré par une variable de pondération avec des fractions (par exemple. ou utiliser des effectifs de cellules non entiers pour l'affichage des tableaux et les calculs statistiques. les effectifs de cellules sont des valeurs entières. mais les pondérations cumulées dans les cellules sont tronquées avant le calcul de toute statistique.338 Chapitre 16 „ Standardisés : Résidu divisé par une estimation de son écart type.25). Egalement appelés résidus de Pearson. Aucun ajustement : Les pondérations d'observation sont utilisées telles quelles . „ Effectifs de cellules arrondis : Les pondérations d'observation sont utilisées telles quelles. lorsque des statistiques exactes (disponibles uniquement avec l'option Tests exacts) sont demandées. les pondérations cumulées dans les cellules sont tronquées ou arrondies avant le calcul des statistiques du test exact. Pondérations non entières : En général. „ Poids des observations arrondis : Les pondérations sont arrondies avant utilisation. „ Standardisés ajustés : Résidu d'une cellule (valeur observée moins valeur théorique) divisé par une estimation de son erreur standard. mais les pondérations cumulées dans les cellules sont arrondies avant le calcul de toute statistique. Le résidu standardisé qui en résulte est exprimé en écarts par rapport à la moyenne. Vous pouvez tronquer ou arrondir les valeurs avant ou après le calcul des effectifs de cellules. . 1. car ils représentent le nombre d'observations figurant dans chaque cellule. les effectifs de cellules peuvent également être des fractions. Toutefois. „ Effectifs de cellules tronqués : Les pondérations d'observation sont utilisées telles quelles.

339 Tableaux croisés Format de tableau croisé Figure 16-5 Boîte de dialogue Tableaux croisés : Format Vous pouvez arranger les lignes par ordre croissant ou décroissant de valeur de la variable de ligne. .

.

Les statistiques Récapituler sont affichées pour chaque variable à travers toutes les modalités. Statistiques : Somme. Exemple : Quel est le montant moyen de ventes de produits par région et par secteur de clientèle ? Vous pouvez découvrir que le montant moyen des ventes est légèrement plus élevé dans la région Ouest que dans les autres régions. Les autres variables doivent pouvoir être classées. avec des sociétés commerciales dans la région Ouest apportant le montant moyen de ventes le plus élevé. 341 . pourcentage de la somme totale. écart type. aplatissement. médiane groupée. Le nombre de modalités doit être raisonnablement limité. nombre d'observations. Récapituler les commentaires de données Données : Les variables de regroupement sont des variables qualitatives dont les valeurs peuvent être numériques ou alphanumériques. erreur standard d'asymétrie. Avec d'importants groupes de données. erreur standard pour la moyenne. Vous pouvez choisir l'ordre dans lequel les statistiques sont affichées. Les valeurs des données dans chaque modalité peuvent être listées ou supprimées.Récapituler 17 Chapitre La procédure Récapituler calcule les statistiques de sous-groupes pour les variables à l'intérieur des modalités de variables de regroupement. pourcentage de la somme dans. moyenne. valeur de la variable pour la première modalité de la variable de regroupement. médiane. minimum. variance. pourcentage de N dans. Tous les niveaux de variables de regroupement sont à tabulation croisée. moyennes géométrique et harmonique. plage. vous pouvez choisir de lister seulement les premières observations n. valeur de la variable pour la dernière modalité de la variable de regroupement. asymétrie. maximum. erreur standard d'aplatissement. pourcentage de N total.

. Les statistiques robustes telles que la médiane et l'intervalle. Echantillon de résultat Figure 17-1 Récapituler Résultat Résumés d'observations Moyenne des ventes de produit par région et industrie Industrie Région Est Centre Ouest Gouvernement Finance Education Santé Total Obtenir des récapitulatifs des observations E A partir du menu.. conviennent aux variables quantitatives qui confirment ou infirment l'hypothèse de normalité.342 Chapitre 17 Hypothèses : Certains des sous-groupes statistiques optionnels. . sélectionnez : Analyse Rapports Récapitulatif des observations. tels que la moyenne et l'écart type sont basés sur la théorie normale et conviennent aux variables quantitatives ayant une distribution symétrique.

. Par défaut. vous pouvez : „ „ „ „ Sélectionner au moins une variable de regroupement afin de diviser vos données en sous-groupes. ou exclure les observations ayant des valeurs manquantes. Cliquer sur Statistiques pour obtenir des statistiques facultatives.343 Récapituler Figure 17-2 Boîte de dialogue Rapport récapitulatif E Sélectionnez une ou plusieurs variables. Sélectionner Afficher les observations afin de répertorier les observations dans chaque sous-groupe. ajouter une légende au-dessous du résultat. Sinon. Cliquer sur Options afin de modifier le titre du résultat. Vous pouvez augmenter ou diminuer la valeur de l'option Limiter les observations aux n premières ou désélectionner cet élément pour répertorier toutes les observations. le système ne liste que les 100 premières observations de votre fichier.

sinon.344 Chapitre 17 Options de Récapituler Figure 17-3 Boîte de Dialogue Options de Rapport récapitulatif SPSS vous permet de modifier le titre de votre résultat ou d'ajouter une légende qui apparaîtra en dessous du tableau de sortie. ou un code que vous souhaitez voir apparaître lorsqu'une valeur manque. Vous pouvez également choisir d'afficher ou de supprimer les sous-en-têtes des totaux et d'inclure ou d'exclure les observations ayant des valeurs manquantes pour toute variable prise en compte dans toute analyse. aucun traitement spécial ne s'applique aux observations manquantes dans le résultat. Saisir un caractère. une phrase. . Vous pouvez contrôler les sauts de ligne dans les titres et légendes en tapant \n à tous les endroits où vous voulez insérer un saut de ligne dans le texte. Il est souvent souhaitable de marquer les observations manquantes dans le résultat par un point ou un astérisque.

maximum. pourcentage de la somme dans. erreur standard d'aplatissement. valeur de la variable pour la dernière modalité de la variable de regroupement. pourcentage de N dans.345 Récapituler Récapituler les statistiques Figure 17-4 Boîte de Dialogue Rapport récapitulatif Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables à l'intérieur de chaque modalité de chacune des variables de regroupement : Somme. pourcentage de N total. nombre d'observations. moyenne. écart type. Les statistiques récapitulatives sont aussi affichées pour chaque variable à travers toutes les modalités. médiane groupée. . intervalle. erreur standard pour la moyenne. minimum. pourcentage de somme totale. n représentant le nombre d'observations. moyenne géométrique. Moyenne géométrique : Racine nième du produit des valeurs de données. erreur standard d'asymétrie. aplatissement. valeur de la variable pour la première modalité de la variable de regroupement. asymétrie. moyenne harmonique. Première : Affiche la première valeur rencontrée dans le fichier de données. variance. L'ordre dans lequel les statistiques apparaissent dans la liste Variables correspond à celui dans lequel elles seront affichées dans le résultat. médiane.

la valeur de la statistique d'aplatissement est égale à 0.346 Chapitre 17 Médiane de groupes : Médiane calculée pour les données codées en groupes. somme divisée par le nombre d'observations. Dernière : Affiche la dernière valeur rencontrée dans le fichier de données. Si le nombre d'observations est pair. Kurtosis : Mesure de l'étendue du regroupement des observations autour d'un point central. chaque valeur de la quarantaine est codée 45. Un aplatissement négatif signifie que les observations sont moins regroupées et présentent des extrémités plus courtes. à l'inverse de la moyenne. Plage : Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum–minimum). si chaque valeur de la trentaine est codée 35. la médiane correspond à la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordre croissant ou décroissant. pour les données d'âge. Un aplatissement positif indique que les observations sont plus regroupées et présentent des extrémités plus longues que dans le cas d'une distribution normale. La médiane est une mesure de tendance centrale et elle n'est pas. Maximum : Plus grande valeur d'une variable numérique. Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque modalité. Moyenne arithmétique . Par exemple. etc. Minimum : Valeur la plus petite d'une variable numérique. sensible aux valeurs éloignées. 50e centile.. la médiane de groupes est la médiane calculée à partir des données codées. Moyenne harmonique : Fonction utilisée pour estimer la taille moyenne d'un groupe lorsque la taille des échantillons diffère d'un groupe à l'autre. Moyenne : Mesure de la tendance centrale. Pourcentage de la somme totale : Pourcentage de la somme totale dans chaque modalité. Dans le cas d'une distribution normale. . N : Nombre d'observations (ou d'enregistrements). Médiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moitié des observations . La moyenne harmonique correspond au nombre total d'échantillons divisé par la somme des réciproques des tailles de l'échantillon.

Pour simplifier. La variance se mesure en unités. qui sont égales au carré des unités de la variable. une valeur d'aplatissement négative présente des extrémités plus courtes (semblables à celles d'une distribution uniforme sous forme de boîtes). . Somme : Somme ou total des valeurs. Erreur standard du Skewness : Rapport de l'asymétrie avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit. une valeur d'asymétrie deux fois supérieure à l'erreur standard correspond à une absence de symétrie. Variance : Mesure de la dispersion des valeurs autour de la moyenne. égale à la somme des carrés des écarts par rapport à la moyenne. Une valeur d'asymétrie positive importante indique une extrémité allongée vers la droite . Une distribution caractérisée par une importante asymétrie positive présente une partie droite plus allongée. Une distribution caractérisée par une importante asymétrie négative présente une extrémité gauche plus allongée. La distribution normale est symétrique et a une valeur d'asymétrie égale à zéro. divisée par le nombre d'observations moins un. une valeur négative extrême produit une extrémité allongée vers la gauche. Une valeur d'aplatissement positive importante indique que les extrémités de la distribution sont plus allongées que celles d'une distribution normale . vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit.347 Récapituler Skewness : Mesure de l'asymétrie d'une distribution. pour toutes les observations n'ayant pas de valeur manquante.

.

variance. Les options comportent une analyse de la variance. écart type. minimum. pourcentage de N dans. ainsi que des tests de linéarité R et R2. moyennes géométrique et harmonique. maximum. médiane. un coefficient êta-carré. nombre d'observations. pourcentage de la somme dans. pourcentage de N total. erreur standard d'asymétrie. Les statistiques robustes telles que la médiane et l'intervalle. aplatissement. Statistiques : Somme. Vous pouvez également obtenir une analyse à un facteur de la variance. Exemple : Mesurez la quantité moyenne de lipides absorbée par trois différents types d'huile alimentaire et effectuez une analyse à un facteur de la variance pour voir si les moyennes divergent. erreur standard pour la moyenne. Les valeurs des variables qualitatives peuvent être soit numériques. plage. tels que la moyenne et l'écart type sont basés sur la théorie normale et conviennent aux variables quantitatives ayant une distribution symétrique. valeur de la variable pour la dernière modalité de la variable de regroupement. Remarques sur les données des moyennes Données : Les variables dépendantes sont quantitatives et les variables indépendantes sont qualitatives. médiane groupée. asymétrie. pourcentage de la somme totale. un coefficient êta et des tests de linéarité. erreur standard d'aplatissement.Moyennes 18 Chapitre La procédure des moyennes calcule les moyennes de sous-groupes et les statistiques univariées correspondantes pour des variables dépendantes au sein des modalités d'une ou de plusieurs variables indépendantes. moyenne. un coefficient êta. conviennent aux variables quantitatives qui confirment ou infirment 349 . soit des chaînes courtes. Hypothèses : Certains des sous-groupes statistiques optionnels. valeur de la variable pour la première modalité de la variable de regroupement.

824 Sig.000 df Grammes de graisse absorbée * Type d'huile Entre groupes Combiné Dans les groupes Total F 7.00 6 13.000 Carré moyen 2 15 17 798.000 3126.000 102.22 73.005 . Echantillon de résultat Figure 18-1 Résultat des moyennes Rapport Grammes de graisse absorbée Type d'huile Huile d'arachide Moyenne N Ecart-type Saindoux Moyenne N Ecart-type Huile de maïs Moyenne N Ecart-type Total Moyenne N Ecart-type 72.350 Chapitre 18 l'hypothèse de normalité. L'analyse de la variance résiste aux écarts par rapport à la normalité.00 6 8. L'analyse de la variance part également du principe que les groupes sont issus de populations ayant la même variance.000 1530. Pour vérifier cette hypothèse. disponible dans la procédure ANOVA à un facteur. .00 6 7.00 18 13.34 85.56 Tableau ANOVA Somme des carrés 1596. à condition que les données de chaque cellule soient symétriques. utilisez le test d'homogénéité de la variance de Levene.77 62.

vous disposez de deux méthodes : „ „ Sélectionnez une ou plusieurs variables indépendantes. par opposition aux tableaux séparés pour chaque variable indépendante. êta. . Des résultats distincts sont présentés pour chaque variable indépendante. Si vous avez une variable indépendante dans la strate 1 et une dans la strate 2. les résultats sont présentés dans un tableau croisé. vous pouvez : „ Cliquez sur Options pour obtenir des statistiques facultatives. telles que la table d'analyse de la variance. R et R2.. E Pour sélectionner les variables indépendantes qualitatives.351 Moyennes Pour obtenir des moyennes de sous-groupes E A partir du menu. Chaque strate divise une nouvelle fois l'échantillon. Figure 18-2 Boîte de dialogue Moyennes E Sélectionnez au moins une variable dépendante. Sélectionnez une ou plusieurs strates des variables indépendantes. sélectionnez : Analyse Comparer les moyennes Moyennes. êta-carré.. E Sinon.

Moyenne géométrique : Racine nième du produit des valeurs de données. pourcentage de la somme dans. nombre d'observations. maximum. Vous pouvez changer l'ordre de présentation des statistiques des sous-groupes. minimum. aplatissement. erreur standard d'aplatissement. moyenne harmonique. valeur de la variable pour la dernière modalité de la variable de regroupement. pourcentage de N total. médiane. erreur standard d'asymétrie. valeur de la variable pour la première modalité de la variable de regroupement. écart type. Première : Affiche la première valeur rencontrée dans le fichier de données. erreur standard pour la moyenne.352 Chapitre 18 Moyennes : Options Figure 18-3 Boîte de dialogue Moyennes : Options Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables à l'intérieur de chaque modalité de chacune des variables de regroupement : Somme. n représentant le nombre d'observations. moyenne géométrique. intervalle. moyenne. pourcentage de N dans. Les statistiques récapitulatives sont aussi affichées pour chaque variable à travers toutes les modalités. L'ordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond à celui dans lequel elles seront affichées dans le résultat. . pourcentage de somme totale. asymétrie. variance. médiane groupée.

Moyenne : Mesure de la tendance centrale. La moyenne harmonique correspond au nombre total d'échantillons divisé par la somme des réciproques des tailles de l'échantillon. Dans le cas d'une distribution normale. Si le nombre d'observations est pair. Pourcentage de somme totale : Pourcentage de la somme totale dans chaque modalité. etc. La médiane est une mesure de tendance centrale et elle n'est pas. la valeur de la statistique d'aplatissement est égale à 0. chaque valeur de la quarantaine est codée 45. Dernière : Affiche la dernière valeur rencontrée dans le fichier de données. Un aplatissement négatif signifie que les observations sont moins regroupées et présentent des extrémités plus courtes. pour les données d'âge. Minimum : Valeur la plus petite d'une variable numérique. Kurtosis : Mesure de l'étendue du regroupement des observations autour d'un point central. la médiane correspond à la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordre croissant ou décroissant. . la médiane de groupes est la médiane calculée à partir des données codées. Maximum : Plus grande valeur d'une variable numérique.. 50e centile. Un aplatissement positif indique que les observations sont plus regroupées et présentent des extrémités plus longues que dans le cas d'une distribution normale. Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque modalité. Plage : Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum–minimum). Médiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moitié des observations . Moyenne harmonique : Fonction utilisée pour estimer la taille moyenne d'un groupe lorsque la taille des échantillons diffère d'un groupe à l'autre. à l'inverse de la moyenne. somme divisée par le nombre d'observations. sensible aux valeurs éloignées. si chaque valeur de la trentaine est codée 35. N : Nombre d'observations (ou d'enregistrements). Moyenne arithmétique .353 Moyennes Médiane de groupes : Médiane calculée pour les données codées en groupes. Par exemple.

une valeur négative extrême produit une extrémité allongée vers la gauche. divisée par le nombre d'observations moins un. Test de linéarité : Calcule la somme des carrés. Variance : Mesure de la dispersion des valeurs autour de la moyenne. le R et le R-deux. vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeur d'aplatissement positive importante indique que les extrémités de la distribution sont plus allongées que celles d'une distribution normale . Statistiques pour première strate Tableau ANOVA et êta : Affiche un tableau d'analyse unifactorielle de la variance et calcule êta et êta carré (mesures de l'association) pour chaque variable indépendante de la première strate. qui sont égales au carré des unités de la variable. Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit. Erreur standard du Skewness : Rapport de l'asymétrie avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit. Somme : Somme ou total des valeurs. La distribution normale est symétrique et a une valeur d'asymétrie égale à zéro. Une distribution caractérisée par une importante asymétrie négative présente une extrémité gauche plus allongée. . Une distribution caractérisée par une importante asymétrie positive présente une partie droite plus allongée. vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). ainsi que le rapport F. Pour simplifier. une valeur d'asymétrie deux fois supérieure à l'erreur standard correspond à une absence de symétrie. pour toutes les observations n'ayant pas de valeur manquante. La linéarité n'est pas calculée si la variable indépendante est une chaîne courte. Une valeur d'asymétrie positive importante indique une extrémité allongée vers la droite .354 Chapitre 18 Skewness : Mesure de l'asymétrie d'une distribution. La variance se mesure en unités. les degrés de liberté et le carré moyen associés aux composants linéaires et non linéaires. égale à la somme des carrés des écarts par rapport à la moyenne. une valeur d'aplatissement négative présente des extrémités plus courtes (semblables à celles d'une distribution uniforme sous forme de boîtes).

moyenne géométrique et moyenne harmonique. les moyennes et autres statistiques univariées pour des variables récapitulatives continues à l'intérieur de modalités d'une ou plusieurs variables de regroupement qualitatives. minimum. erreur standard pour la moyenne. pourcentage des observations totales dans les variables de regroupement. nombre d'observations. Hypothèses : Certains des sous-groupes statistiques optionnels. soit des chaînes courtes. asymétrie. Les valeurs des variables qualitatives peuvent être soit numériques. médiane. écart type. intervalle. Les statistiques robustes telles que 355 . aplatissement.Cubes OLAP 19 Chapitre La procédure de Cubes OLAP (Online Analytical Processing) calcule les totaux. médiane groupée. valeur de la variable pour la dernière modalité de la variable de regroupement. Statistiques : Somme. moyenne. variance. Une strate séparée dans le tableau est créée pour chaque modalité de chaque variable de regroupement. Exemple : Ventes totales et moyennes pour différentes régions et lignes de produits à l'intérieur de chaque région. Remarques sur les données des cubes OLAP Données : Les variables récapitulatives sont quantitatives (variables continues mesurées sur une échelle d'intervalle ou de rapport) et les variables de regroupement sont qualitatives. pourcentage des observations totales. pourcentage de la somme totale dans les variables de regroupement. valeur de la variable pour la première modalité de la variable de regroupement. tels que la moyenne et l'écart type sont basés sur la théorie normale et conviennent aux variables quantitatives ayant une distribution symétrique. erreur standard d'aplatissement. erreur standard d'asymétrie. maximum. pourcentage de somme totale.

00 Ecart-type $80.814.893 $307.100 Moyenne $289.500 $171..674.250 $371. Echantillon de résultat Figure 19-1 Résultat des cubes OLAP Ventes pour 1996 par division et région Division : total Région : total Somme Moyenne Médiane Ecart-type $145.038.548.06 Médiane $273. conviennent aux variables quantitatives qui confirment ou infirment l'hypothèse de normalité. sélectionnez : Analyse Rapports Cubes OLAP.66 Pour obtenir des cubes OLAP E A partir du menu.356 Chapitre 19 la médiane et l'intervalle.600..311 Ventes pour 1996 par division et région Division : produits de consommation Région : est Somme $18. .

vous pouvez : „ Sélectionner d'autres statistiques récapitulatives (cliquez sur Statistiques.. Calculer les différences existant entre des paires de variables et des paires de groupes définies par une variable de regroupement (cliquez sur Différences).357 Cubes OLAP Figure 19-2 Boîte de dialogue Cubes OLAP E Sélectionnez une ou plusieurs variables récapitulatives continues. Créer des titres de tableaux personnalisés (cliquez sur Titre). E Sélectionnez une ou plusieurs variables qualitatives. „ „ . Vous devez sélectionner un ou plusieurs critères de regroupement pour pouvoir sélectionner les statistiques récapitulatives. Sinon.)..

L'ordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiques correspond à celui dans lequel elles seront affichées dans le résultat. Vous pouvez changer l'ordre de présentation des statistiques des sous-groupes. Médiane. Médiane de groupes. Premier (valeur de la variable pour la première modalité de la variable de regroupement).358 Chapitre 19 Cubes OLAP : Statistiques Figure 19-3 Boîte de dialogue Cubes OLAP : Statistiques Vous pouvez choisir l'une des statistiques de sous-groupe suivantes pour les variables récapitulatives à l'intérieur de chaque modalité de chacune des variables de regroupement : Somme. Intervalle. Moyenne. Les statistiques récapitulatives sont aussi affichées pour chaque variable à travers toutes les modalités. Pourcentage de N (observations) totales. Erreur std de la moyenne. Pourcentage de la somme totale dans les variables de regroupement. Dernier (valeur de la variable pour la dernière modalité de la variable de regroupement).. Erreur std d'asymétrie. Pourcentage de somme tot. Nombre d'observations. Moyenne géométrique : Racine nième du produit des valeurs de données. Maximum. Asymétrie. Ecart type. Minimum. Moyenne géométrique et Moyenne harmonique. n représentant le nombre d'observations. Variance. Erreur standard de l'aplatissement. Aplatissement. . Première : Affiche la première valeur rencontrée dans le fichier de données. Pourcentage des observations totales dans les variables de regroupement.

cette valeur est identique au pourcentage du nombre total d'observations. Maximum : Plus grande valeur d'une variable numérique. Moyenne harmonique : Fonction utilisée pour estimer la taille moyenne d'un groupe lorsque la taille des échantillons diffère d'un groupe à l'autre. La moyenne harmonique correspond au nombre total d'échantillons divisé par la somme des réciproques des tailles de l'échantillon. etc. Médiane : Valeur au-dessus ou au-dessous de laquelle se trouve la moitié des observations . Un aplatissement positif indique que les observations sont plus regroupées et présentent des extrémités plus longues que dans le cas d'une distribution normale. Si vous n'avez qu'un seul critère de regroupement. Par exemple. si chaque valeur de la trentaine est codée 35. la médiane correspond à la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordre croissant ou décroissant. La médiane est une mesure de tendance centrale et elle n'est pas. pour les données d'âge. . la valeur de la statistique d'aplatissement est égale à 0. à l'inverse de la moyenne. Pourcentage de N dans : Pourcentage du nombre d'observations pour le critère de regroupement spécifié dans les modalités des autres critères de regroupement. somme divisée par le nombre d'observations. Dernière : Affiche la dernière valeur rencontrée dans le fichier de données. Un aplatissement négatif signifie que les observations sont moins regroupées et présentent des extrémités plus courtes. Moyenne : Mesure de la tendance centrale. Si le nombre d'observations est pair. 50e centile. Minimum : Valeur la plus petite d'une variable numérique. sensible aux valeurs éloignées. Moyenne arithmétique . Dans le cas d'une distribution normale.359 Cubes OLAP Médiane de groupes : Médiane calculée pour les données codées en groupes. Kurtosis : Mesure de l'étendue du regroupement des observations autour d'un point central. la médiane de groupes est la médiane calculée à partir des données codées. chaque valeur de la quarantaine est codée 45. N : Nombre d'observations (ou d'enregistrements)..

Pourcentage de N total : Pourcentage du nombre total d'observations dans chaque modalité. une valeur négative extrême produit une extrémité allongée vers la gauche.360 Chapitre 19 Pourcentage de la somme dans : Pourcentage de la somme pour le critère de regroupement spécifié dans les modalités des autres critères de regroupement. Pourcentage de la somme totale : Pourcentage de la somme totale dans chaque modalité. Une valeur d'asymétrie positive importante indique une extrémité allongée vers la droite . une valeur d'asymétrie deux fois supérieure à l'erreur standard correspond à une absence de symétrie. Pour simplifier. vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Erreur standard du Skewness : Rapport de l'asymétrie avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit. vous pouvez conclure à une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeur d'aplatissement positive importante indique que les extrémités de la distribution sont plus allongées que celles d'une distribution normale . . Si vous n'avez qu'un seul critère de regroupement. Une distribution caractérisée par une importante asymétrie négative présente une extrémité gauche plus allongée. cette valeur est identique au pourcentage de la somme totale. Une distribution caractérisée par une importante asymétrie positive présente une partie droite plus allongée. Plage : Différence entre la valeur maximale et la valeur minimale d'une variable numérique (maximum–minimum). La distribution normale est symétrique et a une valeur d'asymétrie égale à zéro. Skewness : Mesure de l'asymétrie d'une distribution. Somme : Somme ou total des valeurs. une valeur d'aplatissement négative présente des extrémités plus courtes (semblables à celles d'une distribution uniforme sous forme de boîtes). pour toutes les observations n'ayant pas de valeur manquante. Erreur standard du Kurtosis : Rapport de l'aplatissement avec son erreur standard pouvant être utilisé comme test de normalité (autrement dit.

qui sont égales au carré des unités de la variable.361 Cubes OLAP Variance : Mesure de la dispersion des valeurs autour de la moyenne. Différences entre les variables : Calcule les différences existant entre des paires de variables. la valeur de la . Cubes OLAP : Différences Figure 19-4 Boîte de dialogue Cubes OLAP : Différences Cette boîte de dialogue vous permet de calculer les différences arithmétiques et de pourcentage qui existent entre des variables récapitulatives ou entre des groupes définis par une variable de regroupement. Les différences sont calculées pour toutes les mesures sélectionnées dans la boîte de dialogue Cubes OLAP : Statistiques. divisée par le nombre d'observations moins un. égale à la somme des carrés des écarts par rapport à la moyenne. Les valeurs des statistiques récapitulatives de la seconde variable (variable moins) de chaque paire sont soustraites des valeurs des statistiques récapitulatives de la première variable de la paire. La variance se mesure en unités. Pour les différences de pourcentage.

. Vous devez sélectionner plusieurs variables récapitulatives dans la boîte de dialogue principale avant d'indiquer les différences entre les variables. Cubes OLAP : Titre Figure 19-5 Boîte de dialogue Cubes OLAP : Titre SPSS vous permet de modifier le titre de votre sortie ou d'ajouter une légende qui apparaîtra au dessous du tableau de sortie. Vous devez sélectionner au moins une variable de regroupement dans la boîte de dialogue principale avant d'indiquer les différences entre groupes. Les différences de pourcentage utilisent la valeur de la statistique récapitulative pour la modalité moins en tant que dénominateur. Différences entre les groupes d'observations : Calcule les différences existant entre les paires de groupes définies par une variable de regroupement.362 Chapitre 19 caractéristique de la variable moins est utilisée en tant que dénominateur. Vous pouvez également contrôler la répartition des titres et légendes sur plusieurs lignes en tapant \n partout où vous souhaitez insérer un saut de ligne dans le texte. Les valeurs des statistiques récapitulatives de la seconde modalité (modalité moins) dans chaque paire sont soustraites des valeurs des statistiques récapitulatives de la première modalité de la paire.

Les statistiques descriptives des variables tests sont affichées avec le test t. les statistiques descriptives pour les différences. les sujets doivent être attribués de manière aléatoire à deux groupes. Test T pour échantillons indépendants La procédure du Test T pour échantillons indépendants permet de comparer la moyenne de deux groupes d'observations. et qu'un intervalle de confiance de 95 % pour la différence des moyennes. Ceci n'est pas le cas si l'on compare un revenu moyen pour les hommes et les femmes. Ce test sert aussi pour les plans d'études appariées ou de contrôle d'observation. la corrélation entre elles. le test t et un intervalle de confiance de 95 %. Test T pour échantillons appariés (test t dépendant) : Permet de comparer la moyenne de deux variables pour un seul groupe. Le résultat inclut les statistiques descriptives pour les variables tests. Une personne n'est pas aléatoirement désignée comme devant être un homme ou une femme. Dans de telles situations. de manière à ce que toute différence dans la réponse soit due au traitement (ou à un manque de traitement) et non pas à d'autres facteurs.Tests T 20 Chapitre Il existe trois types de test t : Test T pour échantillons indépendants (test t pour deux échantillons) : Permet de comparer la moyenne d'une variable de deux groupes d'observations. Un intervalle de confiance de 95 % pour la différence entre la moyenne de la variable test et la valeur test supposée fait partie du résultat par défaut. appariées. il faut s'assurer que les différences dans les autres facteurs ne cachent pas ou n'augmentent de différence 363 . Idéalement. pour ce test. Test T pour échantillon unique : Permet de comparer la moyenne d'une variable avec une valeur connue ou supposée. Les statistiques descriptives pour chaque groupe et le test de Levene permettant d'obtenir l'égalité des variances sont disponibles ainsi que les valeurs t de variance égale et inégale.

Pour la différence de la moyenne: moyenne. vérifiez qu'elles sont symétriques et n'ont pas de valeurs éloignées. et les échantillons aléatoires de distribution normale doivent avoir la même variance de population. Tests : Test de Levene sur l'égalité des variances. La variable de regroupement peut être numérique (on peut avoir des valeurs telles que 1 et 2. moyenne. ou 6. on a les éléments suivants : taille de l'échantillon. Les différences de revenu moyen peuvent être influencées par des facteurs tels que l'éducation et non par le sexe seul. Vous pouvez utiliser également une variable quantitative.364 Chapitre 20 significative dans les moyennes. telle que l'âge. Remarques sur les Données du Test T pour Echantillons Indépendants Données : Les valeurs de la variable quantitative qui vous intéresse se trouvent dans une seule colonne du fichier de données. Hypothèses : Pour le test t de variance égale. . les observations doivent être indépendantes. et intervalle de confiance (vous pouvez spécifier le niveau de confiance).5) ou alphanumériques (telles que oui et non). Exemple : Les patients souffrant d'hypertension se voient assignés de façon aléatoire à un groupe placebo et à un groupe auquel on donne un traitement. Lors de la vérification graphique des distributions. écart type. SPSS utilise une variable de regroupement à deux valeurs pour séparer les observations en deux groupes. Pour le test t de variance égale. et tests t des variances combinées et séparées pour l'égalité des moyennes. erreur standard. Chaque patient est examiné une fois et appartient à un groupe. et erreur standard de la moyenne. pour séparer les observations en deux groupes en précisant une césure (la césure 21 provoque un groupe dont l'âge est inférieur à 21 ans et un groupe dont l'âge est supérieur à 21 ans). Les sujets du groupe placebo reçoivent une pilule inactive et les sujets du groupe auquel on donne un traitement reçoivent un nouveau médicament supposé réduire l'hypertension.25 et 12. les observations doivent être indépendantes. Après que les sujets aient suivi le traitement pendant deux mois. le test t pour deux échantillons est utilisé pour comparer la tension artérielle moyenne du groupe placebo à celle du groupe qui suit le traitement. et les échantillons aléatoires doivent avoir une distribution normale. Le test t pour deux échantillons est assez robuste pour se départir de la normalité. Statistiques : Pour chaque variable.

90 Intervalle de confiance de la moyenne à 95 % Inférieur 11.365 Tests T Echantillon de résultat Figure 20-1 Résultat Test T pour échantillons indépendants Statistiques de groupe Moyenne des Erreurs Standard 5.001 Différence Différence de des erreurs Moyennes Standard 26.719 t 3.50 116.61 Supérieur 40..59 F Tension Artérielle Signification .90 11.783 17.10 6.001 26.04 13.783 df Hypothèse de variances Égales Hypothèse de variances Inégales .31 Tension Artérielle Traitement placebo Nouveau_ Médicament N 10 10 Moyenne 142.134 3..39 4.163 .40 Ecart type 17.64 Obtenir un test t pour échantillons indépendants E A partir du menu. sélectionnez : Analyse Comparer les moyennes Test T pour échantillons indépendants. .10 6.56 40.62 Test pour échantillons indépendants Test de Levene sur l'égalité des variances Test-t pour égalité des moyennes Signification (Bilatérale) 18 .

Définir Groupes Test T pour Echantillons Indépendants Figure 20-3 Boîte de dialogue Définir groupes pour variables numériques . Un test t distinct est alors calculé pour chaque variable.366 Chapitre 20 Figure 20-2 Boîte de Dialogue Test T pour échantillons indépendants E Sélectionnez au moins une variable test quantitative. E Sélectionnez une seule variable de regroupement et cliquez sur Définir groupes pour spécifier deux codes pour les groupes à comparer. Vous pouvez également cliquer sur Options pour contrôler le traitement des données manquantes et le niveau de l'intervalle de confiance.

définissez les deux groupes du test t en spécifiant deux valeurs ou un point de séparation : „ Utiliser les valeurs spécifiées : Saisissez une valeur pour le Groupe 1 et une autre pour le Groupe 2. 6. entrez une chaîne pour le Groupe 1 et une autre pour le Groupe 2. Les observations qui ont une autre valeur sont exclues de l'analyse. „ Césure : Vous avez également la possibilité de saisir un nombre qui sépare les valeurs de la variable de regroupement en deux groupes.367 Tests T Pour les critères de regroupement numérique. Les observations avec d'autres chaînes sont exclues de l'analyse.25 et 12. par exemple oui et non. Options Test T pour Echantillons Indépendants Figure 20-5 Boîte de dialogue Test T pour échantillons indépendants : Options . Il n'est pas nécessaire que les nombres soient des entiers (par exemple. et les observations ayant des valeurs supérieures ou égales à la césure constituent l'autre groupe. Toutes les observations ayant des valeurs inférieures à la césure constituent un groupe.5 sont valides). Figure 20-4 Définir la boîte de dialogue Groupes pour les variables caractères Pour des variables courtes de groupement et de type chaîne.

Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance différent. Par conséquent. un traitement est administré. et erreur standard de la moyenne. La taille des échantillons peut varier d'un test à l'autre. puis on procède à une nouvelle mesure. souvent nommées mesures avant et après.368 Chapitre 20 Intervalle de confiance : Par défaut. des mesures sont prises sur tous les patients au début de l'étude. Test T pour échantillons appariés La procédure du Test T pour Echantillons Appariés compare la moyenne de deux variables pour un seul groupe. Elle permet de calculer la différence de valeurs entre les deux variables pour chaque observation et de tester si la moyenne diffère de 0. les patients et les contrôles peuvent être appariés selon l'âge (un patient âgé de 75 ans avec un membre du groupe de contrôle âgé de 75 ans). „ Exclure toute observation incomplète : Chaque test t utilise seulement les observations qui ont des données valides pour toutes les variables utilisées dans les tests t requis. chaque déclaration dans le fichier de données contient la réponse du patient ainsi que celle de son sujet de contrôle apparié. chaque sujet est l'objet de deux mesures. vous pouvez indiquer à SPSS les observations à inclure (ou exclure) : „ Exclure les données manquantes analyse par analyse : Chaque test t utilise toutes les observations qui ont des données valides pour les variables testées. Exemple : Dans le cadre d'une étude sur l'hypertension. Dans le cadre d'une étude sur la tension artérielle. taille d'échantillon. Statistiques : Pour chaque variable. écart type. on a les éléments suivants : moyenne. différence moyenne de moyennes. La taille des échantillons est constante durant les tests. Ici. Ecart-type et erreur standard de la différence moyenne. un intervalle de confiance de 95 % pour la différence dans les moyennes est affiché. test t et intervalle de confiance pour la différence moyenne (vous pouvez préciser le niveau de confiance). il s'agit d'une étude appariée ou de contrôle d'observation. Pour chaque paire de variables. Valeurs manquantes : Quand vous testez plusieurs variables et que des données sont manquantes pour au moins une variable. . Il existe une alternative à ce test. on a les éléments suivants : Corrélation.

Les variances de chaque variable peuvent être égales ou inégales.19 -40.09 -4.50 N 10 10 Test d'exemples appariés Différences appariées Intervale de confiance de 95 % de la différence Inférieur Supérieur t df Moyenne Paire 1 Après traitement Avant traitement Ecart-type Moyenne d'erreur std.62 17.04 Moyenne des erreurs Standard 4.40 142. ..59 6.39 Moyenne Paire 1 Après Traitement Avant Traitement 116.369 Tests T Commentaires relatifs au test T pour échantillons appariés Données : Pour chaque test apparié. sélectionnez : Analyse Comparer les moyennes Test T pour échantillons appariés.002 Obtenir un test t pour échantillons appariés E A partir du menu. Dans le cadre d'une étude appariée ou de contrôle d'observation.214 9 . Hypothèses : Les observations pour chaque paire devraient être réalisées dans les mêmes conditions.10 19. précisez deux variables quantitatives (niveau d'intervalle de mesure ou niveau de ratio de mesure). Les différences moyennes devraient suivre une distribution normale.11 -12. Signification (bilatérale) -26.31 5. la réponse pour chaque sujet test et son sujet de contrôle apparié doit être dans la même observation du fichier de données.. Echantillon de résultat Figure 20-6 Test T pour échantillons appariés Statistiques des échantillons appariés Ecart Type 13.

comme suit : „ Cliquez sur chacune des deux variables. sélectionnez une paire dans la liste des Variables Appariées et cliquez sur la flèche. „ Vous pouvez également cliquer sur Options pour contrôler le traitement des données manquantes et le niveau de l'intervalle de confiance.370 Chapitre 20 Figure 20-7 Boîte de dialogue Test T pour échantillons appariés E Sélectionnez une paire de variables. Vous pouvez sélectionner d'autres paires de variables. Pour retirer une paire de variables de l'analyse. cliquez sur la flèche pour déplacer la paire dans la liste des Variables Appariées. Après avoir sélectionné une paire de variables. La première variable apparaît dans le groupe Choix courants comme Variable 1 et la seconde apparaît comme Variable 2. .

Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance différent. vous pouvez indiquer à SPSS les observations à inclure (ou exclure) : „ Exclure les observations analyse par analyse : Chaque test t utilise toutes les observations qui ont des données valides pour la paire de variables testées. „ Exclure toute observation incomplète :Chaque test t utilise seulement les observations qui ont des données valides pour toutes les paires de variables testées. Valeurs manquantes : Quand vous testez plusieurs variables et que des données sont manquantes pour au moins une variable. écart type. Différence moyenne entre chaque valeur de donnée et la valeur test supposée. Statistiques : Pour chaque variable test : moyenne. Exemples : Un chercheur souhaite tester si le QI moyen d'un groupe d'étudiants diffère de 100.3 livres à l'intervalle de confiance 95 %.371 Tests T Options test T pour échantillons appariés Figure 20-8 Boîte de dialogue Test T pour échantillons appariés Intervalle de confiance : Par défaut. La taille des échantillons peut varier d'un test à l'autre. Test T pour échantillon unique La procédure du Test T pour échantillon unique permet de tester si la moyenne d'une seule variable diffère d'une constante spécifiée. le test t vérifie que cette différence est égale à 0 et vérifie également . Un fabricant céréalier prélève un échantillon de boîtes à partir d'une chaîne de production et vérifie si le poids moyen des échantillons diffère de 1. un intervalle de confiance de 95 % pour la différence dans les moyennes est affiché. et erreur standard de la moyenne. La taille des échantillons est constante durant les tests.

005 df 14 .009 9.372 Chapitre 20 l'intervalle de confiance pour cette différence (vous pouvez préciser le niveau de confiance). Test pour échantillon unique Valeur de test = 100 Signification Différence (Bilatérale) de moyennes . Echantillon de résultat Figure 20-9 Résultat Test T pour échantillon unique Statistiques pour échantillon unique QI N Moyenne Ecart type Moyenne des erreurs standard 15 109. ce test résiste convenablement à la normalité.33 12. Hypothèses : Ce test suppose que les données sont distribuées normalement . choisissez une variable quantitative et saisissez une valeur test supposée. cependant. Commentaires sur les Données du Test T pour échantillon unique Données : Afin de tester les valeurs d'une variable quantitative par rapport à une valeur test supposée.33 Intervalle de confiance de la différence à 95 % Inférieur 2.03 3.67 Supérieur 15.99 QI t 3.11 Les lignes et les colonnes ont été transposées.

E Entrez une valeur test numérique à laquelle vous souhaitez comparer chaque moyenne d'échantillon. . Vous pouvez également cliquer sur Options pour contrôler le traitement des données manquantes et le niveau de l'intervalle de confiance.373 Tests T Obtenir un test t pour échantillon unique E A partir du menu. sélectionnez : Analyse Comparer les moyennes Test T pour échantillon unique Figure 20-10 Boîte de dialogue Test T pour échantillon unique E Sélectionnez au moins une variable à tester par rapport à la même valeur supposée.

vous pouvez indiquer à SPSS les observations à inclure (ou à exclure). „ Exclure les observations analyse par analyse : Chaque test t utilise toutes les observations qui ont des données valides pour la variable testée. La taille des échantillons est constante durant les tests. „ Exclure toute observation incomplète : Chaque test t utilise seulement les observations qui ont des données valides pour toutes les variables utilisées dans n'importe lequel des tests t requis.374 Chapitre 20 Options Test T pour échantillon unique Figure 20-11 Boîte de Dialogue Options Test T pour échantillon unique Intervalle de confiance : Par défaut. . un intervalle de confiance de 95 % pour la différence entre la moyenne et la valeur de test supposée est affiché. La taille des échantillons peut varier d'un test à l'autre. Valeurs manquantes : Quand vous testez plusieurs variables et que des données manquent pour ou une ou plusieurs de ces variables. Saisir une valeur comprise entre 1 et 99 pour demander un niveau de confiance différent.

contrastes a priori spécifiés par l'utilisateur et tests d'intervalle et comparaisons multiples post hoc : Bonferroni. et les tests post hoc sont effectués après l'expérience. L'huile d'arachide et l'huile de maïs sont des graisses non saturées. test de Duncan. test C de Dunnett. Cette technique est une extension du test t pour deux échantillons. test F de Ryan-Einot-Gabriel-Welsch (R-E-G-W F). et saindoux. B de Tukey. Scheffé et différence la moins significative. minimum. test de Tukey. Statistiques : Pour chaque groupe : nombre d'observations. Student-Newman-Keuls (S-N-K). Dunnett. L'analyse de variance sert à tester l'hypothèse d'égalité des moyennes. Il existe deux types de tests pour comparer les moyennes : les contrastes a priori et les tests post hoc. Sidak. Exemple : Les beignets absorbent la graisse dans des proportions variées lorsqu'ils sont cuisinés.ANOVA à 1 facteur 21 Chapitre La procédure de l'analyse de variance ANOVA à 1 facteur permet d'effectuer une analyse de variance univariée sur une variable quantitative dépendante par une variable critère simple (indépendant). T3 de Dunnett. Les contrastes sont des tests définis avant l'expérience. T2 de Tamhane. Test de Levene pour l'homogénéité de la variance. mais vous pouvez également créer un contraste a priori afin de déterminer si le degré d'absorption de graisse diffère pour les graisses saturées et non saturées. GT2 de Hochberg. test d'intervalle de Ryan-Einot-Gabriel-Welsch (R-E-G-W Q). 375 . maximum et intervalle de confiance à 95 % pour la moyenne. Vous voulez éventuellement savoir quelles sont les moyennes qui diffèrent. Vous pouvez aussi tester les tendances à travers les modalités. erreur standard pour la moyenne. Non seulement vous déterminez si la quantité de graisse absorbée dépend du type de graisse utilisée. Déterminer que des différences existent parmi les moyennes ne vous suffit peut-être pas. tableau d'analyse de la variance et tests d'égalité des moyennes pour chaque variable dépendante. Waller-Duncan. Une expérience est conduite à partir de l'utilisation de trois types de graisse : huile d'arachide. moyenne. Games-Howell. écart type. huile de maïs. et le saindoux une graisse saturée. Gabriel.

20 Limite inférieure 58.17 3.36 3.00 15 17 102.16 70.84 53.00 93.00 76. et la variable dépendante devrait être quantitative (niveau d'intervalle de mesures).5 .00 Ecart-type 13. Hypothèses : Chaque groupe est un échantillon aléatoire indépendant extrait d'une population normale.77 8.00 3126. Les groupes devraient être composés de populations à variance égale. bien que les données doivent être symétriques.22 13.376 Chapitre 21 Remarques sur les Données ANOVA à 1 facteur Données : Les valeurs de la variable active devraient être des nombres entiers.5 Saindoux 1 Huile de maïs -.00 62.56 Erreur std.00 73.63 79. 5.00 85.00 Descriptions Intervale de confiance de 95 % pour la moyenne N Grammes graisse de absorbée Type d'huile Huile d'arachide Saindoux Huile de maïs Total 6 6 6 18 Moyenne 72.74 Minimum 56 77 49 49 Maximum 95 97 70 97 Coefficients de contraste Type d'huile Huile d'arachide Contraste 1 -.34 7. L'analyse de la variance supporte les écarts à la normalité.824 Signification .00 df 2 Carré moyen 798.37 66. utiliser le test d'homogénéité de variance de Levene. Echantillon de résultat Figure 21-1 Résultat ANOVA à 1 facteur ANOVA Somme des carrés Grammes de graisse absorbée Entre groupes Dans les groupes Total 1596.26 Limite supérieure 86.45 3.005 1530.00 F 7. Pour tester cette hypothèse.

00 Signification [bilatérale) 15 12..05 4.51 t 3. Figure 21-2 Boîte de dialogue ANOVA à 1 facteur E Sélectionnez au moins une variable dépendante.00 18.534 df1 2 df2 15 Signification .002 Erreur std.542 .597 Obtenir une analyse de variance à un facteur E A partir du menu. sélectionnez : Analyse Comparer les moyennes ANOVA à 1 facteur.995 df Test d'homogénéité des variances Statistique de Levene Grammes de graisse absorbée .377 ANOVA à 1 facteur Tests de contraste Valeur de contraste Grammes de graisse absorbée Suppose des variances égales Ne suppose pas des variances égales Contraste Contraste 1 1 18. 5. . E Sélectionnez une variable active indépendante simple..565 3.003 .

Coefficients : Contrastes a priori spécifiés à tester par la statistique t. les coefficients –1. et le dernier coefficient correspond à la valeur la plus élevée.5 et 0. Le premier coefficient de la liste correspond à la valeur la plus petite de la variable active. 0. 0. Par exemple. 0. 0. vous pourriez tester la tendance linéaire (croissante ou décroissante) des salaires perçus les plus élevés à travers les niveaux ordonnés. deuxième. „ Degré : Vous pouvez choisir un polynôme de premier. Vous pouvez tester la tendance d'une variable dépendante à travers les niveaux ordonnés de la variable active. Chaque nouvelle valeur s'ajoute au bas de la liste des coefficients. Par exemple.5 mettent en contraste le premier groupe avec les . L'ordre des coefficients est important car il correspond à l'ordre croissant des valeurs de modalité de la variable active. troisième. quatrième ou cinquième degré. Saisissez un coefficient pour chaque groupe (modalité) de la variable active et cliquez sur Ajouter après chaque saisie. Utilisez Suivant et Précédent pour vous déplacer entre les groupes de contrastes. cliquez sur Suivant. Modèle polynomial : Diviser les sommes des carrés inter-groupes en tendances composants. s'il y a six modalités de variables actives.378 Chapitre 21 Contrastes ANOVA à 1 facteur Figure 21-3 Boîte de dialogue ANOVA à 1 facteur : Contrastes Vous pouvez diviser les sommes des carrés inter-groupes en tendances composants ou spécifier les contrastes a priori. Pour spécifier des groupes de contrastes supplémentaires.

les coefficients devraient s'élever à 0.05. Les groupes qui n'atteignent pas 0 peuvent aussi être utilisés. les tests d'intervalles post hoc et de comparaisons multiples par paire peuvent déterminer les moyennes qui diffèrent. Les tests d'intervalle identifient les sous-groupes homogènes de moyennes qui ne diffèrent pas les uns des autres. Hypothèse de variances égales : Le test de Tukey. Tests Post Hoc ANOVA à 1 facteur Figure 21-4 ANOVA à 1 facteur : Comparaisons multiples a posteriori Lorsque vous avez déterminé qu'il existe des différences parmi les moyennes. mais un message d'avertissement s'affiche. le GT2 de Hochberg. le R-E-G-W F (F de Ryan-Einot-Gabriel-Welsch). le test de Gabriel et le test de Scheffé sont des tests de comparaisons multiples et d'intervalle. Il existe d'autres tests d'intervalle. le S-N-K (Student-Newman-Keuls). tels que le test B de Tukey.379 ANOVA à 1 facteur cinquième et sixième groupes. le R-E-G-W Q (test d'intervalle de . Pour la plupart des applications. le Duncan. Les comparaisons multiples appariées testent la différence entre les moyennes appariées et engendrent une matrice pour laquelle les astérisques indiquent les moyennes de groupes significativement différentes au niveau alpha 0.

Hochberg. S-N-K : Ce test effectue toutes les comparaisons de moyennes par paire. Dunnett. Les tests de comparaison multiple disponibles sont les suivants : Bonferroni. mais contrôle le taux d'erreur global en spécifiant comme taux d'erreur pour chaque test le taux d'erreur empirique divisé par le nombre total de tests. il compare aussi les moyennes par paire dans les sous-ensembles homogènes. Les moyennes sont triées dans l'ordre décroissant et les différences extrêmes sont testées en premier. „ „ „ F de R-E-G-W (Ryan-Einot-Gabriel-Welsch) : Procédure multiple descendante de Ryan-Einot-Gabriel-Welsch basée sur un test F. Sidak. Utilise la distribution d'échantillonnage F.380 Chapitre 21 Ryan-Einot-Gabriel-Welsch) et le Waller-Duncan. La valeur critique est la moyenne de la valeur correspondante du test de Tukey et du test de Student-Newman-Keuls. Scheffé et LSD (différence la moins significative). en utilisant une procédure pas à pas. „ LSD : Utilisation de tests t pour effectuer toutes les comparaisons par paire entre des moyennes de groupe. „ Bonferroni : Utilise des tests t pour effectuer des comparaisons par paire entre les moyennes de groupes. „ Sidak : Test de comparaisons multiples par paire reposant sur la statistique t. Gabriel. et pas seulement des comparaisons par paire. test de différence significative de Tukey. „ B de Tukey : Utilise la distribution des intervalles studentisée pour effectuer des comparaisons de classes deux à deux. „ Tukey : Utilise les statistiques des intervalles studentisées pour effectuer des comparaisons de classes deux à deux. „ Scheffé : Exécute des comparaisons par paire simultanées pour toutes les paires de moyennes possibles. . Le taux d'erreur n'est pas corrigé dans le cas de comparaisons multiples. Peut servir à examiner toutes les combinaisons linéaires possibles de moyennes de groupe. Le test Sidak ajuste le seuil de signification en fonction des comparaisons multiples et fournit des bornes plus étroites que le test Bonferroni. Fixe le taux d'erreur expérimental au niveau du taux d'erreur de l'ensemble pour toutes des comparaisons par paire. Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch) : Procédure multiple descendante de Ryan-Einot-Gabriel-Welsch basée sur un intervalle de Student. Le seuil de signification observé est ainsi ajusté en raison des comparaisons multiples réalisées. à l'aide de la distribution des intervalles de Student. Lorsque la taille des échantillons est égale.

L'option >Contrôle permet de tester si la moyenne est supérieure. L'option Bilatéral teste que la moyenne à un certain niveau (hormis la modalité de contrôle) du facteur n'est pas égale à celle de la modalité de contrôle. Ce test est opportun lorsque les variances sont inégales. T3 de Dunnett : Test des comparaisons par paires basé sur le module maximal de Student. à celle de la modalité de contrôle. „ „ Waller-Duncan : Test de comparaisons multiples basé sur une statistique t et utilisant une approche bayésienne.381 ANOVA à 1 facteur „ Duncan : Réalise des comparaisons par paires en suivant un ordre pas à pas identique à celui utilisé dans le test de Student-Newman-Keuls. „ C de Dunnett : Test des comparaisons par paires basé sur l'intervalle de Student. Games-Howell : Test des comparaisons appariées qui peut parfois être souple. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup. plutôt que pour chaque test en particulier. Gabriel : Test de comparaison par paire qui utilise le modulus maximum de Student. La dernière modalité est la modalité de contrôle par défaut. à un certain niveau du facteur. le T3 de Dunnett. Dunnett : Test T de comparaisons multiples par paires comparant un ensemble de traitements à une moyenne de contrôle unique. mais établit un niveau de protection du taux d'erreur pour l'ensemble des tests. „ „ GT2 de Hochberg : Test de multiples comparaisons et intervalles appariés utilisant le modulus maximum de Student. Games-Howell et le C de Dunnett. L'option <Contrôle permet de tester si la moyenne est inférieure. Similaire au test de Tukey. Utilise la statistique d'intervalle de Student. à celle de la modalité de contrôle. „ „ „ T2 de Tamhane : Test des comparaisons appariées basé sur le test T. Ce test est opportun lorsque les variances sont inégales. à un certain niveau du facteur. . Hypothèse de variances inégales : Les tests de comparaison multiple qui ne supposent pas de variances égales sont le T2 de Tamhane. Vous pouvez également choisir la première modalité. Ce test est opportun lorsque les variances sont inégales. Ce test est opportun lorsque les variances sont inégales. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont inégales.

l'erreur standard et l'intervalle de confiance à 95 % pour le modèle à effets fixes. l'intervalle de confiance à 95 % et l'estimation de la variance inter-composants pour le modèle à effets aléatoires. „ Test d'homogénéité de variance : La procédure calcule la statistique de Levene pour tester l'égalité des variances de groupe. choisissez Propriétés du tableau dans le menu Format). Ce test ne dépend pas de l'hypothèse de normalité. . „ Effets fixes et aléatoires : La procédure affiche l'écart type. la moyenne.382 Chapitre 21 Remarque : Il peut vous paraître plus facile d'interpréter le résultat à partir de tests post hoc si vous désactivez l'option Masquer les lignes et les colonnes vides dans la boîte de dialogue Propriétés du tableau (dans le tableau pivotant activé. l'écart type. le minimum. le maximum. et les intervalles de confiance à 95 % pour chaque variable dépendante de chaque groupe. ainsi que l'erreur standard. Options ANOVA à 1 facteur Figure 21-5 Boîte de dialogue ANOVA à 1 facteur : Options Statistiques : Choisissez une ou plusieurs des options suivantes : „ Caractéristique : La procédure calcule le nombre d'observations. l'erreur standard de la moyenne.

Si vous n'avez pas spécifié de variables multiples dépendantes. Diagramme des moyennes : Affiche un diagramme qui représente les moyennes de sous-groupes (les moyennes de chaque groupe définies par les valeurs de la variable active). Valeurs manquantes : Contrôle le traitement des valeurs manquantes. „ Exclure les observations analyse par analyse : Aucune observation avec valeur manquante n'est utilisée. que ce soit pour la variable dépendante ou pour la variable active d'une analyse donnée. „ Welch : Calcule la statistique de Welch pour tester l'égalité des moyennes de groupe. „ Exclure toute observation incomplète : Les observations ayant des valeurs manquantes pour la variable active ou pour toute variable dépendante contenue dans la liste dépendante de la boîte de dialogue principale sont exclues de toutes les analyses. Il est préférable d'utiliser cette statistique (au lieu de la statistique F) lorsque l'hypothèse d'égalité des variances n'est pas satisfaite. on n'utilise pas d'observation en dehors de l'intervalle spécifié pour la variable active. Il est préférable d'utiliser cette statistique (au lieu de la statistique F) lorsque l'hypothèse d'égalité des variances n'est pas satisfaite. . De même. cela est sans effet.383 ANOVA à 1 facteur „ Brown-Forsythe : La procédure calcule la statistique de Brown-Forsythe pour tester l'égalité des moyennes de groupe.

.

Les moyennes marginales estimées fournissent des estimations des valeurs moyennes estimées pour les cellules dans le modèle et les diagrammes des profils (diagrammes d'interaction) de ces moyennes vous permettent de visualiser plus facilement certaines des relations. les variables indépendantes (explicatives) sont spécifiées comme covariables. les effets et les interactions des covariables avec les facteurs peuvent être inclus. 385 . Pour l'analyse de la régression. peut-être pour compenser les différents niveaux de précision des mesures. Les variables actives divisent la population en groupes. Cette procédure de régression linéaire généralisée vous permet de tester les hypothèses nulles à propos des effets des autres variables sur la moyenne de différents regroupements de la variable dépendante. En outre.Analyse GLM – Univarié 22 Chapitre GLM – Univarié fournit un modèle de régression et une analyse de la variance pour plusieurs variables dépendantes par un ou plusieurs facteurs ou variables. vous pouvez utiliser les tests post hoc pour évaluer les différences entre les moyennes spécifiques. Un modèle est équilibré si chaque cellule de ce modèle contient le même nombre d'observations. L'analyse GLM – Univarié teste non seulement les hypothèses mais elle produit également des estimations. Vous pouvez rechercher les interactions entre les facteurs ainsi que les effets des différents facteurs. les prévisions. certains d'entre eux étant aléatoires. lorsqu'un test F global se révèle significatif. Les résidus. Poids WLS. Vous pouvez tester les modèles équilibrés comme déséquilibrés. Vous permet de spécifier une variable utilisée pour pondérer les observations pour une analyse pondérée (WLS) des moindres carrés. la distance de Cook et les valeurs influentes peuvent être enregistrées sous forme de nouvelles variables dans votre fichier de données pour vérifier les hypothèses. En outre. Vous disposez de contrastes a priori communs pour effectuer les tests d'hypothèse.

GT2 de Hochberg. modéré. le test t de Waller Duncan. Dans cette population.Univarié Données : La variable dépendante est quantitative. Le temps effectué par chaque participant est la variable dépendante. Gabriel. Hypothèses : Les données forment un échantillon aléatoire d'une population normale ou gaussienne. Méthodes : Les sommes des carrés de type I. Scheffé. Games-Howell et C de Dunnett. L'âge est considéré comme co-variable. Il peut s'agir de valeurs numériques ou alphanumériques de 8 caractères au maximum. F multiple de Ryan-Einot-Gabriel-Welsch. Sidak. Diagrammes : Dispersion par niveau. Dunnett (unilatéral. bien que les données doivent être symétriques. écart type et effectifs pour toutes les variables dépendantes dans toutes les cellules. Statistiques descriptives : moyenne observée. Les covariables sont des variables quantitatives liées à la variable dépendante. . Duncan. L'analyse de la variance supporte les écarts à la normalité. bilatéral). chaud). résiduels et profils (interaction). le nombre de mois d'entraînement. Les facteurs sont qualitatifs. T2 de Tamhane. Le test de Levene pour l'homogénéité de la variance. l'intervalle multiple de Ryan-Einot-Gabriel-Welsch. toutes les variances de cellule sont égales. Vous pouvez également étudier les résidus et les diagrammes de résidus. b de Tukey. T3 de Dunnett. Pour vérifier les hypothèses. Le type III est la valeur par défaut.386 Chapitre 22 Exemple : Des données sont collectées sur les différents participants au Marathon de Paris sur plusieurs années. Bonferroni. II. le nombre de marathons précédemment effectués et le sexe. vous pouvez utiliser les tests d'homogénéité de la variance et les diagrammes de dispersion par niveau. Remarques sur les données GLM . III et IV peuvent servir à évaluer les différentes hypothèses. le test de Tukey. Vous devez trouver que le sexe a un effet significatif et que l'interaction du sexe avec le temps est significatif. Student-Newman-Keuls. Statistiques : Tests d'intervalle post hoc et comparaisons multiples : La différence la moins significative. Les autres facteurs comprennent le temps (froid.

404 6.536 5.001 22.203 .301 .629 7.378 5.047 1016.938 17.000 .583 3.203 .059 .981 2.981 8.353 6.200 8.410 .300 5.387 Analyse GLM – Univarié Echantillon de résultat Figure 22-1 Résultat GLM .082 .052 6.118 .Univarié Tests des effets inter-sujets Variable dépendante : SPVOL Somme des carrés de type III Carré moyen Source Modèle corrigé Constante Farine Graisse Précipité Graisse*Précipité df 11 1 3 2 2 4 14 26 25 F 12.833) Graisse * précipité Variable dépendante : SPVOL Intervale de confiance de 95 % Graisse précipité Moyenne Erreur std.891 6.907 (R carré ajusté = .436 7.639 2.241 .023 6.499 1.000 .Univarié E A partir du menu.835 2. R carré = .274 7.000 6.945 6.376 6147.240 .165 Erreur Total Total corrigé 1..997 5.241 .064 5.233 1 1 2 3 5.708 6.522 Sig.513 30.764 7.000 . Limite inférieure Limite supérieure .000 .984 6.564 5.505 6.021 5.520 1016. .239 .636 9.123 7.691 10..301 .897 5.316 1112.605 6. sélectionnez : Analyse Modèle linéaire général Univarié.014 8.641 7.541 7.960 24. .589 2 1 2 3 3 1 2 3 Pour obtenir des tables GLM .

388 Chapitre 22 Figure 22-2 Boîte de dialogue Univarié E Sélectionnez une variable dépendante. vous pouvez utiliser WLS Weight pour préciser une variable de pondération pour l'analyse des moindres carrés pondérés. E Sélectionnez les variables pour Facteur(s) fixé(s). négative ou manquante. en fonction de vos données. . Si la valeur de la variable de pondération est nulle. Une variable déjà utilisée dans le modèle ne peut pas servir de variable de pondération. l'observation est exclue de l'analyse. E En option. Facteur(s) aléatoire(s) et Covariable(s).

. Vous devez indiquer tous les termes à inclure dans le modèle. Pour les modèles équilibrés ou non. auxquels aucune cellule ne manque. Somme des carrés : Méthode de calcul des sommes des carrés. Si vous partez du principe que les données passent par l'origine. des covariables et toutes les interactions facteur/facteur. Inclure une constante au modèle : L'ordonnée est généralement incluse dans le modèle. Critères et covariables : Les covariables et facteurs sont énumérés en indiquant (F) pour facteur fixé et (C) pour covariable. vous pouvez exclure la constante. Dans une analyse univariée. (R) indique un facteur aléatoire. vous pouvez choisir les effets principaux et les interactions qui présentent un intérêt pour votre analyse. Après avoir sélectionné Autre. Il ne contient pas de d'interactions de covariable. le type III est la méthode le plus fréquemment utilisée.389 Analyse GLM – Univarié Modèle GLM Figure 22-3 Boîte de dialogue Modèle univarié Spécifier le modèle : Un modèle factoriel général contient tous les effets principaux des facteurs. Sélectionnez Autre pour indiquer un sous-ensemble d'interactions ou des interactions variable active/covariable. Modèle : Le modèle dépend de la nature de vos données.

et ainsi de suite. Toutes d'ordre 5 : Crée toutes les interactions d'ordre 5 possibles des variables sélectionnées. Somme des carrés Pour ce modèle. Il s'agit de la valeur par défaut. Toutes d'ordre 2 : Crée toutes les interactions d'ordre 2 possibles des variables sélectionnées. Effets principaux : Crée un terme d'effet principal pour chaque variable sélectionnée. et chaque effet de premier ordre spécifié avant ceux de second ordre. Un modèle par imbrication pur dans lequel le premier effet spécifié est imbriqué dans le second et le second spécifié dans le troisième. Un modèle de régression polynomial dans lequel les termes d'ordre inférieur sont spécifiés avant ceux d'ordre supérieur.) „ „ . Chaque terme est ajusté uniquement pour le terme qui le précède dans le modèle. Toutes d'ordre 3 : Crée toutes les interactions d'ordre 3 possibles des variables sélectionnées. Le type III est le plus courant et c'est la valeur par défaut.390 Chapitre 22 Termes construits Pour les facteurs et covariables sélectionnés : Interaction : Crée le terme d'interaction du plus haut niveau de toutes les variables sélectionnées. Type I : Cette méthode est également appelée décomposition hiérarchique de la somme des carrés. vous pouvez choisir un type de sommes des carrés. (Cette forme d'imbrication peut être spécifiée par la syntaxe uniquement. etc. Toutes d'ordre 4 : Crée toutes les interactions d'ordre 4 possibles des variables sélectionnées. La somme des carrés de type I est généralement utilisée pour : „ Une analyse de la variance équilibrée dans laquelle tout effet principal est spécifié avant les effets d'interaction de premier ordre.

le Type IV distribue les contrastes à effectuer parmi les paramètres dans F sur tous les effets de niveau supérieur de façon équitable. . si F n'est inclus dans aucun autre effet. Tout modèle de régression. Si F est inclus dans d'autres effets. Tout modèle qui contient un effet principal uniquement. Les sommes de carrés de type III présentent l'avantage essentiel qu'elles ne varient pas avec les fréquences de cellule tant que la forme générale d'estimabilité reste constante. Dans le modèle factoriel sans cellule manquante. Tous les modèles équilibrés ou non qui contiennent des cellules vides. Un effet approprié est un effet qui correspond à tous les effets qui ne contiennent pas l'effet à étudier.391 Analyse GLM – Univarié Type II : Cette méthode calcule les sommes des carrés d'un effet dans le modèle ajusté pour tous les autres effets « appropriés ». Cette méthode calcule les sommes des carrés d'un effet dans le modèle comme les sommes des carrés ajustée pour tout autre effet qui ne le contient pas et orthogonal à chaque effet qui le contient. Type IV : Cette méthode est conçue pour une situation dans laquelle il manque des cellules. La méthode des sommes des carrés de type II sert généralement pour : „ „ „ „ Une analyse de la variance équilibrée. La méthode des sommes des carrés de type IV sert généralement pour : „ „ Tous les modèles énumérés dans les types I et II. La méthode des sommes des carrés de type III sert généralement pour : „ „ Tous les modèles énumérés dans les types I et II. Pour chaque effet F dans le modèle. Ce type de somme des carrés est donc souvent considéré comme utile pour les modèles déséquilibrés auxquels aucune cellule ne manque. (Cette forme d'imbrication peut être spécifiée par la syntaxe. Tous les modèles équilibrés ou non qui ne contiennent pas de cellules vides. Un modèle par imbrication pur.) Type III : Valeur par défaut. Type IV = Type III = Type II. cette méthode est équivalente à la technique de Yates des carrés moyens pondérés.

pour chaque facteur inter-sujets). le système affiche également les intervalles de confiance simultanés de type Bonferroni fondés sur la distribution t de Student. Helmert. Pour les différences de contraste. L étant la matrice des coefficients de contraste et B le vecteur de paramètre. Contrastes possibles Les contrastes fournis sont écart. Le test des hypothèses est fondé sur l'hypothèse nulle LB =0.392 Chapitre 22 Contrastes GLM Figure 22-4 Boîte de dialogue GLM Univarié : Contrastes Les contrastes servent à tester les différences entre les niveaux d'un facteur. Si un contraste est spécifié. vous pouvez choisir si la modalité de référence est la première ou la dernière. Le résultat reprend une statistique F pour chaque ensemble de contrastes. Les colonnes restantes sont ajustées de telle sorte que la matrice L puisse être estimée. SPSS crée une matrice L de telle sorte que les colonnes correspondant au facteur correspondent aux contrastes. Pour les contrastes d'écart et simple. simple. Les contrastes représentent des combinaisons linéaires des paramètres. . répétée et modèle polynomial. Vous pouvez spécifier un contraste pour chaque facteur du modèle (dans un modèle de mesures répétées. différence.

l'effet cubique etc. Modèle polynomial : Compare l'effet linéaire. le second degré l'effet quadratique. Vous pouvez prendre la première ou la dernière modalité en référence. etc. l'effet quadratique. Ce type de contraste est utile lorsqu'il y a un groupe de contrôle. Le premier degré de liberté contient l'effet linéaire sur toutes les modalités. (Parfois appelé contrastes d'Helmert inversé. Ces contrastes servent souvent à estimer les tendances polynomiales. Répété : Compare la moyenne de chaque niveau (hormis le premier) à la moyenne du niveau suivant.393 Analyse GLM – Univarié Types de contraste Ecart : Compare la moyenne de chaque niveau (hormis une modalité de référence) à la moyenne de tous les niveaux (grande moyenne). Les niveaux du facteur peuvent être de n'importe quel ordre. Simple : Compare la moyenne de chaque niveau à celle d'un niveau donné. .) Helmert : Compare la moyenne de chaque niveau de facteur (hormis le dernier) à la moyenne des niveaux suivants. Différence : Compare la moyenne de chaque niveau (hormis le premier) à la moyenne des niveaux précédents.

Chaque niveau dans un troisième facteur peut servir à créer un diagramme distinct. Pour les analyses multivariées. Tous les facteurs fixés et aléatoire sont disponibles pour les diagrammes. les diagrammes des profils sont créés pour chaque variable dépendante.394 Chapitre 22 Diagrammes de profils GLM Figure 22-5 Boîte de dialogue GLM – Univarié : Diagrammes des protocoles Les diagrammes des profils (diagrammes d'interaction) sont utiles pour comparer les moyennes marginales dans votre modèle. Les niveaux d'un second facteur peuvent servir à dessiner des courbes distinctes. GLM Multivarié et GLM Mesures répétées sont disponibles uniquement si vous avez l'option Statistiques avancées installée. Les courbes non parallèles indiquent une interaction. Un diagramme des profils pour un facteur montre si la moyenne marginale estimée est croissante ou décroissante sur les niveaux. ce qui signifie que vous rechercher les niveaux d'un seul facteur. des courbes parallèles indiquent qu'il n'y a pas d'interaction entre les facteurs. Un diagramme des profils est une courbe dont chaque point indique la moyenne marginale estimée d'une variable dépendante (ajustée pour les covariables) à un niveau du facteur. Pour au moins deux facteurs. à la fois les facteurs inter-sujets et intra-sujets peuvent être utilisés dans les diagrammes des profils. . Dans une analyse à mesures répétées.

des facteurs pour des courbes ou des diagrammes distincts. Ces tests servent aux facteurs inter-sujets . Les comparaisons sont effectuées sur des valeurs non-ajustées. éventuellement. Comparaisons post hoc GLM Figure 22-7 Boîte de dialogue GLM – Univarié : Comparaisons multiples post hoc pour les moyennes observées Test de comparaison multiple post hoc : Lorsque vous avez déterminé qu'il existe des différences parmi les moyennes.395 Analyse GLM – Univarié Figure 22-6 Diagramme non parallèle (gauche) et diagramme parallèle (droite) Après avoir sélectionné des facteurs pour l'axe horizontal pour spécifier un diagramme et. le diagramme doit être ajouté dans la liste Diagrammes. les tests d'intervalles post hoc et de comparaisons multiples par paire peuvent déterminer les moyennes qui diffèrent.

Le test de comparaison par paire de Gabriel utilise également le modulus maximum selon Student. les tests post hoc sont effectués séparément pour chaque variable dépendante.Multivarié. utilisez le test double-face. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellules divergent beaucoup.396 Chapitre 22 fixés seulement. GLM Multivarié et GLM Mesures répétées sont disponibles uniquement si vous avez l'option Statistiques avancées installée. Les procédures multiples descendantes test d'abord que toutes les moyennes sont égales. Pour tester si la moyenne est inférieure. Ces tests sont plus efficaces que le test d'intervalle multiple de Duncan et Student-Newman-Keuls . pour vérifier si la moyenne est supérieure. l'égalité est testée sur des sous-ensembles de moyennes. Le test de Tukey utilise la statistique d'intervalle selon Student pour effectuer des comparaisons par paire entre les groupes et fixe le taux d'erreur empirique au taux d'erreur du regroupement de toutes les comparaisons par paire. sélectionnez > Contrôle. Vous pouvez également choisir la première modalité. La dernière modalité est la modalité de contrôle par défaut. Bonferroni est plus efficace. Dans GLM . le test de Tukey est plus efficace que celui de Bonferroni. Si toutes les moyennes ne sont pas égales. Pour tester que la moyenne à un certain niveau (hormis la modalité de contrôle) du facteur n'est pas égale à celle de la modalité de contrôle. ajuste le niveau de signification observé en fonction du nombre des comparaisons multiples qui sont effectuées. Lorsque vous tester un grand nombre de paire de moyennes. Pour GLM . Le F de R-E-G-W est fondé sur le test F et le Q de R-E-G-W est fondé sur l'intervalle selon Student. Vous pouvez également choisir un test unilatéral ou bilatéral. Le test de comparaison multiple de Dunnet compare un ensemble de traitements à une simple moyenne de contrôle. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellules sont inégales. Le test t de Sidak ajuste également le niveau de signification et fournit des limites plus strictes que le test de Bonferroni.Mesures répétées. Einot. à celle de la modalité de contrôle. Les tests de différence significative de Bonferroni et Tukey servent généralement comme tests de comparaison multiples. Le test de Tukey est généralement plus efficace. ces tests ne sont pas disponibles s'il n'y a pas de facteurs inter-sujets. à celle de la modalité de contrôle. fondé sur la statistique t de Student. En outre. Gabriel et Welsch (R-E-G-W) ont développé deux tests d'intervalles multiples descendants. Les tests de comparaisons multiples post hoc sont effectués pour la moyenne de tous les niveaux des facteurs intra-sujets. Le GT2 de Hochberg est similaire au test de Tukey mais il utilise un modulus maximum selon Student. à un certain niveau du facteur. Le test de Bonferroni. Lorsqu'il y a peu de paire. sélectionnez < Contrôle. Ryan. à un certain niveau du facteur.

le GT2 de Hochberg. Lorsque les variances sont inégales.397 Analyse GLM – Univarié (procédures multiples descendantes). mais ils sont conseillés lorsque les cellules sont de taille inégale. Tests affichés : Les comparaisons par paire sont proposées pour LSD. Le niveau de signification du test de Scheffé est conçu pour permettre toutes les combinaisons linéaires possibles des moyennes de groupe à tester. Duncan. b de Tukey. C et T3 de Dunnett. F et Q de R-E-G-W et Waller. ce qui signifie qu'une plus grande différence de moyenne est nécessaire pour être significative. Sidak. L'inconvénient de ce test est qu'il n'essaie pas d'ajuster le niveau d'importante observée pour les comparaisons multiples. Le test t de Waller-Duncan utilise une approche de Bayes. Le test d'intervalle multiple de Duncan. T2 et T3 de Tamhane. Student-Newman-Keuls (S-N-K) et le b de Tukey sont des tests d'intervalle qui classifient les moyennes de groupe et calculent une valeur d'intervalle. le test de Gabriel et le test de Scheffé sont à la fois des tests de comparaison multiple et des tests d'intervalle. Le test de comparaison multiple par paire de différence la moins significative (LSD) est équivalent aux divers tests t individuels entre toutes les paires des groupes. utilisez le T2 de Tamhane (test de comparaisons par paire conservatif fondé sur un test t). pas seulement par paire. Il en résulte que le test de Scheffé est souvent plus strict que les autres tests. Bonferroni. disponibles dans cette fonction. Ce test d'intervalle utilise la moyenne harmonique de la taille de l'échantillon lorsque les échantillons sont de différentes tailles. Ces tests ne sont pas utilisés aussi souvent que les tests évoqués précédemment. Le test de Tukey. Games et Howell. le test de comparaison par pairedeGames-Howell (parfois flexible) ou le C de Dunnett (test de comparaison par paire fondé sur l'intervalle selon Student). Des sous-ensembles homogènes pour les tests d'intervalle sont proposés pour S-N-K. le T3 de Dunnett (comparaison par paire fondée sur le modulus maximal selon Student). .

La plupart de ces variables peuvent servir à étudier les hypothèses relatives aux données. . Pour enregistrer les valeurs afin de les utiliser dans une autre session SPSS. Disponibles uniquement lorsqu'une variable WLS a été préalablement sélectionnée. les résidus et les mesures associées sous forme de nouvelles variables dans l'éditeur de données. pour les observations ayant la même valeur pour les variables indépendantes. vous devez enregistrer le fichier de données en cours. „ „ „ Non standardisés : Valeur prévue par le modèle pour la variable dépendante. Prévisions : Valeurs que le modèle estime pour chaque observation. Erreur standard : Estimation de l'écart type de la valeur moyenne de la variable dépendante.398 Chapitre 22 Enregistrement GLM Figure 22-8 Boîte de dialogue GLM – Univarié : Enregistrement Vous pouvez enregistrer les prévisions par le modèle. Pondéré : Valeurs estimées non standardisées pondérées. Diagnostics : Mesures permettant d'identifier les observations avec des combinaisons inhabituelles de valeurs pour les variables indépendantes et les observations qui peuvent avoir un impact important sur le modèle.

il y a les mêmes lignes pour chaque variable dépendante. Egalement appelés résidus de Pearson. Influence relative de chaque observation sur la qualité d'ajustement du modèle. selon la distance entre les valeurs et la moyenne des variables indépendantes pour chaque observation. les résidus standardisés ont une moyenne de 0 et un écart type de 1. Il s'agit de la différence entre la valeur de la variable dépendante et la prévision ajustée. „ Supprimées : Résidu d'une observation lorsque celle-ci est exclue du calcul des coefficients de régression. Enregistrer dans nouveau fichier : Ecrit un fichier de données SPSS qui contient une matrice variance-covariance des estimations dans le modèle. Si vous avez choisi une variable de pondération. qui varie d'une observation à une autre. l'exclusion d'une observation changerait substantiellement la valeur des coefficients. Les résidus standardisés. Disponibles uniquement lorsqu'une variable WLS a été préalablement sélectionnée. une ligne de valeurs de signification pour les statistiques t correspondant aux estimations et une ligne de degrés de liberté résiduels. les résidus standardisés pondérés sont disponibles. divisé par une estimation de son écart type. Si la distance de Cook est élevée. . Standardisés : Résidu divisé par une estimation de son écart type. Vous pouvez utiliser ce fichier de matrice dans les autres procédures qui lisent un fichier de matrice SPSS. D'autre part. Pondéré : Résidus estimés non standardisés pondérés. „ Valeurs influentes : Valeurs influentes non centrées. Résidus : Un résidu non standardisé correspond à la valeur réelle de la variable dépendante moins la valeur estimée par le modèle. „ Studentisés : Résidu. Pour un modèle multivarié. il y aura une ligne d'estimations. „ „ „ Non standardisés : Différence entre la valeur observée et la valeur prévue par le modèle. pour chaque variable dépendante.399 Analyse GLM – Univarié „ Distance de Cook : Mesure permettant de savoir de combien les résidus de toutes les observations seraient modifiés si une observation donnée était exclue du calcul des coefficients de régression. selon Student et supprimés sont également disponibles.

. Cet élément est disponible uniquement si Comparer les effets principaux est sélectionné.Univarié : Options Des statistiques facultatives sont disponibles à partir de cette boîte de dialogue. Ces moyennes sont ajustées pour les covariables. „ Ajustement intervalle de confiance : Sélectionnez l'ajustement aux intervalles et à la significativité des intervalles en adoptant l'une des méthodes suivantes : la différence de moindre signification (LSD). „ Comparer les effets principaux : Propose des comparaisons par paire non corrigées des moyennes marginales estimées pour tout effet principal dans le modèle.400 Chapitre 22 Options GLM Figure 22-9 Boîte de dialogue GLM. Moyenne marginale estimée : Sélectionnez les facteurs et les interactions pour lesquels vous souhaitez obtenir des estimations de la moyenne marginale de la population dans les cellules. à la fois pour les facteurs inter-sujets et intra-sujets. Ces statistiques sont calculées à l'aide de modèle à effets fixes. Ceci n'est valable que si les effets principaux sont sélectionnés dans la liste Afficher les moyennes. l'ajustement Bonferroni ou l'ajustement de Sidak. si elles existent.

Ceci n'est pas valable s'il n'y a pas de facteurs. des tests t. Sélectionnez Estimation des paramètres pour produire des estimations de paramètres. Sélectionnez Diagrammes résiduels pour produire un diagramme résiduel observé/estimé/standardisé pour chaque variable dépendante. Les lignes de n'importe quelle matrice des coefficients de contraste sont des combinaisons linéaires de la fonction générale estimée. L'option des tests d'homogénéité produit le test de Levene d'homogénéité de la variance pour chaque variable dépendante sur toutes les combinaisons de niveaux des facteurs inter-sujets. des écarts types et des effectifs pour toutes les variables dépendantes de toutes les cellules.401 Analyse GLM – Univarié Afficher : Sélectionnez Statistiques descriptives pour produire des moyennes. Fonctionnalités supplémentaires de la commande UNIANOVA Le langage de commande SPSS vous permet aussi de : „ Spécifier les effets en cascade dans un modèle (à l'aide de la sous-commande DESIGN). uniquement pour les facteurs inter-sujets. le niveau associé des intervalles de confiance est affiché dans la boîte de dialogue. Niveau de signification : Vous souhaitez peut-être ajuster le niveau de signification utilisé dans les tests post hoc et le niveau de confiance utilisé pour construire des intervalles de confiance. des intervalles de confiance et la puissance observée de chaque test. La valeur spécifiée est également utilisée pour calculer l'intensité observée pour le test. La statistique d'Eta carré décrit la proportion de la variabilité totale imputable au facteur. Les options des diagrammes de dispersion par niveau et de résidus sont utiles pour vérifier les hypothèses sur les données. Lorsque vous spécifiez un niveau de signification. des erreurs standard. Ces diagrammes sont utiles pour vérifier l'hypothèse de variance égale. Sélectionnez Puissance observée pour obtenir la puissance du test lorsque l'autre hypothèse est définie sur la base de la valeur observée. Sélectionnez Matrice des coefficients de contraste pour obtenir la matrice L. Sélectionnez Manque d'ajustement pour vérifier si la relation entre la variable dépendante et les variables indépendantes peut être convenablement décrite par le modèle. . Fonction générale estimée vous permet de construire des tests d'hypothèses personnalisés basés sur la fonction générale estimée. L'option Estimation d'effet de taille fournit une valeur partielle de Eta carré pour chaque effet et chaque estimation.

spécifier une modalité de référence intermédiaire (à l'aide de la sous-commande CONTRAST). Calculer les moyennes marginales estimées pour chaque facteur ou interaction de facteurs parmi les facteurs de la liste (à l'aide de la sous-commande EMMEANS). „ Pour obtenir des renseignements complets sur la syntaxe. Spécifier des termes d'erreur pour les comparaisons post hoc (à l'aide de la sous-commande POSTHOC). Construire un fichier de matrice de corrélation (à l'aide de la sous-commande OUTFILE). Spécifier les critères EPS (à l'aide de la sous-commande CRITERIA). Construire un fichier de type matrice de données qui contient les statistiques provenant de la table ANOVA inter-sujets (à l'aide de la sous-commande OUTFILE). Inclure les valeurs manquantes pour l'utilisateur (à l'aide de la sous-commande MISSING). Construisez une matrice L personnalisée. Pour les contrastes simples ou d'écart. . Spécifier de multiples contrastes (à l'aide de la sous-commande CONTRAST). reportez-vous au manuel SPSS Command Syntax Reference.402 Chapitre 22 „ „ „ „ „ „ „ „ „ „ „ „ Spécifier les tests d'effets par rapport à une combinaison linéaire d'effets ou une valeur (à l'aide de la sous-commande TEST). Attribuer des noms aux variables temporaires (à l'aide de la sous-commande SAVE). Spécifier les mesures pour les contrastes polynomiaux (à l'aide de la sous-commande CONTRAST). une matrice M ou une matrice K (à l'aide des sous-commandes LMATRIX. Enregistrer la matrice du plan dans un nouveau fichier de données (à l'aide de la sous-commande OUTFILE). MMATRIX et KMATRIX).

Deux variables peuvent être parfaitement liées. Remarques sur les données des corrélations bivariées Données : Utilisez des variables quantitatives symétriques pour le coefficient de corrélation de Pearson.401) et la corrélation est significative au niveau 0. on a les éléments suivants : nombre d'observations avec des valeurs non manquantes. le coefficient de corrélation de Pearson n'est pas une statistique appropriée pour mesurer leur association. 403 .05. moins l'adversaire a marqué de points. Avant de calculer un coefficient de corrélation. mais si la relation n'est pas linéaire. produits des écarts et covariance. le rho de Spearman et le tau-b de Kendall avec leurs seuils de signification. rho de Spearman. Le coefficient de corrélation de Pearson est une mesure d'association linéaire.581) est significatif au niveau 0. Les corrélations mesurent comment les variables ou les ordres de rang sont liés. Pour chaque paire de variables. moyenne. Statistiques : Pour chaque variable. Exemple : Le nombre de matchs de basket-ball remportés par une équipe est-il lié au nombre moyen de points marqués par match ? Un diagramme de dispersion indique qu'il existe une relation linéaire.Corrélations bivariées 23 Chapitre La procédure de corrélations bivariées calcule le coefficient de corrélation de Pearson. Ces variables sont liées négativement (–0. on a les éléments suivants : coefficient de corrélation de Pearson. et écart type. parcourez vos données pour rechercher les valeurs éloignées (qui peuvent provoquer des résultats erronés) et les traces d'une relation linéaire. L'analyse des données de la saison NBA 1994–1995 démontre que le coefficient de corrélation de Pearson (0. et des variables quantitatives ou des variables avec des modalités ordonnées pour le rho de Spearman et le tau-b de Kendall. On peut penser que plus on a gagné de matchs dans une saison.01. tau-b de Kendall.

581** 1. Corrélation à 0.000 .457* -. sélectionnez : Analyse Corrélation Bivariée.017 ..457* 1. Corrélation à 0.01(bilatérale) :… *. Echantillon de résultat Figure 23-1 Résultats des corrélations bivariées Corrélations Correlations Nombre de matchs gagnés Corrélation de Pearson Nombre de matchs gagnés Points marqués par match Points en défense par match Signification (bilatérale) Nombre de matchs gagnés Points marqués par match Points en défense par match N Nombre de matchs gagnés Points marqués par match Points en défense par match **.038 .401* .001 . .581** Points en défense par match -.017 .038 .05(bilatérale) :… 1. . 27 27 27 27 27 27 27 27 27 Pour obtenir des corrélations bivariées A partir du menu.401* ..000 Points marqués par match . .404 Chapitre 23 Hypothèses : Le coefficient de corrélation de Pearson part du principe que chaque paire de variables est gaussienne bivariée.001 .000 .

normalement distribuées. qui mesure l'association entre les ordres de rangs. sélectionnez Bilatéral. choisissez Unilatéral. „ Repérer les corrélations significatives : Les coefficients de corrélation significatifs au niveau 0. Lors de l'interprétation de vos résultats. . Les options suivantes sont également disponibles : „ Coefficients de corrélation : Pour des variables quantitatives.05 sont identifiés par un seul astérisque et ceux qui sont significatifs au niveau 0. à partir de l'existence d'une corrélation significative. La valeur 0 indique l'absence de relation linéaire. vous ne pouvez pas. Sinon.01 sont identifiés par deux astérisques. Si la direction de l'association est connue à l'avance. choisissez le coefficient de corrélation de Pearson. „ Test de signification : Vous pouvez choisir des probabilités bilatérales ou unilatérales. choisissez le Tau-b de Kendall ou la corrélation de Spearman.405 Corrélations bivariées Figure 23-2 Boîte de dialogue Corrélations bivariées E Sélectionnez plusieurs variables numériques. conclure en l'existence d'une relation de cause à effet. Les coefficients de corrélation vont de la valeur –1 (relation négative parfaite) à +1 (relation positive parfaite). Si vos données ne sont pas distribuées normalement ou si elles comportent des modalités ordonnées.

Valeurs manquantes : Vous pouvez choisir l'un des éléments suivants : „ Exclure seulement les composantes non valides : Les observations avec des valeurs manquantes pour l'une ou les deux variables d'une paire pour un coefficient de corrélation sont exclues de l'analyse. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour une variable sont exclues de toutes les analyses. la quantité maximale d'informations disponibles est utilisée dans chaque calcul. Ceci peut aboutir à un jeu de coefficients basé sur un nombre variable d'observations. Le nombre d'observations avec valeurs non manquantes est également affiché. égale au produit des écarts divisé par N–1. Ceci est le numérateur du coefficient de corrélation de Pearson. Etant donné que chaque coefficient est basé sur toutes les observations ayant des codes valides pour cette paire particulière de variables. „ Produits des écarts et covariances : Indiqués pour chaque paire de variables. Les valeurs manquantes sont examinées variable par variable quel que soit votre réglage des valeurs manquantes. Le produit des écarts est égal à la somme des produits des variables moyennes corrigées.406 Chapitre 23 Options de corrélations bivariées Figure 23-3 Boîte de dialogue Corrélations bivariées : Options Statistiques : Pour les corrélations de Pearson. La covariance est une mesure non standardisée de la relation entre deux variables. . vous pouvez choisir l'une des options suivantes (ou les deux) : „ Moyennes et écarts types : Affichés pour chaque variable.

407 Corrélations bivariées Propriétés supplémentaires des commandes CORRELATIONS et NONPAR CORR Le langage de commande SPSS vous permet aussi de : „ Ecrire une f pour les corrélations de Pearson qui peut être utilisée à la place de données brutes pour obtenir d'autres analyses comme une analyse factorielle (avec la sous-commande MATRIX). reportez-vous au manuel SPSS Command Syntax Reference. Obtenir des corrélations de chaque variable dans une liste avec chaque variable d'une seconde liste (en utilisant le mot clé WITH avec la sous-commande VARIABLES). „ Pour obtenir des renseignements complets sur la syntaxe. .

.

Cependant. Le financement lié aux soins de santé et les taux d'attaque sont associés de manière positive car le nombre de personnes ayant accès aux soins de santé augmente en même temps que le financement. De ce fait.Corrélations partielles 24 Chapitre La procédure des corrélations partielles calcule les coefficients de corrélation partielle qui décrivent le rapport linéaire entre deux variables tout en contrôlant les effets d'une ou plusieurs autres variables. Deux variables peuvent être parfaitement liées mais. Statistiques : Pour chaque variable. un coefficient de corrélation n'est pas une statistique adaptée pour mesurer leur association. on a les éléments suivants : nombre d'observations avec des valeurs non manquantes. Les corrélations sont des mesures d'association linéaire. moyenne. et écart type. si leur rapport n'est pas linéaire. les taux d'attaque augmentent. Exemple : Existe-t-il une relation entre le financement associé aux soins de santé et les taux d'attaque ? Contre toute attente. Remarques sur les données des corrélations partielles Données : Utiliser des variables quantitatives et symétriques. Matrices de corrélation partielle et simple. le contrôle du taux de visite aux fournisseurs de soins de santé supprime presque la corrélation positive observée. Hypothèses : La procédure des Corrélations Partielles suppose que chaque paire de variables présente une corrélation normale. 409 . le nombre de maladies déclarées par les docteurs et les hôpitaux augmente également. une étude fait état d'une corrélation positive : Lorsque le financement associé aux soins de santé augmente. avec degrés de liberté et seuils de signification.

.410 Chapitre 24 Echantillon de résultat Figure 24-1 Résultats de Corrélations Partielles Obtenir des corrélations partielles E A partir du menu. sélectionnez : Analyse Corrélation Partielle. ..

Si la direction de l'association est connue à l'avance. E Sélectionnez une ou plusieurs variables numériques de contrôle. et les degrés de liberté sont supprimés. Si vous désélectionnez cette option. . Les options suivantes sont également disponibles : „ Test de signification : Vous pouvez choisir des probabilités bilatérales ou unilatérales. les coefficients significatifs au seuil de 0. Sinon. Cette configuration affecte aussi bien les matrices de corrélation partielle que simple.05 sont identifiés par une astérisque.411 Corrélations partielles Figure 24-2 Boîte de dialogue Corrélations partielles E Sélectionnez au moins deux variables numériques pour lesquelles vous voulez calculer des corrélations partielles. les coefficients significatifs au seuil 0. choisissez Unilatéral.01 par deux astérisques. sélectionnez Bilatéral. „ Afficher le seuil exact de signification : La probabilité et les degrés de liberté sont affichés par défaut pour chaque coefficient de corrélation.

y compris les variables de contrôle. Lorsque la suppression des composantes non valides seulement est sélectionnée. . sont exclues de tous les calculs. La suppression des composantes non valides seulement utilise autant de données que possible. s'affiche. „ Corrélations simples : Une matrice de corrélations simples entre toutes les variables. y compris une variable de contrôle. „ Exclure seulement les composantes non valides : Pour le calcul des corrélations simples sur lesquelles se basent les corrélations partielles. une observation ayant des valeurs manquantes pour une composante ou les deux composantes d'une paire de variables ne sera pas utilisée. Valeurs manquantes : Vous avez le choix entre les options suivantes : „ Exclure toute observation incomplète : Les observations ayant des valeurs manquantes pour une variable quelconque. Le nombre d'observations avec valeurs non manquantes est également affiché.412 Chapitre 24 Options Corrélations partielles Figure 24-3 Boîte de dialogue Corrélations partielles : Options Statistiques : Vous avez le choix entre les deux options suivantes : „ Moyennes et écarts types : Affichés pour chaque variable. les degrés de liberté d'un coefficient partiel donné sont basés sur le plus petit nombre d'observations utilisées dans le calcul de l'une quelconque des corrélations d'ordre zéro. Le nombre d'observations peut toutefois différer selon les coefficients.

Sokal et Sneath 4. comme l'analyse factorielle. il s'agit des mesures suivantes : Russel et Rao. Exemple : Est-il possible de mesurer les similarités entre des paires de voitures en fonction de certaines caractéristiques. vous pouvez déterminer les voitures qui sont semblables et celles qui sont différentes. les mesures sont khi-deux et phi-deux. Pour les données binaires. Pour les données d'intervalles. la distance de Tchebycheff. Kulczynski 2. Y de Yule. la distance de Minkowski ou une mesure personnalisée. Vous pourrez ensuite utiliser ces mesures de similarité ou de dissimilarité avec d'autres procédures. ou la mesure de Lance et Williams. comme le nombre de cylindres. la différence de motif. Statistiques : Pour les données d'intervalle. Dans l'optique d'une analyse plus formelle. Pour les données binaires. Sokal et Sneath 5. Q de Yule. les mesures de similarité sont la corrélation de Pearson ou cosinus. le carré de la distance Euclidienne. Jaccard. les mesures de dissimilarité sont la distance Euclidienne. les mesures de dissimilarité sont la distance Euclidienne. Kulczynski 1. Rogers et Tanimoto. vous pouvez appliquer une classification hiérarchique ou un positionnement multidimensionnel aux similarités afin d'examiner la structure sous-jacente. afin de simplifier l'analyse des ensembles de données complexes. la distance de Manhattan (bloc). l'écart de taille. la classification ou le positionnement multidimensionnel. Sokal et Sneath 3. Hamann. la variance. 413 . D d'Anderberg. Ochiai. lambda. indice de Sokal et Michener. Sokal et Sneath 2. Dice. Sokal et Sneath 1. corrélation phi tétrachorique ou dispersion. le carré de la distance Euclidienne. la forme.Distances 25 Chapitre Cette procédure permet de calculer de très nombreuses statistiques mesurant les similitudes ou les différences (distances) entre des paires de variables ou d'observations. la consommation et la puissance ? En calculant les similarités existant entre des voitures. Pour les données d'effectif.

414 Chapitre 25 Pour obtenir des matrices de distance E A partir du menu. . sélectionnez : Analyse Corrélation Indices Figure 25-1 Boîte de dialogue Distances E Sélectionnez au minimum une ou deux variables numériques pour calculer respectivement les distances existant entre des observations ou des variables. E Sélectionnez une possibilité dans le groupe Calculer les distances pour calculer les proximités existant entre des observations ou des variables.

Carré de la distance Euclidienne. Aucune autre valeur ne sera prise en compte dans Distances. Forme. par type de données : „ „ „ Intervalle : Distance Euclidienne. (Entrez des valeurs dans les champs Présent et Absent pour indiquer les deux valeurs significatives. Ces transformations ne s'appliquent pas aux données binaires. Variance.415 Distances Distances : Mesures de dissimilarité Figure 25-2 Boîte de dialogue Indices : Mesures de dissimilarité Dans le groupe Mesure. effectif ou binaire). ou Lance et Williams. Carré de la distance Euclidienne. Distance de Manhattan.) Le groupe Transformer les valeurs vous permet de standardiser les valeurs des données pour les observations ou les variables avant le calcul des proximités. Binaire : Distance Euclidienne. sélectionnez la possibilité qui correspond au type de vos données (intervalle. Ensuite. Effectifs : Distance du Khi-deux ou Distance du phi-deux. Distance de Tchebycheff. sélectionnez l'une des mesures correspondant à ce type de données. dans la liste déroulante. Les méthodes de . Ecart de taille. Différence de motif. Distance de Minkowski ou Autre. Les mesures disponibles sont.

Le groupe Transformer les mesures vous permet de transformer les valeurs générées par la mesure de distance. Ensuite. Indices : Mesures de similarité Figure 25-3 Boîte de dialogue Indices : Mesures de similarité Dans le groupe Mesure. Kulczynski 2. Lambda. par type de données : „ „ Intervalle : Corrélation de Pearson ou Cosinus. Les options possibles sont Valeurs absolues. Hamann. Binaire : Russel et Rao. Sokal et Sneath 2.416 Chapitre 25 standardisation disponibles sont Centrer-réduire. Moyenne = 1 et Ecart type = 1. Rogers et Tanimoto. Ochiai. Dice. et Rééchelonner entre 0 et 1. Indice de Sokal et Michener. Entre 0 et 1. sélectionnez la possibilité qui correspond au type de vos données (intervalle ou binaire). dans la liste déroulante. Kulczynski 1. Corrélation phi tétrachorique ou Dispersion. Jaccard. Sokal et Sneath 3.) . D d'Anderberg. sélectionnez l'une des mesures correspondant à ce type de données. Inverser le signe. Q de Yule. (Entrez des valeurs dans les champs Présent et Absent pour indiquer les deux valeurs significatives. Entre –1 et 1. Aucune autre valeur ne sera prise en compte dans Distances. Maximum = 1. Les mesures disponibles sont. Sokal et Sneath 5. Sokal et Sneath 4. Y de Yule. Elles sont appliquées après le calcul de la mesure de distance. Sokal et Sneath 1.

et Rééchelonner entre 0 et 1. Moyenne = 1 ou Ecart type = 1. Ces transformations ne s'appliquent pas aux données binaires. Les méthodes de standardisation disponibles sont Centrer-réduire. Elles sont appliquées après le calcul de la mesure de distance. Maximum = 1. Entre –1 et 1. . Les options possibles sont Valeurs absolues. Inverser le signe.417 Distances Le groupe Transformer les valeurs vous permet de standardiser les valeurs des données pour les observations ou les variables avant le calcul des proximités. Le groupe Transformer les mesures vous permet de transformer les valeurs générées par la mesure de distance. Entre 0 et 1.

.

erreur standard de l'estimation. Statistiques : Pour chaque variable. mesures et corrélations partielles. différence de prévision. R2 ajusté. intervalles de confiance à 95 % pour chaque coefficient de régression. Lorsque le nombre de matches gagnés augmente. A l'aide de la régression linéaire. moyenne et écart type. mesures de distances (Mahalanobis. le nombre moyen de points marqués par les adversaires diminue. R multiple. matrice de corrélations. et valeurs influentes). Cook. Par exemple. on a les éléments suivants : nombre d'observations valides. tableau d'analyse de la variance. DfBêta. Exemple : Le nombre de matches gagnés par une équipe de basket-ball au cours d'une saison est-il lié au nombre moyen de points marqués par l'équipe à chaque match ? Un diagramme de dispersion indique que ces variables ont un lien linéaire. intervalles d'estimation et diagnostics des observations. Ces variables ont une relation négative. test de Durbin-Watson. qui estiment le mieux la valeur de la variable dépendante. diagrammes partiels. 419 . Un bon modèle peut être utilisé pour prévoir combien de matches les équipes vont gagner. R2. histogrammes et diagrammes de répartition gaussiens. matrice variances-covariances. vous pouvez modéliser la relation entre ces variables. l'éducation et les années d'expérience. impliquant une ou plusieurs variables indépendantes. variation de R2. vous pouvez essayer d'estimer les ventes annuelles globales d'un commercial (la variable dépendante) à partir de variables indépendantes telles que l'âge. En plus. Le nombre de matches gagnés et le nombre moyen de points marqué par l'équipe adverse ont également un lien linéaire. Pour chaque modèle : coefficients de régression.Régression linéaire 26 Chapitre La régression linéaire estime les coefficients de l'équation linéaire. tolérance. Diagrammes : dispersion. prévisions et résidus. facteur d'inflation de la variance.

La variance de la distribution de la variable dépendante doit être constante pour toutes les valeurs de la variable indépendante. la zone de résidence. doivent être enregistrées sous forme de variables binaires (muettes) ou sous de tout autre type de variables de contraste.420 Chapitre 26 Régression linéaire : Remarques sur les données Données : Les variables dépendantes et indépendantes doivent être quantitatives. la qualification. la distribution de la variable dépendante doit être normale. comme la religion. Les variables qualitatives. Echantillon de résultat Figure 26-1 Résultat de régression linéaire . Hypothèses : Pour chaque valeur de la variable indépendante. La relation entre la variable dépendante et chaque variable indépendante doit être linéaire et toutes les observations doivent être indépendantes.

947 . Méthode : introduction simultanée ANOVA 2 Somme des carrés Modèle 1 Régression Résidus Total 4080.266 19. points marqués par match… 2.467 4546. Variables indép.898 . . points marqués par 1. points marqués par match… 2. R carré ajusté de l'estimation . Toutes les variables requises entrées.889 4. Variable dépendante : nombre de matchs gagnés 4. : (constante) points en défense par match. 3.2 match Supprimées R R carré Erreur std. Variables indép. : (constante) points en défense par match.533 465.0001 1.394 F 105.4 Variables Entrées Modèle 1 Points en défense par match.198 Significatif . Variable dépendante : nombre de matchs gagnés .421 Régression linéaire Résumé de modèle 3.000 df 2 24 26 Carré moyen 2040.40 1.

.. Coefficients standardisés Bêta Variable dépendante : nombre de matchs gagnés Obtenir une analyse de régression linéaire E A partir du menu. . sélectionnez : Analyse Régression Linéaire.422 Chapitre 26 Coefficients non standardisés Modèle (constante) Points marqués par match Points en défense par match Erreur std.

sélectionnez une variable numérique dépendante. Sélectionner une variable d'identification d'observations pour identifier des points sur les diagrammes. vous pouvez : „ „ „ „ Grouper des variables indépendantes en blocs et spécifier différentes méthodes d'entrée pour différents sous-groupes de variables. Sélectionnez une variable de pondération WLS numérique pour une analyse des moindres carrés pondérés. E Sélectionnez une ou plusieurs variables indépendantes. Sinon.423 Régression linéaire Figure 26-2 Boîte de dialogue Régression linéaire E Dans la boîte de dialogue Régression linéaire. Choisir une variable de sélection pour limiter l'analyse à un sous-groupe d'observations ayant une ou des valeurs particulières pour cette variable. .

l'observation est exclue de l'analyse. La procédure prend fin quand plus aucune variable de l'équation ne satisfait aux critères d'élimination. Les variables déjà comprises dans l'équation de régression sont éliminées si leur probabilité de F devient trop grande. „ „ Eliminer bloc : Procédure de sélection de variables dans laquelle toutes les variables d'un bloc sont supprimées en une seule étape. Méthodes de sélection des variables de régression linéaire La sélection d'une méthode vous permet de spécifier la manière dont les variables indépendantes sont entrées dans l'analyse. Le processus s'arrête lorsqu'aucune variable ne peut plus être introduite ou éliminée. La variable ayant la plus petite corrélation partielle avec la variable dépendante est la variable dont l'élimination est étudiée en premier. Si la première variable est introduite dans l'équation. Pas à pas : A chaque étape. si cette probabilité est suffisamment faible. La . négative ou manquante. elle est supprimée. Ainsi. l'élimination de la variable suivante restant dans l'équation et ayant le plus petit coefficient de corrélation partielle est étudiée. Les points de données sont pondérés par l'inverse de leur variance. dans laquelle les variables sont introduites séquentiellement dans le modèle. la variable indépendante externe à l'équation et qui présente la plus forte corrélation partielle est considérée ensuite. Cette variable n'est introduite dans l'équation que si elle satisfait le critère d'introduction. „ „ Introduire (régression) : Procédure de sélection de variables au cours de laquelle toutes les variables d'un bloc sont introduites en une seule opération. le programme saisit la variable indépendante exclue de l'équation ayant la plus petite probabilité de F. Une fois la première variable éliminée. vous pouvez construire divers modèles de régression à partir du même groupe de variables. Elimination descendante : Procédure de sélection de variables au cours de laquelle toutes les variables sont entrées dans l'équation. Si elle répond aux critères d'élimination. „ Introduction ascendante : Procédure de sélection pas à pas de variables. puis éliminées une à une. les observations dont la variance est élevée ont moins d'impact sur l'analyse que celles dont la variance est faible. En utilisant différentes méthodes. La première variable considérée est celle qui a la plus forte corrélation positive ou négative avec la variable dépendante.424 Chapitre 26 WLS : Permet d'obtenir un modèle des moindres carrés pondéré. Si la valeur de la variable de pondération est nulle.

Ascendante ou Descendante). alors seules les observations pour lesquelles la variable sélectionnée a une valeur égale à 5 seront incluses dans l'analyse. Régression linéaire : Définir la règle Figure 26-3 Boîte de dialogue Régression linéaire : Définir loi Les observations définies par la règle de sélection sont incluses dans l'analyse. Les valeurs de significativité dans vos résultats sont basées sur l'adéquation à un modèle unique. Par exemple. et 5 pour la valeur. si vous sélectionnez une variable. . Toutes les variables indépendantes sélectionnées sont ajoutées dans un seul modèle de régression. Par exemple. Toutes les variables doivent respecter le critère de tolérance pour être entrées dans l'équation. Une variable n'est pas entrée si elle fait passer la tolérance d'une autre variable déjà entrée dans le modèle en dessous du seuil de tolérance. cliquez sur Suivant. vous pouvez entrer un bloc de variables dans le modèle de régression en utilisant la sélection pas à pas. égale.425 Régression linéaire procédure s'interrompt lorsqu'il ne reste plus de variables satisfaisant au critère d'introduction. Le niveau de tolérance par défaut est 0. Par conséquent. les valeurs de significativité ne sont généralement pas valables lorsqu'on utilise une méthode progressive (Pas à pas.0001. vous pouvez spécifier différentes méthodes d'entrée pour les sous-groupes de variables. Pour ajouter un second bloc de variables au modèle de régression. Cependant. quelle que soit la méthode d'entrée spécifiée. et un second bloc en utilisant la sélection ascendante. Une valeur chaîne est également permise.

prévisions ajustées (*ADJPRED). Après avoir été enregistrés comme variables nouvelles. Les diagrammes sont également utiles pour détecter les valeurs éloignées. résidus supprimés de Student (*SDRESID). résidus supprimés (*DRESID). résidus standardisés (*ZRESID). résidus et autres diagnostics sont disponibles dans l'éditeur de données pour construire des diagrammes avec les variables indépendantes. ainsi que les variables prévues et les résidus suivants prévisions standardisées (*ZPRED). les prévisions. linéarité et d'égalité des variances. les observations éloignées et les observations influentes. les résidus standardisés et les résidus supprimés de Student. les résidus supprimés. Les diagrammes suivants sont disponibles : Diagrammes de dispersion : Vous pouvez afficher deux des éléments suivants : la variable dépendante.426 Chapitre 26 Diagrammes de régression linéaire Figure 26-4 Boîte de dialogue Régression linéaire : Graphiques (diagrammes) Les diagrammes peuvent aider à valider les hypothèses de normalité. les prévisions ajustées. . résidus de Student (*SRESID). Liste des variables sources : Répertorie la variable dépendante (DEPENDNT). les résidus standardisés. Affichez les résidus standardisés par rapport aux prévisions standardisées pour vérifier la linéarité et l'égalité des variances. les prévisions standardisées.

427 Régression linéaire Générer tous les graphiques partiels : Affiche des diagrammes de dispersion des résidus de chaque variable indépendante et les résidus de la variable dépendante lorsque les deux variables sont régressées séparément par rapport au reste des variables indépendantes. Si vous demandez des diagrammes. des statistiques récapitulatives sont affichées pour les prévisions standardisées et les résidus standardisés (*ZPRED et *ZRESID). Diagrammes des résidus standardisés : Vous pouvez obtenir des histogrammes des résidus standardisés et des diagrammes de répartition gaussiens en comparant la répartition des résidus standardisés à une répartition gaussienne. Régression linéaire : Enregistrer de nouvelles variables Figure 26-5 Boîte de dialogue Régression linéaire : Enregistrer les nouvelles variables . Au moins deux variables indépendantes doivent être dans l'équation pour produire un diagramme partiel.

pour les observations ayant la même valeur pour les variables indépendantes. „ Cook : Mesure permettant de savoir de combien les résidus de toutes les observations seraient modifiés si une observation donnée était exclue du calcul des coefficients de régression. Chaque sélection ajoute une ou plusieurs variables à votre fichier de données actif. Les prévisions standardisées ont une moyenne de 0 et un écart type de 1. „ Moyenne : Limites inférieure et supérieure (deux variables) de l'intervalle de prévision de la réponse moyenne prévue. Standardisés : Transformation de chaque prévision en sa forme standardisée. et la différence est divisée par l'écart type des prévisions. Estimation de l'écart type de la valeur moyenne de la variable dépendante. „ Valeurs influentes : Mesures de l'influence d'un point sur l'ajustement de la régression. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrêmes pour des variables indépendantes. Si la distance de Cook est élevée. La prévision moyenne est soustraite de la prévision. „ Mahalanobis : Mesure de la distance entre les valeurs d'une observation et la moyenne de toutes les observations sur les variables indépendantes. Erreur standard prévision moyenne : Erreurs standard des prévisions. Prévisions : Valeurs prévues par le modèle de régression pour chaque observation. „ „ Non standardisés : Valeur prévue par le modèle pour la variable dépendante. les résidus et autres statistiques utiles pour les diagnostics. La valeur influente centrée varie de 0 (aucune influence sur la qualité de l'ajustement) à (N-1)/N. Distances : Mesures permettant d'identifier les observations avec des combinaisons inhabituelles de valeurs pour les variables indépendantes et les observations qui peuvent avoir un impact important sur le modèle. „ „ Ajustées : Prévision pour une observation exclue du calcul des coefficients de régression. . l'exclusion d'une observation changerait substantiellement la valeur des coefficients. Intervalles de la prévision : Les limites supérieure et inférieure pour les intervalles de la prévision moyenne et individuelle.428 Chapitre 26 Vous pouvez enregistrer les prévisions.

Une valeur est calculée pour chaque terme du modèle. La différence entre le résidu supprimé de Student et le résidu de Student associé indique l'impact de l'élimination d'une observation sur sa propre prédiction. „ DfBêta(s) standardisée : Différence standardisée de la valeur bêta. „ Supprimées : Résidu d'une observation lorsque celle-ci est exclue du calcul des coefficients de régression. „ DfBêta(s) : La différence de bêta correspond au changement des coefficients de régression qui résulte du retrait d'une observation particulière. Vous devez sélectionner Moyenne ou Individuelle avant d'entrer cette valeur.429 Régression linéaire „ „ Individuelle : Limites inférieure et supérieure (deux variables) de l'intervalle de prévision de la variable dépendante pour une observation particulière. 95 et 99. Standardisés : Résidu divisé par une estimation de son écart type. Résidus : La valeur réelle de la variable indépendante moins la valeur prévue par l'équation de régression. Il s'agit de la différence entre la valeur de la variable dépendante et la prévision ajustée. „ Studentisés : Résidu.99 pour spécifier le seuil de confiance pour les deux intervalles de la prévision. divisé par une estimation de son écart type. Influences individuelles : La modification des coefficients de régression (DfBêta(s)) et des prévisions (différence de prévision) qui résulte de l'exclusion d'une observation particulière. Modification du coefficient de régression. Les valeurs DfBêtas et de différence de prévision standardisées sont également disponibles ainsi que le rapport de covariance. selon la distance entre les valeurs et la moyenne des variables indépendantes pour chaque observation. y compris la constante. Vous pouvez par exemple examiner les observations ayant des valeurs absolues supérieures à 2. Les seuils d'intervalle de confiance typiques sont 90. qui varie d'une observation à une autre. divisées par la racine carrée de N. „ Supprimés studentisés : Résidu supprimé d'une observation. Intervalle de confiance : Entrez une valeur comprise entre 1 et 99. Egalement appelés résidus de Pearson. divisé par son erreur standard. „ „ Non standardisés : Différence entre la valeur observée et la valeur prévue par le modèle. N représentant le nombre . résultant de l'exclusion d'une observation donnée. les résidus standardisés ont une moyenne de 0 et un écart type de 1.

l'observation modifie peu la matrice de covariance. p correspondant au nombre de paramètres du modèle et N. . Exporter les informations du modèle dans un fichier XML: Exporte les informations du modèle dans le fichier spécifié. au nombre d'observations. y compris la constante. „ „ Différence de prévision : La différence de prévision est le changement de la prévision résultant de l'exclusion d'une observation donnée. Vous pouvez par exemple examiner les valeurs standardisées dont la valeur absolue est supérieure à 2 fois la racine carrée de p/N. Enregistrer dans nouveau fichier : Enregistre les coefficients de régression dans un fichier que vous spécifiez. Si le rapport est proche de 1. Une valeur est calculée pour chaque terme du modèle. Modification de la prévision qui résulte de l'exclusion d'une observation donnée. Dfprévision standardisée : Différence standardisée de la valeur ajustée. SmartScore et les versions ultérieures de WhatIf? pourront utiliser ce fichier.430 Chapitre 26 d'observations. „ Rapport de covariance : Rapport entre le déterminant de la matrice de variance-covariance si une observation donnée a été exclue du calcul des coefficients de régression et le déterminant de la matrice de covariance avec toutes les observations incluses.

Si la variation du R2 associée à une variable est importante. l'erreur standard de B. le coefficient bêta standardisé. L'option Matrice de covariance affiche la matrice de variance-covariance des coefficients de régression avec les covariances hors de la diagonale et les variances dans la diagonale. Une matrice de corrélation est également affichée. . erreur standard de l'estimation et un tableau d'analyse de variance. la valeur t de B et le niveau de signification bilatéral de t.431 Régression linéaire Statistiques de régression linéaire Figure 26-6 Boîte de dialogue Régression linéaire : Statistiques Les statistiques suivantes sont disponibles : Coefficients de régression : L'option Estimations affiche le coefficient de régression B. R2 et R2 ajusté. cela signifie que la variable est une bonne explication de la variable dépendante. L'option Intervalles de confiance affiche les intervalles de confiance à 95 % pour chaque coefficient de régression ou une matrice de covariance. Variation de R-deux : Variation de la statistique du R2 obtenue en ajoutant ou en enlevant une variable indépendante. Qualité de l'ajustement : Les variables entrées et supprimées du modèle sont listées et les statistiques de la qualité de l'ajustement suivantes sont affichées : R multiple.

Mesure et corrélations partielles : Affiche les corrélations simples et partielles. Le signe du coefficient indique la direction de la relation et sa valeur absolue en indique la force : plus la valeur absolue est grande. plus forte est la relation. Les valeurs propres de la matrice des produits croisés dimensionnés et non centrés. Régression linéaire : Options Figure 26-7 Boîte de dialogue Régression linéaire : Options . la moyenne et l'écart type de chaque variable de l'analyse. Les valeurs du coefficient de corrélation varient entre –1 et +1. Résidus : Affiche le test de Durbin-Watson de corrélation sérielle des résidus et le diagnostic des observations correspondant au critère de sélection (valeurs éloignées de n écarts types). Tests de colinéarité : La colinéarité (ou multicolinéarité) est la situation indésirable où une variable indépendante est une fonction linéaire d'autres variables indépendantes. Une matrice de corrélations avec le seuil de signification unilatéral et le nombre d'observations pour chaque corrélation sont également affichés. les indices de conditionnement et les proportions de décomposition de variance sont affichés ainsi que les facteurs d'inflation de la variance (VIF) et les tolérances pour les variables individuelles.432 Chapitre 26 Descriptives : Fournit le nombre d'observations valides.

Désélectionner cette option force la régression jusqu'à l'origine. Certains résultats de la régression jusqu'à l'origine ne sont pas comparables aux résultats de la régression incluant une constante. Les degrés de liberté sont basés sur le minimum N par paire. Valeurs manquantes : Vous pouvez choisir l'un des éléments suivants : „ „ Exclure toute observation incomplète : Seules les observations dont les valeurs sont valides pour toutes les variables sont incluses dans les analyses. la variable est éliminée si ce seuil est supérieur à la valeur Elimination. réduisez la valeur du champ Entrée.433 Régression linéaire Les options suivantes sont disponibles : Paramètres des méthodes progressives : Ces options sont valables lorsque la méthode de sélection ascendante. diminuez la valeur Entrée. Pour éliminer davantage de variables dans le modèle. ce qui est rarement utilisé. le modèle de régression inclut un terme constant. augmentez la valeur du champ Elimination. „ Choisir la probabilité de F : Une variable est entrée dans le modèle si le seuil de signification de la valeur F est supérieur à la valeur Entrée . Pour éliminer davantage de variables du modèle. réduisez la valeur Elimination. Pour introduire davantage de variables dans le modèle. descendante ou progressive a été sélectionnée. Pour introduire davantage de variables dans le modèle. „ Choisir la valeur de F : Une variable est introduite dans un modèle si sa valeur F est supérieure à la valeur Entrée et elle est éliminée si la valeur F est inférieure à la valeur Elimination. . Exclure seulement les composantes non valides : Les observations pour lesquelles les données sont complètes pour la paire de variables corrélées sont utilisées pour calculer le coefficient de corrélation sur lequel l'analyse de régression est basée. R2 ne peut pas être interprété de la manière habituelle. „ Remplacer par la moyenne : Toutes les observations sont utilisées pour les calculs. La valeur Entrée doit être supérieure à la valeur Elimination et toutes deux doivent être positives. en substituant la moyenne de la variable aux observations manquantes. Par exemple. soit en fonction de la valeur F elle-même. La valeur Entrée doit être inférieure à la valeur Elimination et toutes deux doivent être positives. Inclure terme constant dans l'équation : Par défaut. Des variables peuvent être entrées ou supprimées du modèle soit en fonction de la signification (probabilité) de la valeur F.

.

de puissance. R multiples. Si vous sélectionnez temps à la place d'une variable provenant du fichier de travail comme variable indépendante. Vous pouvez ajuster un modèle linéaire en fonction des données. prévisions. Un diagramme de dispersion établit que la relation entre les dommages provoqués par un incendie et la distance jusqu'à la caserne de pompiers est linéaire. les résidus et les intervalles de la prévision comme nouvelles variables. Si Temps est sélectionné. R2. Un modèle différent est produit pour chaque variable dépendante. la variable dépendante doit être une mesure de séries chronologiques. Statistiques : Pour chaque modèle : Coefficients de régression. quadratique. en S. la procédure Ajustement de fonctions génère une variable temps où la durée entre les observations est uniforme. inverse. logarithmique. résidus et intervalles de prévision. composé. cubique. vérifier la validité des hypothèses et le bon ajustement au modèle. de croissance et exponentiel. Vous pouvez aussi enregistrer les prévisions. erreur standard de la prévision.Ajustement de fonctions 27 Chapitre La procédure d'ajustement de fonctions produit des statistiques de régression d'ajustement de fonctions et les diagrammes relatifs pour 11 modèles différents de régression d'ajustement de fonctions. L'analyse des séries chronologiques nécessite une structure de fichier de données 435 . Exemple : Une compagnie d'assurance contre l'incendie effectue une étude pour établir un lien entre l'importance des dommages lors d'incendies domestiques importants et la distance entre la caserne de pompiers la plus proche et la résidence. Modèles : linéaire. Remarques sur les données de l'ajustement de fonctions Données : Les variables dépendantes et indépendantes doivent être quantitatives. tableau d'analyse de la variance. logistique. R2 ajusté.

92348 .919331 10.420278 Beta . les hypothèses suivantes doivent être vérifiées.960978 T Sig T 12.0000 7.75098 Carré moyen 841.76636 5.76636 69.). MOD_1 LINEAIRE ..436 Chapitre 27 dans lequel chaque observation (rangée) représente un ensemble d'observations à des moments différents et où la durée entre les observations est uniforme. Les résidus d'un bon modèle doivent être répartis aléatoirement et doivent être normaux. La relation entre la variable dépendante et la variable indépendante doit être linéaire.36546 .. etc. Variable dépendante.0000 156. Si vous utilisez un modèle linéaire.88616 Signification de F = -------------------. pour chaque valeur de la variable indépendante.91759 2.Variables de l'équation -------------------Variable DISTANCE (Constante) B 4. la distribution de la variable dépendante doit être normale.96098 .392748 1. Hypothèses : Vérifiez vos données graphiquement pour déterminer comment sont reliées les variables indépendantes et dépendantes (de manière linéaire ou exponentielle.31635 Analyse de la variance : DF Régression Résidus F = 1 13 Somme des carrés 841. Echantillon de résultat Figure 27-1 Exemple d'ajustement de fonctions MODELE : MOD_1.277929 SE B . LINEAIRE Suppression des observations incomplètes des données manquantes R multiple R carré R carré ajusté Erreur standard . et toutes les observations doivent être indépendantes.0000 Les nouvelles variables suivantes sont créées : Nom Etiquette Erreur pour DOMMAGES avec DISTANCE de CURVEFIT.525 . La variance de la distribution de la variable dépendante doit être constante pour toutes les valeurs de la variable indépendante.237 . DOMMAGES Méthode.

. sélectionnez : Analyse Régression Ajustement de fonctions. .437 Ajustement de fonctions Pour obtenir un ajustement de fonctions E A partir du menu. Un modèle différent est produit pour chaque variable dépendante.. Figure 27-2 Boîte de dialogue Ajustement de fonctions E Sélectionnez au moins une variable dépendante.

Observez un diagramme de dispersion de vos données. essayez de transformer vos données. . Si vos variables semblent être liées linéairement. les résidus et les intervalles de prévision comme nouvelles variables. ajustez vos données en fonction de ce type de modèle. Si le diagramme ressemble à une fonction mathématique que vous reconnaissez. Un diagramme séparé est produit pour chaque variable dépendante. Pour déterminer quel modèle utiliser. vous devrez peut-être utiliser un modèle plus élaboré. La constante est incluse par défaut.438 Chapitre 27 E Sélectionnez une variable indépendante (une variable dans le fichier de travail ou Temps). utilisez l'outil de sélection de points pour afficher la valeur de la variable avec Etiquette d'observation. Modèles d'ajustement de fonctions Vous pouvez choisir des modèles de régression d'ajustement de fonctions. Cliquez sur Enregistrer pour enregistrer les prévisions. „ Les options suivantes sont également disponibles : „ „ Inclure terme constant dans l'équation : Evalue un terme constant dans l'équation de régression. Inverse : Modèle dont l'équation est Y = b0 + (b1 / t). „ Afficher le tableau ANOVA : Affiche un tableau récapitulatif de l'analyse de la variance pour chaque modèle sélectionné. utilisez un modèle exponentiel. Par exemple. Les valeurs de la série sont modélisées comme fonction linéaire du temps. vous pouvez : „ Sélectionner une variable pour étiqueter des observations dans les diagrammes de dispersion. Sinon. Logarithmique : Modèle dont l'équation est Y = b0 + (b1 * ln(t)). utilisez un modèle de régression linéaire simple. si vos données ressemblent à une fonction exponentielle. Représenter sous forme graphique : Représente graphiquement les valeurs de la variable dépendante et chaque modèle sélectionné face à la variable indépendante. Lorsque la transformation n'améliore pas les choses. représentez vos données sous forme graphique. Pour chaque point du diagramme de dispersion. Linéaire : Modèle dont l'équation est Y = b0 + (b1 * t). Lorsque vos variables ne sont pas liées linéairement.

En S : Modèle dont l'équation est Y = e**(b0 + (b1/t)) ou ln(Y) = b0 + (b1/t). De puissance : Modèle dont l'équation est Y = b0 * (t**b1) ou ln(Y) = ln(b0) + (b1 * ln(t)). Le modèle quadratique peut être utilisé pour modéliser une série qui « décolle » ou qui s'amortit de manière oscillatoire. Cubique : Modèle défini par l'équation Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). Exponentielle : Modèle dont l'équation est Y = b0 * (e**(b1 * t)) ou ln(Y) = ln(b0) + (b1 * t). Logistique : Modèle dont l'équation est Y = 1 / (1/u + (b0 * (b1**t))) ou ln(1/y-1/u)= ln (b0) + (ln(b1)*t). De croissance : Modèle dont l'équation est Y = e**(b0 + (b1 * t)) ou ln(Y) = b0 + (b1 * t). Enregistrement de l'ajustement de fonctions Figure 27-3 Boîte de dialogue Ajustement de fonctions : Enregistrer . Après avoir sélectionné la logistique. La valeur doit être un nombre positif supérieur à la plus grande valeur de la variable dépendante. Composé : Modèle dont l'équation est la suivante Y = b0 * (b1**t) ou ln(Y) = ln(b0) + (ln(b1) * t).439 Ajustement de fonctions Quadratique : Modèle dont l'équation est Y = b0 + (b1 * t) + (b2 * t**2). u étant la valeur de la borne supérieure. précisez la valeur de la borne supérieure à utiliser dans l'équation de régression.

les résidus (valeur observée de la variable dépendante moins la prévision du modèle) et les intervalles de prévision (limites supérieure et inférieure). Calculer une prévision : Si vous sélectionnez Temps à la place d'une variable dans le fichier de travail comme variable indépendante. Les zones de texte disponibles pour la spécification de la fin de la période de prévision dépendent des variables courantes de date définies. à partir des observations de la période d'estimation. vous pouvez spécifier une période de prévision au-delà de la fin de la série chronologique. Vous avez le choix entre les options suivantes : „ A partir d'une estimation limitée à une période : Prévoit les valeurs pour toutes les observations du fichier. Les nouveaux noms de variable et les étiquettes descriptives s'affichent dans un tableau dans la fenêtre de résultats. Ceci peut être utilisé pour prévoir les valeurs au-delà de la dernière observation de la série chronologique. La période d'estimation qui s'affiche en bas de la boîte de dialogue est définie avec la boîte de sous dialogue Intervalle de l'option Sélectionner des observations du menu Données. Si aucune période d'estimation n'a été définie. vous pouvez spécifier le numéro de l'observation finale.. vous pouvez enregistrer les prévisions. l'heure ou le numéro de l'observation spécifié. Utilisez l'option Définir des dates. Si aucune variable de date n'est définie. . „ Jusqu'à : Prévoit les valeurs jusqu'à la date.. dans le menu Données pour créer des variables de date.440 Chapitre 27 Enregistrer les variables : Pour chaque modèle sélectionné. à partir des observations de la période d'estimation. toutes les observations sont utilisées pour prévoir les valeurs.

b. un ensemble de fonctions discriminantes) basée sur les combinaisons linéaires des variables explicatives qui donnent la meilleure discrimination entre groupes. Les fonctions peuvent alors être appliquées aux nouvelles observations avec des mesures de variables explicatives. c et d. Remarque : la variable de groupe peut avoir plus de deux valeurs. Exemple : En moyenne. et vous devez spécifier leur valeur minimale et maximale. Le chercheur pense que la taille de la population et des informations économiques peuvent aussi être importantes. et une plus grande proportion de ces habitants vit en ville. mais de groupe d'affectation inconnu. L'analyse discriminante vous permet d'estimer les coefficients de la fonction discriminante linéaire. Ainsi. la fonction est : D = a * climat + b * urbain + c * population + d * Produit National Brut par habitant 441 . pour plus de deux groupes.Analyse discriminante 28 Chapitre L'analyse discriminante est utile pour les cas où vous voulez construire un modèle de prévision de groupe d'affectation basé sur les caractéristiques observées de chaque observation. en utilisant les coefficients a. La procédure génère une fonction discriminante (ou. Un chercheur veut combiner cette information en une fonction pour déterminer comment un individu peut être différencié selon les deux groupes de pays. Les codes de la variable de regroupement doivent cependant être des nombres entiers. les habitants des pays des zones tempérées consomment plus de calories par jour que ceux des tropiques. Les observations dont les valeurs se situent hors des limites sont exclues de l'analyse. Les fonctions sont générées à partir d'un échantillon d'observations pour lesquelles le groupe d'affectation est connu. qui ressemble à la partie droite d'une équation de régression linéaire multiple.

Les variables explicatives doivent avoir une distribution gaussienne multivariée. Statistiques : Pour chaque variable. . écarts types. Hypothèses : Les observations doivent être indépendantes. matrice de corrélation intra-classe. On part de l'hypothèse que les groupes d'affectation sont mutuellement exclusifs (c'est-à-dire qu'aucune observation n'est affectée à plus d'un groupe) et collectivement exhaustifs (c'est-à-dire que toutes les observations sont affectées à un groupe).442 Chapitre 28 Si ces variables sont utiles pour établir la différence entre les deux zones climatiques. les valeurs de D seront différentes pour les pays tempérés et les pays tropicaux. codifiées sous forme de nombres entiers. Données : La variable de regroupement doit avoir un nombre limité de modalités distinctes. et les matrices de variance-covariance intra-groupes doivent être égales entre groupes. QI élevé contre QI bas). Les variables indépendantes nominales doivent être recodées en variables muettes ou de contraste. lambda de Wilks pour chaque fonction canonique. matrice de covariance intra-classe. Si vous utilisez une méthode de sélection des variables pas à pas. matrice de covariance totale. vous devez envisager d'utiliser la régression linéaire pour exploiter les informations plus riches données par la variable continue elle-même. on a les éléments suivants : moyenne. coefficients de fonction de Fisher. Pour chaque analyse : Test de Box. coefficients de fonction non standardisés. Pour chaque pas : probabilités à priori. Pour chaque fonction discriminante canonique : valeur propre. corrélation canonique. Si l'affectation à un groupe est basée sur les valeurs d'une variable continue (par exemple. La procédure est la plus efficace lorsque l'affectation à un groupe est une variable réellement qualitative. Khi-deux. lambda de Wilks. vous pouvez découvrir que vous n'avez pas forcément besoin d'inclure les quatre variables dans la fonction. ANOVA à un facteur. pourcentage de la variance. matrice de covariance de chaque classe.

707 Fonction 1 Valeur propre 1.002 % cumulé 100.790 .934 Df 4 Sig.499 Khi-deux 31.986 .443 Analyse discriminante Echantillon de résultat Figure 28-1 Résultats d'analyse discriminante Valeurs propres % de variance 100.0 Corrélation canonique .0 Lambda de Wilks Test de fonction(s) 1 Lambda de Wilks .082 .000 Matrice de structure Fonction 1 CALORIES LOG_GDP URBAIN (%) LOG_POP .488 . .

444 Chapitre 28 Obtenir une analyse discriminante E A partir du menu. „ Entrer les variables simultanément : Méthode d'introduction forcée : Toutes les variables indépendantes qui satisfont aux critères de tolérance sont entrées simultanément. .) E Sélectionnez la méthode de saisie des variables indépendantes. „ Utiliser la méthode pas à pas : Utilise la méthode pas à pas pour contrôler l'entrée et la suppression de variables.. Figure 28-2 Boîte de dialogue Analyse discriminante : Classement E Sélectionnez une variable de regroupement à valeur entière et cliquez sur Définir intervalle pour spécifier les modalités à considérer. En option. la procédure de recodification automatique du menu Transformer permettra d'en créer un avec des valeurs entières. vous pouvez sélectionner les observations avec une variable de sélection. sélectionnez : Analyse Classification Analyse discriminante.. E Sélectionnez les variables indépendantes (ou explicatives). (Si votre variable de regroupement n'a pas de valeurs entières.

Ces résultats fournissent une méthode de classification des nouvelles observations reposant sur des données existantes ou de . Sélection des observations pour l'analyse discriminante Figure 28-4 Boîte de dialogue Analyse discriminante : Enregistrer Pour sélectionner les observations pour votre analyse. Les résultats des statistiques et de classification sont générés pour les observations sélectionnées et celles qui ne le sont pas. Seules les observations avec cette valeur pour la variable de sélection sont utilisées pour dériver les fonctions discriminantes. Le Minimum et le Maximum doivent être des entiers. choisissez une variable de sélection et cliquez sur Valeur pour entrer un nombre entier comme valeur de sélection.445 Analyse discriminante Définition d'intervalles pour l'analyse discriminante Figure 28-3 Boîte de dialogue Analyse discriminante : Définir intervalle Spécifiez la valeur minimum et maximum de la valeur de la variable de regroupement pour l'analyse. Les observations avec des valeurs hors de cet intervalle ne sont pas utilisées dans l'analyse discriminante mais elles sont classées dans un des groupes existants en fonction des résultats de l'analyse. cliquez sur Sélectionner dans la boîte de dialogue principale.

une valeur p non significative indique qu'il n'est pas démontré que les matrices diffèrent. Ce test est sensible aux déviations par rapport à la distribution gaussienne multivariée. „ Test de Box : Test d'égalité des matrices de covariance des classes.446 Chapitre 28 partitionnement de vos données dans un sous-ensemble de test ou de formation en vue d'effectuer une validation sur le modèle créé. Pour les échantillons de taille suffisamment importante. ANOVA à 1 facteur et Test de Box. „ Moyennes : Affichage du total et de la moyenne de chaque groupe. ainsi que des écarts types des variables indépendantes. Coefficients de la fonction : Les options disponibles sont les coefficients de la classification de Fisher et les coefficients non standardisés. . „ ANOVA à 1 facteur : Effectue pour chacune des variables indépendantes une analyse de variance à 1 facteur pour tester l'égalité des moyennes de groupe. Statistiques de l'analyse discriminante Figure 28-5 Boîte de dialogue Analyse discriminante: Statistiques Descriptives : Les options disponibles sont Moyennes (y compris écarts types).

„ „ Covariance de chaque classe : Affiche des matrices de covariances distinctes pour chaque groupe. en calculant la moyenne des matrices de covariance distinctes pour tous les groupes avant de calculer les corrélations. Covariance totale : Affiche la matrice de covariance de toutes les observations comme si elles provenaient d'un seul échantillon. Matrices : Les matrices de coefficients pour variables indépendantes disponibles sont la matrice de corrélation intra-classe. „ Non standardisés : Affiche les coefficients non standardisés de la fonction discriminante. Méthode pas à pas de l'analyse discriminante Figure 28-6 Boîte de dialogue Analyse discriminante : Méthode pas à pas . Cette matrice est obtenue en calculant la moyenne des matrices de covariances distinctes de tous les groupes. qui peut différer de la matrice de covariance totale. la matrice de covariance intra-classe. „ Corrélations intra-classe : Affiche une matrice de corrélations intra-classe globale. la matrice de covariance de chaque classe et la matrice de covariance totale.447 Analyse discriminante „ Fisher : Affiche les coefficients de la fonction de classification de Fisher qui peuvent être directement utilisés pour la classification. „ Covariance intra-classe : Affiche une matrice de covariances intra-classe globale. Un groupe de coefficients est obtenu pour chaque groupe et une observation est affectée au groupe qui a le plus grand score discriminant.

A chaque étape. la variable est éliminée si ce seuil est supérieur à la valeur Elimination. réduisez la valeur du champ Entrée. Critères : Les options disponibles sont Choisir la valeur de F et Choisir la probabilité de F. Les options possibles sont le lambda de Wilks. La valeur Entrée doit être inférieure à la valeur Elimination et toutes deux doivent être positives. Entrez des valeurs pour ajouter et supprimer des variables. Pour éliminer davantage de variables dans le modèle. „ Variance résiduelle : A chaque étape. Après avoir sélectionné cette option. . entrez la valeur minimale que doit avoir une variable pour entrer dans l'analyse. „ V de Rao : Mesure des différences entre des moyennes de groupes. Pour introduire davantage de variables dans le modèle.448 Chapitre 28 Méthode : Sélectionnez la statistique à utiliser pour ajouter ou supprimer de nouvelles variables. Une distance de Mahalanobis importante identifie une observation qui a des valeurs extrêmes pour des variables indépendantes. la variable qui minimise la somme des variations résiduelles entre les groupes est saisie. La valeur Entrée doit être supérieure à la valeur Elimination et toutes deux doivent être positives. „ Lambda de Wilks : Méthode de sélection des variables pour une analyse discriminante pas à pas qui sélectionne les variables à entrer dans l'équation d'après leur capacité à faire baisser le lambda de Wilks. „ Choisir la probabilité de F : Une variable est entrée dans le modèle si le seuil de signification de la valeur F est supérieur à la valeur Entrée . la variance résiduelle. diminuez la valeur Entrée. vous pouvez spécifier l'augmentation minimum de V pour entrer une variable. le plus petit rapport F et le V de Rao. Avec le V de Rao. les variables sont entrées dans l'analyse d'après leur capacité à faire baisser le lambda de Wilks. la distance de Mahalanobis. fondée sur la maximisation d'un rapport F calculé à partir de la distance de Mahalanobis entre des groupes. „ Choisir la valeur de F : Une variable est introduite dans un modèle si sa valeur F est supérieure à la valeur Entrée et elle est éliminée si la valeur F est inférieure à la valeur Elimination. la variable qui maximise l'augmentation du V de RAO est entrée. A chaque étape. Pour introduire davantage de variables dans le modèle. réduisez la valeur Elimination. Pour éliminer davantage de variables du modèle. augmentez la valeur du champ Elimination. „ Distance de Mahalanobis : Mesure de la distance entre les valeurs d'une observation et la moyenne de toutes les observations sur les variables indépendantes. Egalement appelée trace de Lawley-Hotelling. „ Plus petit rapport F : Méthode de sélection des variables en analyse pas à pas.

le récapitulatif et la classification par élimination. Analyse discriminante : Classement Figure 28-7 Boîte de dialogue Analyse discriminante : Classement Probabilités à priori : Ces valeurs sont utilisées pour le classement. Vous pouvez également laisser les effectifs de classes observés dans votre échantillon calculer les probabilités d'affectation à une classe. L'option Test F des distances entre couples affiche une matrice de rapports F appariés pour chaque paire de groupes.449 Analyse discriminante Afficher : L'option Récapitulation des étapes affiche les statistiques de toutes les variables après chaque étape. Vous pouvez spécifier des probabilités à priori égales pour toutes les classes. Parfois appelés « matrice de confusion ». Cette classification est également appelée « méthode U ». du groupe prévu. Afficher : Les options d'affichage disponibles sont les résultats par observation. . „ Classification par élimination : Classement de chaque observation de l'analyse par les fonctions dérivées de l'ensemble des observations autres que cette observation. „ Récapitulatif : Nombre d'observations correctement et incorrectement affectées à chacune des classes sur la base de l'analyse discriminante. „ Résultats par observation : Les codes du groupe actuel. des probabilités a posteriori et des scores discriminants sont affichés pour chaque observation.

450 Chapitre 28 Remplacer les valeurs manquantes par la moyenne : Sélectionnez cette option pour remplacer la valeur manquante d'une variable indépendante par la moyenne de cette variable. Les numéros correspondent aux groupes auxquels les observations ont été affectées. Lorsqu'il n'y a qu'une seule fonction. Classe par classe : Les matrices de covariances de chaque groupe sont utilisées pour la classification. La moyenne de chaque groupe est indiquée par un astérisque à l'intérieur de ses limites. „ Toutes classes combinées : Crée un diagramme de dispersion de tous les groupes. S'il n'y a qu'une seule fonction. des histogrammes sont affichés à la place. „ Classe par classe : Crée des diagrammes de dispersion classe par classe pour les deux premières valeurs de fonction discriminante. Comme la classification repose sur les fonctions discriminantes et pas sur les variables d'origine. et carte des régions d'affectation. mais seulement durant la phase de classification. „ „ Intra-classe : La matrice de covariances intra-classes globale est utilisée pour classifier les observations. Diagrammes : Les options de diagramme disponibles sont toutes classes combinées. . cette option n'est pas toujours équivalente à la discrimination quadratique. Utiliser la matrice d'inertie : Vous pouvez choisir de classer les observations en utilisant une matrice de covariance intra-classe ou une matrice de covariance pour chaque classe. un histogramme est tracé à la place. classe par classe. La carte n'est pas affichée s'il n'existe qu'une seule fonction discriminante. des valeurs des deux premières fonctions discriminantes. „ Carte des régions d'affectation : Diagramme des limites servant à classifier les observations en fonction de valeurs de fonction.

valeurs du facteur discriminant (une variable pour chaque fonction discriminante dans la solution). Vous pouvez également exporter des informations de modèle dans le fichier spécifié. SmartScore et les versions ultérieures de WhatIf? pourront utiliser ce fichier. . Les options disponibles sont classe(s) d'affectation (une seule variable). et probabilités d'affectation à un groupe en fonction des valeurs du facteur discriminant (une variable pour chaque groupe).451 Analyse discriminante Enregistrement de l'analyse discriminante Figure 28-8 Boîte de dialogue Analyse discriminante : Enregistrer Vous pouvez ajouter de nouvelles variables à votre fichier de données actif.

.

Avec l'analyse factorielle. Il existe cinq méthodes de rotation. et. vous pouvez enquêter sur le nombre de facteurs sous-jacents. L'analyse factorielle est souvent utilisée dans la factorisation. 453 . de même que les questions à thèmes militaires. etc. et ces facteurs peuvent être enregistrés en tant que variables pour des analyses ultérieures. vous pouvez identifier le concept représenté par ces facteurs. dont directe Oblimin et Promax pour les rotations non orthogonales. dans de nombreux cas. ou facteurs. vous pouvez calculer les facteurs pour chaque répondant. On peut également utiliser l'analyse factorielle pour générer des hypothèses concernant des mécanismes de causalité ou pour afficher des variables pour une analyse ultérieure (par exemple. Par exemple.Analyse factorielle 29 Chapitre L'analyse factorielle essaie d'identifier des variables sous-jacentes. De plus. La procédure d'analyse factorielle offre une très grande flexibilité : „ „ „ Il existe sept méthodes d'extraction de facteur. Les questions sur les impôts ont tendance à être en corrélation. Il existe trois méthodes pour calculer les facteurs. en identifiant un petit nombre de facteurs qui expliquent la plupart des variances observées dans le plus grand nombre de variables manifestes. L'analyse factorielle est souvent utilisée pour réduire un ensemble de données. pour identifier la colinéarité avant une analyse de régression linéaire). sur la base des facteurs. facteurs que vous pouvez utiliser pour des analyses ultérieures. Exemple : Quelle est l'attitude sous-jacente qui pousse les personnes à répondre d'une certaine manière aux questions concernant un sondage politique ? L'examen des corrélations parmi les éléments d'un sondage révèle qu'il y a des recouvrements significatifs parmi divers sous-groupes d'éléments. qui permettent d'expliquer le patron des corrélations à l'intérieur d'un ensemble de variables observées. vous pouvez développer un modèle logistique de régression pour prévoir le comportement de vote.

du deuxième et du troisième facteur. les matrices des corrélations reconstituées. valeurs propres et pourcentage de variance expliqué) . Pour chaque analyse factorielle : matrice de corrélation des variables. les solutions initiales (qualités de représentation. incluant une matrice de forme après rotation et une matrice de transformation pour des rotations obliques : type et matrices de structure après rotation . Remarques sur les données d'analyse factorielle Données : Les variables doivent être quantitatives au niveau de l' intervalle ou du rapport. Le modèle d'analyse factorielle spécifie que les variables sont déterminées par des facteurs communs (les facteurs estimés par le modèle) et des facteurs uniques (qui ne sont pas corrélés entre les variables observées). Diagrammes : Diagramme de valeurs propres et carte factorielle du premier. Les données qualitatives (comme la religion ou le pays d'origine) ne conviennent pas pour l'analyse factorielle. incluant l'anti-image . moyenne et écart type. . les estimations calculées se basent sur l'hypothèse que tous les facteurs uniques ne sont pas en corrélation entre eux ainsi qu'avec les facteurs communs. structure avant rotation. incluant des seuils de signification. et les valeurs propres . structure après rotation. la qualité de représentation. Les données pour lesquelles la corrélation de Pearson calculée a un sens conviennent pour l'analyse factorielle. déterminant. Hypothèses : Les données doivent posséder une distribution gaussienne bivariée pour chaque paire de variables et les observations doivent être indépendantes. on a les éléments suivants : nombre d'observations valides. mesure d'adéquation d'échantillonnage de Kaiser-Meyer-Olkin et le test de sphéricité de Bartlett . inverse . incluant les saturations sur les facteurs. matrice factorielle de coefficient de facteur et matrice factorielle de facteur de covariance.454 Chapitre 29 Statistiques : Pour chaque variable.

945 .000 LIFEEXPF LITERACY BIRTH_RT FERTILTY URBAN LOG_GDP POP_INCR B_TO_D DEATH_RT LOG_POP BABYMORT 1.375 3.925 .000 1.000 .313 3.038 4.583 3.000 1.833 Mortalité infantile (nombre de décès sur 1 000 naissances vivantes) Personnes sachant lire (%) Taux de natalité pour 1 000 personnes Fécondité : nombre moyen d'enfants Personnes habitant en ville (%) Log (base 10) de GDP_CAP Croissance démographique (% par année) Rapport entre les naissances et les décès Taux de mortalité pour 1 000 personnes Log (base 10) de Population Ecart.552 1.000 Méthode d'extraction : Analyse en composantes principales . Type 8.153 Qualité de représentation Initiale Extraction 1.292 1.000 1.000 1.835 .156 2.222 18.455 Analyse factorielle Echantillon de résultat Figure 29-1 Sortie d'analyse factorielle Statistiques descriptives Moyenne Espérance de vie moyenne des femmes 72.000 1.132 82.608 1.000 1.504 1.953 .686 N Analyse 72 72 72 72 72 72 72 72 72 72 72 35.825 .000 1.472 24.604 .949 .577 8.943 .875 .689 .738 .272 32.593 22.625 10.205 62.697 3.000 1.174 .

985 1.131E-02 3.946E-02 4.456 Chapitre 29 Total des variables explicatives Sommes des carrés chargées Total 6.237 8.183 .721 Valeurs propres initiales Composante 1 2 3 4 5 6 7 8 9 10 11 Total 6.633 99.275 86.819 86.283 95.819 23.562 3.361 .275 86.055E-02 % cumulé 63.721 Sommes des carrés pour la rotation Total 6.840E-03 4.579 .732 99.564 97.218 .960 2.290 99.960 2.959 100.461E-03 % de variance 63.130 6.446 5.000 Méthode d'extraction : analyse en composantes principales .902 % cumulé 62.557 .775E-02 2.721 92.275 23.446 % cumulé 63.549 98.275 23.579 % de variance 63.612 .910 2.281 1.629 % de variance 62.343 .610E-02 9.870 99.

614 1 . .827 .561 .539 -.190 2 -.856 .847 -.741 -.982 .190 .469 -.853 .520 2 En composantes principales Méthode de rotation : Varimax avec normalisation de Kaiser. Matrice des transformations des composants Composant 1 2 1 .457 Analyse factorielle Matrice pivotée des composants Composant BIRTH_RT FERTILTY LITERACY LIFEEXPF BABYMORT POP_INCR LOG_GDP URBAN DEATH_RT B_TO_D LOG_POP .969 .226 .880 -.476 .794 -.327 .982 Méthode d'extraction : Analyse en composantes principales Méthode de rotation : Varimax avec normalisation de Kaiser.469 .931 -.

5 1. . sélectionnez : Analyse Factorisation Analyse factorielle.5 0.0 Component 1 Obtenir une analyse factorielle E A partir du menu..0 -1..0 -.0 birth to death ratio people living in cit averag e female life .458 Chapitre 29 Component Plot in Rotated Space 1.0 .5 log (ba se 10) of pop infant mortality (de death rate per 1 000 -1.5 log (ba se 10) of gdp people who re ad (%) fertility: average n birth rate per 100 0. E Sélectionnez les variables pour l'analyse factorielle.0 population increase Component 2 -.

choisissez une variable de sélection.459 Analyse factorielle Figure 29-2 Boîte de dialogue Analyse factorielle Sélection des observations pour l'analyse factorielle Figure 29-3 Sélectionnez la boîte de dialogue Analyse factorielle Pour sélectionner les observations pour votre analyse. puis cliquez sur Valeur pour entrer une valeur de sélection. . Seules les observations ayant cette valeur pour la variable de sélection sont utilisées dans l'analyse factorielle.

Statistiques : Les statistiques univariées incluent la moyenne. „ Reconstituée : Matrice des corrélations estimée à partir de la solution factorielle. ce qui indiquerait que le modèle de facteur n'est pas adapté. „ Indice KMO et test de sphéricité de Bartlett : Mesure de l'adéquation de l'échantillonnage de Kaiser-Meyer-Olkin qui teste si les corrélations partielles entre les variables sont faibles. la plupart des éléments hors diagonale doivent être petits. l'anti-image et l'indice KMO et le test de sphéricité de Bartlett. La structure initiale affiche la qualité de représentation initiale. les reproduits. Matrice de corrélation : Les options disponibles sont les coefficients.460 Chapitre 29 Caractéristiques d'analyse factorielle Figure 29-4 Boîte de dialogue Analyse Factorielle : Caractéristiques.. la matrice de covariance des anti-images contient les opposés des covariances partielles. La mesure d'adéquation d'échantillonnage pour une variable est affichée sur la diagonale de la matrice de corrélation des anti-images. les inverses. les valeurs propres. les déterminants. l'écart type et le nombre d'observations valides pour chaque variable. „ Anti-image : La matrice de corrélation des anti-images contient les opposés des coefficients de corrélation partielle . . Dans un bon modèle factoriel.. Les résidus (différence entre les corrélations estimées et observées) sont également affichés. les seuils de signification. Le test de sphéricité de Bartlett teste si la matrice des corrélations est une matrice d'identité. et le pourcentage de variance expliqué.

La première composante principale a une variance maximale. E Dans la boîte de dialogue Analyse factorielle. Les autres composantes expliquent progressivement des portions plus petites de la variance sans être corrélées les unes aux autres. L'analyse des composantes principales est .461 Analyse factorielle Spécification des statistiques récapitulatives et des coefficients de corrélation E A partir du menu. la Factorisation en axes principaux. l'Alpha-maximisation. Les méthodes disponibles sont les Composantes principales. les Moindres carrés non pondérés. les Moindres carrés généralisés... „ Analyse en composantes principales : Méthode d'extraction de facteur utilisée pour former des combinaisons linéaires non corrélées des variables observées. et la Factorisation en projections. sélectionnez : Analyse Factorisation Analyse factorielle. le Maximum de vraisemblance. cliquez sur Caractéristiques. Extraction d'analyse factorielle Figure 29-5 Boîte de dialogue Analyse Factorielle : Extraction Méthode : Vous permet de spécifier la méthode d'extraction de facteur.

462 Chapitre 29

utilisée pour obtenir la solution factorielle initiale. Elle peut être utilisée quand la matrice des corrélations est singulière.
„

Méthode des moindres carrés non pondérés : Méthode d'extraction de facteur qui

minimise la somme des carrés des différences entre les matrices de corrélations observées et reconstituées en ignorant les diagonales.
„

Méthode des Moindres carrés généralisés : Méthode d'extraction de facteur qui

minimise la somme des carrés des différences entre les matrices de corrélations observées et reconstituées. Les corrélations sont pondérées par l'inverse de leur unicité, de façon à ce que les variables présentant une forte unicité reçoivent une pondération inférieure à celles présentant une faible unicité.
„

Méthode du maximum de vraisemblance : Méthode d'extraction de facteur qui

fournit les estimations de paramètres les plus susceptibles d'avoir généré la matrice de corrélations observée si l'échantillon est issu d'une distribution gaussienne multivariée. Les corrélations sont pondérées par l'inverse de l'unicité des variables et un algorithme itératif est utilisé.
„

Factorisation en axes principaux : Méthode d'extraction de facteurs à partir de la

matrice des corrélations initiales où les coefficients de corrélation multiple au carré sont placés sur la diagonale comme estimation initiale des qualités de représentation. Ces cartes factorielles sont utilisées pour une nouvelle estimation des qualités de représentation qui remplace alors l'ancienne sur la diagonale. Les itérations se poursuivent jusqu'à ce que les variations des qualités de représentation d'une itération à l'autre satisfassent le critère de convergence de l'extraction.
„

Alpha de Cronbach : Méthode d'extraction de facteur qui considère les variables

dans l'analyse comme un échantillon issu de la population des variables potentielles. Maximise l'alpha de Cronbach des facteurs.
„

Factorisation en projections : Méthode d'extraction de facteur développée par

Guttman et basée sur la théorie d'une image. La partie commune de la variable, appelée image partielle, est définie comme sa régression linéaire sur les autres variables, plutôt qu'une fonction de facteurs hypothétiques.
Analyser : Vous permet de spécifier si l'analyse porte sur une matrice de corrélation ou sur une matrice de covariance.

463 Analyse factorielle „ „

Matrice de corrélation : Utile si les variables de votre analyse sont mesurées

selon des échelles différentes.
Matrice de covariance : Utile lorsque vous souhaitez appliquer l'analyse factorielle

à plusieurs groupes avec des variances différentes pour chaque variable.
Extraire : Vous pouvez retenir tous les facteurs dont les valeurs propres dépassent une valeur spécifique ou retenir un nombre spécifique de facteurs. Afficher : Vous permet de demander la solution factorielle avant rotation et un diagramme des valeurs propres.
„

Structure factorielle sans rotation : Affiche les corrélations factorielles sans

rotation (matrice de projections factorielles), les qualités de représentation et les valeurs propres de la solution factorielle.
„

Diagramme des valeurs propres : Diagramme représentant la variance associée

à chaque facteur. Permet de déterminer le nombre de facteurs à conserver. Généralement, le diagramme montre une coupure franche entre la forte pente des facteurs élevés et la traîne graduelle du reste (valeurs propres).
Maximum des itérations pour converger : Vous permet de spécifier le nombre maximum de pas que l'algorithme peut prendre pour estimer la solution.

Spécification des options de l'extraction
E A partir du menu, sélectionnez : Analyse Factorisation Analyse factorielle... E Dans la boîte de dialogue Analyse factorielle, cliquez sur Extraction.

464 Chapitre 29

Rotation d'analyse factorielle
Figure 29-6 Boîte de dialogue Analyse factorielle : Rotation

Méthode : Vous permet de sélectionner la méthode de rotation des facteurs. Les

méthodes disponibles sont Varimax, Oblimin directe, Quartimax, Equamax ou Promax.
„

Méthode varimax : Méthode de rotation orthogonale qui minimise le nombre de

variables ayant de fortes corrélations sur chaque facteur. Simplifie l'interprétation des facteurs.
„

Critère oblimin direct : Méthode de rotation oblique (non orthogonale). Lorsque

delta est nul (valeur par défaut), les solutions sont les plus obliques. Plus la valeur de delta est négative, moins les facteurs sont obliques. Pour remplacer la valeur nulle par défaut de delta, entrez un nombre inférieur ou égal à 0,8.
„ „

Méthode quartimax : Méthode de rotation qui réduit le nombre de facteurs requis

pour expliquer chaque variable. Simplifie l'interprétation des variables observées.
Equamax : Méthode de rotation qui est une combinaison de la méthode Varimax

(qui simplifie les facteurs) et de la méthode Quartimax (qui simplifie les variables). Le nombre de variables pesant sur un facteur et le nombre de facteurs nécessaires pour expliquer une variable sont minimisés.
„

Rotation Promax : Rotation oblique qui permet aux facteurs d'être corrélés. Peut

être calculée plus rapidement qu'une rotation oblimin directe, aussi est-elle utile pour les vastes ensembles de données.

465 Analyse factorielle

Afficher : Vous permet d'inclure le résultat de la structure après rotation, et également

d'afficher les cartes factorielles sur le premier, le second et le troisième facteur (Cartes factorielles).
„

Structure après rotation : Vous devez sélectionner une méthode de rotation pour

obtenir une structure après rotation. Pour les rotations orthogonales, la matrice de forme après rotation et la matrice de transformation factorielle sont affichées. Pour les rotations obliques, le programme affiche la matrice des projections factorielles, la matrice de structure et la matrice des corrélations de facteurs.
„

Diagramme des Contributions des Facteurs : Diagramme en trois dimensions des

contributions des trois premiers facteurs. Pour une solution à deux facteurs, un diagramme en deux dimensions est affiché. Le diagramme n'est pas affiché si un seul facteur est extrait. Les diagrammes affichent des solutions ayant subi une rotation si cette dernière est demandée.
Maximum des itérations pour converger : Vous permet de spécifier le nombre maximum

de pas que l'algorithme peut utiliser pour réaliser la rotation.

Spécification des options de la rotation
E A partir du menu, sélectionnez : Analyse Factorisation Analyse factorielle... E Dans la boîte de dialogue Analyse factorielle, cliquez sur Rotation.

466 Chapitre 29

Scores d'analyse factorielle
Figure 29-7 Boîte de dialogue Scores de l'Analyse Factorielle

Enregistrer dans des variables : Vous permet de créer une nouvelle variable pour

chaque facteur selon la structure finale. Sélectionnez une des méthodes alternatives suivantes pour calculer les facteurs : Régression, Bartlett, ou Anderson-Rubin.
„ Méthode de régression : Méthode d'estimation des coefficients factoriels. Les écarts

obtenus ont une moyenne de 0 et une variance égale au carré de la corrélation multiple entre les coefficients factoriels estimés et les vraies valeurs du facteur. Les écarts peuvent être corrélés même lorsque les facteurs sont orthogonaux.
„

Facteurs de Bartlett : Méthode d'estimation des coefficients factoriels. Les facteurs

produits ont une moyenne de 0. La somme des carrés des facteurs uniques dans la plage de variables est minimisée.
„

Méthode d'Anderson-Rubin : Méthode d'estimation des coefficients factoriels

; variante de la méthode de Bartlett qui garantit l'orthogonalité des facteurs estimés. Les facteurs obtenus ont une moyenne de 0 et un écart type de 1, et ne sont pas corrélés.
Afficher la matrice des coefficients factoriels : Vous permet de montrer les coefficients

par lesquels les variables sont multipliées pour obtenir les facteurs. Cela permet également de montrer les corrélations entre les facteurs.

467 Analyse factorielle

Spécification des options des facteurs
E A partir du menu, sélectionnez : Analyse Factorisation Analyse factorielle... E Dans la boîte de dialogue Analyse factorielle, cliquez sur Facteurs.

Options d'analyse factorielle
Figure 29-8 Boîte de dialogue des Options de l'Analyse Factorielle

Valeurs manquantes : Vous permet de spécifier comment traiter les valeurs manquantes.

Les options disponibles sont d'exclure toute observation incomplète, d'exclure seulement les composantes non valides ou de les remplacer par la moyenne.
Affichage des projections : Vous permet de contrôler le format des matrices de résultat.

Triez les coefficients par leur taille (option Classement des variables par taille) et supprimez les coefficients dont la valeur absolue est inférieure à la valeur spécifiée (option Supprimer les valeurs absolues inférieures à).

468 Chapitre 29

Spécification des options de l'analyse factorielle
E A partir du menu, sélectionnez : Analyse Factorisation Analyse factorielle... E Dans la boîte de dialogue Analyse factorielle, cliquez sur Options.

Choix d'une procédure de classification

30

Chapitre

Vous pouvez effectuer des analyses de classes à l'aide de la procédure TwoStep, de la classification hiérarchique ou des nuées dynamiques. Chaque procédure utilise un algorithme différent pour la création des classes, et chacune d'elles comporte des options qui ne sont pas disponibles dans les autres procédures.
Classification TwoStep : La procédure Analyse du composant Classe TwoStep est la méthode privilégiée pour de nombreuses applications. Elle offre les fonctionnalités spécifiques suivantes :
„ „ „

Sélection automatique du meilleur nombre de classes, en plus des mesures de sélection parmi des modèles de classe. Possibilité de créer simultanément des modèles de classe sur la base de variables qualitatives et continues. Possibilité d'enregistrer le modèle de classe dans un fichier XML externe, puis de lire ce fichier et de mettre à jour le modèle de classe à l'aide des données les plus récentes.

En outre, la procédure Analyse du composant Classe TwoStep permet d'analyser des fichiers de données volumineux.
Classification hiérarchique : La procédure Classification hiérarchique est limitée à des fichiers de données plus petits (centaines d'objets à classer), mais offre les fonctionnalités spécifiques suivantes :
„

Possibilité de classer des observations ou des variables.

469

470 Chapitre 30 „ „

Possibilité de calculer plusieurs solutions possibles et d'enregistrer des classes d'affectation pour chacune de ces solutions. Plusieurs méthodes de formation de classes, de transformation de variables et de mesure de la dissimilarité entre les classes.

Tant que toutes les variables sont du même type, la procédure Classification hiérarchique peut analyser des variables d'intervalle (continues), d'effectif ou binaires.
Nuées dynamiques : La procédure Nuées dynamiques est limitée aux données

continues et exige que vous indiquiez au préalable le nombre de classes. Elle offre néanmoins les fonctionnalités spécifiques suivantes :
„ „

Possibilité d'enregistrer les distances à partir des centres de classes pour chaque objet. Possibilité de lire les centres de classes initiaux à partir d'un fichier SPSS externe et d'enregistrer les centres de classes finaux dans un fichier de ce type.

En outre, la procédure Nuées dynamiques permet d'analyser des fichiers de données volumineux.

Classification TwoStep

31

Chapitre

La procédure d'analyse TwoStep Cluster est un outil d'exploration conçu pour révéler des groupements naturels (ou classes) au sein d'un ensemble de données. L'algorithme utilisé par cette procédure possède plusieurs fonctionnalités qui le distinguent des techniques de classification standard :
„

Gestion des données qualitatives et continues : En supposant que les variables

soient indépendantes, une distribution jointe multinomiale-normale peut être placée sur des variables qualitatives et continues.
„

Sélection automatique du nombre de classes : En comparant les valeurs d'un critère

de modèle-choix dans différentes solutions de classification, la procédure peut déterminer automatiquement le nombre optimal de classes.
„

Evolutivité : En construisant une arborescence de fonctionnalités de classe (CF)

qui récapitule les enregistrements, l'algorithme TwoStep vous permet d'analyser des fichiers de données volumineux.
Exemple : Les entreprises du domaine des produits de consommation et du commerce de détail utilisent régulièrement des techniques de classification des données qui décrivent les habitudes d'achat, le sexe, l'âge, le niveau de revenu, etc. de leurs clients. Ces sociétés adaptent leurs stratégies de marketing et de développement produit à chaque groupe de consommation afin d'augmenter les ventes et de développer la fidélité à la marque. Statistiques : Cette procédure produit des critères d'information (AIC ou BIC) par nombres de classes dans la solution, fréquences de classe pour la classification finale et statistiques descriptives par classe pour la classification finale. Diagrammes : Cette procédure produit des diagrammes en bâtons pour les fréquences de classe, des diagrammes en secteurs pour les fréquences de classe et des diagrammes d'importance pour les variables.

471

472 Chapitre 31 Figure 31-1 Boîte de dialogue Analyse du composant Classe TwoStep

Mesure de distance : Cette sélection détermine la façon dont la similarité entre deux

classes est calculée.
„

Log-vraisemblance : La mesure de vraisemblance place une distribution de

probabilité sur les variables. Les variables continues sont considérées comme étant distribuées normalement alors que les variables qualitatives sont considérées comme étant multinomiales. Toutes les variables sont considérées comme étant indépendantes.
„

Euclidienne : La mesure euclidienne est la distance « en ligne droite » entre

deux classes. Elle peut être utilisée uniquement lorsque toutes les variables sont continues.
Nombre de classes : Cette sélection vous permet d'indiquer la façon dont le nombre

de classes doit être déterminé.
„

Déterminer automatiquement : Cette procédure déterminera automatiquement

473 Classification TwoStep

le « meilleur » nombre de classes en utilisant le critère défini dans le groupe Critère de classification. Vous pouvez également entrer un entier positif qui définit les nombres maximaux de classes que la procédure doit prendre en compte.
„

Indiquer une valeur fixe : Vous permet d'indiquer le nombre de classes (valeur fixe)

dans la solution. Entrez un entier positif.
Nombre de variables continues : Ce groupe fournit un récapitulatif des spécifications

de standardisation des variables continues qui sont définies dans la boîte de dialogue Options. Pour plus d'informations, reportez-vous à « Options de la procédure d'analyse TwoStep Cluster » , page 475.
Critère de classification : Cette sélection détermine la façon dont l'algorithme de

classification automatique détermine le nombre de classes. Vous pouvez spécifier le critère d'information bayésien (BIC) ou le critère d'information d'Akaike (AIC).

Remarques sur les données de la procédure d'analyse TwoStep Cluster
Données : Cette procédure fonctionne avec des variables continues et qualitatives. Les

observations représentent les objets à classer et les variables représentent les attributs sur lesquels est basée la classification.
Hypothèses : La mesure de la distance de vraisemblance considère que les variables

du modèle de classe sont indépendantes. De plus, chaque variable continue est considérée comme ayant une distribution normale (gaussienne) et chaque variable qualitative comme ayant une distribution multinomiale. Des tests internes empiriques indiquent que la procédure est assez résistante aux violations de l'hypothèse d'indépendance et des hypothèses de distribution, mais vous devez savoir comment ces hypothèses sont vérifiées. Utilisez la procédure Corrélations bivariées pour tester l'indépendance de deux variables continues. Utilisez la procédure Tableaux croisés pour tester l'indépendance de deux variables qualitatives. Utilisez la procédure Moyennes pour tester l'indépendance entre une variable continue et une variable qualitative. Utilisez la procédure Explorer pour tester la normalité d'une variable continue. Utilisez la procédure Test du Khi-deux pour tester si une variable qualitative comporte une distribution multinominale spécifiée.

474 Chapitre 31

Pour effectuer une procédure d'analyse TwoStep Cluster
E

A partir du menu, sélectionnez :
Analyse Classification Classification TwoStep...

E Sélectionnez une ou plusieurs variables qualitatives ou continues.

Sinon, vous pouvez :
„ „ „ „

Ajuster les critères sur lesquels est basée la construction des classes. Sélectionner les paramètres de gestion du bruit, d'affectation de mémoire, de standardisation de variable et d'entrée de modèle de classe. Demander des tableaux et des diagrammes facultatifs. Enregistrer les résultats de modèle dans le fichier de travail ou dans un fichier XML externe.

475 Classification TwoStep

Options de la procédure d'analyse TwoStep Cluster
Figure 31-2 Boîte de dialogue Options de la procédure d'analyse TwoStep Cluster

Traitement des valeurs éloignées : Ce groupe permet de traiter les valeurs éloignées, notamment lors de la classification, si l'arborescence des fonctionnalités de classe (CF) est saturée. L'arborescence CF est saturée si elle ne peut plus accepter d'autres observations dans un noeud feuille et qu'aucun noeud feuille ne peut être divisé.
„

Si vous sélectionnez la gestion du bruit et que l'arborescence CF est saturée, l'arborescence est reconstruite lorsque vous placez des observations de feuilles éclatées dans une feuille « bruit ». Une feuille est éclatée si elle contient un pourcentage inférieur au pourcentage d'observations correspondant à la taille maximale de la feuille. Une fois que l'arborescence est reconstruite, les valeurs

Si l'insertion d'une observation dans une feuille de l'arborescence CF provoque une étroitesse inférieure au seuil. Si l'étroitesse dépasse le seuil.476 Chapitre 31 éloignées sont placées dans l'arborescence CF si cela est possible. . Les variables continues non standardisées doivent être laissées comme étant « A standardiser ». „ „ Consultez l'administrateur système pour connaître la plus grande valeur que vous pouvez spécifier sur votre système. Après la classification finale. Pour gagner du temps et éviter trop de calculs. les valeurs éloignées sont supprimées. elle utilisera le disque pour stocker les informations ne pouvant pas être enregistrées en mémoire. la feuille est divisée. la feuille n'est pas divisée. Options avancées Critères de réglage de l'arborescence CF : Les paramètres d'algorithme de classification suivants s'appliquent de façon spécifique à l'arborescence CF et doivent être modifiés avec le plus grand soin : „ Seuil de modification de distance initiale : Il s'agit du seuil initial utilisé pour construire l'arborescence CF. Allocation de mémoire : Ce groupe vous permet d'indiquer la quantité de mémoire maximale en mégaoctets (Mo) que l'algorithme de classe doit utiliser. elle sera reconstruite à l'aide d'un seuil de changement de distance supérieur. L'algorithme risque de ne pas trouver le nombre correct ou souhaité de classes si cette valeur est trop basse. Un numéro d'identification de –1 est affecté à la classe de valeur éloignée et cette dernière n'est pas prise en compte dans le nombre de classes. les valeurs ne pouvant être affectées à une classe deviennent des valeurs éloignées étiquetées. Si la procédure dépasse cette limite. vous pouvez sélectionner une variable continue déjà standardisée comme variable « Standardisées ». Sinon. „ Nombre maximum de branches (par noeud feuille) : Nombre maximum de noeuds enfant qu'un noeud feuille peut contenir. Standardisation de variable : L'algorithme de classification fonctionne avec des variables continues standardisées. Spécifiez une valeur supérieure ou égale à 4. „ Si vous ne sélectionnez pas la gestion du bruit et que l'arborescence CF est saturée.

les options relatives à la génération de l'arborescence CF spécifiées pour le modèle d'origine sont utilisées. reportez-vous à « Résultats de l'analyse TwoStep Cluster » . Nombre maximal de noeuds possible : Ceci indique le nombre maximal de noeuds de l'arborescence CF pouvant être générés par la procédure. Le fichier XML demeure inchangé. Si vous avez indiqué la mise à jour d'un modèle de classe. Plus précisément. de gestion du bruit. sauf si vous enregistrez les informations du nouveau modèle en utilisant le même nom de fichier. Notez qu'une arborescence CF trop volumineuse risque d'épuiser les ressources du système et d'avoir des effets défavorables sur les performances de la procédure. Si votre « nouveau » groupe d'observations ne provient pas de la même population que votre « ancien » groupe. d'affectation de mémoire ou les critères de réglage de l'arborescence CF pour le modèle enregistré sont utilisés et tous les paramètres de ces options dans les boîtes de dialogue sont ignorés. Mettre à jour le modèle de classe : Ce groupe vous permet d'importer et de mettre à jour un modèle de classe généré dans une analyse précédente. Le modèle est ensuite mis à jour avec les données du fichier actif. . d'après la fonction (bd+1 –1) / ((b –1). exécutez la procédure Analyse du composant Classe TwoStep sur les groupes d'observations combinés pour obtenir de meilleurs résultats.477 Classification TwoStep „ „ Profondeur maximum de l'arborescence : Nombre maximum de niveaux que l'arborescence CF peut contenir. La procédure considère également que les observations utilisées dans la mise à jour du modèle sont issues de la même population d'observations utilisée pour créer le modèle d'origine. la profondeur maximale de l'arborescence. Chaque noeud exige au moins 16 octets. la procédure considère qu'aucune des observations sélectionnées dans le fichier de travail n'a été utilisée pour créer le modèle de classe d'origine. page 479. Le fichier d'entrée contient l'arborescence CF au format XML. Remarque : Lorsque vous effectuez une mise à jour d'un modèle de classe. En d'autres termes. les moyennes et les variances des variables continues et les niveaux des variables qualitatives sont considérés comme étant identiques dans les deux groupes d'observations. b étant le nombre maximal de branches et d. Pour plus d'informations. les paramètres de mesure de la distance. Vous devez sélectionner les noms des variables dans la boîte de dialogue principale dans le même ordre que celui dans lequel ils ont été spécifiés dans l'analyse précédente.

„ „ Rang des variables : Cette option détermine si des diagrammes seront créés pour chaque classe (Par classe) ou pour chaque variable (Par variable). Pour chaque variable continue. indiquant les variations par ID de classe. un diagramme de variation est produit. Le résultat est trié par ordre d'importance de chaque variable.478 Chapitre 31 Diagrammes de l'analyse TwoStep Cluster Figure 31-3 Boîte de dialogue Diagrammes de l'analyse TwoStep Cluster Dans le graphique de pourcentage de classe : Fait apparaître les graphiques indiquant la variation de classe de chaque variable. Diagramme d'importance des variables : Fait apparaître plusieurs diagrammes différents indiquant l'importance de chaque variable dans chaque classe. indiquant la fréquence de modalité par ID de classe. L'option Khi-deux ou test T de signification indique une statistique Khi-deux de Pearson comme importance . Mesure de l'importance : Cette option vous permet de sélectionner la mesure de l'importance des variables à représenter. Diagramme en secteurs de classe : Fait apparaître un diagramme en secteurs indiquant le pourcentage et le nombre d'observations dans chaque classe. un diagramme en bâtons juxtaposés est produit. Pour chaque variable qualitative.

Si les diagrammes sont créés par variable ou si la mesure de la signification est représentée. la valeur du niveau de confiance apparaît sous la forme d'une ligne verticale dans les diagrammes d'importance des variables.479 Classification TwoStep d'une variable qualitative et une statistique t comme importance d'une variable continue. Résultats de l'analyse TwoStep Cluster Figure 31-4 Boîte de dialogue des résultats de l'analyse du composant Classe TwoStep . „ Niveau de confiance : Cette option vous permet de définir le niveau de confiance pour le test d'égalité de la distribution d'une variable dans une classe par rapport à la distribution globale de la variable. Indiquez un nombre inférieur à 100 et supérieur ou égale à 50. moins la valeur p pour le test d'égalité des moyennes pour une variable continue et la fréquence théorique avec le groupe global des données pour une variable qualitative. „ Omettre les variables non significatives : Les variables non significatives au niveau de confiance spécifié n'apparaissent pas dans les diagrammes d'importance des variables. L'option Signification indique 1.

n étant un entier positif qui indique l'ordinal de l'opération d'enregistrement du fichier de travail effectuée par cette procédure au cours d'une session. „ Exporter l'arborescence CF : Cette option vous permet d'enregistrer l'état actuel de l'arborescence de classe et de le mettre à jour ultérieurement en utilisant des données plus récentes. L'autre tableau indique les effectifs des variables qualitatives par classe. Le nom de cette variable est tsc_n. Dans un tableau. Ce tableau est fourni uniquement lorsque le nombre de classes est déterminé automatiquement. Critère d'information (AIC ou BIC) : Fait apparaître un tableau contenant les valeurs d'AIC ou de BIC en fonction du critère choisi dans la boîte de dialogue principale. Fichier de travail : Ce groupe vous permet d'enregistrer des variables dans le fichier de travail. „ Exporter le modèle final : Le modèle de classe final est exporté vers le fichier spécifié. „ Descriptives par classe : Fait apparaître deux tableaux qui décrivent les variables dans chaque classe. „ „ Fréquences de classe : Fait apparaître un tableau indiquant le nombre d'observations dans chaque classe. Les statistiques descriptives et les fréquences de classe sont produites pour le modèle de classe final alors que le tableau du critère d'information fait apparaître des résultats pour une plage de solutions de classe. Fichiers XML : Le modèle de classe final et l'arborescence CF représentent deux types de fichiers de résultats pouvant être exportés au format XML.480 Chapitre 31 Statistiques : Ce groupe fournit des options d'affichage pour les tableaux des résultats de la classification. pour différents nombres de classes. SmartScore et les versions ultérieures de WhatIf? pourront utiliser ce fichier. „ Créer une variable d'appartenance à une classe : Cette variable contient un numéro d'identification de classe pour chaque observation. Si le nombre de classes est fixe. ce paramètre est ignoré et le tableau n'est pas fourni. les moyennes et les écarts types sont indiqués pour les variables continues par classe. .

Exemple : Y a-t-il des classes identifiables de spectacles télévisuels qui attirent des audiences similaires à l'intérieur de chaque classe ? Avec une classification hiérarchique. Statistiques : Chaîne des agrégations. en utilisant un algorithme qui débute avec chaque observation (ou variable) dans une classe séparée et qui combine les classes jusqu'à ce qu'il n'en reste qu'une. matrice de distances (ou des similarités) et classe d'affectation pour une seule solution ou un ensemble de solutions. Cette méthode peut être utilisée pour identifier des segments à des fins commerciales. 481 . Remarques sur les données de la classification hiérarchique Données : Les variables peuvent être des données quantitatives. une variable est mesurée en dollars et l'autre est mesurée en années). Vous pouvez analyser des variables non normées ou vous pouvez choisir parmi un assortiment de transformations standardisées. Les statistiques s'affichent à chaque étape pour vous aider à choisir la meilleure solution. binaires ou d'effectif. vous pouvez reclasser les spectacles télévisuels (observations) en classes homogènes basées sur les caractéristiques du spectateur. Vous pouvez aussi classer les villes (observations) en groupes homogènes pour permettre la sélection de villes comparables afin de tester diverses stratégies commerciales. Les mesures de distance ou de similarité sont générées par la procédure Proximities (Proximités). vous devez envisager de les standardiser (ceci peut être fait automatiquement avec la procédure de la classification hiérarchique). Diagrammes : arbres hiérarchiques et Stalactites.Classification hiérarchique 32 Chapitre Cette procédure tente d'identifier les classes d'observations (ou de variables) relativement homogènes basées sur des caractéristiques sélectionnées. L'échelle des variables est un élément important : des différences d'échelle qui peuvent affecter votre (vos) solution(s) en classes hiérarchiques. Si vos variables sont d'échelles très différentes (par exemple.

Echantillon de résultat Figure 32-1 Résultat de classification hiérarchique Agglomeration Schedule Cluster Combined Cluster 1 Stage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 11 6 7 6 7 1 6 13 2 1 1 15 1 1 1 Cluster 2 12 11 9 8 10 3 7 14 5 4 2 16 15 6 13 Coefficients .438 .185 .370 1.112 .772 Stage Cluster First Appears Cluster 1 0 0 0 2 3 0 4 0 0 6 10 0 11 13 14 Cluster 2 0 1 0 0 0 0 5 0 0 0 9 0 12 7 8 Next Stage 2 4 5 7 7 10 14 15 11 11 13 13 14 15 0 .484 .691 1.716 2.274 .642 4.423 . L'omission de variables influentes peut aboutir à une solution erronée. Vous devez aussi inclure toutes les variables appropriées dans votre analyse.227 .547 .132 . Parce que la classification hiérarchique est une méthode d'exploration.023 1. les résultats doivent être considérés comme provisoires tant qu'ils ne sont pas confirmés avec un échantillon indépendant.482 Chapitre 32 Hypothèses : Les mesures de distance ou de similarité utilisées doivent convenir aux données analysées (Voir la procédure Proximities (proximités) pour plus de renseignements sur le choix des mesures de distances et de similarité).

Indonesia Austria Canada Denmark Italy Japan Norway Switzerland Bangladesh India Bolivia Paraguay 4 Clusters 1 1 1 1 1 2 2 2 2 2 2 2 3 3 4 4 3 Clusters 1 1 1 1 1 2 2 2 2 2 2 2 3 3 1 1 2 Clusters 1 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 Vertical Icicle 14:India 14 13:Banglades 13 10:Japan 10 9:Italy 9 7:Canada 7 8:Denmark 8 12:Switzerlan 12 11:Norway 11 6:Austria 6 16:Paraguay 16 15:Bolivia 15 5:Indonesia 5 2:Brazil 2 4:Domincan R 4 3:Chile 3 1:Argentina Case Number of clusters 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 XX XX XX XX XX XX XXX XX XX XX XX XX XX XXX X XX X XX X XX X XX X XX X XX X XX X X X X X X X X X X X X X X X XX XX XX XX XXX XX XX XX XX XX XX XXX X XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX XX XX XXX XX XX XX X XX XX X X X X X XX X XX X X X X X XX XXX XX XX XXX XX XX XXX XX X X X XXX XX XXX XX XXX X X XX XX XX XX XXX X X XX X X X X X X X X X X X X X X X X X X X X X X X XX XX XXX X X XX XX XXX X X XX X XX X X X X X X X X X X X X X X X X X XXX X X X X X X X X X X XX X XX X XX X XX X X X X X X X X X X X .483 Classification hiérarchique Cluster Membership Label Case 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Argentina Brazil Chile Domincan R.

484 Chapitre 32 * * * * * * H I E R A R C H I C A L * * C L U S T E R A N A L Y S I S * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Norway Switzerland Austria Denmark Canada Italy Japan Brazil Indonesia Argentina Chile Domincan R. sélectionnez : Analyse Classification Classification hiérarchique... Figure 32-2 Boîte de dialogue Classification hiérarchique . Bolivia Paraguay Bangladesh India 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ -+ -+ -+-+ -+ +-----------------------+ -+ I I -+-+ I -+ +---------------------+ -----+---+ I I -----+ +-------+ I I ---+---+ I I I I ---+ +-+ +---------+ I -------+ I I -------------+---+ I -------------+ I ---+---------------------------------------------+ ---+ Num 11 12 6 8 7 9 10 2 5 1 3 4 15 16 13 14 Obtenir une classification hiérarchique E A partir du menu.

Mesure : Il permet de spécifier la mesure de distance ou de similarité devant être utilisée pour la classification. l'Agrégation suivant le saut minimum. et Autre. Vous avez la possibilité de sélectionner une variable d'identification pour étiqueter les observations. la Corrélation de Pearson. les Barycentres. Méthode de classification hiérarchique Figure 32-3 Boîte de dialogue Classification hiérarchique : Méthode Méthode d'agrégation : Les choix disponibles sont : la Distance moyenne entre classes. sélectionnez au moins une variable numérique. la Distance de Minkowski. le Cosinus. le Carré de la distance Euclidienne. Si vous classez des variables. . l'Agrégation suivant le diamètre. Sélectionnez le type de données et la mesure appropriée de distance ou de similarité : „ Intervalle : Les choix possibles sont la Distance Euclidienne. la Distance de Manhattan (bloc). la Distance moyenne dans les classes. sélectionnez au moins trois variables numériques. la Médiane et la Méthode de Ward. la Distance de Tchebycheff.485 Classification hiérarchique E Si vous classez des observations.

Les choix possibles sont Valeurs absolues. l'Indice de Sokal et Michener. la Forme. Dice. Entre –1 et 1. Sokal et Sneath 3. le Lambda. et Rééchelonner entre 0 et 1. Entre 0 et 1. le D d'Anderberg. Moyenne = 1 ou Ecart type = 1. la Différence de motif. . Kulczynski 1. le Y de Yule. la Dispersion. les distances entre les observations ou les classes en cours de combinaison. Mesures : Vous permet de transformer les valeurs générées par la mesure de distance. Statistiques de la classification hiérarchique Figure 32-4 Boîte de dialogue Classification hiérarchique : Statistiques Chaîne des agrégations : Affiche les observations ou les classes combinées à chaque étape. Kulczynski 2.486 Chapitre 32 „ „ Effectifs : Les choix possibles sont la Distance du Khi-deux et la Distance du phi-deux. Russel et Rao. la Corrélation phi tétrachorique. Rogers et Tanimoto. et le Q de Yule. Binaire : Les choix possibles sont la Distance Euclidienne. Hamann. Inverser le signe. Maximum = 1. Transformer les valeurs : Vous permet de standardiser les valeurs des données pour les observations ou les valeurs avant le calcul des proximités (non disponible pour les données binaires). le Carré de la distance Euclidienne. Sokal et Sneath 4. Lance et Williams. Ochiai. Sokal et Sneath 2. Sokal et Sneath 5. l'Ecart de taille. Jaccard. Les méthodes de standardisation disponibles sont Centrer-réduire. Elles sont appliquées après le calcul de la mesure de distance. et le dernier niveau de classe auquel une observation (ou une variable) a rejoint la classe. la Variance. Sokal et Sneath 1.

incluant toutes les classes ou une classe spécifique. Les options disponibles sont Une seule partition. Les arbres hiérarchiques peuvent être utilisés pour évaluer la cohésion des groupes formés et ils fournissent des renseignements sur le nombre approprié de groupes à conserver. Diagrammes (graphiques) de classification hiérarchique Figure 32-5 Boîte de dialogue Classification hiérarchique : Graphiques (diagrammes) Arbre hiérarchique : Affiche un arbre hiérarchique. Plusieurs partitions ou Aucune. Orientation vous permet de sélectionner un diagramme vertical ou horizontal. Stalactites : Affiche un diagramme en stalactite. . Classe(s) d'affectation : Affiche le groupe auquel chaque observation appartient lors d'une ou plusieurs étapes de la combinaison de classes. Les diagrammes en stalactite affichent des informations sur la façon dont les observations sont regroupées à chaque itération de l'analyse.487 Classification hiérarchique Matrice des distances : Indique les distances ou les similarités entre éléments.

. Classe(s) d'affectation : Vous permet de sauvegarder les classes d'affectation pour une ou plusieurs ou aucune partition(s). Les variables sauvegardées peuvent alors être utilisées pour des analyses ultérieures pour explorer d'autres différences entre groupes.. .488 Chapitre 32 Enregistrement des nouvelles variables de classification hiérarchique Figure 32-6 Boîte de dialogue Classification hiérarchique : Enregistrer les nouvelles.

L'algorithme vous demande toutefois d'indiquer le nombre de classes. Bien que ces statistiques soient opportunistes (la procédure cherche à former des groupes qui diffèrent). vous pouvez classer les programmes de télévision (observations) en k groupes homogènes d'après les caractéristiques des téléspectateurs. Vous pouvez enregistrer l'appartenance à une classe.Nuées dynamiques 33 Chapitre Cette procédure cherche à identifier des groupes d'observations relativement homogènes d'après des caractéristiques sélectionnées. les informations de distance et les centres de classes finaux. Exemple : Quels sont les groupes de programmes de télévision identifiables qui attirent des publics similaires au sein de chaque groupe ? Grâce à l'analyse des nuées dynamiques. Vous pouvez aussi classer les villes (observations) en groupes homogènes pour permettre la sélection de villes comparables afin de tester diverses stratégies commerciales. tableau ANOVA. Vous pouvez également demander des statistiques F d'analyse de la variance. soit la classification seule. au moyen d'un algorithme qui peut traiter de grands nombres d'observations. Chaque observation: information de classe. distance au centre de classe. soit la mise à jour des centres de classe de façon itérative. Vous pouvez choisir entre deux méthodes de classement des observations. la taille relative des statistiques fournit des informations sur la contribution de chaque variable à la séparation des groupes. Statistiques : Solution complète : centres de classes initiaux. Cette méthode peut être utilisée pour identifier des segments à des fins commerciales. Vous pouvez indiquer les centres de classe initiaux si vous connaissez cette information. Vous pouvez éventuellement indiquer une variable dont les valeurs servent à étiqueter les résultats par observations. 489 .

89037 .74406 .89320 . Si vous souhaitez utiliser une autre distance ou une mesure de similarité.52581 -2.78455 -. Echantillon de résultat Figure 33-1 Résultats de l'analyse des nuées dynamiques Centres de classes initiaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.16813 2.40082 . vous pouvez envisager de standardiser vos variables avant d'effectuer l'analyse des nuées dynamiques (cela peut être fait dans la procédure Descriptives). utilisez la procédure de classification hiérarchique.99285 -.75481 2.68796 4. vos résultats risquent d'être erronés. Si vous avez choisi un nombre de classes inadéquat ou omis de variables importantes.65146 .38422 . vos résultats risquent d'être erronés. Si vos variables sont binaires ou sont des effectifs.16291 1.29624 4 .51770 3.31333 .12785 -.99370 . La mise à l'échelle des variables est une considération importantes—si vos variables sont mesurées selon des échelles différentes (une variable est exprimée en dollars par exemple et une autre en années).53091 4.54314 -1.46008 -1.24626 2 -1.65246 3 1.88606 -3.69589 .88983 -1.24070 .55724 .41517 -1.52182 2.62725 -.490 Chapitre 33 Considérations de données sur la classification en nuées dynamiques Données : Les variables doivent être quantitatives au niveau intervalle ou ratio. utilisez la procédure de classification hiérarchique.63185 1.69358 -1.45741 .76793 -.99641 -. Hypothèses : Les distances sont calculées à l'aide de la distance euclidienne simple. Dans ces cas.33278 -1.88601 -1.42699 .08033 . La procédure suppose que vous avez sélectionné le nombre voulu de classes et que vous avez inclus toutes les variables pertinentes.03701 -.93737 4.22118 -.63185 -1.

314 .343 .897 3.199 .94249 -.000 .27010 -.25622 1.627 3 5.70745 -2.29856 1.45301 .34577 3 .30833 .000 .640 7.253 .172 .77704 -.80611 .52826 -2.16871 1.84758 -.337 .185 4 1.249 5.249 5.287 .22286 .59747 2.924 2.000 .95175 -.80817 -.167 .596 .000 .000 2 2.640 2.000 .44640 -.000 .724 .897 4 7.13880 .084 .160 .13716 -.861 .246 .414 .000 Centres de classes finaux Classe ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP 1 -1.604 .83475 2 -.000 .13400 .73368 -.28417 -.30863 -.237 .932 .81671 1.19154 -.000 .466 .58745 .077 .074 .627 5.623 .924 3.10314 -1.22199 Distances entre les centres de classes finaux 1 Classe 1 2 3 4 5.43210 1.195 .12929 -.491 Nuées dynamiques Historique des itérations Changements dans les centres de classes Itération 1 2 3 4 5 6 7 8 9 10 1 1.246 2 5.080 .31319 .071 .87669 -.000 .16816 -.51003 .097 3 3.471 .71414 -.49499 4 .000 .99285 .150 .52607 2.15939 .45251 1.62767 .12150 .

.457 Sig..210 .168 .006 ZURBAN ZLIFEEXP ZLITERAC ZPOP_INC ZBABYMOR ZBIRTH_R ZDEATH_R ZLOG_GDP ZB_TO_D ZFERTILT ZLOG_POP Les tests F ne doivent être utilisés qu'à des fins descriptives car les classes sont choisies pour maximiser les différences entre les observations des différentes classes.000 . Obtenir une analyse de nuées dynamiques E A partir du menu.907 df 3 3 3 3 3 3 3 3 3 3 3 Erreur Carré Moyen .829 3. sélectionnez : Analyse Classification Nuées dynamiques.444 .167 .273 4.859 117.877 df 68 68 68 68 68 68 68 68 68 68 68 F 19.410 18.313 56.409 19.731 18.655 84..219 .000 .621 19.000 .000 .464 18.000 .000 .234 92.229 .339 30.599 13.000 .287 .599 16.316 18.492 Chapitre 33 ANOVA Classe Carré Moyen 10.000 .676 61. .628 17.000 .682 112.288 .000 .239 .428 77.541 . Les seuils de signification observés ne sont pas corrigés par la suite et ne peuvent donc pas être interprétés en tant que tests de l’hypothèse Selon laquelle les moyennes de classe sont égales.614 81.

E Spécifiez le nombre de classes. E Sélectionnez soit la méthode Itérer et classer soit la méthode Classer seulement. . Le nombre de classes doit être au moins de deux et ne doit pas être supérieur au nombre d'observations du fichier de données. Efficacité de la classification en nuées dynamiques La commande d'analyse des nuées dynamiques est efficace essentiellement parce qu'elle ne calcule pas les distances entre toutes les paires d'observations. Vous avez la possibilité de sélectionner une variable d'identification pour étiqueter les observations. comme c'est le cas dans de nombreux algorithmes de classification.493 Nuées dynamiques Figure 33-2 Boîte de dialogue Nuées dynamiques E Sélectionnez les variables à utiliser dans l'analyse. y compris celui utilisé par la commande de classification hiérarchique de SPSS.

0. Cliquez sur Centres et Lire les centres initiaux Fichier pour classer tout le fichier en utilisant les centres estimés à partir de l'échantillon. Maximum des itérations : Limite le nombre des itérations dans l'algorithme des nuées dynamiques. . Ce nombre doit être compris entre 1 et 999. Rétablissez ensuite tout le fichier de données. Si le critère est égal à 0. et doit donc être plus grand que 0 mais plus petit que 1.02 par exemple. indiquez 1 comme Maximum des itérations.494 Chapitre 33 Pour plus d'efficacité. Pour reproduire l'algorithme utilisé par la commande de classement rapide Quick Cluster dans SPSS avant la version 5. Itération de la classification en nuées dynamiques Figure 33-3 Boîte de dialogue Nuées dynamiques : Itérer Ces options ne sont disponibles que si vous avez sélectionné la méthode Itérer et classer dans la boîte de dialogue principale. Sélectionnez Ecrire les centres finaux dans Fichier. L'itération s'arrête après ce nombre d'itérations même si le critère de convergence n'est pas satisfait. Critère de convergence : Détermine le moment où l'itération s'arrête. puis sélectionnez la méthode Classer seulement. Utiliser les nouveaux centres : Vous permet de demander la mise à jour des centres après l'affectation de chaque observation. l'itération cesse lorsque une itération complète ne déplace plus aucun des centres d'une distance de plus de deux pour cent de la plus petite distance entre n'importe quels centres initiaux. Si vous ne sélectionnez pas cette option. les nouveaux centres seront calculés lorsque toutes les observations auront été affectées. prenez un échantillon d'observations et utilisez la méthode Itérer et classer pour déterminer les centres. Il représente une proportion de la distance minimale entre les centres de classes initiaux.

Options d'analyses des classes de nuées dynamiques Figure 33-5 Boîte de dialogue Nuées dynamiques : Options Statistiques : Vous pouvez sélectionner les statistiques suivantes : Centres de classes initiaux. et Affectation et distances au centre.495 Nuées dynamiques Enregistrement des analyses de classes de nuées dynamiques Figure 33-4 Boîte de dialogue Nuées dynamiques : Enregistrer les nouvelles variables.. Tableau ANOVA. Vous pouvez enregistrer des informations sur la solution relatives aux nouvelles variables à utiliser dans les analyses ultérieures : Classe(s) d'affectation : Crée une nouvelle variable indiquant la classe d'affectation finale de chaque observation. Distance au centre de classe : Crée une nouvelle variable indiquant la distance euclidienne entre chaque nouvelle variable et son centre de classification.. Les valeurs de la nouvelle variable vont de 1 au nombre de classes. .

. Par défaut. Exclure seulement les composantes non valides : Affecte des observations aux classes basées sur des distances calculées à partir de toutes les variables n'ayant pas de valeur manquante. Les tests F sont uniquement descriptifs et les probabilités qui en résultent ne doivent pas être interprétées.496 Chapitre 33 „ Centres de classe initiaux : Première estimation des moyennes des variables de chacune des classes. incluant les tests F univariés pour chacune des variables de la classification. „ „ Exclure toute observation incomplète : Exclut de l'analyse les observations qui ont des valeurs manquantes pour une variable de classe. le nombre d'observations assez espacées sélectionné dans les données est égal au nombre de classes. „ Affectations et distances au centre : Affiche pour chaque observation l'affectation de classe finale et la distance euclidienne entre l'observation et le centre de classe utilisé pour classer l'observation. Le tableau ANOVA n'apparaît pas si toutes les observations sont affectées à une seule classe. Valeurs manquantes : Les options disponibles sont Exclure toute observation incomplète ou Exclure seulement les composantes non valides. Les centres de classes initiaux sont utilisés pour une première classification et sont ensuite mis à jour. „ Tableau ANOVA : Affiche un tableau d'analyse de la variance. Affiche également la distance euclidienne entre les centres de classe finaux.

Test Kolmogorov-Smirnov pour un échantillon : Compare la fonction de distribution cumulée observée pour une variable avec une distribution théorique spécifiée. Le test U de Mann-Whitney. Test binomial : Compare la fréquence observée dans chaque modalité d'une variable dichotomique avec les fréquences attendues de la distribution binomiale. Le test de Kruskal-Wallis. le test de la médiane et le test de Jonckheere-Terpstra sont disponibles. Suites en séquence : Teste si l'ordre d'occurrence de deux valeurs d'une variable est aléatoire. qui peut être normale. le test de Kolmogorov-Smirnov pour deux échantillons. le test des signes et le test de McNemar sont disponibles.Tests non paramétriques 34 Chapitre La procédure de tests non paramétriques propose plusieurs tests qui ne nécessitent pas d'hypothèse concernant la forme de la distribution sous-jacente : Test Khi-deux : Tabule une variable en modalités et calcule une statistique khi-deux basée sur les différences entre les fréquences observées et les fréquences attendues. Tests de plusieurs échantillons indépendants : Compare deux groupes d'observations ou plus d'une variable. et les suites en séquences Wald-Wolfowitz sont disponibles. le test W de Kendall et le test Q de Cochran sont disponibles. uniforme ou Poisson. Tests de plusieurs échantillons liés : Compare les distributions de deux variables ou plus. 497 . Tests de deux échantillons indépendants : Compare deux groupes d'observations d'une variable. Le test de Wilcoxon. le test de réactions extrêmes Moses. Le test de Friedman. Tests de deux échantillons liés : Compare les distributions de deux variables.

20 % des modalités au maximum doivent avoir des fréquences inférieures à 5. Pour convertir des variables chaînes en variables numériques. 15 % de bonbons rouges et 15 % de bonbons jaunes. 20 % bonbons oranges. et le nombre d'observations sont disponibles pour tous les tests ci-dessus. les résidus et la statistique khi-deux. l'écart type. . Test du Khi-deux : remarques sur les données Données : Utilisez des variables qualitatives numériques ordonnées ou désordonnées (niveau de mesure ordinal ou nominal). Test du Khi-deux La procédure de test du Khi-deux tabule une variable en modalités et calcule une statistique Khi-deux. Les fréquences attendues pour chaque modalité doivent être au moins égales à 1. le maximum. le nombre de cas observés et attendus pour chaque modalité. 30 % de bonbons marrons. et quartiles. Le nombre et le pourcentage d'observations manquantes et non manquantes. Ce test de qualité de l'ajustement compare les fréquences observées et attendues dans chaque modalité pour vérifier si toutes les modalités contiennent la même proportion de valeurs ou si chaque modalité contient une proportion de valeurs spécifiées par l'utilisateur Exemples : Le test du Khi-deux peut être utilisé pour déterminer si un sac de bonbons contient les mêmes proportions de bonbons bleus. oranges. Hypothèses : Les tests non paramétriques ne nécessitent pas d'hypothèses sur la forme de la distribution sous-jacente. maximum. utilisez la procédure Recoder Automatiquement. marrons. écart type. verts. le minimum. 10 % de bonbons verts. rouges et jaunes. On part du principe que les données constituent un échantillon aléatoire. Vous pouvez aussi tester si le sac de bonbons contient 5 % de bonbons bleus.498 Chapitre 34 Les quartiles et la moyenne. disponible dans le menu Transformer. minimum. Statistiques : Moyenne.

8 18.8 18. 18.8 18.8 33 9 17 22 26 113 Tests statistiques Couleur du Bonbon Haricot 27.2 -9.8 -1.2 Bleu Marron Vert Jaune Orange Rouge Total 18.8 3.973 5 . 0 cellule. 0 % de fréquences faibles.8 Khi-deux df 1 Signification Asymptotique 1.8 18.8 14.2 7.000 Résidu -12.499 Tests non paramétriques Echantillon de résultat Figure 34-1 Résultat de test du Khi-deux Couleur du bonbon haricot N N Observé(e)s Théoriques 6 18.8 fréquences faibles théoriques… .

sélectionnez : Analyse Tests non paramétriques Khi-deux.8 18.500 Chapitre 34 Couleur du bonbon haricot N N Observé(e)s Théoriques 6 18. 0 % de fréquences faibles. .2 7.041 5 .959 Résidu -12..7 fréquences faibles théoriques… Pour obtenir un test Khi-deux E A partir du menu.2 Bleu Marron Vert Jaune Orange Rouge Total 18.8 18.8 33 9 17 22 26 113 Tests statistiques Couleur du Bonbon Haricot 1. 5.8 14..8 18.8 -1.8 3.2 -9. 0 cellule.8 Khi-deux df 1 Signification Asymptotique 1.8 18.

sélectionnez l'option Dans les limites spécifiées.501 Tests non paramétriques Figure 34-2 Boîte de dialogue Test du khi-deux E Sélectionnez des variables de test. chaque valeur distincte de la variable est définie comme modalité. Chaque fois que vous ajoutez une valeur. Vous pouvez également cliquer sur Options pour les statistiques descriptives. si vous spécifiez une valeur de limite inférieure de 1 et une valeur de limite supérieure de 4. toutes les modalités ont des valeurs théoriques égales. Pour établir des modalités dans un intervalle spécifique. et les observations à l'extérieur des limites sont exclues. L'ordre des valeurs est important. Sélectionnez Valeurs. Les modalités peuvent avoir des proportions attendues définies par l'utilisateur. et indiquez les valeurs entières pour les limites inférieure et supérieure. Effectifs théoriques : Par défaut. Valeurs et intervalles théoriques du test du Khi-deux Intervalle théorique : Par défaut. indiquez une valeur supérieure à 0 pour chaque modalité de variable de test et cliquez sur Ajouter. . les quartiles et le contrôle du traitement des données manquantes. Des modalités sont établies pour chaque valeur entière comprise dans l'intervalle. celle-ci apparaît au bas de la liste des valeurs. Par exemple. Chaque variable produit un test distinct. seules les valeurs entières de 1 à 4 sont utilisées pour le test du Khi-deux.

Par exemple. et le nombre d'observations non manquantes. chaque test est effectué séparément selon le nombre des valeurs manquantes. „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. La première valeur de la liste correspond à la valeur de groupe la plus basse de la variable de test et la dernière valeur correspond à la valeur la plus élevée. 50ème et 75ème centiles. le maximum. Quartiles : Indique les valeurs correspondant au 25ème. Les éléments de la liste des valeurs sont additionnés et chaque valeur est ensuite divisée par cette somme pour calculer la proportion d'observations attendues dans la modalité correspondante.502 Chapitre 34 Il correspond à l'ordre croissant des valeurs des modalités de la variable de test. 5/16 et 4/16. l'écart type. 4 indique les proportions attendues de 3/16. Valeurs manquantes : Contrôle le traitement des valeurs manquantes. Test du Khi-deux : Options Figure 34-3 Boîte de dialogue Test du Khi-deux : Options Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Affiche la moyenne. 5. 4/16. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses. 4. . une liste de valeurs de 3. le minimum.

Pour convertir des variables chaînes en variables numériques.5. Ces résultats indiquent qu'il est peu probable que la probabilité pour que la pièce tombe sur le côté face soit égale à 1/2. Pour obtenir des renseignements complets sur la syntaxe.0027). Statistiques : Moyenne. ou des fréquences attendues pour différentes variables (avec la sous-commande CHISQUARE). Par défaut. et les résultats sont enregistrés (pile ou face). reportez-vous au manuel SPSS Command Syntax Reference. Pour modifier les probabilités.503 Tests non paramétriques Fonctionnalités supplémentaires de la commande NPAR TESTS (test du Khi-deux) Le langage de commande SPSS vous permet aussi de : „ „ Spécifier des valeurs minimale et maximale différentes. le paramètre de probabilité pour les deux groupes est de 0. Tester la même variable avec différentes fréquences attendues ou utiliser différentes plages (avec la sous-commande EXPECTED). La probabilité pour le second groupe sera de 1 moins la probabilité spécifiée pour le premier groupe. Test binomial : remarques sur les données Données : Les variables testées doivent être numériques et dichotomiques. Une variable . maximum. une pièce est lancée 40 fois. disponible dans le menu Transformer. la probabilité de tomber sur le côté face est de 1/2. Test binomial La procédure de test binomial compare les fréquences observées des deux modalités d'une variable dichotomique avec les fréquences que l'on peut attendre d'une distribution binomiale avec un paramètre de probabilité spécifié. La pièce est probablement truquée. utilisez la procédure Recoder Automatiquement. écart type. Exemple : Quand vous lancez une pièce. nombre d'observations avec des valeurs non manquantes et quartiles. il se peut que vous observiez que les 3/4 des lancements sont tombés sur le côté face et que le seuil de signification observé est bas (0. Du test binomial. vous pouvez entrer un test de proportion pour le premier groupe. minimum. Sur la base de cette hypothèse.

00 Test de Proportion ..75 . On part du principe que les données constituent un échantillon aléatoire. La césure répartit les observations avec une valeur supérieure à la césure dans un groupe et le reste des observations dans un autre groupe. Basé sur l'approximation Z Pour obtenir un test binomial E A partir du menu. sélectionnez : Analyse Tests non paramétriques Binomial. etc..50 1. il faut spécifier une césure. .504 Chapitre 34 dichotomique est une variable qui ne peut prendre que deux valeurs possibles : oui ou non. vrai ou faux.25 1. Hypothèses : Les tests non paramétriques ne nécessitent pas d'hypothèses sur la forme de la distribution sous-jacente.0031 Pièce Groupe 1 Groupe 2 Total Modalité Face Pile N 30 10 40 Proportion Observée . Echantillon de résultat Figure 34-4 Résultat du test binomial Test binomial Signification Asymptotique (Bilatérale) . Si les variables ne sont pas dichotomiques. 0 ou 1.

Vous pouvez également cliquer sur Options pour les statistiques descriptives. Test binomial : Options Figure 34-6 Boîte de dialogue Test binomial .505 Tests non paramétriques Figure 34-5 Boîte de dialogue Test binomial E Sélectionnez une ou plusieurs variables numériques à tester. les quartiles et le contrôle du traitement des données manquantes.

„ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour toutes les variables du test sont exclues de toutes les analyses. reportez-vous au manuel SPSS Command Syntax Reference. Spécifier différentes césures ou probabilités pour différentes variables (avec la sous-commande BINOMIAL). Pour obtenir des renseignements complets sur la syntaxe. l'écart type. chaque test est effectué séparément selon le nombre des valeurs manquantes. Fonctionnalités supplémentaires de la commande NPAR TESTS (Test binomial) Le langage de commande SPSS vous permet aussi de : „ „ „ Sélectionner des groupes spécifiques (et excluez-en d'autres) lorsqu'une variable comporte plus de deux modalités (avec la sous-commande BINOMIAL). . le minimum. le maximum. Suites en séquences La procédure Suites en séquences teste si l'ordre d'occurrence de deux valeurs d'une variable est aléatoire. et le nombre d'observations non manquantes. Tester la même variable avec différentes césures ou probabilités (avec la sous-commande EXPECTED). Une séquence est une suite d'observations semblables. Quartiles : Indique les valeurs correspondant au 25ème. 50ème et 75ème centiles. Un échantillon comportant trop ou trop peu de séquences suggère que l'échantillon n'est pas aléatoire. „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués.506 Chapitre 34 Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Affiche la moyenne. Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

utilisez la procédure Recoder Automatiquement. Utilisez des échantillons à distribution de probabilité continue. Pour convertir des variables chaînes en variables numériques. maximum. Echantillon de résultat Figure 34-7 Résultat de suites en séquences Suites en séquences Valeur de test 1 Observations < Valeur de test Observations >= Valeur de test Total des observations Nombre de séquences Z Signification asymptotique (bilatérale) Sexe 1. disponible dans le menu Transformer. écart type.507 Tests non paramétriques Exemples : Supposons que 20 personnes soient sondées pour déterminer si elles achèteraient un produit donné. minimum. nombre d'observations avec des valeurs non manquantes et quartiles.025 1. Le test Suites en séquences peut être utilisé pour déterminer si l'échantillon a été tiré au hasard.00 7 13 20 15 2. On peut douter que l'échantillon soit aléatoire si toutes les personnes sont du même sexe. Suites en séquences : Remarques sur les Données Données : Les variables doivent être numériques. Médiane . Statistiques : Moyenne. Hypothèses : Les tests non paramétriques ne nécessitent pas d'hypothèses sur la forme de la distribution sous-jacente.234 .

Vous pouvez également cliquer sur Options pour les statistiques descriptives. soit une valeur spécifiée comme césure. la médiane ou le mode observés...508 Chapitre 34 Pour obtenir un test de suites E A partir du menu. Vous pouvez utiliser soit la moyenne. Les observations dont les valeurs sont inférieures à la césure sont assignées à un groupe. . Un test est réalisé pour chaque césure choisie. et les observations dont les valeurs sont supérieures à la césure sont assignées à l'autre groupe. sélectionnez : Analyse Tests non paramétriques Séquences. Figure 34-8 Boîte de dialogue Suites en séquences E Sélectionnez une ou plusieurs variables numériques à tester. les quartiles et le contrôle du traitement des données manquantes. Césure des Suites en séquences Césure : Spécifie une césure pour dichotomiser les variables que vous avez choisies.

509 Tests non paramétriques Options des Suites en séquences Figure 34-9 Boîte de dialogue Suites en séquences : Options Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Affiche la moyenne. Tester la même variable par rapport à différentes césures personnalisées (à l'aide de la sous-commande RUNS). „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. 50ème et 75ème centiles. le minimum. Quartiles : Indique les valeurs correspondant au 25ème. l'écart type. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses. . et le nombre d'observations non manquantes. le maximum. Valeurs manquantes : Contrôle le traitement des valeurs manquantes. Fonctionnalités supplémentaires de la commande NPAR TESTS (Suites en séquences) Le langage de commande SPSS vous permet aussi de : „ „ Spécifier différentes césures pour différentes variables (à l'aide de la sous-commande RUNS). chaque test est effectué séparément selon le nombre des valeurs manquantes.

de Poisson ou exponentielle.510 Chapitre 34 Pour obtenir des renseignements complets sur la syntaxe. minimum. Remarques sur les données du test de Kolmogorov-Smirnov pour un échantillon Données : Utilisez des variables quantitatives (mesure d'intervalle ou de rapport). l'échantillon de moyenne est le paramètre pour la distribution de Poisson et l'échantillon de l'écart type est le paramètre pour la distribution exponentielle. Le test de qualité de l'ajustement contrôle si les observations peuvent avoir été raisonnablement déduites de la distribution spécifiée. reportez-vous au manuel SPSS Command Syntax Reference. nombre d'observations avec des valeurs non manquantes et quartiles. Les valeurs minimum et maximum de l'échantillon définissent l'intervalle de la distribution uniforme. Test Kolmogorov-Smirnov pour un échantillon Le test de Kolmogorov-Smirnov pour un échantillon compare la fonction de distribution cumulée observée d'une variable avec une distribution théorique spécifiée. . Le test de Kolmogorov-Smirnov pour un échantillon permet de tester si une variable comme Revenu. L'échantillon de moyenne et l'échantillon d'écart type sont les paramètres pour une distribution normale. maximum. écart type. Le Z de Kolmogorov-Smirnov est calculé à partir de la plus grande différence (en valeur absolue) entre les fonctions de distribution cumulées observées et théoriques. Exemple : La plupart des tests paramétriques nécessitent des variables distribuées normalement. par exemple. qui peut être normale. uniforme. Cette procédure estime les paramètres à partir d'un échantillon. est distribuée normalement. Statistiques : Moyenne. Hypothèses : Le test de Kolmogorov-Smirnov part du principe que les paramètres de la distribution à tester sont précisés a priori.

2 Pour obtenir un test de Kolmogorov-Smirnov pour un échantillon E A partir du menu. .170 ..170 -.00 45146.511 Tests non paramétriques Echantillon de résultat Figure 34-10 du test de Kolmogorov-Smirnov pour un échantillon Test Kolmogorov-Smirnov pour un échantillon Revenu 20 Moyenne Ecart type Différences les plus extrêmes Absolues Positives Négatives Z de Kolmogorov-Smirnov Signification asymptotique (bilatérale) 1.164 .40 . sélectionnez : Analyse Tests non paramétriques K-S à 1 échantillon.611 N Paramètres gaussiens 1.. Calcul à partir de données 56250.760 . Distribution à tester normale 2.

Options du test de Kolmogorov-Smirnov pour un échantillon Figure 34-12 Boîte de dialogue K-S pour un échantillon : Options . Chaque variable produit un test distinct. les quartiles et le contrôle du traitement des données manquantes. Vous pouvez également cliquer sur Options pour les statistiques descriptives.512 Chapitre 34 Figure 34-11 Boîte de dialogue Test de Kolmogorov-Smirnov pour un échantillon E Sélectionnez une ou plusieurs variables numériques à tester.

Le test U de Mann-Whitney peut par exemple vous montrer que les sujets portant les nouveaux appareils ne doivent pas les porter aussi longtemps que les sujets utilisant les anciens appareils. 50ème et 75ème centiles. Quartiles : Indique les valeurs correspondant au 25ème. . Valeurs manquantes : Contrôle le traitement des valeurs manquantes. Fonctions supplémentaires de commandes NPAR TESTS (test de Kolmogorov-Smirnov pour un échantillon) Le langage de commande SPSS vous permet aussi de : „ Spécifier les paramètres de la distribution à tester (avec la sous-commande K-S). „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. le maximum. Tests pour deux échantillons indépendants La procédure des tests pour deux échantillons indépendants compare deux groupes d'observations en fonction d'une variable. Exemple : De nouveaux appareils dentaires qui sont censés être plus confortables. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.513 Tests non paramétriques Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Affiche la moyenne. 10 enfants sont choisis de façon aléatoire pour porter les anciens appareils et 10 autres pour porter les nouveaux appareils. Pour savoir si les nouveaux appareils doivent être portés aussi longtemps que les anciens. avoir une apparence plus agréable et provoquer des progrès plus rapides pour le redressage des dents ont été développés. et le nombre d'observations non manquantes. l'écart type. reportez-vous au manuel SPSS Command Syntax Reference. le minimum. chaque test est effectué séparément selon le nombre des valeurs manquantes. Pour obtenir des renseignements complets sur la syntaxe.

aléatoires. réactions extrêmes de Moses.10 6. suites de Wald-Wolfowitz.00 . Le test U de Mann-Whitney exige que les deux échantillons testés soient de forme semblable.90 Somme des rangs 141. Tests pour deux échantillons indépendants : remarques sur les données Données : Utilisez des variables numériques qui peuvent être ordonnées. nombre d'observations avec des valeurs non manquantes et quartiles.514 Chapitre 34 Statistiques : Moyenne. Hypothèses : Utilisez des échantillons indépendants.00 69. Tests : U de Mann-Whitney. Z de Kolmogorov-Smirnov. écart type. minimum. Echantillon de résultat Figure 34-13 Résultat pour deux échantillons indépendants Rangs N Temps Type Anciens écoulé en D'appareil Appareils Jours Nouveaux Appareils Total 10 10 20 Rang Moyen 14. maximum.

.005 1.000 -2. Critère de regroupement qualitatif numérique : type d'appareil Pour effectuer les tests pour deux échantillons indépendants A partir du menu. Ex æquo non corrigés. 2.721 . sélectionnez : Analyse Tests non paramétriques 2 échantillons indépendants.000 W de Wilcoxon Z Signification Asymptotique (Bilatérale) Signification exacte [2*(sig. . Unilatérale)] 69..515 Tests non paramétriques Tests statistiques 2 Temps écoulé en jours U de Mann-Whitney 14.007 1 .

. Les observations des deux groupes sont combinées et ordonnées. les rangs doivent être attribués de façon aléatoire entre les deux échantillons. Le test U de Mann-Whitney est le plus populaire des tests pour deux échantillons indépendants. Si les populations ont une position identique. E Sélectionnez une variable de regroupement et cliquez sur Définir groupes. Le nombre de fois ou un résultat du groupe 1 précède un résultat du groupe 2 et le nombre de fois ou un résultat du groupe 2 . pour scinder le fichier en deux groupes ou échantillons. et il leur est attribué un rang moyen en cas d'ex aequo.516 Chapitre 34 Figure 34-14 Boîte de dialogue Tests pour deux échantillons indépendants E Sélectionnez une ou plusieurs variables numériques. Le nombre d'ex aequo doit être petit par rapport au nombre total d'observations.. Les tests de Mann-Whitney servent à vérifier que deux échantillons d'une population ont une position équivalente. Types de tests pour deux échantillons indépendants Type de test : Quatre tests sont disponibles pour tester si deux échantillons (groupes) proviennent de la même population. Il équivaut au test de Wilcoxon et au test de Kruskal-Wallis pour deux groupes.

5 % des observations de contrôle sont filtrées automatiquement à chaque extrémité. Il vérifie les réponses extrêmes par rapport à un groupe de contrôle. Le test des réactions extrêmes de Moses part du principe que la variable expérimentale influence certains sujets dans une direction et d'autres sujets dans la direction opposée. on considère que les deux distributions sont différentes. également affichée. Si les deux échantillons ont le même nombre d'observations.517 Tests non paramétriques précède un résultat du groupe 1 sont calculés. est la somme des rangs du plus petit échantillon. Puisque des valeurs éloignées peuvent occasionnellement et facilement fausser l'intervalle d'amplitude. Si les deux échantillons proviennent de la même population. Définition de deux groupes d'échantillons indépendants Figure 34-15 Boîte de dialogue Tests pour deux échantillons indépendants : Définir groupes . les deux groupes doivent être dispersés de façon aléatoire dans tout le classement. Les observations des deux groupes sont combinées et ordonnées. La statistique du U de Mann-Whitney est le plus petit de ces deux nombres. Lorsque cette différence est significative. Le test des suites en séquences de Wald-Wolfowitz combine et ordonne les observations des deux groupes. L'intervalle du groupe de contrôle se calcule en effectuant la différence entre les rangs des valeurs les plus grandes et les plus petites du groupe de contrôle plus 1. Le test Z de Kolmogorov-Smirnov et les suites en séquences de Wald-Wolfowitz sont des tests plus généraux qui détectent les différences de position et la forme des distributions. Le groupe de contrôle est défini par la valeur du groupe 1 dans la boîte de dialogue Définition des deux groupes d'échantillons indépendants. W est la somme des rangs du groupe nommé en premier dans la boîte de dialogue Définition des deux groupes d'échantillons indépendants. Le test Z de Kolmogorov-Smirnov est basé sur la différence absolue maximum entre les fonctions de distribution cumulées observées pour les deux échantillons. Ce test permet d'étudier l'intervalle du groupe de contrôle et de mesurer à quel point les valeurs extrêmes du groupe expérimental influencent l'amplitude lorsque ce test est associé au groupe de contrôle. La statistique de la somme de rangs de Wilcoxon W.

et le nombre d'observations sans valeurs manquantes. Fonctionnalités supplémentaires de la commande NPAR TESTS (tests pour deux échantillons indépendants) Le langage de commande SPSS vous permet aussi de : „ Spécifier le nombre d'observations devant être filtrées pour le test de Moses (avec la sous-commande MOSES). chaque test est effectué séparément selon le nombre des valeurs manquantes. Tests pour deux échantillons indépendants : Options Figure 34-16 Boîte de dialogue Deux échantillons indépendants : Options Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Indique la moyenne. „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. . l'écart type.518 Chapitre 34 Pour scinder le fichier en deux groupes ou échantillons. Valeurs manquantes : Contrôle le traitement des valeurs manquantes. le minimum. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses. Les observations avec d'autres valeurs sont exclues de l'analyse. indiquez un nombre entier pour le groupe 1 et un autre pour le groupe 2. Quartiles : Indique les valeurs correspondant au 25ème. le maximum. 50ème et 75ème centiles.

Tests : Wilcoxon. Exemple : En général. Hypothèses : Bien qu'aucune distribution particulière ne soit supposée pour les deux variables. maximum.519 Tests non paramétriques Pour obtenir des renseignements complets sur la syntaxe. Signe. . qu'une famille perçoit plus que le prix demandé et que deux familles perçoivent le prix demandé. une famille qui vend sa maison perçoit-elle le prix demandé ? En appliquant le test de Wilcoxon aux données de 10 foyers. nombre d'observations avec des valeurs non manquantes et quartiles. vous apprendrez que sept familles perçoivent moins que le prix demandé. on part du principe que la distribution de la population des différences liées est symétrique. reportez-vous au manuel SPSS Command Syntax Reference. Statistiques : Moyenne. Tests pour deux échantillons liés La procédure des tests pour deux échantillons liés compare les distributions pour deux variables. écart type. Homogénéité marginale. Tests pour deux échantillons liés : remarques sur les données Données : Utilisez des variables numériques qui peuvent être ordonnées. minimum. McNemar.

50 Somme des rangs 34.50 1.50 2 23 10 Tests statistiques 2 Z Signification Asymptotique (Bilatérale) Prix demandé .3131 .Prix de vente -2. Prix demandé = Prix de vente 7 1 1 Rangs Moyen 4.Prix de vente Négatifs Rangs Positifs Ex aequo Total 1..021 1. Basé sur les rangs positifs 2..520 Chapitre 34 Echantillon de résultat Figure 34-17 Analyse pour deux échantillons liés Rangs N Prix demandé Rangs . sélectionnez : Analyse Tests non paramétriques 2 échantillons liés. . Test de Wilcoxon Pour obtenir des tests pour deux échantillons liés A partir du menu. Prix demandé > Prix de vente 3. Prix demandé < Prix de vente 2.93 1.

négatives ou liées. et classe les différences comme étant positives. utilisez le test de Signe ou le test de Wilcoxon. Le test de Wilcoxon prend en compte les informations relatives au signe des différences. sélectionnez une paire dans la liste Paire(s) à tester et cliquez sur le bouton fléché. Pour supprimer une paire de variables de l'analyse.521 Tests non paramétriques Figure 34-18 Boîte de dialogue Tests pour deux échantillons liés E Sélectionnez des paires de variables de la manière décrite ci-dessous : „ Cliquez sur chacune des deux variables. Vous pouvez sélectionner d'autres paires de variables. Si les deux variables sont réparties de la même manière. . La première variable apparaît dans le groupe Choix courants comme Variable 1 et la seconde apparaît comme Variable 2. Le test qu'il convient d'utiliser dépend du type de données. Après avoir sélectionné une paire de variables. le nombre de différences positives et le nombre de différences négatives ne diffèrent pas de façon significative. cliquez sur le bouton fléché pour déplacer la paire vers la liste Paire(s) à tester. Le test de signe calcule les différences entre les deux variables pour toutes les observations. „ Types de tests pour deux échantillons liés Type de test : Les tests de cette section comparent les distributions pour deux variables liées. Si vos données sont continues.

le maximum. Si vos données sont qualitatives. . Ce test s'utilise fréquemment lors de situations de mesures répétées. Ce test est utile pour détecter les changements dans les réponses dues à une intervention expérimentale dans les plans avant et après. Il recherche les changements de réponse en utilisant la distribution khi-deux et permet de détecter les changements de réponse dus à une intervention expérimentale dans les plans avant et après. Le test d'homogénéité marginale n'est disponible que si vous avez installé les tests exacts SPSS. utilisez le test de McNemar. Quartiles : Indique les valeurs correspondant au 25ème. Si vos données sont binaires. une fois avant qu'un événement spécifié se produise et une fois après qu'un événement spécifié s'est produit. le minimum.522 Chapitre 34 ainsi qu'à l'amplitude des différences entre paires. l'écart type. Valeurs manquantes : Contrôle le traitement des valeurs manquantes. au cours desquelles la réponse du sujet est provoquée deux fois. Le test de McNemar détermine si le taux de réponses initial (avant l'événement) est égal au taux de réponse final (après l'événement). utilisez le test d'Homogénéité marginale. il est plus puissant que le test des signes. Comme le test de Wilcoxon intègre plus de renseignements sur les données. 50ème et 75ème centiles. Il s'agit d'un développement du test de McNemar d'une réponse binaire à une réponse multinomiale. Tests pour deux échantillons liés : Options Figure 34-19 Boîte de dialogue Tests pour deux échantillons liés : Options Statistiques : Vous pouvez choisir une des statistiques récapitulatives suivantes (ou les deux) : „ „ Caractéristique : Indique la moyenne. et le nombre d'observations sans valeurs manquantes.

vous apprendrez peut-être que les trois marques diffèrent par leur durée de vie moyenne. Tests pour plusieurs échantillons indépendants La procédure de Tests pour Plusieurs Echantillons Indépendants compare deux groupes d'observations ou plus sur une variable. Le test du H de Kruskal-Wallis nécessite que les échantillons testés soient de forme similaire. Tests pour Plusieurs Echantillons Indépendants : Remarques sur les Données Données : Utilisez des variables numériques qui peuvent être ordonnées. Tests : H de Kruskal-Wallis. Statistiques : Moyenne. maximum. médiane. Fonctionnalités supplémentaires de la commande NPAR (Deux échantillons liés) Le langage de commande SPSS vous permet aussi de : „ tester une variable avec toute autre variable d'une liste. Exemple : Trois marques d'ampoules 100 watts diffèrent-elles par leur durée moyenne de fonctionnement ? A partir de l'analyse de variance d'ordre 1 de Kruskal-Wallis. Pour obtenir des renseignements complets sur la syntaxe. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses.523 Tests non paramétriques „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. chaque test est effectué séparément selon le nombre des valeurs manquantes. Hypothèses : Utilisez des échantillons indépendants. reportez-vous au manuel SPSS Command Syntax Reference. minimum. nombre d'observations avec des valeurs non manquantes et quartiles. écart type. aléatoires. .

sélectionnez : Analyse Tests non paramétriques K échantillons indépendants .20 25.000 N 10 10 10 30 Rang Moyen 15.524 Chapitre 34 Echantillon de résultat Figure 34-20 Résultat des Tests pour plusieurs échantillons indépendants Rangs Heures Marque Marque A Marque B Marque C Total Tests statistiques 1.50 5. Critère de regroupement qualitatif numérique : Marque Pour obtenir des tests pour plusieurs échantillons indépendants A partir du menu. Test de Kruskal-Wallis 2.80 Khi-deux df Signification Asymptotique 1.2 Heures 25.061 2 .

les k populations peuvent représenter k températures croissantes. Par exemple. Le test H de Kruskal-Wallis. est l'équivalent non paramétrique de l'analyse de variance d'ordre 1 et détecte les différences dans la position de la distribution. test plus général mais moins puissant. le test de la Médiane et le test de Jonckheere-Terpstra testent tous si plusieurs échantillons indépendants proviennent de la même population.525 Tests non paramétriques Figure 34-21 Boîte de dialogue Tests pour plusieurs échantillons indépendants E Sélectionnez une ou plusieurs variables numériques. Lorsqu'il existe un classement naturel a priori (ascendant ou descendant) des k populations. Le test de la médiane. Tests pour Plusieurs Echantillons Indépendants : Types de tests Type de test : Trois tests permettent de déterminer si plusieurs échantillons indépendants proviennent de la même population. Le test du H de Kruskal-Wallis. E Sélectionnez une variable de regroupement et cliquez sur Définir intervalle pour spécifier les valeurs entières minimale et maximale pour la variable de regroupement. Le test du H de Kruskal-Wallis et le test de la médiane supposent qu'il n'existe aucun classement a priori des k populations à partir desquelles les échantillons sont tirés. L'hypothèse selon laquelle différentes températures produisent la même distribution des réponses est . le test de Jonckheere-Terpstra est plus puissant. détecte les différences de position et de forme des distributions. extension du test du U de Mann-Whitney.

entrez les valeurs entières minimale et maximale correspondant à la modalité la plus basse et à la plus haute de la variable de regroupement. Par exemple. Ici. La valeur minimale doit être inférieure à la valeur maximale. si vous spécifiez une valeur minimale de 1 et une valeur maximale de 3. le test de Jonckheere-Terpstra est donc le plus approprié.526 Chapitre 34 testée contre l'hypothèse alternative selon laquelle l'accroissement de température fait augmenter la magnitude de la réponse. l'hypothèse alternative est ordonnée . Tests pour Plusieurs Echantillons Indépendants : Définir l'Intervalle Figure 34-22 Boîte de dialogue Plusieurs échantillons indépendants : Définir l'intervalle Pour définir l'intervalle. . Les observations dont les valeurs se trouvent à l'extérieur des limites sont exclues. seules les valeurs entières comprises entre 1 et 3 seront utilisées. Le test de Jonckheere-Terpstra n'est disponible que si vous avez installé les Tests Exacts de SPSS. et les deux valeurs doivent être spécifiées.

527 Tests non paramétriques Options des Tests pour Plusieurs Echantillons Indépendants Figure 34-23 Boîte de dialogue Plusieurs échantillons indépendants : Options Statistiques : Vous pouvez choisir l'une des statistiques récapitulatives suivantes. et le nombre d'observations sans valeurs manquantes. le maximum. „ Exclure toute observation incomplète : Les observations avec des valeurs manquantes pour l'une ou l'autre variable sont exclues de toutes les analyses. le minimum. Valeurs manquantes : Contrôle le traitement des valeurs manquantes. ou bien les deux. 50ème et 75ème centiles. l'écart type. chaque test est effectué séparément selon le nombre des valeurs manquantes. Pour obtenir des renseignements complets sur la syntaxe. reportez-vous au manuel SPSS Command Syntax Reference. . „ Exclure les observations test par test : Lorsque plusieurs tests sont indiqués. Fonctionnalités supplémentaires de la commande NPAR TESTS (K échantillons indépendants) Le langage de commande SPSS vous permet aussi de : „ Spécifier une valeur différente de la médiane observée pour le test de la médiane (avec la sous-commande MEDIAN). „ „ Caractéristique : Indique la moyenne. Quartiles : Indique les valeurs correspondant au 25ème.

écart type. Le test de Friedman indique que le public associe effectivement différents niveaux de prestige à ces quatre professions.50 2. Hypothèses : Les tests non paramétriques ne nécessitent pas d'hypothèses sur la forme de la distribution sous-jacente. minimum. Echantillon de résultat Figure 34-24 Résultat des Tests pour Plusieurs Echantillons Liés Rangs Rang Moyen 1.40 2. W de Kendall et Q de Cochran. Statistiques : Moyenne. Tests : Friedman.60 Médecin Homme de loi Policier Enseignant .528 Chapitre 34 Tests pour plusieurs échantillons liés La procédure de Tests pour Plusieurs Echantillons Liés compare les distributions de deux variables ou plus.50 3. aléatoires. un officier de police et un enseignant ? On demande à dix personnes de classer ces quatre métiers par ordre de prestige. Tests pour plusieurs échantillons liés de considérations de données Données : Utilisez des variables numériques qui peuvent être ordonnées. maximum. un avocat. Exemple : Le public associe-t-il différents niveaux de prestige à un docteur. nombre d'observations avec des valeurs non manquantes et quartiles. Utilisez des échantillons dépendants.

529 Tests non paramétriques Tests statistiques N Khi-deux df Signification asymptotique 1. Test de Friedman 1 10 10.920 3 . . Tests pour plusieurs échantillons liés de types de tests Type de test : Trois tests sont disponibles pour comparer les distributions de plusieurs variables liées.012 Pour obtenir des tests pour plusieurs échantillons liés A partir du menu. sélectionnez : Analyse Tests non paramétriques K échantillons liés Figure 34-25 Boîte de dialogue Tests pour plusieurs échantillons liés E Sélectionnez deux variables numériques ou plus à tester.

. Pour chaque observation. et chaque variable est une personne ou un élément jugé. et le nombre d'observations sans valeurs manquantes. C'est une extension du test de McNemar à K échantillons. Fonctionnalités supplémentaires de la commande NPAR TESTS (K échantillons liés) Pour obtenir des renseignements complets sur la syntaxe. qui est une mesure de l'accord entre les évaluateurs. le minimum. Statistiques des tests pour plusieurs échantillons liés Figure 34-26 Boîte de dialogue Statistiques pour Plusieurs Echantillons Liés „ „ Caractéristique : Indique la moyenne. l'écart type. Le test W de Kendall est une standardisation de la statistique de Friedman. Le W de Kendall se situe entre 0 (pas d'accord) et 1 (accord total). 50ème et 75ème centiles. le maximum. Pour chaque variable. Chaque observation est un juge ou un indicateur. Le test de Friedman teste l'hypothèse nulle selon laquelle k variables liées proviennent de la même population. Quartiles : Indique les valeurs correspondant au 25ème. Le test W de Kendall peut être interprété comme le coefficient de concordance. Le Q de Cochran est identique au test de Friedman mais s'applique lorsque toutes les réponses sont binaires. Les variables sont mesurées sur le même individu ou sur des individus comparables. Le Q de Cochran teste l'hypothèse nulle selon laquelle plusieurs variables dichotomiques liées ont la même moyenne. reportez-vous au manuel SPSS Command Syntax Reference. la somme des rangs est calculée.530 Chapitre 34 Le testdeFriedman est l'équivalent non paramétrique d'un plan de mesures répétées sur un échantillon ou d'une analyse de variance d'ordre 2 avec une observation par cellule. les variables k sont classées de 1 à k. La statistique de test est basée sur ces classements.

Exemple : Cet exemple illustre l'utilisation des éléments multiréponses dans une étude de marché. United. Une compagnie aérienne est parfois amenée à interroger les passagers d'un trajet donné pour évaluer la concurrence. avec des codes correspondant à la compagnie aérienne empruntée. parce qu'une variable SPSS ne peut avoir qu'une valeur pour chaque cas. Ces données sont fictives et ne doivent pas être considérées comme réelles. La procédure des Tableaux croisés multiréponses affiche des tableaux croisés à deux ou trois dimensions. le numéro de code 1 est affecté à la variable united. Il s'agit d'une question à réponses multiples. TWA. United. American Airlines veut savoir si ses passagers utilisent d'autres compagnies aériennes pour couvrir le trajet Chicago-New York et connaître l'importance relative des horaires et du service dans le choix d'une compagnie aérienne. sinon c'est le code 0 qui lui est affecté. TWA. Vous devez utiliser plusieurs variables pour mapper les réponses à chaque question. car le passager peut entourer plus d'une réponse. American. L'hôtesse distribue à chaque passager un court questionnaire lors de l'embarquement. L'autre méthode permettant de mapper les réponses est la méthode des modalités multiples. USAir et d'autres. vous vous apercevrez peut-être que personne n'a emprunté plus de trois compagnies 531 . Si le passager entoure United. Il s'agit de la méthode de codage de variables à dichotomie multiple. L'une consiste à définir une variable correspondant à chaque choix possible (par exemple. cette question ne peut pas être codée directement. Cependant. La première question est la suivante : Entourez toutes les compagnies aériennes par lesquelles vous avez effectué au moins un vol dans les six derniers mois parmi American.Analyse des réponses multiples 35 Chapitre Deux procédures sont proposées pour l'analyse des vecteurs comportant plusieurs variables dichotomiques ou plusieurs modalités. Avant d'utiliser l'une de ces procédures. où vous devez estimer le nombre maximal de réponses possibles à la question et définir le même nombre de variables. En utilisant un échantillon de questionnaires. La procédure Fréquences multiréponses affiche les tableaux de fréquences. USAir et d'autres). Ceci peut être fait de deux manières. Dans cet exemple. vous devez définir des vecteurs multiréponses.

du fait de la déréglementation des compagnies aériennes. jdate. la première variable porte le code 1. Entrez une valeur entière dans Valeur comptée. Le nom du vecteur multiréponses doit uniquement être utilisé dans les procédures multiréponses. et la troisième un code sans valeur. vous finissez par vous retrouver avec 14 variables différentes. Pour utiliser des variables dichotomiques. length et width. la seconde le code 3. 10 autres compagnies figurent dans la modalité Autre. sélectionnez-le dans la liste. Pour modifier un vecteur. time. Chaque variable ayant au moins une occurrence de la valeur comptée devient une modalité du vecteur de dichotomies multiples. codées comme suit : 1 = american. Chaque vecteur doit avoir un nom unique. 4 = usair. 3 = twa. Pour éliminer un vecteur.532 Chapitre 35 différentes pour ce trajet. Sélectionnez Modalités pour créer un vecteur de modalités multiples ayant le même intervalle de valeurs que les variables qui le composent. et la troisième un code sans valeur. Vous pouvez coder vos variables itemaires sous forme de dichotomies ou de modalités. Les modalités vides ne sont pas tabulées. Définition de vecteurs multiréponses La procédure de définition de vecteurs multiréponses regroupe des variables itemaires dans des vecteurs de dichotomies ou de modalités. 5 = delta. vous pouvez définir trois variables. Vous ne pouvez pas faire référence . vous vous rendrez compte que. sélectionnez-le dans la liste des vecteurs multiréponses et cliquez sur Eliminer. Un autre passager a peut-être entouré American et ajouté Delta. Les noms réservés suivants ne doivent pas être utilisés : casenum. etc. Ainsi. Cependant. d'un autre côté. sysmis. Les deux méthodes de codage sont possibles dans le cadre de cette enquête. votre choix dépendra de la répartition des réponses. A chaque vecteur multiréponses doit être attribué un nom unique de 7 caractères maximum. Entrez des nombres entiers pour le minimum et le maximum de l'intervalle des modalités du vecteur de modalités multiples. A l'aide de la méthode multiréponses. pour lesquels vous pouvez obtenir des tableaux de fréquences et des tableaux croisés. Qui plus est. date. La procédure ajoute un signe dollar ($) devant le nom que vous avez attribué. la seconde le code 5. sélectionnez Variables dichotomiques afin de créer un vecteur de dichotomies multiples. modifiez-en les caractéristiques et cliquez sur Changer. Si un passager entoure American et TWA. SPSS totalise chaque valeur entière contenue dans l'intervalle pour toutes les variables qui le composent. la première variable porte le code 1. 2 = united. Si vous utilisez la méthode des dichotomies multiples. Vous pouvez définir jusqu'à 20 vecteurs multiréponses.

Figure 35-1 Boîte de dialogue Définition des vecteurs multiréponses E Sélectionnez deux ou plusieurs variables. Pour définir des vecteurs de réponses multiples E A partir du menu. . Si elles sont codées comme modalités. E Entrez un nom unique pour chaque vecteur multiréponses.. Cette étiquette peut comporter jusqu'à 40 caractères. A titre facultatif. E Si vos variables sont codées comme dichotomies. vous pouvez entrer une étiquette de variable décrivant le vecteur multiréponses.533 Analyse des réponses multiples aux noms des vecteurs multiréponses dans les autres procédures. E Cliquez sur Ajouter pour ajouter les vecteurs multiréponses à la liste des vecteurs définis. indiquez la valeur que vous souhaitez calculer. définissez leur intervalle.. sélectionnez : Analyse Réponses multiples Définir des groupes.

les noms de modalité apparaissant dans le résultat proviennent d'étiquettes de variable définies pour les variables itemaires du groupe. Par exemple. Ceci s'applique seulement aux vecteurs multiréponses définis comme vecteurs de dichotomies. Exemple : Chaque variable créée à partir d'une question de l'enquête est une variable élémentaire. United Airlines ou TWA) que vous avez empruntée au cours des six derniers mois. si vous utilisez des . les noms de variables servent d'étiquettes. mais pas toutes. Si les modalités manquantes de la première variable sont présentes pour d'autres variables du groupe. Vous devez d'abord définir un ou plusieurs vecteurs multiréponses (voir « Définir les vecteurs multiréponses »). Par défaut. „ Exclure toute observation ayant une information incomplète à l'intérieur des modalités : Cela permet d'exclure les observations ayant des valeurs manquantes pour toute variable provenant du tableau croisé du vecteur des modalités multiples. Si les étiquettes de variable ne sont pas définies. Les cas de valeurs manquantes pour certaines variables.534 Chapitre 35 Tableaux de fréquences des réponses multiples La procédure Fréquences multiréponses produit des tableaux de fréquences pour les vecteurs multiréponses. Pour les vecteurs de dichotomies multiples. une observation est considérée manquante pour un vecteur de modalités multiples si aucune de ses composantes n'a de valeurs valides à l'intérieur de l'intervalle défini. les étiquettes des modalités proviennent des étiquettes de valeurs de la première variable du groupe. sont inclus dans les tabulations du groupe si au moins une variable contient la valeur comptée. une compagnie aérienne vous demande la compagnie (American Airlines. définissez une étiquette de valeurs pour les modalités manquantes. Valeurs manquantes : Les cas de valeurs manquantes sont exclus tableau par tableau. Ceci s'applique seulement aux vecteurs multiréponses définis comme des vecteurs de modalités. Vous pouvez donc choisir l'une ou les deux solutions suivantes : „ Exclure les observations ayant une information incomplète à l'intérieur des dichotomies : Ceci permet d'exclure les observations ayant des valeurs manquantes pour toute variable issue du tableau croisé du vecteur de dichotomies multiples. une observation est considérée manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur comptée. Pour les vecteurs de modalités multiples. si dans une enquête. vous devez combiner les variables dans l'un des deux types de vecteurs multiréponses : vecteur de modalités multiples ou vecteur de dichotomies multiples. Pour analyser un élément multiréponses. Par défaut.

vous pouvez créer deux variables. les valeurs sont tabulées et les mêmes codes sont ajoutés dans toutes les variables élémentaires. Le vecteur de valeurs résultant est le même que pour chacune des variables itemaires. Les effectifs et les pourcentages correspondant aux trois compagnies aériennes s'affichent dans un tableau de fréquences. Si vous définissez un vecteur de modalités multiples. Hypothèses : Les effectifs et pourcentages représentent une description utile des données de n'importe quelle distribution. chacune ayant trois codes. Les effectifs et les pourcentages correspondant aux trois compagnies aériennes s'affichent dans un tableau de fréquences. Gestion des données des fréquences de réponses multiples Données : Utilisez des vecteurs multiréponses. un par compagnie aérienne. . et le nombre de cas manquants. des pourcentages de réponses. Par exemple.535 Analyse des réponses multiples variables dichotomiques et avez défini un vecteur de dichotomies multiples. le nombre de cas valables. chacune des trois variables du vecteur devient une modalité de la variable de regroupement. 30 réponses pour United représentent la somme des cinq réponses United pour la compagnie aérienne 1 et des 25 réponses United pour la compagnie 2. Procédures apparentées : La procédure Définir Vecteurs multiréponses vous permet de définir des vecteurs multiréponses. Statistiques : Tableaux de fréquences contenant des effectifs. Si vous découvrez qu'aucun des répondants n'a mentionné plus de deux compagnies. des pourcentages de cas.

536 Chapitre 35 Echantillon de résultat Figure 35-2 Résultat de la méthode des fréquences de réponses multiples Pour obtenir des tableaux de fréquences de réponses multiples E A partir du menu.. Figure 35-3 Boîte de dialogue Fréquences de réponses multiples E Sélectionnez un ou plusieurs vecteurs multiréponses. sélectionnez : Analyse Réponses multiples Fréquences. ..

Si les modalités manquantes de la première variable sont présentes pour d'autres variables du groupe. modifier la gestion des valeurs manquantes ou obtenir des tableaux croisés appariés. United. Est-il plus important de privilégier l'horaire ou le service ? Choisissez une seule réponse. Après avoir saisi les données en tant que dichotomies ou modalités multiples. SPSS affiche les étiquettes de modalité des colonnes sur trois lignes. des vecteurs multiréponses définis. définissez une étiquette de valeurs pour les modalités manquantes. les noms de variables servent d'étiquettes. et effectif total. voici ce qui leur a été demandé : Parmi les compagnies aériennes suivantes. par tableaux croisés. vous pouvez inverser les éléments lignes et les éléments colonnes ou redéfinir les étiquettes. Pour les vecteurs de modalités multiples. Statistiques : Tableau croisé avec cellule. Les pourcentages cellule peuvent être basés sur les observations ou les réponses. . Vous devez d'abord définir un ou plusieurs vecteurs multiréponses (veuillez consulter « Pour Définir des vecteurs multiréponses »). les noms de modalité apparaissant dans le résultat proviennent d'étiquettes de variable définies pour les variables itemaires du groupe. entourez toutes celles avec lesquelles vous avez voyagé au moins une fois durant les six derniers mois (American. ligne. TWA). des variables itemaires ou une combinaison. Dans le cadre d'une enquête menée auprès de passagers de compagnies aériennes. avec jusqu'à huit caractères par ligne. colonne. et effectif total. vous pouvez croiser les choix de compagnie aérienne déclarés avec la question relative au service ou aux horaires. Vous pouvez également obtenir des pourcentages de cellules basés sur des observations ou des réponses. les étiquettes des modalités proviennent des étiquettes de valeurs de la première variable du groupe. colonne. Pour éviter de scinder les mots. et après les avoir combinées dans un vecteur. Si les étiquettes de variable ne sont pas définies.537 Analyse des réponses multiples Tableaux croisés des réponses multiples La procédure Tableaux croisés de réponses multiples classe. et avec les pourcentages ligne. Exemple : Les vecteurs de dichotomies multiples et les vecteurs de modalités multiples peuvent être croisés avec d'autres variables dans cette procédure. Pour les vecteurs de dichotomies multiples.

Hypothèses : Les effectifs et pourcentages offrent une description utile des données qui suivent tout type de distribution.538 Chapitre 35 Remarques sur les Données de Tableaux croisés de réponses multiples Données : Utilisez des vecteurs multiréponses ou des variables qualitatives numériques. Procédures apparentées : La procédure Définir Vecteurs multiréponses vous permet de définir des vecteurs multiréponses. Echantillon de résultat Figure 35-4 Résultat Tableaux croisés de réponses multiples .

539 Analyse des réponses multiples Pour obtenir des tableaux croisés des réponses multiples E A partir du menu. ... E Définissez l'intervalle de chaque variable itemaire. Sélectionnez un ou plusieurs éléments pour la liste de strate(s). vous pouvez obtenir un tableau croisé bilatéral pour chaque modalité de variable de contrôle ou chaque vecteur multiréponses. sélectionnez : Analyse Réponses multiples Tableaux croisés. Sinon. Figure 35-5 Boîte de dialogue Tableaux Croisés de réponses multiples E Sélectionnez une ou plusieurs variables numériques ou vecteurs multiréponses pour chaque dimension de tableau croisé.

les pourcentages colonnes. Options Tableaux croisés de réponses multiples Figure 35-7 Boîte de dialogue Options Tableaux croisés de réponses multiples Pourcentages de cellule : Les effectifs des cellules sont toujours affichés. Les modalités se situant en dehors de l'intervalle sont exclues de l'analyse. Vous pouvez choisir d'afficher les pourcentages lignes. .540 Chapitre 35 Définir Intervalles Tableaux croisés De réponses multiples Figure 35-6 Définir boîte de dialogue Intervalle Variables Tableaux croisés de réponses multiples Les intervalles des valeurs doivent être définis pour toute variable itemaire de tableaux croisés. et les pourcentages tableau bilatéral (total). Les valeurs se situant à l'intérieur de l'intervalle inclusif sont supposées être des nombres entiers (les nombres non entiers sont tronqués). Entrez les valeurs entières de modalités minimum et maximum que vous souhaitez tabuler.

Par conséquent. certaines réponses peuvent apparaître plus d'une fois dans un tableau. une observation est considérée manquante pour un vecteur de modalités multiples si aucune de ses composantes n'a de valeurs valides à l'intérieur de l'intervalle défini. SPSS tabule chaque variable du premier groupe avec chaque variable du second groupe et additionne les effectifs de chaque cellule. Pour les vecteurs de modalités multiples. une observation est considérée manquante pour un vecteur de dichotomies multiples si aucune de ses variables composantes ne contient de valeur comptée. les variables sont incluses dans les tableaux croisés du groupe si au moins une variable contient la valeur comptée. SPSS base les pourcentages cellules sur les réponses plutôt que sur les répondants. etc. le nombre de réponses correspond au nombre de valeurs comprises dans l'intervalle défini. Vous pouvez aussi baser les pourcentages cellules sur les réponses. Ceci n'est pas possible si vous sélectionnez la fonction qui permet d'apparier les variables entre les vecteurs de modalités multiples. On ne peut apparier les vecteurs de dichotomies multiples ou les variables itemaires. le nombre de réponses est égal au nombre de valeurs comptées à travers les observations. Par défaut. lorsque vous croisez deux vecteurs de modalités multiples. Par défaut. Par défaut. Ceci s'applique seulement aux vecteurs multiréponses définis comme vecteurs de dichotomies.541 Analyse des réponses multiples Pourcentages basés sur : Vous pouvez baser les pourcentages cellules sur les observations (ou répondants). Si vous sélectionnez cette option. Pour les vecteurs de dichotomies multiples. Valeurs manquantes : Vous avez le choix entre les deux options suivantes : „ Exclure les observations ayant une information incomplète à l'intérieur des dichotomies : Ceci permet d'exclure les observations ayant des valeurs manquantes pour toute variable issue du tableau croisé du vecteur de dichotomies multiples. mais pas toutes. Ceci s'applique seulement aux vecteurs multiréponses définis comme des vecteurs de modalités. . Les observations ayant des valeurs manquantes pour certaines. „ Exclure toute observation ayant une information incomplète à l'intérieur des modalités : Cela permet d'exclure les observations ayant des valeurs manquantes pour toute variable provenant du tableau croisé du vecteur des modalités multiples. Vous pouvez choisir l'option suivante : Apparier les variables entre les vecteurs réponses : Cela permet d'apparier la première variable du premier groupe avec la première variable du second groupe.

Pour obtenir des renseignements complets sur la syntaxe.542 Chapitre 35 Fonctionnalités supplémentaires de la commande MULT RESPONSE Le langage de commande SPSS vous permet aussi de : „ „ Obtenir des tableaux croisés ayant jusqu'à cinq dimensions (avec la sous-commande BY). . Modifier les options de formatage du résultat. y compris la suppression des étiquettes de valeurs (avec la sous-commande FORMAT). reportez-vous au manuel SPSS Command Syntax Reference.

Exemple : Une société possédant une chaîne de magasins conserve des dossiers sur les employés comprenant le salaire. division et par division dans chaque magasin. Les listes d'observations sont également disponibles. les effectifs de fréquence et les statistiques descriptives à l'aide de la procédure Fréquences. Vous pourriez générer un tableau de bord fournissant les informations individuelles sur les employés (liste) divisées par magasin et par division (critères d'agrégation). Variables en colonnes : Donne la liste des variables de tableau pour lesquelles vous voulez obtenir des listes d'observations ou des statistiques récapitulatives. le magasin et le service où chaque employé travaille. et contrôle le format d'affichage des Variables en colonnes. Vous pouvez obtenir les listes d'observations à l'aide de l'éditeur de Données ou de la procédure Récapituler. les procédures Tableaux de bord en lignes et Tableaux de bord en colonnes vous permettent de contrôler la présentation des données. Tableaux de bord en lignes Tableaux de bord en lignes produit des tableaux de bord dans lesquels différentes statistiques récapitulatives sont disposées en lignes. Chacune de ces procédures utilise un format destiné à rendre les informations claires. avec ou sans statistiques récapitulatives. et les statistiques de sous-population à l'aide de la procédure Moyennes.Tableaux de Résultats 36 Chapitre Les listes d'observations et les statistiques descriptives sont des outils de base permettant d'étudier et de présenter des données. Si vous souhaitez afficher les informations dans un format différent. avec les statistiques récapitulatives (par exemple. 543 . salaire moyen) pour chaque magasin. l'ancienneté.

Aperçu : N'affiche que la première page du tableau de bord.544 Chapitre 36 Variables de ventilation : Donne la liste des critères d'agrégation optionnels qui divisent le tableau de bord en groupes et contrôle les statistiques récapitulatives et les formats d'affichage des colonnes de ventilation. la numérotation des pages et les titres. Les données sont déjà triées : Pour les rapports avec critères d'agrégation. Pour les critères d'agrégation multiples. La liste produite peut être nettement plus longue qu'un tableau de bord. triées. le fichier de données doit être trié par valeur des critères d'agrégation avant de générer le tableau de bord. l'affichage des valeurs manquantes. . Cette option est particulièrement utile après avoir vu un aperçu du tableau. Si votre fichier de données est déjà trié par valeur des critères d'agrégation. vous pouvez gagner du temps de traitement en sélectionnant cette option. Afficher les observations : Affiche les valeurs réelles (ou les étiquettes de valeurs) des variables de Variables en colonnes pour chaque observation. Les critères d'agrégation doivent être des variables qualitatives discrètes qui divisent les observations en un nombre limité de modalités significatives. Tableau de bord : Contrôle les caractéristiques globales du tableau de bord. il y aura un groupe séparé pour chaque modalité de chaque critère d'agrégation à l'intérieur des modalités du critère d'agrégation précédent dans la liste. Les valeurs individuelles de chaque critère d'agrégation apparaissent. dans une colonne séparée à gauche des Variables en colonnes. y compris les statistiques récapitulatives globales. Cette option est utile pour avoir un aperçu du format de votre tableau sans traiter le tableau entier.

754 $8.92 3.000 $10.00 2.67 3.000 $10.75 4.. sélectionnez une ou plusieurs variables pour les critères d'agrégation.92 2.00 4..83 3.00 5.08 2.00 34.00 3.08 2.08 3.17 42.25 4.42 5. E Sélectionnez une ou plusieurs variables pour les variables en colonnes.75 4.000 $8.00 3.92 4.00 33.900 $15.508 Pour obtenir un rapport récapitulatif : Récapitulatifs en lignes E A partir du menu.50 3.00 33.17 22.00 2.545 Tableaux de Résultats Echantillon de résultat Figure 36-1 Tableau de bord combiné avec listes d'observations et statistiques récapitulatives Ancienneté Ancienneté dans Société Niveau Salaire -.81 $12.00 35.00 4.00 3.Annuel __________ _____ _______ ______ ______________ Division dans Age Revêtements de sol 27.690 $10.500 $28.31 $11.000 $9.300 3.00 32.50 6.00 3. sélectionnez le critère d'agrégation dans la liste et cliquez sur Tableau récapitulatif dans le groupe Variables de ventilation pour spécifier les mesures récapitulatives.900 $8.11 3.67 26.50 30.92 2.67 2.67 2.00 3.00 27.08 4.700 $9. sélectionnez : Analyse Rapports Tableaux de bord en lignes.00 44.00 2.00 33.67 3.83 3.000 $15.00 36.92 3.17 2.08 24.67 38.67 2.00 3. Une colonne est générée dans le tableau de bord pour chaque variable sélectionnée.25 30.08 23.900 $10. E Pour les tableaux triés et affichés par sous-groupe.33 3.000 $7.92 3.975 $18.520 $19.500 3.900 $10.00 6.04 Appareils ménagers 21.00 6.200 35. E Pour les tableaux avec statistiques récapitulatives de sous-groupe définies par des critères d'agrégation.33 Moyenne 30.50 $8.00 4.33 2.00 5.42 Moyenne 31.17 3.300 $8. .335 $10.000 $15.25 $10.54 24.

. Format colonne de ventilation contrôle le format des Colonnes de ventilation du côté gauche. Format colonne de données contrôle le format des Variables en colonnes du côté droit de la page du tableau de bord. cliquez sur Fonction dans le groupe Tableau pour spécifier les mesures récapitulatives. Figure 36-2 Boîte de dialogue Tableaux de bord en lignes Format des Colonnes de données/Ventilations des Tableaux de bord Les boîtes de dialogue Format contrôlent les titres et largeurs des colonnes.546 Chapitre 36 E Pour les tableaux avec statistiques récapitulatives globales. l'alignement du texte et l'affichage des valeurs de données ou des étiquettes de valeurs.

Vous pouvez soit indenter le contenu de la colonne d'un nombre de caractères donné. Utilisez la touche Entrée pour insérer manuellement des sauts de lignes aux endroits où vous voulez ajuster les titres. soit des étiquettes de valeurs définies. soit centrer le contenu de la colonne. Position des valeurs dans la colonne : Pour la variable sélectionnée. Les valeurs de données sont affichées pour toutes les valeurs qui ne possèdent pas d'étiquette de valeur définie. contrôle l'affichage soit des valeurs de données. (Non disponible pour les Variables en colonnes dans les Tableaux de bord en colonnes) . Contenu de la colonne : Pour la variable sélectionnée. contrôle le titre de la colonne. contrôle l'alignement des valeurs de données ou des étiquettes de données dans la colonne.547 Tableaux de Résultats Figure 36-3 Boîte de dialogue Tableau de bord : Format colonne de données Titre de la colonne : Pour la variable sélectionnée. L'alignement des valeurs ou des étiquettes n'affecte pas l'alignement des titres de colonnes. Les titres longs sont automatiquement ajustés dans la colonne.

548 Chapitre 36 Fonctions récapitulatives des Tableaux pour/Fonctions récapitulatives Finales Les deux boîtes de dialogue Fonctions récapitulatives contrôlent l'affichage des statistiques récapitulatives pour les agrégats et pour l'ensemble du tableau de bord. la variance et l'asymétrie. l'aplatissement. . L'option Fonctions récapitulatives contrôle les statistiques de sous-groupe pour chaque modalité définie par les critères d'agrégation. la valeur minimale. le pourcentage d'observations situées au-dessus ou en dessous d'une valeur spécifiée. le pourcentage d'observations compris à l'intérieur d'un intervalle donné de valeurs. Figure 36-4 Boîte de dialogue Tableau de bord : Fonction récapitulative Les statistiques récapitulatives disponibles sont la somme des valeurs. la valeur maximale. Options de Ventilation de Tableau de Bord Options de Ventilation contrôle l'espacement et la pagination des informations de modalité de ventilation. la moyenne des valeurs. le nombre d'observations (effectif). l'écart type. Fonctions récapitulatives Finales contrôle les statistiques globales affichées à la fin du tableau de bord.

Lignes à sauter avant fonctions élémentaires : Contrôle le nombre de lignes vides entre les étiquettes ou les données des modalités de ventilation et les statistiques récapitulatives. vous pouvez insérer des espaces entre les listes d'observations et les statistiques récapitulatives. .549 Tableaux de Résultats Figure 36-5 Boîte de dialogue Options de Ventilation des Tableaux de bord Gestion des pages : Contrôle l'espacement et la pagination des modalités du critère d'agrégation sélectionné. Options du Tableau de bord Options du Tableau de bord contrôle le traitement et l'affichage des valeurs manquantes et la numérotation des pages du tableau de bord. Cette option est particulièrement utile pour les tableaux de bords combinés incluant des listes d'observations individuelles et des statistiques récapitulatives pour les modalités de ventilation . dans ces tableaux. Vous pouvez spécifier un nombre de lignes vides entre les modalités de ventilation ou commencer chaque modalité de ventilation sur une nouvelle page.

l'emplacement du tableau sur la page et l'insertion de lignes vides et d'étiquettes. Présentation du Tableau de bord Présentation du Tableau de bord contrôle la largeur et la longueur de chaque page du tableau de bord. Exclure les observations avec des valeurs manquantes : Elimine (du tableau de bord) toute observation avec des valeurs manquantes pour l'une des variables du tableau de bord. . Paginer à partir de : Vous permet de spécifier un numéro pour la première page du tableau de bord.. Ce symbole ne peut comporter qu'un seul caractère et sert à représenter les valeurs Manquante par défaut et Spécifiée par l'utilisateur.550 Chapitre 36 Figure 36-6 Boîte de dialogue Tableau de bord : Options colonne de ventilation . Représentation des valeurs manquantes : Vous permet de spécifier le symbole représentant les valeurs manquantes dans le fichier de données..

551 Tableaux de Résultats Figure 36-7 Boîte de dialogue Tableau : Présentation Mise en page : Contrôle les marges de page exprimées en lignes (haut et bas) et en caractères (gauche et droite). Position var/étiquettes de ventilation : Contrôle l'emplacement des informations de Variables en colonnes (valeurs de données et/ou statistiques récapitulatives) par rapport aux étiquettes de ventilation au début de chaque modalité de ventilation. Titres des colonnes : Contrôle l'affichage des titres de colonnes. La première ligne des informations de Variables en colonnes peut commencer soit sur la . l'espacement entre les titres et le corps du tableau. et reporte l'alignement à l'intérieur des marges. Titres et bas de page : Contrôle le nombre de lignes séparant les titres et les pieds de page du corps du tableau de bord. ils peuvent être affichés en colonnes séparées ou dans la première colonne. et l'alignement vertical des titres de colonnes. y compris le soulignement des titres. Si des critères d'agrégation multiples sont spécifiés. Placer tous les critères d'agrégation dans la première colonne produit un tableau de bord plus étroit. Variables de ventilation : Contrôle l'affichage des colonnes de ventilation.

la valeur réelle est affichée. l'étiquette de valeur correspondant à la valeur de la variable à la fin de la page est affichée. avec des composants justifiés à gauche. l'étiquette de valeur correspondant à la valeur de la variable au début de la page est affichée. Dans les titres. soit un nombre donné de lignes après cette étiquette. l'étiquette de valeur actuelle ou la valeur de la variable est affichée dans le titre ou le pied de page. Vous pouvez spécifier jusqu'à dix lignes de titre et jusqu'à dix lignes de pieds de page.552 Chapitre 36 même ligne que l'étiquette de modalité de ventilation. centrés et justifiés à droite sur chaque ligne. (Non disponible pour les Tableaux de bord en colonnes) Titres du Tableau de bord Titres du Tableau de bord contrôle le contenu et l'emplacement des titres et pieds de page du tableau de bord. Figure 36-8 Boîte de dialogue Tableau : Titres Si vous insérez des variables dans les titres ou les pieds de page. Dans les pieds de page. . S'il n'y a aucune étiquette de valeur.

il y aura un groupe séparé pour chaque modalité de chaque critère d'agrégation à l'intérieur des modalités du critère d'agrégation précédent dans la liste. vous ne pouvez pas utiliser ces variables dans les titres ou les pieds de page des tableaux. l'ancienneté et le service où chaque employé travaille. Variables en colonnes : Fournit la liste des variables du tableau de bord pour lesquelles vous voulez des statistiques récapitulatives et contrôle le format d'affichage et les statistiques récapitulatives affichées pour chaque variable. Cette option est utile pour avoir un aperçu du format de votre tableau sans traiter le tableau entier. . la numérotation des pages et les titres. Cette option est particulièrement utile après avoir vu un aperçu du tableau. Si votre fichier de données contient des variables nommées DATE ou PAGE. Tableaux de bord en colonnes Tableaux de bord en colonnes produit des tableaux de bord dans lesquels différentes statistiques récapitulatives apparaissent en colonnes séparées. vous pouvez gagner du temps de traitement en sélectionnant cette option. Si votre fichier de données est déjà trié par valeur des critères d'agrégation. Les critères d'agrégation doivent être des variables qualitatives discrètes qui divisent les observations en un nombre limité de modalités significatives. Les données sont déjà triées : Pour les rapports avec critères d'agrégation. Aperçu : N'affiche que la première page du tableau de bord. Vous pourriez générer un tableau de bord fournissant des statistiques récapitulatives sur les salaires (par exemple moyenne. Variables de ventilation : Fournit la liste des critères d'agrégation optionnels qui divisent le tableau de bord en groupes et contrôle les formats d'affichage des colonnes de ventilation. minimum. Tableau de bord : Contrôle les caractéristiques globales du tableau de bord. y compris l'affichage des valeurs manquantes. maximum) pour chaque division.553 Tableaux de Résultats Variables spéciales : Les variables spéciales DATE et PAGE vous permettent d'insérer la date actuelle ou le numéro de page dans l'une des lignes d'un en-tête ou d'un pied de page. le fichier de données doit être trié par valeur des critères d'agrégation avant de générer le tableau de bord. Pour les critères d'agrégation multiples. Exemple : Une société possédant une chaîne de magasins conserve des dossiers sur les employés comprenant le salaire.

cliquez sur Insérer le total. E Pour obtenir plus d'une mesure récapitulative pour une variable. Une colonne est générée dans le tableau de bord pour chaque variable sélectionnée. sélectionnez : Analyse Rapports Tableaux de bord en colonnes E Sélectionnez une ou plusieurs variables pour les variables en colonnes.508 $7.200 $19.500 $28.500 Pour obtenir un rapport récapitulatif : Récapitulatifs en colonnes E A partir du menu.11 Meubles Matériel 36. une fois pour chaque mesure récapitulative que vous souhaitez.554 Chapitre 36 Echantillon de résultat Figure 36-9 Tableau de bord avec statistiques récapitulatives en colonnes Division Moyenne Salaire Salaire Salaire Age moyen annuel annuel annuel Minimum Maximum __________ ________ ________ ________ ________ Revêtements de sol 30. sélectionnez une ou plusieurs variables pour les critères d'agrégation. sélectionnez la variable dans la liste source et déplacez-la dans la liste Variables en colonnes plusieurs fois.300 Appareils ménagers 31.255 $8.87 $13.20 $17. E Pour modifier la mesure récapitulative d'une variable. sélectionnez la variable dans la liste Variables en colonnes et cliquez sur Fonction. .975 $17.500 $12.754 $9. le rapport ou une autre fonction de colonnes existantes. Une variable appelée total est alors placée dans la liste Variables en colonnes.75 $11. la moyenne. E Pour les tableaux triés et affichés par sous-groupe.050 36.450 $22.580 $7. E Pour afficher une colonne contenant la somme.

555 Tableaux de Résultats Figure 36-10 Boîte de dialogue Tableaux de bord en colonnes Fonction récapitulative des Colonnes de données Fonctions récapitulatives contrôle les statistiques récapitulatives affichées pour la variable de colonne de données sélectionnée. Figure 36-11 Boîte de dialogue Tableau de bord : Fonction récapitulative .

l'aplatissement et l'asymétrie. Moyenne des colonnes : La colonne total représente la moyenne des colonnes de la liste Variables à récapituler. le pourcentage d'observations à l'intérieur d'un intervalle donné de valeurs. Minimum des colonnes : La colonne total représente la somme minimale des colonnes de la liste Variables à récapituler. la moyenne. la variance. la moyenne des colonnes. le minimum. la différence entre les valeurs de deux colonnes. l'écart type. le maximum. Figure 36-12 Boîte de dialogue Tableau de bord : Colonnes Somme des colonnes : La colonne total représente la somme des colonnes de la liste Variables à récapituler. le pourcentage d'observations situées au-dessus ou en dessous d'une valeur spécifiée. le minimum. le quotient des valeurs d'une colonne divisées par les valeurs d'une autre colonne et le produit des valeurs de colonnes multipliées. le maximum. Maximum des colonnes : La colonne total représente la somme maximale des colonnes de la liste Variables à récapituler. le nombre d'observations. Fonction élémentaire des Colonnes de Données pour colonne de total Variables à récapituler contrôle les statistiques récapitulatives totales qui récapitulent deux ou plusieurs Variables en colonnes. .556 Chapitre 36 Les statistiques récapitulatives disponibles sont la somme. Les statistiques récapitulatives totales sont la somme des colonnes.

La liste Variables à récapituler doit contenir exactement deux colonnes. % 1ère colonne / 2ème colonne : La colonne total représente le pourcentage de la première colonne par rapport à la seconde colonne de la liste Variables à récapituler. Figure 36-13 Boîte de dialogue Options de Ventilation des Tableaux de bord . La liste Variables à récapituler doit contenir exactement deux colonnes. Tableaux de bord en Colonnes : Options de Ventilation Options de Ventilation contrôle l'affichage des sous-totaux. Produit des colonnes : La colonne total représente le produit des colonnes de la liste Variables à récapituler. La liste Variables à récapituler doit contenir exactement deux colonnes. Format des Colonnes du Tableau de bord Les options de format des Variables en colonnes et de ventilation pour les Tableaux de bord en colonnes sont identiques à celles décrites pour les Tableaux de bord en lignes. 1ère colonne / 2ème colonne : La colonne total représente le quotient des colonnes de la liste Variables à récapituler.557 Tableaux de Résultats 1ère colonne – 2ème colonne : La colonne total représente la différence des colonnes de la liste Variables à récapituler. l'espacement et la pagination des modalités de ventilation.

Présentation du Tableau de bord en Colonnes Les options de présentation pour les Tableaux de bord en colonnes sont identiques à celles présentées pour les Tableaux de bord en lignes. Figure 36-14 Boîte de dialogue Tableau de bord : Options colonne de ventilation . .. Gestion des pages : Contrôle l'espacement et la pagination des modalités du critère d'agrégation sélectionné. Total général : Affiche et étiquette un total général pour chaque colonne . Vous pouvez spécifier un nombre de lignes vides entre les modalités de ventilation ou commencer chaque modalité de ventilation sur une nouvelle page. Exclure les observations avec des valeurs manquantes : Vous pouvez exclure les valeurs manquantes du tableau ou sélectionner un caractère unique indiquant les valeurs manquantes dans le tableau de bord.. l'affichage des valeurs manquantes et la pagination dans les Tableaux de bord en colonnes. Lignes à sauter avant sous-total : Contrôle le nombre de lignes vides entre les données des modalités de ventilation et les sous-totaux. Options des Tableaux de bord en Colonnes Options contrôle l'affichage des totaux généraux. affiché au bas de la colonne.558 Chapitre 36 Sous-total : Contrôle l'affichage des sous-totaux pour les modalités de ventilation.

559 Tableaux de Résultats

Fonctionnalités supplémentaires de la commande REPORT
Le langage de commande SPSS vous permet aussi de :
„ „

Afficher différentes fonctions récapitulatives dans les colonnes d'une ligne de fonction unique. Insérer des fonctions récapitulatives dans les Variables en colonnes pour des variables autres que la variable de la colonne de données, ou pour diverses combinaisons (fonctions composites) de fonctions récapitulatives. récapitulatives.

„ Utiliser la Médiane, le Mode, la Fréquence et le Pourcentage comme des fonctions „ „ „

Contrôler plus précisément le format d'affichage des statistiques récapitulatives. Insérer des lignes vides à divers emplacements du tableau de bord. Insérer des lignes vides toutes les n observations dans les listes.

Du fait de la complexité de la syntaxe de la commande REPORT, vous trouverez peut-être utile, lorsque vous construirez un nouveau tableau de bord avec syntaxe, d'approcher le tableau généré à partir des boîtes de dialogue, de copier et coller la syntaxe correspondante, puis de préciser cette syntaxe afin d'obtenir le tableau de bord exact que vous souhaitez. Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Analyse de fiabilité

37

Chapitre

L'analyse de fiabilité vous permet d'étudier les propriétés des échelles de mesure et des éléments qui les constituent. La procédure d'analyse de fiabilité calcule plusieurs mesures fréquemment utilisées de la fiabilité de l'échelle et propose également des informations sur les relations entre les différents éléments de l'échelle. Les coefficients de corrélation intra-classe peuvent être utilisés pour calculer les estimations de fiabilité inter-coefficients.
Exemple : Mon questionnaire mesure-t-il de façon fidèle la satisfaction de la clientèle

? L'analyse de la fiabilité vous permet de déterminer dans quelle mesure les éléments de votre questionnaire sont liés les uns aux autres et vous procure un indice général de la consistance ou de la cohérence interne de l'échelle dans son ensemble. Elle vous permet enfin d'identifier les éléments qui posent problème et qu'il faudrait exclure de l'échelle.
Statistiques : Descriptions de chaque variable et pour l'échelle, statistiques

récapitulatives sur les éléments, corrélations et covariances entre éléments, prévisions de fiabilité, tableau d'ANOVA, coefficients de corrélation intra-classe, T2 d'Hotelling et test d'additivité de Tukey.
Modèles : Les modèles suivants de fiabilité sont disponibles :
„ „ „

Alpha (Cronbach) : Il s'agit d'un modèle de cohérence interne, fondé sur la

corrélation moyenne entre éléments.
Split-half : Ce modèle fractionne l'échelle en deux et examine la corrélation

entre les deux parties.
Guttman : Ce modèle calcule les limites minimales de Guttman pour une fiabilité

vraie.

561

562 Chapitre 37 „ „

Parallèle : Ce modèle part de l'hypothèse que tous les éléments ont des variances

égales et des variances d'erreur égales en cas de réplication.
Parallèle strict : Ce modèle se fonde sur les mêmes hypothèses que le modèle

parallèle mais envisage également que tous les éléments ont la même moyenne.

Remarques sur les données de l'analyse de fiabilité
Données : Les données peuvent être dichotomiques, ordinales ou constituer des

intervalles, mais elles doivent être codées en numérique.
Hypothèses : Les observations doivent être indépendantes, les erreurs ne doivent pas

être corrélées entre éléments. Chaque paire d'éléments doit avoir une distribution gaussienne bivariée. Les échelles doivent être additives, de sorte que chaque élément est linéairement relié au total.
Procédures apparentées : Si vous souhaitez explorer la dimensionnalité des éléments

de votre échelle (pour voir si plusieurs éléments de base sont nécessaires au modèle des calculs), utilisez Analyse factorielle ou Positionnement multidimensionnel. Pour identifier des groupes homogènes de variables, vous pouvez vous servir de la classification hiérarchique pour classer les variables.

Echantillon de résultat
Figure 37-1 Résultat de fiabilité
Moyenne 1. 2. 3. 4. Aucune Ennui Critiques Collègues .4868 .5022 .5033 .5287 Ecart-type Observations .5001 .5003 .5003 .4995 906.0 906.0 906.0 906.0

563 Analyse de fiabilité

Matrice de corrélation Aucune Aucune Ennui Critiques Collègues 1.0000 .8150 .8128 .7823 Ennui 1.0000 .8256 .8068 Critiques Collègues

1.0000 .8045

1.0000

Coefficients de fiabilité Alpha = .9439

4 items Alpha d'item standardisé = .9439

Obtenir une analyse de fiabilité
E A partir du menu, sélectionnez : Analyse Echelle Analyse de la fiabilité... Figure 37-2 Boîte de dialogue Analyse d'items

E Sélectionnez deux variables (éléments) au moins en tant que composants potentiels

d'une échelle additive.
E Sélectionnez un modèle dans la liste déroulante Modèle.

564 Chapitre 37

Statistiques de l'analyse de fiabilité
Figure 37-3 Boîte de dialogue Analyse d'items : Statistiques

Vous pouvez sélectionner les différentes statistiques décrivant votre échelle et vos éléments. Les statistiques émises par défaut regroupent le nombre d'observations, le nombre d'éléments et les prévisions de fiabilité de la façon suivante :
„ „

Modèles alpha : Coefficient alpha. Pour les données dichotomiques, il s'agit d'un équivalent du coefficient Kuder-Richardson 20 (KR20). Modèles Split-half : Corrélation entre les sous-échelles, fiabilité Split-half de Guttman, fiabilité de Spearman-Brown (longueur égale ou inégale) et coefficient alpha pour chaque moitié. Modèles de Guttman : Coefficients de fiabilité lambda 1 à lambda 6. Modèles parallèle et parallèle strict: test de fiabilité du modèle, estimation de la variance de l'erreur, variance commune et réelle, estimation de la corrélation commune entre éléments, estimation de la fiabilité et estimation de la fiabilité non biaisée.

„ „

565 Analyse de fiabilité

Caractéristiques pour : Produit des statistiques descriptives pour les échelles ou les éléments sur les observations. Les options disponibles sont Item, Echelle et Echelle sans l'item.
„

Echelle sans l'item : Affiche les statistiques récapitulatives en comparant chaque

item à l'échelle composée des autres items. Les statistiques incluent la moyenne et la variance de l'échelle si l'item a été supprimé de l'échelle, la corrélation entre l'item et l'échelle composée des autres items, et l'alpha de Cronbach si l'item a été supprimé de l'échelle.
Principales statistiques : Fournit des statistiques descriptives de la distribution des

éléments sur l'ensemble des éléments dans l'échelle. Les options disponibles sont Moyennes, Variances, Covariances et Corrélations.
„

Moyennes : Statistiques récapitulatives pour les moyennes d'élément. Les

moyennes d'élément minimale, maximale et intermédiaire sont affichées, ainsi que le rapport de la moyenne maximale à la moyenne minimale.
„

Variances : Statistique récapitulative des variances d'élément. Les valeurs de

variance maximale, minimale et moyenne sont affichées, ainsi que la plage et la variance des variances d'élément, et le rapport entre les variances d'élément maximale et minimale.
„

Covariances : Statistiques récapitulatives pour les covariances d'élément. Les

covariances entre éléments minimale, maximale et intermédiaire sont affichées, ainsi que l'intervalle et la variance des covariances entre éléments, et le rapport de la covariance entre éléments maximale à la covariance minimale.
„

Corrélations : Statistiques récapitulatives pour les corrélations d'élément. Les

corrélations entre éléments minimale, maximale et intermédiaire sont affichées, ainsi que l'intervalle et la variance des corrélations entre éléments, et le rapport de la corrélation entre éléments maximale à la corrélation minimale.
Cohérence inter-items : Produit des matrices de corrélations et de covariances entre

éléments.
Tableau ANOVA : Produit des tests de moyennes égales. Les possibilités sont Aucune, Test F, Khi-deux de Friedman ou Khi-deux de Cochran.
„

Test F : Affiche un tableau d'analyse de la variance des mesures répétées.

566 Chapitre 37 „

Khi-deux de Friedman : Affiche le test de Friedman (khi-deux) et le coefficient

de concordance de Kendall. Cette option convient aux données organisées sous forme de rangs. Le test du khi-deux remplace le test F habituel dans le tableau ANOVA.
„

Khi-deux de Cochran : Affiche la valeur Q de Cochran. Cette option est appropriée

pour les données dichotomiques. Le Q de Cochran remplace le test F habituel dans le tableau ANOVA.
T-carré de Hotelling : Produit un test multivarié basé sur l'hypothèse nulle que tous les

éléments sur l'échelle ont la même moyenne.
Test d'additivité de Tukey : Produit un test basé sur l'hypothèse qu'il n'y a pas

d'interaction multiplicative entre les éléments.
Coefficient de corrélation intra-classe : Produit des mesures d'homogénéité ou de

cohérence des valeurs par observation.
„

Modèle : Sélectionnez le modèle de calcul du coefficient de corrélation

intra-classe. Les modèles disponibles sont Mixte à deux facteurs, Aléatoire à deux facteurs, et Aléatoire à un facteur. Sélectionnez le modèle mixte à deux facteurs lorsque les effets de population sont aléatoires et les effets d'item sont fixes, le modèle aléatoire à deux facteurs lorsque les effets de population et les effets d'item sont aléatoires, et le modèle aléatoire à un facteur lorsque les effets de population sont aléatoires.
„ „ „

Type : Sélectionnez le type d'index. Les types disponibles sont Homogénéité et

Cohérence absolue.
Intervalle de confiance : Spécifiez le niveau de l'intervalle de confiance. La valeur

par défaut est 95 %.
Valeur test : Spécifiez la valeur hypothétique du coefficient pour le test

d'hypothèse. Il s'agit de la valeur par rapport à laquelle la valeur observée est comparée. La valeur par défaut est 0.

Fonctionnalités supplémentaires de la commande RELIABILITY
Le langage de commande SPSS vous permet aussi de :
„

Lire et analyser une matrice de corrélation.

567 Analyse de fiabilité „ „

Enregistrer une matrice de corrélation à analyser ultérieurement. Spécifier un fractionnement autre qu'en deux moitiés égales quant au nombre d'éléments pour la méthode Split-half.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuel SPSS Command Syntax Reference.

Positionnement multidimensionnel

38

Chapitre

Le positionnement multidimensionnel tente de déterminer une structure dans un ensemble de mesures de distance entre objets ou observations. Pour cela, il affecte les observations à des positions particulières dans un espace conceptuel (à deux ou trois dimensions généralement) de telle sorte que les distances entre les points dans l'espace correspondent le mieux possible aux dissimilarités données. Dans la plupart des cas, les dimensions de cet espace conceptuel peuvent être interprétées et utilisées pour mieux comprendre les données. Si vous avez mesuré objectivement les variables, vous pouvez utilisez le positionnement multidimensionnel comme technique de factorisation (le Positionnement multidimensionnel calcule pour vous les distances à partir des données multivariées, le cas échéant). Le positionnement multidimensionnel peut également s'appliquer à des estimations subjectives de dissimilarité entre objets ou concepts. D'autre part, le positionnement multidimensionnel peut gérer les informations de dissimilarité provenant de plusieurs sources, comme c'est le cas lorsqu'il y a plusieurs indicateurs ou plusieurs répondants au questionnaire.
Exemple : Comment les gens perçoivent-ils les relations entre différentes voitures ? Si les données que vous obtenez de vos répondants indiquent des évaluations de similarité entre différentes modèles, le positionnement multidimensionnel peut servir à identifier les dimensions qui décrivent les perceptions des consommateurs. Vous pouvez trouver, par exemple, que le prix et la taille du véhicule définissent un espace à deux dimensions qui tient compte des similarités reportées par les répondants. Statistiques : Pour chaque modèle : matrice des données, positionnement optimisé des données de la matrice, stress S (de Young), stress S (de Kruskal), RSQ, coordonnées des stimuli, stress moyen et RSQ pour chaque stimulus (modèles RMDS). Pour les modèles des différences individuelles : pondérations des sujets et indice de singularité pour chaque sujet. Pour chaque matrice dans les modèles de positionnement multidimensionnel répliqués : stress et RSQ pour chaque stimulus. Diagrammes :

569

570 Chapitre 38

coordonnées des stimulus (à deux ou trois dimensions), diagramme de dispersion des disparités par rapport aux distances.

Remarques sur les données du positionnement multidimensionnel
Données : Si vos données sont dissemblables, toutes les dissemblances doivent être

quantitatives et mesurées avec les mêmes unités et échelles. Si vos données sont multivariées, les variables peuvent être quantitatives, binaires mais peuvent aussi être des données d'effectif. Le positionnement des variables est un enjeu de taille : les différences de positionnement peuvent affecter votre solution. Si vos variables présentent de grandes différences de positionnement (par exemple, si une variable est mesurée en dollar et l'autre en année), vous devez envisager de les standardiser (et cela automatiquement par la procédure de positionnement multidimensionnel).
Hypothèses : La procédure de positionnement multidimensionnel est relativement

indépendante de toute hypothèse de distribution. Assurez-vous que vous avez sélectionné le niveau de mesure approprié (ordinal, intervalle ou rapport) dans les options afin de garantir la justesse des résultats.
Procédures apparentées : Si votre but est la factorisation, vous pouvez également

envisager l'analyse factorielle, plus particulièrement si vos données sont quantitatives. Si vous souhaitez identifier des groupes d'observations similaires, envisagez de compléter votre analyse par positionnement multidimensionnel avec une analyse des nuées dynamiques ou une analyse de la classification hiérarchique.

Obtenir une analyse par positionnement multidimensionnel
E A partir du menu, sélectionnez : Analyse Echelle Positionnement multidimensionnel...

571 Positionnement multidimensionnel Figure 38-1 Boîte de dialogue Positionnement multidimensionnel

E Dans Distances, sélectionnez Données en matrice(s) ou Calculées à partir des données. E Si vos données sont des distances, vous devez sélectionner au moins quatre variables numériques pour l'analyse, et vous pouvez cliquer sur Forme pour indiquer la forme

de la matrice de distances.
E Si vous souhaitez que SPSS crée des distances avant de les analyser, vous devez sélectionner au moins une variable numérique, puis cliquer sur Mesure pour indiquer

le type de mesure de distance souhaité. Vous pouvez créer des matrices distinctes pour chaque modalité d'une variable de regroupement (numérique ou alphanumérique). Pour cela, déplacez cette variable dans la liste Matrices individuelles pour.

Forme des données du positionnement multidimensionnel
Figure 38-2 Boîte de dialogue Positionnement multidimensionnel : Forme des données

572 Chapitre 38

Si votre fichier de travail représente les distances au sein d'un ensemble d'objets, ou entre deux ensembles d'objets, vous devez indiquer la forme de votre matrice de données afin d'obtenir des résultats corrects. Choisir une possibilité : Matrice carrée symétrique, Matrice carrée asymétrique ou Matrice rectangulaire. Remarque : Vous pouvez sélectionner Carré symétrique si la boîte de dialogue Modèle indique une conditionnalité de ligne.

Positionnement multidimensionnel : créer une mesure
Figure 38-3 Boîte de dialogue Positionnement multidimensionnel : Calcul de l'indice de dissimilarité

Le positionnement multidimensionnel utilise les données de dissimilarité pour créer une solution de codage. Si vos données sont multivariées (valeurs des variables mesurées), vous devez créer des données de dissimilarité afin de calculer une solution de positionnement multidimensionnel. Vous pouvez spécifier les détails de création de mesures de dissimilarité à partir de vos données.
Mesure : Vous permet de spécifier la mesure de dissimilarité adaptée à votre analyse.

Sélectionnez une possibilité dans le groupe Mesure correspondant à votre type de données, puis sélectionnez l'une des mesures dans la liste déroulante correspondant à ce type de mesure. Les possibilités sont :
„

Intervalle : Distance Euclidienne, Carré de la distance Euclidienne, Distance de

Tchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.

573 Positionnement multidimensionnel „ „ Compter: Distance du Khi-deux ou Distance du phi-deux. Modèle de positionnement multidimensionnel Figure 38-4 Boîte de dialogue Positionnement multidimensionnel : Modèle Une estimation correcte d'un modèle de positionnement multidimensionnel dépend des aspects des données et du modèle lui-même. Différence de motif. Si vos variables sont ordinales. Ecart de taille. Intervalle ou Rapport. Binaire : Distance Euclidienne. Les possibilités sont Par variables ou Par observations. la sélection de l'option Délier des observations liées demande qu'elles soient traitées en tant que variables continues. Les possibilités sont Ordinales. vous voudrez peut-être standardiser des valeurs avant de calculer les proximités (ne s'applique pas aux données binaires). de telle sorte que les liens (mêmes valeurs pour des observations différentes) soient résolus de manière optimale. Sélectionnez une méthode de standardisation dans la liste déroulante Standardiser (si la standardisation n'est pas nécessaire. Transformer les valeurs : Dans certains cas. sélectionnez Aucune). Variance ou Lance et Williams. Créer une matrice de distances : Vous permet de choisir l'unité d'analyse. . comme lorsque les variables sont mesurées selon des échelles très différentes. Carré de la distance Euclidienne. Niveau de mesure : Vous permet de spécifier le niveau de vos données.

Indiquez des nombres entiers entre 1 et 6. indiquez le même nombre en tant que minimum et maximum. Une seule solution est calculée pour chaque nombre de l'intervalle. vous pouvez sélectionner l'option Permet la pondération négative.574 Chapitre 38 Conditionnalité : Vous permet de spécifier les comparaisons pertinentes. La valeur minimale 1 n'est autorisée que si vous sélectionnez l'option Distance Euclidienne comme modèle de positionnement. Ligne et Inconditionnel. Les possibilités existantes sont Distance Euclidienne ou Distance Euclidienne des différences individuelles (connue également en tant que INDSCAL). Pour n'obtenir qu'une seule solution. Les possibilités sont Matrice. Positionnement multidimensionnel : Options Figure 38-5 Boîte de dialogue Positionnement multidimensionnel : Options . Pour le modèle Distance Euclidienne des différences individuelles. Dimensions : Vous permet de spécifier la dimensionnalité de la ou des solutions de positionnement. Modèle de positionnement : Vous permet de spécifier les hypothèses sous lesquelles le positionnement est effectué. si cela convient à vos données.

entrez des valeurs pour la Convergence du stress S. reportez-vous au manuel SPSS Command Syntax Reference. Analyser les données nominales. . Critères : Vous permet de déterminer quand l'itération doit s'interrompre. Fonctions supplémentaires de la commande Positionnement multidimensionnel Le langage de commande SPSS vous permet aussi de : „ „ „ „ „ „ Utiliser trois modèles supplémentaires. Traiter les dissimilarités inférieures à n comme des valeurs manquantes : Ces distances sont exclues de l'analyse. Effectuer des transformations polynomiales sur l'intervalle et les données de type ratio. Pour obtenir des renseignements complets sur la syntaxe. AINDS et GEMSCAL dans la documentation relative au Positionnement multidimensionnel. Diagrammes des sujets. Analyser les similarités (plutôt que les distances) avec des données ordinales. Les options possibles sont Diagrammes des stimuli. Enregistrer diverses matrices de coordonnées et de pondération dans des fichiers et les relire pour l'analyse.575 Positionnement multidimensionnel Vous pouvez spécifier les options de votre analyse par Positionnement multidimensionnel : Afficher : Vous permet d'afficher les différents types d'affichage. le Minimum du stress S et le Maximum des itérations. Contraindre le dépliage multidimensionnel. ASCAL. Pour modifier les valeurs par défaut. Matrice des données et Récapitulatif des options du modèle.

.

Statistiques : Médiane. coefficient de dispersion (COD). vous pouvez conclure que la distribution des rapports varie considérablement d'un comté à l'autre. Hypothèses : Vous devez utiliser des variables d'échelle acceptant les valeurs positives pour les variables qui définissent le numérateur et le dénominateur du rapport. intervalles de confiance. moyenne. valeurs minimale et maximale.Statistiques de ratio 39 Chapitre La procédure Statistiques de ratio permet d'obtenir la liste exhaustive des statistiques récapitulatives qui servent à décrire le rapport entre deux variables d'échelle. différentiel lié au prix (PRD). et index de concentration calculés pour un intervalle ou un pourcentage défini par l'utilisateur dans le rapport médian. Remarque sur les données des statistiques de ratio Données : Utilisez des codes numériques ou alphanumériques courts pour coder les variables de regroupement (mesures de niveau nominal ou ordinal). écart absolu moyen (AAD). intervalle. coefficient de variation avec moyenne centrée. moyenne pondérée. 577 . Exemple : Le rapport existant entre le prix estimatif et le prix de vente des maisons est-il uniforme dans chacun de ces cinq comtés ? D'après les résultats. Vous pouvez supprimer le rapport des statistiques de ratio dans le document de sortie et enregistrer les résultats dans un fichier externe. coefficient de variation avec médiane centrée. dans l'ordre croissant ou décroissant. Vous pouvez trier le résultat sur la base des valeurs d'une variable de regroupement. écart type.

Décider d'afficher ou non les résultats dans le Viewer..578 Chapitre 39 Pour obtenir des statistiques de ratio E A partir du menu. vous pouvez : „ „ „ Sélectionner une variable de regroupement et préciser l'ordre de présentation des groupes dans le résultat.. Choisir ou non d'enregistrer les résultats dans un fichier externe en vue d'une utilisation ultérieure. et préciser le nom du fichier dans lequel les résultats sont enregistrés. Sinon. . E Sélectionnez la variable du dénominateur. Figure 39-1 Boîte de dialogue Statistiques de ratio E Sélectionnez la variable du numérateur. sélectionnez : Analyse Statistiques descriptives Ratio.

divisée par le nombre total de ratios. Moyenne pondérée : Résultat de la division de la moyenne du numérateur par la moyenne du dénominateur. „ AAD : L'écart absolu moyen est égal à la somme des écarts absolus des ratios relatifs à la médiane. . ou de répartition. de la médiane et de la moyenne pondérée (si demandée). Moyenne : Résultat de la somme des ratios divisée par le nombre total de ratios. Affectez une valeur supérieure ou égale à 0. et inférieure à 100 au niveau de confiance. au niveau des valeurs observées.579 Statistiques de ratio Statistiques de ratio Figure 39-2 Boîte de dialogue Statistiques Tendance centrale : Les mesures de tendance centrale sont des statistiques qui décrivent la distribution des rapports. „ „ „ Médiane : La valeur telle que le nombre de ratios inférieurs à cette valeur est identique au nombre de ratios supérieurs à cette valeur. Correspond également à la moyenne des ratios pondérée par le dénominateur. Dispersion : Ces statistiques permettent de mesurer le degré de variation. „ Intervalles de confiance : Affiche les intervalles de confiance de la moyenne.

Minimum : Ratio le plus petit. . „ Ecart type : L'écart type est la racine carrée positive de la somme des carrés des écarts des ratios relatifs à la moyenne divisée par le nombre total des ratios moins un. vous définissez l'intervalle de manière implicite en indiquant le pourcentage de la médiane. Vous pouvez le calculer de deux manières : „ Ratios entre : Dans ce cas. Entrez les valeurs des proportions inférieure et supérieure.580 Chapitre 39 „ „ „ COD : Le coefficient de dispersion résulte de l'expression de l'écart moyen absolu en pourcentage de la médiane. Index de concentration : Le coefficient de concentration mesure le pourcentage des ratios compris dans un intervalle. „ Ratios dans : Dans ce cas.01×valeur)×médiane et la limite supérieure est égale à (1 + 0. puis cliquez sur Ajouter pour obtenir un intervalle. Entrez une valeur comprise entre 0 et 100. vous définissez l'intervalle de manière explicite en précisant les valeurs minimale et maximale. „ „ „ Intervalle : Résulte de la soustraction du ratio minimal au ratio maximal. Médiane centrée COV : Le coefficient de variation avec médiane centrée résulte de l'expression de la racine de la moyenne des carrés de l'écart par rapport à la médiane en pourcentage de la médiane. La limite inférieure de l'intervalle est égale à (1 – 0. ou index de régressivité.01×valeur)×médiane. résulte de la division de la moyenne par la moyenne pondérée. Maximum : Ratio le plus grand. et cliquez sur Ajouter. PRD : Le différentiel lié au prix. „ Moyenne centrée COV : Le coefficient de variation avec moyenne centrée résulte de l'expression de l'écart type en tant que pourcentage de la moyenne.

vous pouvez créer un diagramme en sélectionnant un type dans le menu Diagrammes. vous devez disposer de données dans l'éditeur de données. Les diagrammes interactifs. Vous pouvez saisir les données directement dans l'éditeur de données. disponibles dans le sous-menu Interactif du menu Diagrammes. ouvrir un fichier de données déjà enregistré ou lire une feuille de calcul. Création du diagramme Une fois les données entrées dans l'éditeur de données.Présentation de l'utilitaire de diagramme 40 Chapitre Les procédures du menu Diagrammes et de nombreuses procédures du menu Analyse permettent de créer des diagrammes et des graphiques haute résolution. et le système d'aide en ligne explique comment créer et modifier tous les types de diagramme. Création et modification d'un diagramme Avant de créer un diagramme. Une boîte de dialogue de diagramme apparaît. Ce chapitre présente l'utilitaire de diagramme. sont abordés dans le manuel SPSS Interactive Graphics. L'élément Didacticiel du menu Aide propose des exemples en ligne de création et de modification de diagramme. un fichier de données délimité par des tabulations ou un fichier de base de données. 581 .

Cliquez sur Définir pour ouvrir une boîte de dialogue de définition de diagramme semblable à celle-ci.582 Chapitre 40 Figure 40-1 Boîte de dialogue de diagramme La boîte de dialogue contient des icônes correspondant aux divers types de diagramme et la liste des structures de données. Figure 40-2 Boîte de dialogue de définition du diagramme .

Le diagramme apparaît dans l'éditeur de diagrammes. . Le diagramme apparaît dans le Viewer. double-cliquez n'importe où dans le diagramme affiché dans le Viewer.583 Présentation de l'utilitaire de diagramme Cette boîte de dialogue permet de sélectionner les variables adaptées au diagramme et de choisir les options voulues. cliquez sur Aide. Pour plus d'informations sur les divers choix proposés. Figure 40-3 Diagramme dans le Viewer Modification d'un diagramme Pour modifier un diagramme.

. Les onglets de la fenêtre Propriétés dépendent des choix effectués. afficher ou masquer des éléments. Pour ajouter. L'aide en ligne explique comment afficher les onglets nécessaires. sélectionnez : Affichage Propriétés La fenêtre Propriétés apparaît. Pour modifier un élément de diagramme : E Sélectionnez l'élément à modifier. utilisez les menus de l'éditeur de diagrammes. E A partir du menu.584 Chapitre 40 Figure 40-4 Diagramme initial dans l'éditeur de diagrammes Vous pouvez modifier tout élément du diagramme ou choisir un autre type de diagramme pour représenter les mêmes données.

Ajout de texte au diagramme (par exemple. Modification de la couleur et du motif de remplissage des bâtons. un titre ou une annotation). .585 Présentation de l'utilitaire de diagramme Figure 40-5 Fenêtre Propriétés Les modifications suivantes sont fréquemment apportées : „ „ „ „ Modification du texte du diagramme. Modification de l'emplacement de la ligne d'origine des bâtons. „ Remplacement de la bordure transparente du cadre extérieur par une bordure noire. Ci-dessous figure un diagramme modifié.

ainsi qu'un groupe Modèle. Q-Q. Ces options globales sont disponibles avec la plupart des diagrammes. Le diagramme modifié apparaît alors dans le Viewer. Elles ne sont toutefois pas proposées pour les diagrammes P-P. séquentiels ou les diagrammes de séries chronologiques. quel que soit leur type. Options globales de définition du diagramme Lorsque vous définissez un diagramme. . la boîte de dialogue prévue à cet effet contient généralement les boutons Titres et Options.586 Chapitre 40 Figure 40-6 Diagramme modifié Les modifications apportées au diagramme sont enregistrées lorsque vous fermez la fenêtre de diagramme.

Pour spécifier des titres ou des notes de bas de page lors de la définition d'un diagramme. Vous pouvez également appliquer un modèle d'attributs précédemment sélectionnés lors de la définition du diagramme ou après la création du diagramme. Vous pouvez cliquer sur Options pour contrôler le traitement des valeurs manquantes de la plupart des diagrammes et des étiquettes d'observation des diagrammes de dispersion. une ligne de sous-titre et deux lignes de note de bas de page. cliquez sur Titres dans la boîte de dialogue de définition du diagramme. sous-titres et notes de bas de page Lors de la définition initiale du diagramme.587 Présentation de l'utilitaire de diagramme Figure 40-7 Boîte de dialogue de définition du diagramme Cliquez sur Titres pour spécifier des titres. vous pouvez spécifier deux lignes de titre. des sous-titres ou des notes de bas de page. Les sections suivantes expliquent comment définir ces caractéristiques lors de la définition du diagramme. La boîte de dialogue Titres apparaît. Titres. .

Toutefois. Les titres des diagrammes en secteurs sont quant à eux centrés par défaut et tronqués des deux côtés s'ils sont trop longs. leur taille ou leur justification. Les titres.588 Chapitre 40 Figure 40-8 Boîte de dialogue Titres Chaque ligne peut compter jusqu'à 72 caractères. les sous-titres et les notes de bas de page sont représentés par des zones de texte dans l'éditeur de diagrammes. Elle est accessible via le bouton Options de la boîte de dialogue de définition du diagramme. leur police. le nombre de caractères accepté sur le diagramme lui-même dépend de la police et de la taille choisies. vous pouvez ajouter ou supprimer des zones de texte. Dans l'éditeur de diagrammes. Figure 40-9 Options . et modifier leur contenu. la plupart des titres sont alignés à gauche et tronqués à droite s'ils sont trop longs. Options La boîte de dialogue Options propose des options de traitement des valeurs manquantes et d'affichage des étiquettes d'observation. Par défaut.

vous pouvez choisir l'une des options suivantes pour exclure les observations comportant des valeurs manquantes : „ Exclure toute observation incomplète : Si l'une des variables du diagramme comporte une valeur manquante pour une observation donnée. „ Exclure les observations variable par variable : Si une variable sélectionnée comporte des valeurs manquantes. Valeurs manquantes : Si vous avez sélectionné des récapitulatifs de variables distinctes pour un diagramme qualitatif ou si vous créez un diagramme de dispersion. l'observation est intégralement exclue du diagramme.589 Présentation de l'utilitaire de diagramme La disponibilité de chaque option dépend des choix effectués précédemment. L'option d'affichage des étiquettes d'observation n'est disponible qu'avec les diagrammes de dispersion qui disposent d'une variable sélectionnée pour les étiquettes d'observation. Figure 40-10 Exclusion des valeurs manquantes de toute observation incomplète . les observations contenant ces valeurs manquantes sont exclues lors de l'analyse de la variable. étudiez les figures suivantes qui représentent le diagramme en bâtons correspondant à chacune des deux options. Les options des valeurs manquantes ne sont pas proposées avec les diagrammes utilisant des valeurs d'observations individuelles ou avec les histogrammes. Pour connaître la différence entre les exclusions de valeurs manquantes de type Exclure toute observation incomplète et Exclure les observations variable par variable.

le nombre d'observations non manquantes de chaque variable d'une modalité donnée est représenté indépendamment des valeurs manquantes dans les autres variables. L'option Afficher les groupes définis par des valeurs manquantes étant sélectionnée pour les deux diagrammes. et 13 la valeur manquante utilisateur 0. Dans le diagramme avec exclusion de toute observation incomplète. la modalité Manquant est ajoutée aux types de poste affichés. si une valeur est manquante. Dans le diagramme avec exclusion des observations variable par variable.590 Chapitre 40 Figure 40-11 Exclusion des valeurs manquantes des observations variable par variable Ces diagrammes ont été créés à partir d'une version du fichier Employee data. Dans chaque diagramme. L'option suivante est également disponible pour les valeurs manquantes : „ Afficher les groupes définis par des valeurs manquantes : Si des valeurs manquantes figurent dans les données des variables utilisées pour définir des modalités ou des sous-groupes. les valeurs de la fonction récapitulative Nombre d'observations figurent dans les étiquettes des bâtons. les valeurs manquantes utilisateur (valeurs identifiées .sav. le nombre d'observations est identique pour les deux variables de chaque regroupement de bâtons. Cette dernière a été modifiée afin que les variables du salaire actuel et du type de poste occupé contiennent quelques valeurs manquantes par défaut (vides). Dans d'autres observations. En effet. l'observation est exclue pour toutes les variables. la valeur 0 a été saisie et définie comme manquante. 26 observations des deux diagrammes comportent une valeur manquante par défaut pour le type de poste occupé.

sélectionnez dans les menus : Fichier Appliquer modèle de diagramme. Si vous avez sélectionné cette option et que vous ne voulez plus afficher la modalité Manquant une fois le diagramme tracé. d'un secteur dans les diagrammes en secteurs ou d'une boîte dans les boîtes à moustaches. Si vous sélectionnez cette option. les étiquettes d'observation risquent de se chevaucher. elle est désélectionnée.591 Présentation de l'utilitaire de diagramme comme manquantes par l'utilisateur) et les valeurs manquantes par défaut sont regroupées dans la modalité Manquant. Modèles de diagramme Vous pouvez appliquer la plupart des attributs et des éléments textuels d'un diagramme à un autre. La dernière option de la boîte de dialogue Options permet de contrôler l'état des étiquettes d'observation lors de l'affichage initial d'un diagramme de dispersion. „ Afficher le diagramme avec les étiquettes d'observation : Lorsque cette option est sélectionnée. L'onglet Modalités permet de déplacer vers la liste Exclues les modalités à masquer. Il est possible de modifier un diagramme. sélectionnez ce dernier. puis choisissez Propriétés dans le menu Modifier. Une boîte de dialogue standard de sélection de fichier apparaît. le diagramme de dispersion affiché par défaut ne comporte aucune étiquette. La modalité Manquant figure sur l'axe de modalités ou dans la légende. la modalité Manquant n'apparaît pas. . puis d'utiliser le modèle pour créer toute une série de diagrammes similaires. Autrement dit. Pour utiliser un modèle lors de la création d'un diagramme. S'il n'existe aucune valeur manquante.. les valeurs manquantes ajoutent une modalité Manquant à l'ensemble des marques. Par défaut. et se traduit par exemple par l'ajout d'un bâton supplémentaire. dans lesquels les données sont récapitulées selon des variables distinctes. Pour appliquer un modèle à un diagramme qui figure déjà dans une fenêtre de diagramme.. toutes les étiquettes d'observation figurent sur le diagramme de dispersion créé. sélectionnez l'option Utiliser les spécifications du graphique de (dans le groupe Modèle de la boîte de dialogue de définition du diagramme) et cliquez sur Fichier. Cette option n'est pas disponible avec les diagrammes de dispersion superposés ou mono-série. de l'enregistrer en tant que modèle. Dans les diagrammes de dispersion.

si l'ancien diagramme est un diagramme en bâtons juxtaposés dont les bâtons ont été colorés en vert et en jaune.. Par exemple. ils remplacent ceux du diagramme modèle. les titres du diagramme modèle sont repris. L'extension du modèle est . Si l'ancien diagramme est un diagramme en bâtons simples comportant des ombrages. Pour créer un modèle de diagramme E Créez un diagramme. et le nouveau un diagramme curviligne simple. mais pas le nouveau diagramme. Si vous êtes en train de créer un diagramme. Les modèles permettent d'emprunter le format d'un diagramme et de l'appliquer au diagramme en cours de création. et le nouveau un diagramme curviligne multiple. Si des titres sont définis dans le nouveau diagramme.592 Chapitre 40 Une boîte de dialogue standard de sélection de fichier apparaît. Sélectionnez le fichier à utiliser comme modèle. En général. E Dans la boîte de dialogue Enregistrer le modèle de diagramme. indiquez les caractéristiques du diagramme à enregistrer dans le modèle. le nom du fichier sélectionné apparaît dans le groupe Modèle lorsque vous revenez dans la boîte de dialogue de définition du diagramme. E Modifiez le diagramme afin qu'il contienne les attributs souhaités dans le modèle. . sélectionnez : Fichier Enregistrer modèle de diagramme.. E Cliquez sur Poursuivre.sgt. E Entrez le nom de fichier et l'emplacement du nouveau modèle. L'aide en ligne décrit ces paramètres en détail. Si le diagramme modèle comporte des titres. E A partir des menus de l'éditeur de diagrammes. toutes les informations de formatage de l'ancien diagramme applicables au nouveau diagramme s'appliquent automatiquement. les lignes de ce dernier n'auront pas d'ombrages car ceux-ci ne s'appliquent pas aux diagrammes curvilignes. les lignes de ce dernier seront vertes et jaunes.

à savoir ceux qui assumeront ou non le remboursement de leur prêt. Diagrammes : Courbe ROC Méthodes : L'estimation de la zone située sous la courbe ROC peut être calculée de façon paramétrique ou non à l'aide du modèle exponentiel binégatif. L'utilisateur doit choisir la direction 593 . Exemple : L'intérêt de la banque est donc de classer correctement les clients en modalités. Elles se composent souvent des probabilités issues d'une analyse discriminante.Courbes ROC 41 Chapitre Cette procédure constitue un moyen efficace d'évaluer les performances des méthodes de classement ne mettant en œuvre qu'une seule variable à deux modalités et utilisées pour la classification des sujets. La variable d'état peut être d'un type quelconque et indique la véritable modalité à laquelle un sujet appartient. Les courbes ROC peuvent être utilisées pour évaluer le mode de fonctionnement optimal de ces méthodes. Statistiques : La zone inférieure à la courbe ROC comporte un intervalle de confiance ainsi que les coordonnées de cette courbe. Des méthodes particulières sont en cours de développement afin de les aider dans leur choix. Remarques sur les données de la courbe ROC Données : Les variables de test sont quantitatives. d'une régression logistique ou des scores indiqués sur une échelle arbitraire et spécifiant la « force de conviction » d'un indicateur lorsqu'un sujet se rapporte à l'une ou l'autre des modalités. Hypothèses : Les nombres croissants d'une échelle d'indicateurs confirment que le sujet appartient à une modalité. tandis que les nombres décroissants d'une échelle confirment qu'il appartient à une autre modalité. La valeur de la variable d'état indique la modalité à considérer comme positive.

Echantillon de résultat Figure 41-1 Résultat de la courbe ROC .594 Chapitre 41 positive. On suppose également que la véritable modalité à laquelle chaque sujet appartient est connue.

595 Courbes ROC Pour obtenir une courbe ROC E A partir du menu. . E Identifiez la valeur positive de la variable d'état. sélectionnez : Graphes Courbe ROC... Figure 41-2 Boîte de dialogue Courbe ROC E Sélectionnez une ou plusieurs variables de probabilité de test. E Sélectionnez une variable d'état.

Les méthodes disponibles sont des valeurs exponentielles non paramétriques et bi-négatives.1 % et 99.596 Chapitre 41 Courbe ROC : Options Figure 41-3 Boîte de dialogue Courbe ROC : Options Vous pouvez indiquer les options suivantes pour votre analyse ROC : Classification : Permet de spécifier si la valeur du point de césure doit être incluse ou exclue lors d'une classification positive. . La valeur n'a pas de conséquence sur le résultat. Valeurs manquantes : Vous permet de spécifier comment traiter les valeurs manquantes. Direction du test : Permet de spécifier la direction de l'échelle en fonction de la modalité positive. Les valeurs de l'intervalle se situent entre 50. Paramètres pour une erreur standard de zone : Vous permet de spécifier la méthode utilisée pour estimer l'erreur standard de la zone située sous la courbe.9 %. Vous permet également de définir le niveau de l'intervalle de confiance.

y compris : „ „ „ „ le format des Données l'étiquette Variable les valeurs manquantes spécifiées les étiquettes Valeurs Figure 42-1 la boîte de dialogue Variables Aller à : Permet d'accéder à la variable sélectionnée dans la fenêtre de l'éditeur de données.Outils 42 Chapitre Ce chapitre décrit les fonctions du menu Outils et vous indique comment réordonner les listes de variables cible en utilisant les menus systèmes de Windows. 597 . Informations de la variable La boîte de dialogue Variables affiche des informations sur la définition des variables pour les variables couramment sélectionnées.

(Non disponible dans la version Education). Pour les fichiers de données au format SPSS. modifier. Les lignes sont automatiquement interrompues par un renvoi à la ligne suivante à partir de 80 caractères. Les commentaires ne sont pas limités en longueur. sélectionnez Afficher les commentaires dans la sortie. . cela correspond à 80 caractères dans les langues sur un octet) par ligne..598 Chapitre 42 Coller : Permet de coller les variables sélectionnées dans la fenêtre syntaxe désignée à l'emplacement du curseur.. E Pour afficher les commentaires dans le Viewer. Commentaires de fichier de données Vous pouvez inclure des commentaires descriptifs dans le fichier de données. sélectionnez : Outils Variables. mais ne doivent pas dépasser 80 octets (en général.. sélectionnez : Outils Commentaires de fichier de données. La police utilisée pour afficher les commentaires est celle utilisée pour les résultats texte de manière à donner une représentation fidèle de l'affichage dans le Viewer. E Sélectionnez la variable dont vous souhaitez afficher les informations de définition variable. supprimer ou afficher les commentaires de fichier de données : E A partir du menu.. Pour obtenir des informations sur les variables E A partir du menu. utilisez l'affichage des variables dans l'éditeur de données. les commentaires sont enregistrés avec le fichier de données. Pour ajouter. Pour modifier les définitions de variables.

599 Outils Un cachet de date (la date actuelle entre parenthèses) est automatiquement ajouté à la fin de la liste des commentaires dès que vous modifiez un commentaire ou que vous en ajoutez un. définissez et utilisez des groupes de variables. . Si votre fichier de données a un grand nombre de variables et si les boîtes de dialogue s'ouvrent lentement. Ceci est particulièrement utile pour les fichiers de données avec un grand nombre de variables. Ceci peut entraîner des ambiguïtés au niveau des dates associées aux commentaires lorsque vous modifiez un commentaire ou que vous insérez un nouveau commentaire entre deux commentaires existants. Les petits groupes de variables facilitent la recherche et la sélection des variables pour votre analyse et peuvent aussi augmenter votre performance sur SPSS. Définir des groupes de variables La procédure Définir des groupes de variables crée des sous-groupes de variables pour permettre d'afficher les listes source de boîtes de dialogue. le fait de réduire les listes source de boîtes de dialogue en sous-groupes de variables plus petits devrait permettre de réduire le temps nécessaire à l'ouverture des boîtes de dialogue. Groupes de Variables Vous pouvez limiter le nombre de variables devant s'afficher dans les listes des variables source de la boîte de dialogue. Pour cela.

Variables du groupe : Toute combinaison de variables numériques.600 Chapitre 42 Figure 42-2 Définir boîte de dialogue Définir des groupes Nom du groupe : Les noms de groupes peuvent contenir jusqu'à 12 caractères. y compris vides. Tous les caractères. peuvent être utilisés. alphanumériques et alphanumériques longues peuvent être comprises dans un groupe. . Une variable peut appartenir à de multiples groupes.. Les noms de Groupes sont indifférents aux observations. E Sélectionnez les variables à inclure dans le groupe. sélectionnez : Outils Définir des groupes. Pour définir des groupes de variables E A partir du menu.. L'ordre des variables dans le groupe n'a pas d'effet sur l'ordre d'affichage des variables dans les listes source de la boîte de dialogue.

601 Outils E Saisir un nom de groupe (jusqu'à 12 caractères). L'ordre des groupes et l'ordre des variables dans le groupe n'ont pas d'effet sur l'ordre des listes source de variables. Les variables apparaissent dans les listes source dans l'ordre alphabétique ou dans l'ordre du fichier. Figure 42-3 Utiliser la boîte de dialogue Définir des groupes Groupes utilisés : Affiche les groupes utilisés pour produire les listes source de variables dans les boîtes de dialogue. Par défaut. Utiliser les groupes La procédure Utiliser des groupes limite le nombre de variables affichées dans les listes source de la boîte de dialogue aux groupes sélectionnés que vous avez définis. E Cliquez sur Ajouter. . NEWVARIABLES : Ce groupe contient seulement les nouvelles variables créées pendant la session. y compris les nouvelles variables créées pendant une session. deux groupes définis par défaut sont utilisés : ALLVARIABLES : Ce groupe contient toutes les variables du fichier de données.

Si vous n'enlevez pas le groupe ALLVARIABLES de la liste des Groupes utilisés.602 Chapitre 42 Vous pouvez enlever ces groupes de la liste et en sélectionner d'autres. mais il doit y avoir au moins un groupe dans la liste.. . Si vous souhaitez modifier l'ordre des variables d'une liste cible — mais que vous ne souhaitez pas désélectionner toutes les variables et les resélectionner dans le nouvel ordre — vous pouvez faire remonter et redescendre les variables dans la liste cible en utilisant le menu système dans le coin supérieur gauche de la boîte de dialogue (à laquelle vous pouvez accéder en cliquant sur la partie gauche de la barre de titre de la boîte de dialogue). Pour limiter les listes source de boîte de dialogue à des groupes de variables définis E A partir du menu.. E Sélectionnez les groupes de variables définis qui contiennent les variables que vous souhaitez voir apparaître dans les listes source de la boîte de dialogue. tous les autres groupes que vous incluez ne sont pas significatifs. sélectionnez : Outils Utiliser des groupes. Réordonner Listes Variables Cible Les variables apparaissent dans les listes cible de la boîte de dialogue dans l'ordre dans lequel elles sont sélectionnées à partir de la liste source.

603 Outils Figure 42-4 Menu système de Windows avec réordonnance de la liste cible Faire remonter sélection : Fait remonter la ou les variables sélectionnées d'une position dans la liste destination. Faire redescendre sélection : Fait descendre la ou les variables sélectionnées d'une position dans la liste destination. . Vous ne pouvez pas déplacer les groupes de variables non attenantes. Vous pouvez déplacer simultanément les variables multiples si elles sont attenantes (regroupées).

.

le modèle de tableau pour les nouveaux tableaux pivotants et le modèle de graphiques pour les nouveaux diagrammes interactifs ..Options 43 Chapitre Les commandes Options permettent de contrôler un grand nombre de paramètres. E Modifiez les paramètres. les éléments affichés et masqués dans les nouveaux résultats de sortie . les formats monétaires personnalisés (devises). y compris : „ „ „ „ „ „ le journal de session qui enregistre toutes les commandes exécutées dans chaque session . sélectionnez : Affichage Options. E Cliquez sur OK ou sur Appliquer. 605 . E Cliquez sur les onglets correspondant aux paramètres que vous souhaitez modifier. l'ordre d'affichage des variables dans les listes source des boîtes de dialogue . Pour modifier les paramètres d'options E A partir du menu.. les fichiers et fonctions autoscript permettant de personnaliser la sortie.

Vous pouvez . On peut afficher les variables dans l'ordre alphabétique ou dans l'ordre du fichier qui correspond à l'ordre dans lequel elles interviennent dans le fichier de données (et dans lequel elles sont affichées dans la fenêtre Editeur de données). Vous pouvez modifier le fichier-journal et réutiliser les commandes dans d'autres sessions. Journal de session : Fichier-journal de toutes les commandes exécutées dans une session. ainsi que les commandes générées par les choix de boîte de dialogue. Vous pouvez activer ou désactiver la fonction journal. Les listes de variables cible reproduisent toujours l'ordre dans lequel les variables ont été sélectionnées. Vous pouvez afficher des noms de variables ou des étiquettes de variable. L'ordre d'affichage affecte seulement la liste des variables source. Celui-ci comprend les commandes saisies et exécutées dans les fenêtres de syntaxe. ajouter au fichier-journal ou l'écraser et sélectionner le nom et l'emplacement du fichier-journal.606 Chapitre 43 Options générales Figure 43-1 Options : onglet Général Listes de variables : Contrôle l'affichage des variables dans boîtes de dialogue et boîtes de liste.

De nombreux langages sont installés automatiquement lorsque . (La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student. ni aux graphiques interactifs. En mode distribué (disponible avec la version serveur). Ceci est particulièrement utile pour les utilisateurs avertis de SPSS qui préfèrent travailler avec la syntaxe de commande plutôt que les boîtes de dialogue. Ne s'applique ni au résultat texte simple. Unités de mesure : Système de mesure utilisé (Points. La liste des langages disponibles dépend des fichiers de langage installés. sélectionnez cette option pour ouvrir automatiquement une fenêtre de syntaxe au début de chaque session SPSS. Ouvrir la fenêtre de syntaxe au démarrage : Les fenêtres de syntaxe sont des fenêtres de fichier de texte utilisées pour saisir. Type de Viewer au démarrage : Contrôle le type de Viewer utilisé et le format de résultat. contactez votre administrateur système. cette option n'affecte pas l'emplacement des fichiers de données temporaires.000).) Répertoire temporaire : Contrôle l'emplacement des fichiers temporaires créés au cours d'une session. Les valeurs décimales très petites sont affichées au format suivant : 0 (ou 0. ni aux cartes (disponible avec l'option Maps).607 Options copier la syntaxe de commande à partir du fichier-journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser avec le système de production automatisée. Pouces. l'emplacement des fichiers temporaires est contrôlé par la variable d'environnement SPSSTMPDIR. ou Centimètres) pour spécifier les attributs tels que les marges de cellules du tableau pivotant. En mode distribué. Pas d'affichage scientifique pour les petits nombres dans les tableaux : Supprime l'affichage scientifique pour les petites valeurs décimales dans le résultat. les largeurs de cellules et l'espace d'impression entre les tableaux Langage : Contrôle le langage utilisé dans les résultats. Liste des fichiers récemment utilisés : Cette procédure permet de contrôler le nombre de fichiers récemment utilisés qui apparaissent dans le menu Fichier. et exécuter les commandes SPSS. Le Viewer en mode brouillon convertit les tableaux pivotants en sortie texte et les diagrammes en métafichiers. Si vous travaillez fréquemment avec la syntaxe de commande. (non disponible avec la version Student). Si vous devez modifier l'emplacement du répertoire temporaire. modifier. qui ne peut être définie que sur l'ordinateur exécutant la version serveur du programme. Le Viewer produit des tableaux pivotants interactifs et des diagrammes interactifs.

Options Viewer Les options d'affichage du résultat avec l'explorateur affectent seulement le nouveau résultat produit après modification de la configuration. Un résultat déjà affiché dans le Viewer n'est pas affecté par les changements de ces paramètres.608 Chapitre 43 vous installez SPSS. Pour obtenir d'autres fichiers de langage. Figure 43-2 Onglet Viewer . reportez-vous à « Options script » .com/tech/downloads/base. Pour plus d'informations. Remarque : Les scripts personnalisés fondés sur des chaînes de texte propres à un langage dans le résultat risquent de ne pas être exécutés correctement lorsque vous modifiez le langage des résultats.htm. visitez le site http://www.spss. page 625. Notification : Cette procédure contrôle la façon dont SPSS notifie que votre exécution est terminée et que les résultats sont accessibles dans le Viewer.

(La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student. Police résultats texte : Police utilisée pour la sortie de texte.) Remarque : Tous les éléments de résultat sont affichés alignés à gauche dans le Viewer. Vous pouvez contrôler l'affichage des éléments suivants : Log. Le résultat texte SPSS est prévu pour être utilisé dans une police monoespacée (à espacement fixe).609 Options Etat initial résultats : Cette procédure détermine quels éléments seront automatiquement affichés ou masqués chaque fois que vous exécuterez une procédure et combien d'éléments sont initialement alignés. Si vous sélectionnez une police qui n'est pas monoespacée. Seul l'alignement des résultats imprimés est affecté par les paramètres d'alignement. Tableau pivotant. Les éléments centrés et alignés à droite sont identifiés par un symbole situé au-dessus et à gauche des éléments en question. Vous pouvez également démarrer ou arrêter l'affichage des commandes SPSS dans le journal. et Résultat texte (sortie non affichée dans les tableaux pivotants). Avertissements. la taille et la couleur des nouveaux titres de page et de ceux générés par la syntaxe de commande TITLE et SUBTITLE. Remarques. Options du Viewer en mode brouillon Les options d'affichage des résultats dans le Viewer affectent seulement le nouveau résultat produit après modification des paramètres Un résultat déjà affiché dans le Viewer n'est pas affecté par les changements de ces paramètres. et la couleur des titres de sortie. la taille. Police du titre : Cette procédure permet de contrôler le style de police. certaines statistiques sont affichées seulement en format Large. Titre. Diagramme. ou créés dans le menu Insertion à l'aide de l'option Nouveau titre de page. ainsi que la longueur de page (exprimée en nombre de lignes). Dans certaines procédures. le tableau de résultats ne sera pas correctement aligné. Vous pouvez copier la syntaxe de commande à partir du journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser dans le système de production automatisé. Police du titre de la page : Cette procédure permet de contrôler tous les styles de police. Taille de page résultats texte : Cette procédure permet de contrôler la largeur de page dans la sortie de texte (exprimée en nombre de caractères). .

610 Chapitre 43 Figure 43-3 Onglet Viewer Afficher items résultats : Contrôle les éléments à afficher automatiquement à chaque exécution d'une procédure. . Police : Police utilisée pour le nouveau résultat. Vous pouvez contrôler l'affichage des éléments suivants : Journal.) Sauts de page entre : Insère des sauts de page entre les résultats à partir de différentes procédures et/ou entre des éléments de résultat individuels. Seules les polices à espacement fixe (monoespacées) sont disponibles car le résultat texte en séparation d'espace ne s'alignera pas correctement avec une police proportionnelle. Titre. Avertissement. Vous pouvez copier la syntaxe de commande à partir du journal et l'enregistrer dans un fichier de syntaxe pour l'utiliser dans le système de production automatisé. (La syntaxe de commande et la production automatique ne sont pas disponibles dans la version Student. et Résultats texte (résultats en séparation d'espace). Diagramme. Résultats en tableau (les tableaux pivotants sont convertis en sortie texte). Remarques. Vous pouvez également démarrer ou arrêter l'affichage des commandes dans le journal.

Ce format est utile pour copier et coller les résultats dans des traitements de texte dans lesquels vous pouvez utiliser n'importe quelle police (et pas uniquement des polices à espacement fixe) et définir les onglets permettant d'aligner le résultat correctement. spécifiez un nombre de caractères pour la largeur de la colonne. Remarque : Cependant. certaines statistiques sont affichées seulement en format Large. Les spécifications de largeur de colonne et de séparateur de colonne ne sont disponibles que si vous sélectionnez Espaces comme séparateur de colonne. Vous pouvez afficher les noms de variables et/ou les étiquettes de variable définies ainsi que les valeurs de données réelles et/ou les étiquettes valeur définies. Dans certaines procédures.611 Options Résultats en tableau : Contrôle les paramètres pour les résultats de tableaux pivotants convertis en résultat texte. Pour limiter la largeur des colonnes et insérer des sauts de ligne dans les longues étiquettes. Les variables descriptives et les étiquettes de valeurs (affichage des variables de l'éditeur de données. tous les sauts de lignes sont supprimés et chaque colonne a la largeur de la plus longue étiquette ou la valeur de la colonne par défaut. Les étiquettes longues peuvent cependant être gênantes dans certains tableaux. Pour les résultats avec séparation tabulaire. la sortie avec des tabulations de séparation ne s'alignera pas correctement dans le Viewer en mode brouillon. . Résultats texte : Pour des sorties texte autres que des résultats de tableaux pivotants convertis. Options Etiquettes Résultats Les options Etiquettes Résultats permettent de contrôler l'affichage des variables et les informations sur la valeur des données dans les tableaux de légende et les tableaux pivotants. contrôle la largeur de page (exprimée en nombre de caractères) et la longueur de page (exprimée en nombre de lignes). colonnes Etiquettes et Valeurs) facilitent souvent l'interprétation des résultats. sous forme de tableaux.

. Le résultat texte ne se trouve pas affecté par ces paramètres. Un résultat déjà affiché dans le Viewer n'est pas affecté par les changements de ces paramètres. Cette configuration n'affecte que le résultat du tableau pivotant.612 Chapitre 43 Figure 43-4 Onglet des options Etiquettes Résultats Les options Etiquettes Résultats affectent seulement le nouveau résultat produit après modification des paramètres. Un résultat déjà affiché dans le Viewer n'est pas affecté par les changements de ces paramètres.

Une valeur 1 donne un diagramme carré. Cliquez sur Parcourir pour sélectionner un fichier de modèle de diagramme. Les valeurs supérieures à 1donnent des diagrammes plus larges que hauts. Dès qu'un diagramme est créé.1 à 10. créez un diagramme avec les attributs que vous souhaitez et enregistrez-le comme modèle (choisissez l'option Enregistrer diagramme Modèle dans le menu Fichier). Les valeurs inférieures à 1 donnent des diagrammes plus hauts que larges. Vous pouvez spécifier un rapport largeur à hauteur de 0.613 Options Options de diagramme Figure 43-5 Onglet Diagrammes Modèle de diagramme : Les diagrammes peuvent utiliser soit les paramètres sélectionnés ici. Ratio d'aspect diagramme : Le rapport largeur à hauteur du cadre extérieur de nouveaux diagrammes. . Pour créer un fichier de modèle de diagramme. soit les paramètres provenant d'un fichier de modèle de diagramme. le ratio de son aspect peut être modifié.0.

Préférence de cycle de style : Les affectations initiales des couleurs et/ou motifs pour de nouveaux diagrammes. puis modifie le style des courbes. Pour modifier l'ordre d'utilisation des couleurs. et que vous sélectionnez Couleurs puis motifs dans la boîte de dialogue principale Options de diagramme. les deux premières couleurs de la liste des diagrammes regroupés sont utilisées comme couleurs des bâtons du nouveau diagramme. les styles de ligne. Vous pouvez changer l'ordre des couleurs et des motifs utilisés lors de la création d'un diagramme. Quadrillage : Permet de contrôler l'affichage des quadrillages de l'axe d'échelle et de l'axe des modalités des nouveaux diagrammes. procédez comme suit : . sous-menu Interactive). Cadre : Permet de contrôler l'affichage des cadres intérieurs et extérieurs des nouveaux diagrammes. L'option Motifs uniquement utilise seulement les styles de courbe. Données Couleurs des éléments : Précisez l'ordre dans lequel les couleurs doivent être utilisées pour les éléments de données (comme les bâtons et les marques) de votre nouveau diagramme.614 Chapitre 43 Police : Police utilisée pour tout le texte des nouveaux diagrammes. Elle n'utilise pas de couleur. Par exemple. si vous créez un diagramme en bâtons juxtaposés comprenant deux groupes. au besoin. L'option Couleurs uniquement utilise seulement les couleurs pour différencier les éléments de diagramme et n'utilise pas de motif. le symbole des marques ou ajoute un motif de remplissage. Cycles de style : Personnalise les couleurs. les symboles de marque et les motifs de remplissage pour les nouveaux diagrammes. les symboles des marques ou les motifs de remplissage pour différencier les éléments de diagramme. L'option Couleurs puis motifs utilise la palette par défaut de couleurs. Les couleurs sont utilisées dès que vous effectuez une sélection incluant l'option Couleur dans la zone de groupe Préférence de cycle de style de la boîte de dialogue principale Options de diagramme. Remarque : Ces paramètres n'ont pas d'effet sur les diagrammes interactifs (menu Graphes.

sélectionnez la modalité concernée. les deux premiers styles de la liste des diagrammes regroupés sont utilisés comme motifs des courbes du nouveau diagramme. sélectionnez la modalité concernée. procédez comme suit : E Sélectionnez Diagramme simple. si vous créez un diagramme curviligne comprenant deux groupes. Par exemple. Sinon. Pour modifier l'ordre d'utilisation des styles de courbe. supprimer une modalité sélectionnée . vous pouvez : „ „ „ „ „ insérer une nouvelle modalité avant la modalité sélectionnée . E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammes curvilignes avec modalités. paramétrer la séquence sur la valeur par défaut . Pour modifier le style de courbe d'une modalité. et que vous sélectionnez Motifs uniquement dans la boîte de dialogue principale Options de diagramme. déplacer une modalité sélectionnée . puis en cliquant sur Edition. Les styles de courbe sont utilisés si votre diagramme inclut des éléments de données de courbe et que vous effectuez une sélection incluant l'option Types dans la zone de groupe Préférence de cycle de style de la boîte de dialogue principale Options de diagramme.615 Options E Sélectionnez Diagramme simple. Pour modifier la couleur d'une modalité. . E Sélectionnez Diagramme regroupé pour modifier le cycle des couleurs des diagrammes avec modalités. Courbes des éléments de données Précisez l'ordre dans lequel les styles doivent être utilisés pour les éléments de données de la courbe de votre nouveau diagramme. puis sélectionnez un style de courbe utilisé pour les diagrammes curvilignes sans modalités. puis choisissez un style de courbe dans la palette. puis choisissez une couleur dans la palette. modifier une couleur en sélectionnant son puits. puis sélectionnez une couleur utilisée pour les diagrammes sans modalités.

paramétrer la séquence sur la valeur par défaut . E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammes avec modalités. supprimer une modalité sélectionnée . vous pouvez : „ „ „ „ insérer une nouvelle modalité avant la modalité sélectionnée . Sinon. Pour modifier l'ordre d'utilisation des marques. . supprimer une modalité sélectionnée . Marques des éléments de données Précisez l'ordre dans lequel les symboles doivent être utilisés pour les éléments de données des marques de votre nouveau diagramme. paramétrer la séquence sur la valeur par défaut . puis choisissez un symbole dans la palette. Les styles de marque sont utilisés si votre diagramme inclut des éléments de données de marque et que vous effectuez une sélection incluant l'option Types dans la zone de groupe Préférence de cycle de style de la boîte de dialogue principale Options de diagramme. déplacer une modalité sélectionnée .616 Chapitre 43 Sinon. puis sélectionnez un symbole de marque utilisé pour les diagrammes sans modalités. déplacer une modalité sélectionnée . et que vous sélectionnez Motifs uniquement dans la boîte de dialogue principale Options de diagramme. sélectionnez la modalité concernée. Par exemple. Pour modifier le symbole de marque d'une modalité. vous pouvez : „ „ „ „ insérer une nouvelle modalité avant la modalité sélectionnée . procédez comme suit : E Sélectionnez Diagramme simple. les deux premiers symboles de la liste des diagrammes regroupés sont utilisés comme marques du nouveau diagramme. si vous créez un diagramme de dispersion comprenant deux groupes.

déplacer une modalité sélectionnée . E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammes avec modalités. procédez comme suit : E Sélectionnez Diagramme simple. puis choisissez un motif de remplissage dans la palette. . les deux premiers styles de la liste des diagrammes regroupés sont utilisés comme motifs de remplissage des bâtons du nouveau diagramme. puis sélectionnez un motif de remplissage utilisé pour les diagrammes sans modalités. et que vous sélectionnez Motifs uniquement dans la boîte de dialogue principale Options de diagramme. Pour modifier le motif de remplissage d'une modalité. Les styles de remplissage sont utilisés si votre diagramme inclut des éléments de données de bâton et d'aire. vous pouvez : „ „ „ „ insérer une nouvelle modalité avant la modalité sélectionnée . sélectionnez la modalité concernée. Par exemple.617 Options Remplissages des éléments de données Précisez l'ordre dans lequel les styles de remplissage doivent être utilisés pour les éléments de données de bâton et d'aire de votre nouveau diagramme. et que vous effectuez une sélection incluant l'option Types dans la zone de groupe Préférence de cycle de style de la boîte de dialogue principale Options de diagramme. Sinon. si vous créez un diagramme en bâtons juxtaposés comprenant deux groupes. paramétrer la séquence sur la valeur par défaut . supprimer une modalité sélectionnée . Pour modifier l'ordre d'utilisation des styles de remplissage.

les options suivantes sont disponibles : AspectGraphique : Sélectionnez un modèle de graphiques dans la liste des fichiers et cliquez sur OK ou Appliquer. Vous pouvez utiliser l'un des modèles de graphiques fournis avec le programme. choisissez Modèles de graphiques dans le menu Format). Utilisez Parcourir pour ajouter des répertoires à la liste. la liste affiche les modèles de graphiques enregistrés dans le répertoire Looks du répertoire dans lequel le programme est installé. .618 Chapitre 43 Options diagrammes interactifs Figure 43-6 Onglet Interactif Pour des diagrammes interactifs (menus Graphes. sous-menu Interactive). „ „ Répertoire : Permet de sélectionner un répertoire de modèles de graphiques. ou vous pouvez créer le vôtre dans l'éditeur de graphiques interactifs (depuis un diagramme activé. Parcourir : Cette procédure permet de sélectionner un modèle de graphiques à partir d'un autre répertoire. Par défaut.

Résolution de l'impression : Contrôle la résolution d'impression de diagrammes interactifs. Cependant. la taille. si vous ouvrez un fichier Viewer enregistré dans une session précédente). Unités de mesure : Le système de mesure utilisé (Points. et la couleur de fond. le style de police. la couleur.619 Options Données enregistrées avec diagramme : Contrôle les informations enregistrées avec des diagrammes interactifs une fois que les diagrammes ne sont plus attachés au fichier données qui les a créés (par exemple. les diagrammes à basse résolution s'impriment plus rapidement et les diagrammes à haute résolution ont un meilleur aspect. . Dans le cas des bitmaps. particulièrement pour les fichiers données importants.0 : Pour des fichiers de données créés dans des versions précédentes de SPSS. Dans la plupart des cas. sous-menu Interactif). Les variables avec moins que le nombre spécifié de valeurs uniques sont classées comme qualitatives. y compris l'affichage et la largeur du quadrillage . Le modèle de tableau peut contrôler une variété d'attributs de tableaux pivotants. vous pouvez spécifier le nombre minimum de valeurs de données pour une variable numérique utilisée pour classer la variable comme échelle ou qualitative. Lecture des fichiers de données Pre-8. l'option Métafichier vecteur produira une impression plus rapide et offrira les meilleurs résultats. Enregistrer des données avec le diagramme vous permet d'exécuter la plupart des fonctions interactives disponibles pour les diagrammes attachés au fichier données qui les a créés (sauf d'ajouter des variables qui n'étaient pas incluses dans le diagramme original). Remarque : Ces paramètres n'affectent que les diagrammes interactifs (menu Graphes. ceci peut substantiellement augmenter la taille des fichiers Viewer. sans tenir compte du nombre de valeurs uniques. Pouces ou Centimètres) pour spécifier des attributs comme la taille de la région de données dans un diagramme. Toute variable avec des étiquettes de valeurs définies est classée comme qualitative. Options tableaux pivotants Les options de tableaux pivotants définissent le modèle de tableau par défaut utilisé pour de nouveaux résultats de tableaux pivotants.

choisissez Modèles de tableaux). Ajustement largeur de colonne pour : Cette procédure permet de contrôler l'ajustement automatique des largeurs de colonnes des tableaux pivotants. la liste affiche les modèles de tableau enregistrés dans le répertoire Looks dans lequel le programme est installé. Par défaut.620 Chapitre 43 Figure 43-7 onglet Tableaux pivotants Modèle de tableaux : Sélectionnez un modèle de tableau dans la liste des fichiers et cliquez sur OK ou sur Appliquer. „ „ Parcourir : Cette procédure permet de sélectionner un modèle de tableau à partir d'un autre répertoire. . Définir le répertoire des modèles de tableaux : Cette procédure permet de modifier le répertoire des modèles de tableau par défaut. Vous pouvez utiliser l'un des modèles de tableau SPSS ou en créer un dans l'éditeur de tableaux pivotants (dans le menu Format.

soit celle de l'étiquette colonne. Cela produit des tableaux plus compacts. Par défaut.621 Options „ Etiquettes seulement : Cette procédure permet d'ajuster la largeur de colonne par rapport à la largeur de l'étiquette colonne. mais les valeurs de données plus larges que l'étiquette ne seront pas affichés (des astérisques indiquent les valeurs trop larges pour être affichées). Mode de modification par défaut : Contrôle l'activation des tableaux pivotants dans la fenêtre du Viewer ou dans une fenêtre séparée. soit celle de la valeur des données. Vous pouvez choisir d'activer les tableaux pivotants dans une fenêtre séparée ou de sélectionner une définition de taille qui ouvrira de plus petits tableaux pivotants dans la fenêtre du Viewer et de plus grands tableaux pivotants dans une fenêtre séparée. le fait de double-cliquer sur un tableau pivotant active le tableau dans la fenêtre du Viewer. Cela produit des tableaux plus larges. mais garantit que toutes les valeurs seront affichées. . „ Etiquettes et données : Cette procédure permet d'ajuster la largeur de colonne par rapport à la plus grande largeur.

Il n'existe pas de format d'affichage par défaut pour les nouvelles variables chaînes. Pour les gros fichiers de données.622 Chapitre 43 Options de données Figure 43-8 Onglet Données Options de transformation et fusion : Chaque fois que SPSS exécute une commande. telle qu'une procédure statistique. sélectionner Calculer les valeurs avant leur utilisation pour retarder l'exécution et enregistrer le temps de traitement. et l'exécution de ces commandes peut être retardée jusqu'à ce que SPSS lise les données pour exécuter une autre commande. Si une valeur est trop grande pour le format d'affichage spécifié. Certaines transformations de données (telles que Calculer et Recoder) et certaines transformations de fichiers (telles que Ajouter Variables et Ajouter Observations) ne nécessitent pas de passe de données séparée. il lit le fichier de données. Afficher format nouvelles variables numériques : Cette procédure permet de contrôler la largeur d'affichage par défaut et le nombre de positions décimales par défaut des nouvelles variables numériques. les premières décimales sont arrondies et les valeurs sont ensuite .

Options monétaires (devises) Vous pouvez afficher jusqu'à cinq formats monétaires personnalisés (devises) qui peuvent comprendre des caractère spéciaux de préfixe et suffixe. Le paramétrage de l'intervalle automatique est basé sur l'année en cours. . Pour modifier un format monétaire personnalisé. CCD. Par exemple. l'année de fin est automatiquement déterminée en fonction de la valeur que vous entrez pour l'année de début. sélectionnez le nom du format à partir de la liste source et procédez aux modifications souhaitées. la valeur 123456. commençant 69 années avant et finissant 30 années après l'année en cours (ajouter l'année en cours donne un intervalle total de 100 années).10/28/86. et qui peuvent recevoir un traitement spécial pour les valeurs négatives. CCC. Vous ne pouvez pas modifier les noms de format ou en ajouter de nouveaux. 29-OCT-87).623 Options converties en notation scientifique Les formats d'affichage n'affectent pas les valeurs de données internes. mais la valeur originale non arrondie est utilisée pour tout calcul. Les cinq noms de format monétaire personnalisé sont CCA. CCB. et CCE.78 peut être arrondie à 123457 pour l'affichage. Pour un intervalle personnalisé. Définir siècle pour années sur 2 chiffres : Définit l'intervalle d'années pour les variables de format de date entrés et/ou affichés avec des années à deux chiffres (par exemple.

CCE). Création de formats monétaires personnalisés E Cliquez sur l'onglet Devise. et de séparateur décimal E Cliquez sur OK ou sur Appliquer. Vous ne pouvez saisir de valeur dans l'éditeur de données en utilisant des caractères monétaires personnalisés. CCD. suffixe. CCB. E Sélectionnez l'un des formats monétaires à partir de la liste (CCA. CCC. .624 Chapitre 43 Figure 43-9 Onglet Devise Les préfixes et suffixes définis pour les formats monétaires servent uniquement à l'affichage. E Saisissez les valeurs de préfixe.

y compris les fichiers autoscript. Procédures globales : Le fichier de procédure globale est une bibliothèque de sous-routines script et de fonctions script qui peuvent être nommées par fichier script. y compris la personnalisation des tableaux pivotants. . Nombre des scripts livrés avec SPSS utilisent des fonctions et des sous-routines de ce fichier de procédures globales et ne seront pas opérationnelles si vous spécifiez un fichier de procédures globales différent. Vous pouvez utiliser les scripts pour automatiser de nombreuses fonctions dans SPSS. Autoscripts : Un fichier d'autoscript est un recueil de sous routines script exécutées automatiquement chaque fois que vous lancez des procédures qui créent certains types d'objet de sortie.625 Options Options script Utilisez l'onglet Scripts pour spécifier le fichier de procédures globales et le fichier autoscript. et sélectionner les sous-routines d'autoscript à utiliser. Remarque : Le fichier de procédures globales livré avec SPSS est sélectionné par défaut.

626 Chapitre 43 Figure 43-10 Onglet Scripts Toutes les sous-routines du fichier courant autoscript sont affichées. les sous-routines individuelles. Vous pouvez aussi spécifier un fichier d'autoscript différent ou un fichier de procédure globale. ou non. Pour spécifier des options pour fichiers de procédures globales et autoscripts E Cliquez sur l'onglet Scripts. . E Sélectionnez les sous routines d'autoscript souhaitées. E Sélectionnez Permettre l'autoscript. ce qui vous permet d'autoriser.

Excel 4. E Cliquez sur Insérer item pour insérer un nouvel élément de menu. Ajouter des éléments de menu qui exécutent des fichiers de syntaxe de commande SPSS.. Ajouter des éléments de menu qui lancent d'autres applications et envoient automatiquement des données SPSS vers d'autres applications. et dBASE IV. SYLK. tabulé. double-cliquez sur le menu dans lequel vous voulez rajouter un nouvel élément. Avec l'éditeur de menu vous pouvez : „ „ „ 44 Chapitre Ajouter des éléments de menus qui exécutent des scripts SPSS personnalisés. Lotus 1-2-3 version 3. 627 . E Dans la boîte de dialogue Editeur de menu.Personnalisation des menus et des barres d'outils Editeur de menu Vous pouvez utiliser l'éditeur de menu pour personnaliser vos menus SPSS. sélectionnez : Outils Editeur de menu.. Pour ajouter des items aux menus E A partir du menu. E Sélectionnez l'élément de menu au-dessus de laquelle vous voulez qu'apparaisse la nouvelle option.0. SPSS peut envoyer des données vers d'autres applications dans les formats suivants : SPSS.

y compris les outils utilisés pour toutes les procédures des menus. Figure 44-1 Boîte de dialogue Editeur de menu Vous pouvez également ajouter des menus entièrement nouveaux et des séparateurs entre les éléments de menu. Les barres d'outils peuvent contenir tous les outils disponibles dans SPSS. Elles peuvent également contenir des outils personnalisés permettant de lancer d'autres applications. E Cliquez sur Parcourir pour sélectionner un fichier à attacher à l'élément de menu. fichier de syntaxe de commande ou application externe). Vous pouvez également envoyer automatiquement le contenu de l'éditeur de données vers une autre application lorsque vous sélectionnez cette application dans les menus SPSS. d'exécuter des fichiers de syntaxe de commande ou des fichiers de script. . Personnalisation des barres d'outils Vous pouvez personnaliser les barres d'outils SPSS et créer de nouvelles barres d'outils.628 Chapitre 44 E Sélectionnez le type de fichier du nouvel élément (fichier de script.

E Sélectionnez la barre d'outils que vous voulez personnaliser et cliquez sur Personnaliser. Les barres d'outils peuvent contenir tous les outils disponibles dans SPSS. d'exécuter des fichiers de syntaxe de commande ou des fichiers de script. y compris les outils utilisés pour toutes les procédures des menus. . Figure 44-2 Boîte de dialogue Montrer barres d'outils Pour personnaliser les barres d'outils E A partir du menu.. Elles peuvent également contenir des outils personnalisés permettant de lancer d'autres applications.629 Personnalisation des menus et des barres d'outils Montrer barres d'outils Utilisez Montrer barres d'outils pour afficher ou masquer les barres d'outils. les personnaliser et en créer de nouvelles.. ou cliquez sur Nouvelle barre d'outils pour créer une barre d'outils. sélectionnez : Affichage Barres d'outils.

qui peut aussi contenir des éléments de menu définis par l'utilisateur. Propriétés barre d'outils Utilisez Propriétés des barres d'outils pour sélectionner les types de fenêtres dans lesquelles vous voulez voir apparaître la barre d'outils sélectionnée. E Pour supprimer un outil dans une barre d'outils. E Cliquez sur Parcourir pour sélectionner un fichier ou une application à associer à l'outil. le faire glisser n'importe où en dehors de la barre d'outils affichée dans la boîte de dialogue. exécuter un fichier de syntaxe de commande ou exécuter un script : E Cliquez sur Nouvel outil dans la boîte de dialogue Personnaliser barre d'outils. exécuter un fichier de syntaxe de commande ou exécuter un script). indiquez le nom de la barre. Pour créer un outil personnalisé pour ouvrir un fichier. . Les nouveaux outils s'affichent dans la modalité définie par l'utilisateur. E Indiquez une étiquette décrivant l'outil. sélectionnez les fenêtres dans lesquelles vous voulez qu'elle apparaisse et cliquez sur Personnaliser. E Faites glisser et lâchez les outils que voulez inclure dans la barre d'outils affichée dans la boîte de dialogue. Cette boîte de dialogue sert aussi à créer des noms ou de nouvelles barres d'outils. E Sélectionnez un élément dans la liste Modalités pour afficher les outils disponibles dans cette modalité.630 Chapitre 44 E Pour les nouvelles barres d'outils. E Sélectionnez l'action que vous voulez affecter à l'outil (ouvrir un fichier.

puis sur Propriétés dans la boîte de dialogue Personnaliser barre d'outils. y compris les outils utilisés pour toutes les . Pour les nouvelles barres d'outils. indiquez aussi un nom de barre. E Pour les nouvelles barres d'outils.631 Personnalisation des menus et des barres d'outils Figure 44-3 Boîte de dialogue Propriétés barre d'outils Pour définir des propriétés des barres d'outils E A partir du menu.. cliquez sur Personnaliser. Personnaliser barre d'outils Utilisez la boîte de dialogue Personnaliser barre d'outils pour personnaliser les barres d'outils existantes et en créer de nouvelles. sélectionnez : Affichage Barres d'outils.. E Sélectionnez les types de fenêtres dans lesquelles vous voulez voir apparaître la barre d'outils. E Pour les barres d'outils existantes. Les barres d'outils peuvent contenir tous les outils disponibles dans SPSS. cliquez sur Nouvel outil.

d'exécuter des fichiers de syntaxe de commande et d'exécuter des fichiers de script. Figure 44-4 Boîte de dialogue Personnaliser barre d'outils Créer nouvel outil Utilisez la boîte de dialogue Créer nouvel outil pour créer des outils personnalisés permettant de lancer d'autres applications. Elles peuvent également contenir des outils personnalisés permettant de lancer d'autres applications. d'exécuter des fichiers de syntaxe de commande ou des fichiers de script.632 Chapitre 44 procédures des menus. .

Cela est tout particulièrement utile pour les outils personnalisés créés pour exécuter des scripts.633 Personnalisation des menus et des barres d'outils Figure 44-5 Boîte de dialogue Créer nouvel outil Editeur bitmap de barre d'outils Utilisez l'éditeur BMP pour créer des icônes personnalisées pour les boutons des barres d'outils. . de la syntaxe et d'autres applications.

E Utilisez la boîte à outils et la palette de couleurs pour modifier l'image bitmap ou créer une nouvelle icône bitmap. E Cliquez sur Modifier outil. .. E Cliquez sur l'outil avec l'icône bitmap que vous voulez modifier dans l'exemple de barre d'outils.634 Chapitre 44 Figure 44-6 Editeur BMP Pour modifier les images bitmap de la barre d'outils E A partir du menu. sélectionnez : Affichage Barres d'outils. E Sélectionnez la barre d'outils à personnaliser et cliquez sur Personnaliser..

Après que vous avez créé des fichiers de syntaxe et que vous les avez intégrés dans une tâche de production. SPSS fonctionne seul et prend fin après avoir exécuté la dernière commande. ce qui vous permet d'exécuter d'autres tâches pendant qu'il fonctionne. Un fichier de syntaxe de commande est un fichier texte simple contenant une syntaxe de commande. vous pouvez les afficher et les modifier à partir du système de production. Vous pouvez également générer une syntaxe de commande en collant les sélections de la boîte de dialogue dans une fenêtre de syntaxe ou en modifiant le fichier-journal. Le mode Production est utile si vous exécutez souvent le même ensemble d'analyses longues.Système de production 45 Chapitre Le Système de Production permet d'exécuter SPSS en mode automatisé. Vous pouvez utiliser n'importe quel éditeur de texte pour créer ce fichier. 635 . Le Système de Production utilise des fichiers de syntaxe de commande pour indiquer au programme la marche à suivre. telles que des rapports hebdomadaires.

spp crée un fichier de résultats intitulé prodjob.spo. E Indiquez les fichiers de syntaxe que vous souhaitez utiliser dans la tâche de . Le Viewer en mode brouillon produit les résultats texte et des fichiers images (metafiles ou métafichiers) des graphiques. Utilisation de l'Utilitaire de Production E Créez un fichier de syntaxe de commande. à l'inverse des graphiques.spo. Type de résultat : Les sorties du Viewer sont sous forme de tableaux pivotants et de graphiques haute résolution et interactifs. un fichier de tâche de production intitulé prodjob. Les résultats texte peuvent être modifiés dans le Viewer en mode brouillon. Le fichier de résultats est un document du Viewer. disponible dans le menu Démarrage. E Démarrez le Système de production. Par exemple.636 Chapitre 45 Figure 45-1 Système de production Résultats de la tâche de production : Chaque séquence de production crée un fichier de résultats portant le même nom que la tâche de production et l'extension .

Les lignes suites doivent être en retrait d'un espace au moins. nous vous recommandons d'utiliser des noms de chemin UNC (Universal Naming Convention = convention de dénomination universelle) pour spécifier l'emplacement des fichiers de données dans vos fichiers de commande. Cliquez sur le bouton Exécuter de la barre d'outils ou choisissez dans les menus : Exécuter Tâche de production Règles de syntaxe pour le système de production SPSS Les règles de syntaxe des fichiers de syntaxe de commande utilisés dans le système de production SPSS sont les mêmes que les règles pour les fichiers Inclure de SPSS : „ „ „ Chaque commande doit commencer sur la première colonne d'une nouvelle ligne. Si vous disposez d'un accès réseau à la version pour serveur distant de SPSS.637 Système de production production. et non par rapport à votre ordinateur local. Si vous générez de la syntaxe de commande en collant les choix d'une boîte de dialogue dans une fenêtre de syntaxe. Le point à la fin de la commande est optionnel. comme dans l'exemple suivant : GET FILE = '\\hqdev01\public\juillet\ventes. Cliquez sur Ajouter pour sélectionner les fichiers de syntaxe. E Enregistrer le fichier de Tâche de production. Noms de chemin UNC : Les spécifications de chemins relatifs pour des fichiers de données sont relatifs par rapport au serveur utilisé en mode d'analyse distribuée. le format des commandes convient au système de production SPSS. . E Exécutez le fichier de Tâche de production.sav'.

638 Chapitre 45 Figure 45-2 Syntaxe de commande collée à partir des sélections d'une boîte de dialogue Options d'exportation Les options d'exportation permettent d'enregistrer les tableaux pivotants SPSS et les éléments texte au format HTML. . et d'enregistrer des diagrammes sous divers formats communément utilisés par d'autres applications. Word/RTF et Excel. texte.

Pour les documents HTML et texte. „ Pour les formats HTML et texte.639 Système de production Figure 45-3 Boîte de dialogue Options d'exportation Exporter Cette liste déroulante indique les éléments que vous souhaitez exporter. PostScript encapsulé (EPS). les diagrammes sont toujours exportés au format métafichier Windows. et vous devez exporter les tableaux sous un format adapté pour permettre leur intégration dans des documents HTML. Graphiques uniquement : N'exporte que les graphiques. Pour le format document texte. les diagrammes sont exportés au format métafichier Windows et incorporés dans le document Word. une ligne est insérée dans le fichier texte pour chaque diagramme. Les diagrammes ne sont pas inclus dans les documents Excel. „ „ Document Résultat (sans Graphiques) : Exporte les tableaux pivotants et les résultats texte. Pour le format document HTML. Les diagrammes du Viewer sont ignorés. Pour le format Word/RTF. résultat texte et diagrammes. les diagrammes sont exportés dans le format d'exportation du diagramme sélectionné. JPEG. Document résultat : Exporte toute combinaison de tableaux pivotants. indiquant le nom de fichier du diagramme exporté. Pour les documents Word/RTF. bitmap Windows (BMP). les tableaux sont intégrés par référence. les formats d'exportation sont les suivants : métafichier Windows (WMF). . TIFF. PNG ou PICT Macintosh.

styles de police. PNG ou PICT Macintosh. etc. Pour Graphiques Seulement.spp exporte des diagrammes au format métafichier Windows. TIFF. Chaque ligne du résultat texte est une ligne dans le fichier Excel. PostScript encapsulé (EPS). les options disponibles sont HTML. styles de police. colonnes et cellules Excel. Tous les résultats texte sont exportés en format avec espaces.txt) : Les tableaux pivotants peuvent être exportés en format tabulé ou avec espaces. et l'extension du format choisi. Une police à espacement fixe est nécessaire pour le bon alignement des résultats texte séparés par des espaces. Fichier texte (*. prodjob3. texte. Si la tâche de production prodjob.). Le résultat texte est exporté en tant que fichier RTF. avec tous les attributs de formatage (bordures de cellule. „ Fichier Word/RTF (*. couleurs d'arrière-plan. Pour les documents de résultat.wmf. couleurs d'arrière-plan. pour les formats HTML et texte. les noms des diagrammes seraient prodjob1.doc) : Les tableaux pivotants sont exportés comme des tableaux Word avec tous les attributs de formatage (bordures de cellule. et ainsi de suite. les diagrammes sont exportés au format du diagramme sélectionné. etc. JPEG.wmf.xls) : Les lignes.wmf. sélectionnez un format d'exportation de graphiques dans la liste déroulante. . Les noms des diagrammes exportés comprennent le nom de fichier de la tâche de production. Fichier Excel (*. CGM. bitmap Windows (BMP). avec le contenu de toute la ligne dans une seule cellule.htm) : Les tableaux pivotants sont exportés comme des tableaux HTML.640 Chapitre 45 Format d'exportation Pour les documents de résultat. prodjob2. un numéro séquentiel. colonnes et cellules des tableaux pivotants sont exportées comme des lignes. Word/RTF et Excel . Les diagrammes peuvent être exportés aux formats suivants : métafichier Windows (WMF). les tableaux pivotants et le texte sont exportés de la façon suivante : „ „ „ Fichier HTML (*. Le résultat texte est exporté avec tous les attributs de police. Format d'image L'option Format d'image contrôle le format d'exportation des diagrammes. Le résultat texte dans SPSS apparaît toujours dans une police à espacement fixe et est exporté avec les mêmes attributs de police. Les résultats texte sont publiés au format HTML pré-formaté.).

par exemple) et les options d'exportation de diagrammes (paramètres des couleurs. Invites utilisateur Les symboles de macro définis dans un fichier de tâche de production et utilisés dans un fichier de syntaxe de commande simplifient les tâches comme l'exécution de la même analyse pour différents fichiers de données ou l'exécution du même ensemble de commandes pour différents ensembles de variables.641 Système de production Options de texte et d'image Les options d'exportation de texte (séparé par des tabulations ou par des espaces. taille et résolution. . utilisez l'option Exporter du menu Fichier de SPSS. Exportation du Viewer en mode brouillon La seule option d'exportation disponible pour les résultats du Viewer en mode brouillon consiste à exporter les résultats en texte simple. Pour modifier les options d'exportation de texte et de diagrammes. par exemple) sont définies dans SPSS et ne peuvent pas être modifiées dans le système de production. Les diagrammes ne peuvent être exportés par le Viewer en mode brouillon. Vous pouvez par exemple définir les symboles de macro @datfile pour que le système vous demande un nom de fichier de données chaque fois que vous exécutez une tâche de production qui utilise la chaîne @datfile au lieu d'un nom de fichier.

Vous pouvez par exemple utiliser la phrase « Quel fichier de données souhaitez-vous utiliser ? » pour identifier un champ qui exige un nom de fichier de données. . Le nom du symbole de macro doit commencer par un @. Sinon.642 Chapitre 45 Figure 45-4 Boîte de dialogue Invites utilisateur Symbole de macro : Nom de macro utilisé dans le fichier de syntaxe de commande pour appeler la macro qui demande à l'utilisateur de saisir des informations. Par exemple. laissez le champ vide ou tapez N ou Non. Vous pouvez remplacer ou modifier cette valeur pendant l'exécution. Invite : Etiquette descriptive qui s'affiche lorsque la tâche de production vous demande de saisir des informations. Défaut : Valeur que la tâche de production donne par défaut si vous ne tapez pas une valeur différente. Mettre la valeur entre guillemets : Tapez O ou Oui si vous souhaitez que la valeur soit mise entre guillemets. Cette valeur s'affiche lorsque la tâche de production vous demande cette information. vous devez entrer Oui pour les spécifications de nom de fichier car les spécifications de ce type doivent être placées entre guillemets.

643 Système de production Figure 45-5 Invites de macro dans un fichier de syntaxe de commande Sollicitation de macros de production Le système de production SPSS vous demande des valeurs chaque fois que vous exécutez une tâche de production qui contient des symboles de macro définis. SPSS remplace alors ces valeurs par les symboles de macro dans tous les fichiers de syntaxe de commande associés à la tâche de production. . Vous pouvez remplacer ou modifier les valeurs par défaut affichées.

SPSS et les résultats qu'il génère au fur et à mesure de l'exécution de la tâche. Si vous ne fournissez pas ces informations.644 Chapitre 45 Figure 45-6 Boîte de dialogue Sollicitation de macros de production Options de production Les options de production vous permettent de : „ Spécifier un éditeur de texte par défaut pour les fichiers de syntaxe auxquels on a accédé par le bouton de modification de la boîte de dialogue principale. Vous ne pouvez sélectionner que les serveurs distants que vous avez précédemment définis dans la boîte de dialogue d'ajout de serveur de SPSS (menu Fichier. Ajouter). Changer serveur. un ID utilisateur ainsi qu'un mot de passe pour l'analyse distribuée (applicable uniquement si vous disposez d'un accès réseau à la version serveur de SPSS). les paramètres par défaut de la boîte de dialogue de connexion au serveur de SPSS seront utilisés. . „ Exécuter la tâche de production comme une opération de fond invisible ou afficher „ Définir un serveur distant. un nom de domaine.

sélectionnez Redimensionner largeur de tableau pour l'ajuster à la page dans l'onglet Général. Pour éviter la division de tableaux larges sur plusieurs pages. et les bordures..645 Système de production Figure 45-7 Options Modification des options de production Dans les menus du Système de production choisissez Affichage Options. Contrôle du format des tâches de production Plusieurs paramètres de SPSS peuvent vous aider à choisir le meilleur format pour les tableaux pivotants créés dans les tâches de production : Aspects de tableaux : En modifiant et en enregistrant Aspects de tableaux (menu Format dans un tableau pivotant actif) vous pouvez contrôler de nombreux attributs de tableaux pivotants.. option Propriétés du tableau. . Vous pouvez spécifier les tailles et styles de polices. les couleurs.

mais vous pouvez également utiliser les commandes SET dans vos fichiers de syntaxe pour les contrôler. mais garantit que toutes les valeurs seront affichées.. mais les valeurs de données plus larges que l'étiquette ne seront pas affichés (des astérisques indiquent les valeurs trop larges pour être affichées). Les étiquettes de variable et de valeur.646 Chapitre 45 Etiquettes de résultats : Les options Etiquettes de résultats (Menu Edition. sélectionnez : Format Aspects de tableaux. permettent souvent d'interpréter plus facilement vos résultats. Le recours aux commandes SET dans les fichiers de syntaxe vous permet d'utiliser plusieurs paramètres Modèles de tableaux et Options dans la même tâche. „ L'option Etiquettes seulement ajuste la largeur d'une colonne à celle de l'étiquette de colonne. Vous pouvez définir les paramètres dans Modèles de tableaux et Options avant de lancer votre tâche de production. . Vous pouvez afficher des noms de variables et/ou des étiquettes de variable définies. plus descriptives. de longues étiquettes peuvent parfois paraître étranges dans certains tableaux. des valeurs de données réelles et/ou des étiquettes de valeurs définies. onglet Etiquettes Résultats) contrôlent l'affichage des informations relatives aux variables et aux valeurs de données dans les tableaux pivotants. onglet Tableaux pivotants) contrôlent les modèles de tableaux par défaut et l'ajustement automatique des largeurs de colonnes dans les tableaux pivotants. Options. Création d'un modèle de tableau par défaut personnalisé E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau).. Largeur de colonne : Les options Tableaux pivotants (menu Edition. de l'étiquette ou de la valeur de donnée. L'option Etiquettes et données ajuste la largeur d'une colonne à l'élément le plus large de la colonne. Cela produit des tableaux plus compacts. „ Les tâches de production utilisent les paramètres en vigueur définis sous Modèle de tableau et Options. E Définissez les propriétés du tableau selon les attributs voulus. Toutefois. Cela produit des tableaux plus larges. E Sélectionnez un modèle de tableau dans la liste et cliquez sur Modifier modèle. E A partir du menu. Options.

Lorsque vous exécutez une tâche de production.. et l'ajustement automatique de la largeur des colonnes avec Options. . SET TVARS : Contrôle l'affichage des noms et des étiquettes de variable dans les nouveaux tableaux pivotants. E Cliquez sur l'onglet Tableaux pivotants. les paramètres des options en vigueur lors de la dernière exécution du programme sont appliqués à la tâche de production. Définition des options pour les tâches de production E A partir du menu. E Sélectionnez le modèle de tableau dans la liste et cliquez sur OK..647 Système de production E Cliquez sur Enregistrer aspect ou Enregistrer sous pour enregistrer le modèle de tableau et cliquez sur OK. sélectionnez : Affichage Options E Sélectionnez les options souhaitées. sélectionnez : Affichage Options. Les paramètres définis sous Options sont enregistrés avec le programme. E A partir du menu. Vous pouvez définir le modèle de tableau par défaut.tlo'. les paramètres des étiquettes de résultats. comme dans : „ SET TLOOK = 'c:\prodjobs\montableau. Contrôle du format des tableaux pivotants avec la syntaxe de commande SET TLOOK : Contrôle le modèle de tableau par défaut pour les nouveaux tableaux pivotants. „ SET TVARS = LABELS fait apparaître les étiquettes de variable. E Cliquez sur OK.

SET ONUMBER : Contrôle l'affichage des valeurs de données ou des étiquettes de valeurs dans les nouveaux tableaux pivotants. „ „ „ SET ONUMBER = LABELS fait apparaître les étiquettes de valeurs. SET TFIT : Contrôle l'ajustement automatique de la largeur des colonnes pour les nouveaux tableaux pivotants. SET TFIT = BOTH ajuste la largeur des colonnes à la largeur des étiquettes ou à la plus grande valeur de données. Si la tâche de production contient des invites utilisateur. SET TVARS = BOTH fait apparaître les noms et les étiquettes de variable. SET ONUMBER = BOTH fait apparaître les valeurs de données et les étiquettes de valeurs.648 Chapitre 45 „ „ SET TVARS = NAMES fait apparaître les noms de variable. „ „ SET TFIT = LABELS ajuste la largeur des colonnes en fonction de la largeur des étiquettes de colonne. SET ONUMBER = VALUES fait apparaître les valeurs de données. Les valeurs par défaut des invites utilisateur sont automatiquement utilisées. le chiffre retenu étant le plus grand des deux. Vous pouvez exécuter des tâches de Production à partir d'une ligne de commande à l'aide des boutons suivants : -r : Exécute la tâche de production. et supprime les éventuels messages ou invites utilisateur. . -s : Exécute la tâche de production. Exécution de tâches de production à partir d'une ligne de commande Les boutons de la ligne de commande vous permettent de programmer l'heure d'exécution des tâches de production grâce aux utilitaires de programmation comme celui disponible dans Microsoft Plus!. vous devez fournir l'information demandée pour que la tâche de production puisse s'exécuter.

-u : ID utilisateur pour l'accès au serveur distant. indiquez des chaînes vides entre guillemets pour tous les commutateurs de ligne de commande de l'analyse distribuée. -n. -p : Mot de passe pour l'accès au serveur distant.spp" -s -r Pour les commutateurs de ligne de commande nécessitant des spécifications supplémentaires. le serveur par défaut et les informations associées (si vous ne les avez pas spécifiés dans les paramètres de ligne de commande) correspondent au serveur par défaut défini dans la boîte de dialogue de connexion au serveur de SPSS. comme dans l'exemple suivant : "c:\program files\spss\spssprod. Vous devez indiquer le chemin complet aussi bien pour le système de production (spssprod. vous devez tous les indiquer (-x. indiquez la valeur entre guillemets ou entre apostrophes. -d : Nom de domaine.649 Système de production Analyse distribuée : Si vous disposez d'un accès réseau à la version serveur de SPSS. -n : Numéro du port.exe) que pour la tâche de production. comme dans l'exemple suivant : "c:\program files\spss\spssprod. -u et -p). Si aucun serveur par défaut n'est défini dans cette boîte de dialogue. Si vous spécifiez l'un de ces paramètres de ligne de commande pour l'analyse distribuée. -d.exe" "c:\spss\datajobs\prodjob. Si la spécification comporte des espaces (par exemple. vous pouvez également utiliser les commutateurs suivants pour exécuter le système de production en mode d'analyse distribuée : -x : Nom ou adresse IP du serveur distant. et les deux doivent être mis entre guillemets.exe" "c:\spss\datajobs\prodjob.spp" -x="" -n="" -d="" -u="" -p="" . comme dans l'exemple suivant : -x="HAL 9000" -u="nom secret" Serveur par défaut : Si vous disposez d'un accès réseau à la version serveur de SPSS. vous devez les faire suivre du signe égal (=) immédiatement avant la spécification. dans un nom de serveur en deux mots). Si vous souhaitez exécuter une tâche de production en mode local mais que votre ordinateur local n'est pas votre serveur par défaut. la tâche s'exécute en mode local.

Tableaux uniquement : Exclut les graphiques. Document résultat (sans Notes) : Publie tout sauf les tableaux Notes produits automatiquement pour chaque procédure. (La plupart des navigateurs utilisent par défaut une police à espacement fixe pour le texte préformaté. Rien : Désactive la publication sur le Web.650 Chapitre 45 Publication sur le Web La fonction Publier sur le Web exporte les résultats à publier vers le serveur Web SmartViewer. fichiers HTML) spécifiés dans la tâche de production. Statique : Les tableaux sont statiques et ne peuvent pas être manipulés après publication. à moins que vous ne sélectionniez l'option Rien. les résultats seront publiés à chaque fois vous que exécuterez la tâche de production. Tous les tableaux pivotants et tableaux de texte sont publiés. y compris les éléments masqués ou réduits.spp). Du fait que tous les paramètres sont enregistrés avec la tâche de production (fichier . Graphiques uniquement : Publie uniquement les graphiques du document. Les tableaux et rapports publiés dans SmartViewer peuvent être visualisés et manipulés via le Web. .). Publier tableaux en tant que : Contrôle la manière dont les tableaux pivotants sont publiés : „ „ Interactif : Les tableaux sont des objets dynamiques pouvant être manipulés via le Web afin d'obtenir différents affichages des données. en temps réel et à l'aide d'un navigateur standard. Tableaux uniquement (sans Notes) : Exclut les graphiques et les tableaux Notes. Les diagrammes sont publiés sous forme de fichiers graphiques JPEG ou PNG. Les résultats texte sont publiés sous forme de HTML pré-formaté. Celle-ci désactive la publication tout en générant d'autres types de résultats (fichiers du Viewer. Publier : Permet de spécifier le résultat à publier : „ „ „ „ „ „ Document résultat : Publie la totalité du document de résultat. „ „ „ Les tableaux pivotants sont publiés comme des tableaux dynamiques pouvant être manipulés via le Web afin d'obtenir différents affichages des données.

Si SmartViewer n'est pas disponible sur votre site. Contactez votre administrateur système ou Webmaster pour plus d'informations.651 Système de production Configurer : Ouvre la page Configurer la publication automatique du serveur Web SmartViewer dans une fenêtre de navigateur. . Contactez votre administrateur système ou Webmaster pour obtenir des instructions sur le téléchargement du plug-in. Remarque : La fonction Publier sur le Web est disponible uniquement avec les sites où le serveur Web SmartViewer est installé et elle nécessite un plug-in pour activer la fonction de publication. Ces informations sont stockées dans la tâche de production dans un format codé. vous devez entrer votre ID utilisateur et votre mot de passe. Connexion au serveur Web SmartViewer La publication sur le serveur Web SmartViewer nécessite un nom d'utilisateur (ID utilisateur) et un mot de passe valides. utilisez l'option Exporter le résultat pour enregistrer le résultat au format HTML. Lorsque vous créez une tâche de production à publier sur le Web. Cette procédure est requise pour la création d'une tâche de production à publier sur le Web. Une ID utilisateur et un mot de passe vous sont également demandés pour accéder au serveur Web SmartViewer.

.

l'ouverture et l'enregistrement des fichiers de données. 653 . Exécution d'un script E A partir du menu. Un certain nombre de scripts figure dans le logiciel. Vous pouvez utiliser ces scripts comme ils se présentent ou les adapter à vos besoins. l'exécution des transformations de données et des procédures statistiques à l'aide de la syntaxe de commande SPSS. Si vous souhaitez créer vos propres scripts..Utilitaire de script SPSS 46 Chapitre L'utilitaire de script vous permet d'automatiser certaines tâches. l'affichage et la manipulation de boîtes de dialogue. vous pouvez d'abord en choisir un parmi les nombreux Assistants script. notamment les scripts automatiques qui s'exécutent automatiquement à chaque fois qu'un type de résultat est produit. sélectionnez : Outils Exécuter le script.. telles que : „ „ „ „ „ le résultat personnalisé et automatique dans le Viewer. l'exportation des diagrammes sous forme de fichiers graphiques dans de nombreux formats.

Le document doit être ouvert dans la fenêtre correspondante du Viewer avant l'exécution du script. page 627. Clean navigator. Modifier la signification de p : Changez Sig. Pour plus d'informations.sbs (effacer le Navigateur) : Supprime tous les tableaux de remarques d'un document de résultat. Scripts livrés avec SPSS Les scripts suivants sont livrés avec le programme : Analyser les observations restantes : Répète une Analyse factorielle ou une Analyse discriminante à l'aide des observations qui n'ont pas été sélectionnées dans une analyse précédente. Il faut choisir le tableau avant d'exécuter le script. Un tableau de Remarques produit par la précédente exécution de l'analyse factorielle ou discriminante doit être sélectionné avant d'exécuter le script. E Sélectionnez le script de votre choix. . reportez-vous à « Personnalisation des menus et des barres d'outils » dans Chapitre 44 .654 Chapitre 46 Figure 46-1 Boîte de dialogue Exécuter le script E Sélectionnez le dossier Scripts. en p= dans les étiquettes de colonnes de n'importe quel tableau pivotant.

.sbs (état des moyennes) : Extrait les informations du tableau des moyennes et écrit les résultats dans plusieurs fichiers de résultat ASCII. Means report. colonnes ou strates de données indiquées comme étant un Total dans le tableau pivotant. Il faut choisir le tableau avant d'exécuter le script.sbs (retirer les étiquettes) : Supprime toutes les étiquettes de colonnes ou de lignes dans un tableau pivotant sélectionné. Remove labels. Le tableau de statistiques de fréquences doit être sélectionné avant l'exécution du script. Make totals bold. Le tableau des moyennes doit être sélectionné avant d'exécuter le script. . Rerun syntax from note. reportez-vous à « Options » dans Chapitre 43 .655 Utilitaire de script SPSS Fréquences en bas de page : Insère les statistiques affichées dans un tableau statistique de fréquences sous forme de notes de bas de page dans le tableau de fréquences correspondant pour chaque variable. appliquez le format Gras et la couleur Bleue à la ligne correspondant au modèle qui maximise les R-deux ajustés. R-deux max : Dans le tableau récapitulatif des modèles de régression. Par exemple. page 605. Le tableau récapitulatif des modèles doit être sélectionné avant l'exécution du script. Il faut choisir le tableau avant d'exécuter le script.sbs (réexécuter la syntaxe à partir des remarques) : Exécute à nouveau la commande trouvée dans le tableau de remarques sélectionné avec le fichier de données actif. Si aucun fichier n'est ouvert.. Autoscripts Les scripts automatiques s'exécutent automatiquement lorsqu'ils sont déclenchés à la création d'une partie de résultat particulière par une procédure donnée. le script tente de lire le fichier de données utilisé initialement.sbs (totaux en gras) : Applique l'attribut Gras et la couleur Bleue à toutes les lignes. Pour plus d'informations.. Remarque : cette liste n'est pas exhaustive. SPSS contient un autoscript qui supprime automatiquement la diagonale supérieure et met en surbrillance les coefficients de corrélation négligeables à chaque fois qu'un tableau de corrélations est produit par la procédure Corrélation Bivariée. Le tableau des remarques doit être sélectionné avant l'exécution du script.

produit à la fois un tableau de fréquences et un tableau de statistiques. vous pouvez utiliser un autoscript distinct pour chaque type de résultat produit par la même procédure. Un autoscript qui formate les tableaux ANOVA produit par une analyse ANOVA à un facteur n'est pas déclenché par des tableaux ANOVA produits par d'autres types de procédure statistiques (mais vous pourriez utiliser des procédures générales pour créer des scripts automatiques distincts pour les tableaux ANOVA qui partagent un code très similaire). Pour plus d'informations. . Figure 46-2 Onglet Scripts de la boîte de dialogue Options Les scripts automatiques sont spécifiques à une procédure et à un type de résultat donnés. Cependant. Fréquences.656 Chapitre 46 L'onglet Scripts de la boîte de dialogue Options (menu Edition) affiche les scripts automatiques (Autoscripts) disponibles sur votre système et vous permet d'activer ou de désactiver différents scripts. chacune pouvant avoir son propre autoscript. par exemple. reportez-vous à « Options » dans Chapitre 43 . page 605.

Par exemple. vous pouvez d'abord en choisir un parmi les nombreux Assistants scripts. Figure 46-3 Modifier un script dans la fenêtre de script Si vous préférez créer vos propres scripts. l'un des scripts permet de supprimer tous les tableaux de remarques dans le document de résultat choisi. Vous pouvez facilement modifier ce script pour supprimer les éléments de résultat de n'importe quel type et d'étiquette. .657 Utilitaire de script SPSS Création et modification de scripts Vous pouvez adapter à vos besoins la plupart des scripts livrés avec le logiciel.

. E Sélectionnez le script de votre choix. un navigateur d'objets.658 Chapitre 46 Modification d'un script E A partir du menu. des fonctions de mise au point et une aide contextuelle. Si vous ouvrez plusieurs scripts.. chacun d'eux dispose de sa propre fenêtre. Figure 46-4 Ouvrir un fichier de script E Sélectionnez le dossier Scripts.sbs). E Dans Type. sélectionnez Script SPSS (*. . sélectionnez : Fichier Ouvrir Script. Fenêtre de script La fenêtre de script est un environnement de programmation complet qui utilise le langage Sax BASIC et inclut un éditeur de boîte de dialogue.

le nom de la procédure s'affiche en haut de la fenêtre. cliquez sur ces termes et appuyez sur F1. Les termes en magenta sont des objets SPSS. (Il est inutile de cliquer sur le nom d'un objet dans un commentaire : l'aide qui apparaît concerne le langage Sax BASIC et non les objets SPSS. Pour accéder à l'Aide contextuelle relative à ces termes. Vous pouvez également cliquer sur ces termes et sur F1 pour accéder à l'Aide. Les termes en bleu sont des mots réservés au BASIC (tels que Sub. End Sub et Dim).659 Utilitaire de script SPSS Figure 46-5 Fenêtre de script „ „ Lorsque vous déplacez le curseur. mais uniquement lorsqu'ils apparaissent en magenta et dans des instructions correctes. des propriétés ou des méthodes.) „ .

les termes Sax BASIC sont en bleu et les noms des objets. .660 Chapitre 46 „ „ Les commentaires sont affichés en vert. sont en magenta. propriétés et méthodes valides. Pour définir les propriétés de l'éditeur de script E A partir du menu. sélectionner l'élément et une couleur dans la palette déroulante. Par défaut. Propriétés de l'éditeur de script (fenêtre de script) Les éléments de code dans la fenêtre de script répondent à un code couleur qui permet de les distinguer plus facilement. Cliquez sur F2 pour afficher le navigateur d'objets qui affiche les objets SPSS. les commentaires sont en vert. sélectionnez : Script Propriétés de l'éditeur… Figure 46-6 Boîte de dialogue Propriétés Editeur E Pour modifier la couleur d'un type d'élément de code. Vous pouvez indiquer des couleurs différentes pour ces éléments et changer la taille et la police de tout le texte. les propriétés et les méthodes.

l'option Masquer les lignes et colonnes vides doit être sélectionnée dans la boîte de dialogue Propriétés de Tableau. de colonnes ou de strates. Note de bas de page : Reformate les notes de bas de page d'un tableau pivotant. Supprimer par étiquette : Supprime des lignes ou des colonnes dans un tableau pivotant en fonction du contenu de RowLabels ou ColumnLabels. Supprimer les items du Navigateur : Supprime les éléments du Viewer en fonction d'un certain nombre de critères. Reformate par valeur : Reformate un tableau pivotant en fonction de la valeur de cellules de données ou d'une combinaison de cellules et d'étiquettes. Pour que ce script fonctionne. modifie le texte dans une note de bas de page ou ajoute une note de bas de page. . Reformate par étiquettes : Reformate un tableau pivotant en fonction des étiquettes de lignes.661 Utilitaire de script SPSS L'Assistant script Lorsque vous créez un nouveau script. Figure 46-7 Boîte de dialogue Utiliser l'Assistant script Chaque Assistant script fournit un code pour une ou plusieurs procédures classiques ainsi que certaines astuces sur la personnalisation du script. vous pouvez tout d'abord choisir un certain nombre d'Assistants script.

E Si vous ne souhaitez pas utiliser d'assistant. Par exemple. même s'il est plus complexe à personnaliser. Vous pouvez également utiliser n'importe quel autre script disponible comme Assistant Script. cliquez sur Annuler. Cliquez sur le bouton droit de la souris ou utilisez le menu Outils pour créer un nouveau autoscript déclenché à chaque fois que ce type de tableau est produit. un texte de coin ou une légende.662 Chapitre 46 Reformate un tableau pivotant divers : Reformate ou modifie le texte dans un titre de tableau pivotant. . Ouvrez simplement le script et enregistrez-le sous un nom différent. sélectionnez : Nouveau Script… E Sélectionnez un Assistant script si vous souhaitez commencer par là. sélectionnez un objet du résultat qui servira de déclencheur. créez un tableau de fréquences selon la procédure habituelle et cliquez sur le tableau dans le Viewer pour le sélectionner. Création de scripts automatiques Pour créer un autoscript. pour créer un autoscript qui s'exécute à chaque fois qu'un tableau de fréquences est produit. Création d'un script E A partir du menu.

Le nom de la procédure renvoie à l'événement qui sert de déclencheur. Figure 46-9 Procédure de Nouveau autoscript affiché dans la fenêtre de script . le nom de la sous-routine d'autoscript est Explore_Table_Descriptives_Create. Par exemple.663 Utilitaire de script SPSS Figure 46-8 Créer un nouveau autoscript Chaque autoscript que vous créez est ajouté au fichier d'autoscript actif (autscript. si vous créez un autoscript déclenché chaque fois qu'Explorer crée un tableau de caractéristiques.sbs. par défaut) en tant que nouvelle procédure.

664 Chapitre 46 Ceci facilite le développement des scripts automatiques en vous évitant d'avoir à réécrire le code permettant d'obtenir l'objet que vous souhaitez traiter. E Entrez le code. il est affiché. Création d'un autoscript E Sélectionnez l'objet que vous souhaitez utiliser en tant que déclencheur dans le Viewer. Evénements déclenchant les scripts automatiques Le nom de la procédure de l'autoscript renvoie à l'événement qui le déclenche. Les événements suivants peuvent déclencher des scripts automatiques : Création d'un tableau pivotant : Le nom de cette procédure renvoie à la fois le type de tableau et la procédure qui l'a créé. un nouveau autoscript est créé. sélectionnez : Outils Créer/modifier un script automatique… S'il n'existe pas d'autoscript pour l'objet sélectionné. mais il faut que les scripts automatiques soient spécifiques à un élément de résultat et à une procédure statistique donnés. Correlations_Table_Correlations_Create. sélectionnez Options pour activer ou désactiver l'autoscript. par exemple. . Si un autoscript existe déjà. E Dans le menu Edition. E A partir du menu.

Par exemple. Vous pouvez également utiliser un script pour déclencher indirectement un autoscript. qui. Création de remarques : Renvoie à la procédure qui l'a créé : Correlations_Notes_Create. . vous pouvez écrire un script qui invoque une procédure de corrélation. à son tour. déclenche l'autoscript déclaré pour le tableau de corrélation en résultant. Création d'avertissements : Renvoyé par la procédure qui l'a créé.665 Utilitaire de script SPSS Figure 46-10 Procédure d'autoscript pour un tableau de corrélation Création du titre : Renvoie à la procédure statistique qui l'a créé : Correlations_Title_Create.

Le nom du fichier d'autoscript actif est affiché dans l'onglet Scripts de la boîte de dialogue Options (menu Edition). . Le fichier d'autoscript par défaut est autscript. ce qui vous permet d'activer et de désactiver les différents scripts. Vous pouvez spécifier un fichier d'autoscript différent mais vous ne pouvez en activer qu'un seul à la fois. Tous les nouveaux scripts automatiques que vous créez sont ajoutés à ce fichier.666 Chapitre 46 Fichier d'autoscript Tous les scripts automatiques sont enregistrés dans un seul fichier (à la différence des autres scripts enregistrés dans des fichiers distincts). Figure 46-11 Sous-routines d'autoscript affichées dans la boîte de dialogue Options La boîte de dialogue Options affiche également tous les scripts automatiques dans le fichier actif.sbs.

les tableaux pivotants constituent une classe d'objets.667 Utilitaire de script SPSS Fonctionnement des scripts Les scripts manipulent les objets à l'aide des propriétés et des méthodes. naviguez dans la hiérarchie des objets SPSS à chaque étape à partir des propriétés et des méthodes du niveau supérieur pour accéder aux objets du niveau inférieur. L'utilisation des objets constitue une procédure en deux étapes. Les objets de cette classe vous permettent d'utiliser la méthode SelectTable pour choisir tous les éléments du tableau et la propriété TextColor pour changer la couleur du texte sélectionné. Figure 46-12 Arborescence de la hiérarchie des objets. Le regroupement des classes (ou types) d'objets SPSS s'appelle la bibliothèque des types SPSS. pour . Pour atteindre les objets. Utilisez ensuite les propriétés et les méthodes pour effectuer quelque chose. Par exemple. Créez tout d'abord une référence pour l'objet (appelée accès à l'objet). Chaque classe d'objets possède des propriétés et des méthodes qui lui sont propres. Par exemple.

Déclarations des variables (Script) Même si ce n'est pas obligatoire. effectuez plusieurs fois les tâches à accomplir à l'aide de la souris. la première déclaration ci-dessus crée une variable d'objet appelée objOutputDoc et affecte cette variable à la classe d'objets ISpssOutputDoc. Par exemple. tel qu'un document de résultat ou un tableau pivotant. L'instruction se contente de déclarer que la variable existe (il a été fait référence à ce processus comme à « une attribution d'un nouveau nom aux objets que vous désirez utiliser »).668 Chapitre 46 atteindre un tableau pivotant. Avant d'écrire un script. il est judicieux de déclarer toutes les variables avant de les utiliser. Classes d'objets SPSS : ISpssOutputDoc et PivotTable sont des noms de classes d'objet SPSS. vous devez d'abord accéder au document de résultat qui contient ce tableau puis aux éléments de ce document. ceux des variables numériques (entiers) par int et ceux des variables chaîne par str. le nom de chaque variable fait référence à son type. Pour cela. Conventions d'appellation des variables : Par convention. La variable n'a pas encore de valeur.) L'une des premières étapes de la création d'un script est souvent la déclaration de variables pour les objets dont vous avez besoin. Les noms des variables d'objet commencent par obj. Chaque classe d'objets possède . elle n'a pas encore été définie pour un document de résultat particulier. tenez compte des objets que vous manipulez et des propriétés de chaque objet que vous modifiez. Vous pouvez nommer vos variables de la façon qui vous convient mais nous vous conseillons d'utiliser des appellations aidant à leur compréhension lors de leur suivi. En effet. on utilise généralement les instructions de déclaration Dim : Dim objOutputDoc As ISpssOutputDoc Dim objPivotTable As PivotTable Dim intType As Integer Dim strLabel As String Chaque déclaration indique le nom et le type de variable. Chaque objet que vous atteignez est enregistré dans une variable. A chaque étape. Astuces : il est difficile de comprendre le fonctionnement de scripts si vous ne comprenez pas le fonctionnement de SPSS. Chaque classe représente un type d'objet que le programme peut créer. (Souvenez-vous que tout ce que vous enregistrez dans la variable est une référence à l'objet.

Objet Application SPSS Options SPSS Informations sur les fichiers SPSS Documents Document de données Document de syntaxe Document du Viewer Options d'impression Type ou Classe IspssApp ISpssOptions ISpssInfo ISpssDocuments ISpssDataDoc ISpssSyntaxDoc ISpssOutputDoc ISpssPrintOptions Nom de variable La variable objSpssApp est globale. Notez que. objSpssOptions objSpssInfo objDocuments objDataDoc objSyntaxDoc objOutputDoc objPrintOptions objOutputItems objOutputItem objSPSSChart objSPSSText objPivotTable objFootnotes objDataCells objLayerLabels objColumnLabels objRowLabels objPivotMgr objDimension Regroupement des éléments ISpssItems de résultat Elément de résultat ISpssItem Graphes Texte Tableau pivotant Notes de bas de page Cellules de données Etiquettes de strates Etiquettes de colonnes Etiquettes de lignes Gestionnaire de tableau pivotant Dimension ISpssChart ISpssRtf PivotTable ISpssFootnotes ISpssDataCells ISpssLayerLabels ISpssLabels ISpssLabels ISpssPivotMgr IspssDimension . Le regroupement des classes (ou types) d'objets SPSS s'appelle la bibliothèque des types SPSS. à l'exception des tableaux pivotants. Ils sont conseillés pour tous les scripts. Elle ne requiert aucune déclaration. les noms de classes d'objets commencent toujours par ISpss.669 Utilitaire de script SPSS des propriétés et des méthodes qui lui sont propres. Table des classes d'objet et conventions d'appellation Les noms de variables suivants sont utilisés sans les scripts types livrés avec SPSS.

GetDesignatedOutputDoc Vous utilisez les propriétés et les méthodes des objets supérieurs dans la hiérarchie des objets pour obtenir les objets inférieurs.GetDesignatedOutputDoc 'obtenir la référence du document de sortie Set objOutputItems = objOutputDoc. Si cet élément n'est pas un objet OLE. Chaque référence à un objet que vous obtenez est enregistrée dans une variable. méthode apparentée à l'objet d'application SPSS. le script renvoie une erreur. De la même façon. Par exemple. pour accéder à un tableau pivotant. Pour obtenir un objet. déclarez d'abord une variable d'objet de la classe appropriée puis affectez cette variable à un objet particulier.Items() 'obtenir la collection des éléments dans le document Set objOutputItem = objOutputItems. La seconde instruction ci-dessus permet d'accéder au document de résultat mentionné à l'aide de GetDesignatedOutputDoc. Exemple : Accès à un élément de résultat Ce script accède au troisième élément de résultat dans le document de résultat mentionné et l'active.670 Chapitre 46 Accès aux objets d'automation SPSS (script) Accéder à un objet signifie créer une référence à l'objet de telle sorte que vous puissiez utiliser les propriétés et les méthodes servant à effectuer une action.GetItem(2) 'obtenir le troisième élément de résultat '(les numéros d'élément commencent à 0 pour que « 2 » corresponde au troisième élément) . vous devez d'abord atteindre le document de résultat qui contient le tableau pivotant pour le regroupement des éléments de ce document de résultat et ainsi de suite. qui est d'un niveau supérieur. Sub Main Dim objOutputDoc As ISpssOutputDoc'Déclarer les variables objet Dim objOutputItems As ISpssItems Dim objOutputItem As ISpssItem Set objOutputDoc = objSpssApp. pour accéder au document de résultat mentionné : Dim objOutputDoc As ISpssOutputDoc Set objOutputDoc = objSpssApp. Vous pouvez vous reporter ci-dessous à un autre exemple qui active le premier tableau pivotant dans le document de résultat mentionné.

Activate()'si l'élément est un tableau pivotant.Items()'obtenir la collection des items du document Dim intItemCount As Integer'nombre d'éléments de résultat Dim intItemType As Integer'type d'élément (défini par la propriété SpssType) intItemCount = objOutputItems. l'activer Exit For End If Next index End sub Ces exemples sont également accessibles dans l'aide en ligne.GetDesignatedOutputDoc'obtenir la référence du document de sortie Set objOutputItems = objOutputDoc.SPSSType()'obtenir le type de l'élément courant If intItemType = SPSSPivot Then Set objPivotTable = objOutputItem. Sub Main Dim objOutputDoc As ISpssOutputDoc 'déclarer les variables objet Dim objOutputItems As ISpssItems Dim objOutputItem As ISpssItem Dim objPivotTable As PivotTable Set objOutputDoc = objSpssApp. Pour cela. Vous pouvez tester ces exemples vous-même. .671 Utilitaire de script SPSS objOutputItem.Activate 'activer l'élément de résultat End sub Exemple : Accès au premier tableau pivotant Ce script accède au premier tableau pivotant dans le document de résultat mentionné et l'active.Count()'obtenir le nombre d'éléments de résultat For index = 0 To intItemCount'parcourir les éléments de résultat Set objOutputItem = objOutputItems. copiez le code de la fenêtre d'aide et collez-le dans la fenêtre de script.GetItem(index)'obtenir l'élément courant intItemType = objOutputItem.

Dans le vocabulaire de programmation. Chaque classe d'objets dispose de propriétés et de méthodes spécifiques qui déterminent ce que vous pouvez en faire.CaptionText = "Résultats d'Anita" Lorsqu'une propriété apparaît sur la droite.SelectTable . Par exemple.CaptionText Exemple : Utilisation des méthodes (Script) Les méthodes opèrent des actions sur les objets. Objet Crayon (réalité) Tableau pivotant (SPSS) Propriété Dureté (couleur) TextFont DataCellWidths CaptionText Méthode Ecrire Ecraser SelectTable ClearSelection HideFootnotes Exemple : Utilisation des propriétés (Script) Les propriétés définissent ou renvoient aux attributs de l'objet. les attributs sont appelés des propriétés et les utilisations des méthodes. Lorsqu'une propriété apparaît à gauche du signe égal. vous écrivez dessus. telles que la sélection de tous les éléments dans un tableau : objPivotTable. Par exemple. pour définir la légende d'un tableau pivotant et l'enregistrer sous forme de variable : strFontName = objPivotTable. pour attribuer la légende « Résultats d'Anita » à un tableau pivotant activé (objPivotTable) : objPivotTable.672 Chapitre 46 Propriétés et méthodes (script) Tout comme les objets réels. les objets d'automation OLE de SPSS ont des attributs et des utilisations. tels que la couleur ou la largeur de cellule. vous lisez depuis cette propriété.

De telles méthodes sont extrêmement importantes pour la navigation dans la hiérarchie des objets.GetDesignatedOutputDoc Set objItems = objOutputDoc.Items Navigateur d'objets Le navigateur d'objets affiche toutes les classes d'objets et les méthodes et propriétés qui leur sont apparentées. puis copier les propriétés et méthodes sélectionnées pour les coller dans votre script.ClearSelection Certaines méthodes renvoient à un autre objet. ce qui vous permet d'accéder aux éléments de ce document de résultat : Set objOutputDoc = objSpssApp. Vous pouvez également accéder à l'aide relative aux différentes propriétés et méthodes. Par exemple. la méthode GetDesignatedOutputDoc renvoie le document de résultat choisi. Figure 46-13 Navigateur d'objets .673 Utilitaire de script SPSS ou l'annulation d'une sélection : objPivotTable.

vous pouvez appeler n'importe quelle procédure autant de fois que vous le souhaitez. Vous pouvez également appeler . Les scripts doivent contenir au moins une procédure (Sous-routine principale). E Sélectionnez une classe d'objets dans la liste Data Type (type de données) afin d'afficher les méthodes et propriétés de cette classe. le nom de la procédure active s'affiche en haut de la fenêtre. E Sélectionnez les Methods/Properties (propriétés et méthodes) pour accéder à l'Aide contextuelle ou les coller dans votre script. Dans un script. soit des fonctions. Ils en contiennent souvent plusieurs.. sélectionnez : Mettre au point Parcourir les objets.. Sub Main ou Function DialogMonitor( )) et se termine par l'instruction de fin appropriée (End Sub ou End Function). Figure 46-14 Boîte de dialogue Nouvelle procédure Les procédures sont soit des sous-routines. Une procédure commence par une instruction qui spécifie le type de la procédure et son nom (par exemple. La procédure principale peut à son tour contenir plusieurs instructions et des appels à d'autres sous-routines qui effectuent le plus gros de la tâche. L'organisation des codes dans les procédures facilite la gestion et la réutilisation des différentes portions de code. Lorsque vous faites défiler la fenêtre du script.674 Chapitre 46 Utilisation du navigateur d'objets E A partir du menu de la fenêtre de script. Nouvelle procédure (Script) Une procédure est une séquence libellée d'instructions exécutées comme un ensemble.

. Vous pouvez également créer une nouvelle procédure. . vous pouvez l'ajouter au fichier général des scripts. Ajout d'une nouvelle procédure à un script E A partir du menu. entrez les instructions qui définissent la procédure directement dans le script. E Sélectionnez Sous-routine ou Fonction. Les procédures du fichier général des scripts peuvent être appelées par d'autres scripts. Procédures générales (script) Si vous souhaitez utiliser une procédure ou une fonction dans plusieurs scripts.675 Utilitaire de script SPSS n'importe quelle procédure dans le fichier général des scripts.. sélectionnez : Script Nouvelle procédure. E Saisissez un nom pour la procédure. ce qui permet de partager les procédures sur plusieurs scripts. Pour cela.

Vous pouvez ajouter librement des procédures à ce fichier.676 Chapitre 46 Figure 46-15 Fichier général des scripts Le fichier général des scripts par défaut est global.sbs ne sont plus disponibles. Cela signifie que si vous créez et activez un nouveau fichier général. les procédures et les fonctions de global. mais un seul fichier à la fois peut être actif en tant que fichier général.sbs. mais vous ne pouvez effectuer de modifications que dans une seule fenêtre à la fois. sous la barre d'outils). Vous pouvez également spécifier un autre fichier général des scripts dans l'onglet Scripts de la boîte de dialogue Options (menu Edition). . Vous pouvez consulter le fichier général dans n'importe quelle fenêtre de script (cliquez sur l'onglet n°2 à droite de la fenêtre.

Ajoutez simplement un commentaire sur la première ligne du script. Ce commentaire doit commencer par Begin Description. . Il n'est pas nécessaire d'entrer le code directement. Vous ne pouvez pas exécuter un script général directement depuis le menu Outils ou une fenêtre de script. Par exemple : 'Begin Description 'Ce script change "Sig. puis créez une fonction de surveillance de la boîte de dialogue (DialogFunc) qui surveille la boîte de dialogue et définit son comportement.677 Utilitaire de script SPSS Les procédures générales doivent être appelées par les autres procédures de script. 'Requirement: Le tableau pivotant à modifier doit être sélectionné. suivi du commentaire souhaité (une ou plusieurs lignes). Ajout d'une description à un script Vous pouvez ajouter une description à afficher dans les boîtes de dialogue Exécuter le script et Utiliser l'Assistant script. et s'achever par End Description. La boîte de dialogue est définie par un bloc Begin Dialog. Boîtes de dialogue de script personnalisées La mise en oeuvre d'une boîte de dialogue personnalisée se déroule en deux étapes : Créez d'abord la boîte de dialogue à l'aide de l'éditeur de boîte de dialogue.End Dialog.. L'éditeur de boîte de dialogue fournit une interface graphique conviviale permettant de définir la boîte de dialogue. 'End Description La description doit être mise en forme comme un commentaire (chaque ligne commençant par une apostrophe).." en "p=" dans les étiquettes de colonne d'un tableau pivotant.

Une fois que vous avez fini. sélectionner l'outil approprié et le faire glisser avec la souris. Fonction de surveillance de la boîte de dialogue : Pour créer la fonction de surveillance de la boîte de dialogue. cliquez sur l'icône Save and Exit (Enregistrer et quitter). pour cela. même si vous devez modifier manuellement la fonction pour définir le comportement de chaque action. cliquez sur le curseur dans le script à l'endroit où vous souhaitez insérer le code de la boîte de dialogue.678 Chapitre 46 Figure 46-16 Créer une boîte de dialogue à l'aide de l'éditeur de Boîte de Dialogue L'éditeur affiche au départ une boîte de dialogue vierge. Les instructions qui définissent la fonction sont ajoutées au script. Création d'une boîte de dialogue personnalisée E Dans la fenêtre de script. . cliquez avec le bouton droit de la souris sur la boîte de dialogue (assurez-vous qu'aucun contrôle n'est sélectionné) et entrez un nom pour la fonction dans le champ Dialog Function (fonction dialogue). par exemple.) Vous pouvez également faire glisser les côtés et les coins de la boîte de dialogue afin de la redimensionner. (Placez la souris sur chaque outil pour obtenir une description. Après avoir ajouté un contrôle. Vous pouvez ajouter des commandes comme. Il faut. située à l'extrême droite de la barre d'outils) pour insérer le code de la boîte de dialogue dans votre script. cliquez le bouton droit de la souris pour définir les propriétés de ce contrôle. des boutons radio et des cases à cocher.

. Case 5 ' veille. 'instructions à exécuter lorsque la boîte de dialogue est initialisée Case 2 'changement de valeur ou sélection de bouton . sélectionnez : Script Editeur de boîte de dialogue.679 Utilitaire de script SPSS E A partir du menu. End Select End Function . intSuppValue as Integer) Select Case intAction Case 1 ' initialisation de boîte de dialogue . cliquez sur l'icône Save and Exit (Enregistrer et quitter) située à l'extrême droite de la barre d'outils. E Cliquez avec le bouton droit de la souris sur la forme (aucun contrôle sélectionné) et saisissez un nom pour la fonction de surveillance de la boîte de dialogue dans le champ Dialog Function (fonction dialogue)...... tels que boutons ou cases à cocher. La fonction prend la forme (générale) suivante : Function DialogFunc(strDlgItem as String. intAction as Integer. E Redimensionnez la boîte de dialogue en faisant glisser les côtés et les coins.. E Une fois que vous avez fini. Vous devez modifier manuellement cette fonction pour définir le comportement de la boîte de dialogue. Fonctions de surveillance des boîtes de dialogue (Script) Une fonction de surveillance de la boîte de dialogue définit le comportement d'une boîte de dialogue pour chacun des cas spécifiés. Case 4 ' focus modifié... E Sélectionnez les outils dans la palette et faites-les glisser dans la nouvelle boîte de dialogue afin d'ajouter des contrôles. 'instructions. Case 3 ' Texte de zone de texte ou de zone de liste déroulante modifié......

et vous pouvez spécifier les instructions qui s'exécutent pour chaque action. Le dernier paramètre est utilisé pour fournir des informations complémentaires dans certains cas. lorsqu'un utilisateur clique sur un contrôle dans la boîte de dialogue. Vous devez ajouter les trois paramètres dans la définition de la fonction.680 Chapitre 46 Paramètres : La fonction doit être capable de supporter trois paramètres : une chaîne (strDlgItem) et deux entiers (intAction et intSuppValue). Il y a cinq actions possibles. intSuppValue est égale à 0. etc. et vous devez définir DialogFunc = Vrai pour empêcher la fermeture de la boîte de dialogue. en fonction de l'action entreprise. „ Cas 2 : S'exécute lorsqu'un bouton est enfoncé ou lorsqu'une valeur change dans un contrôle CheckBox. intSuppValue représente le nombre de caractères. ListBox ou OptionGroup. et intSuppValue représente la nouvelle valeur. La chaîne strDlgItem représente le contrôle dont le texte a changé et qui perd le focus. Sélectionnez Case intAction : La valeur de intAction indique l'action entreprise dans la boîte de dialogue. comme illustré ci-dessous. DropListBox. même s'ils ne servent pas tous. strDlgItem est l'élément dont la valeur change. „ Cas 3 : S'exécute lorsqu'une valeur change dans un contrôle TextBox ou ComboBox. si vous ne souhaitez pas d'instructions exécutant l'initialisation. Par exemple. Par exemple. intSuppValue est sans valeur. l'initialisation de la boîte de dialogue correspond à intAction = 1. Si une valeur change. Il n'est pas nécessaire de spécifier les 5 cas possibles. Les paramètres sont des valeurs admises entre la fonction et la boîte de dialogue. Le second paramètre (intAction) est une valeur numérique qui indique l'action entreprise dans la boîte de dialogue. le nom du contrôle passe à la fonction en tant que strDlgItem (le nom du champ est spécifié dans la définition de la boîte de dialogue). Par exemple. „ Cas intAction = 1 : Spécifie les instructions à exécuter lors de l'initialisation de la boîte de dialogue. Si un bouton est enfoncé. mais uniquement ceux qui s'appliquent. écartez le cas 1. La chaîne strDlgItem est une chaîne vide . . strDlgItem représente le bouton. Par exemple. vous pouvez désactiver un ou plusieurs contrôles ou ajouter un son. intAction prend la valeur 2. Si l'utilisateur clique sur un bouton.

etc..28. créée par un script Sub Main Call BuildDialog End Sub 'définir boîte de dialogue Sub BuildDialog Begin Dialog UserDialog 580.100.681 Utilitaire de script SPSS „ Cas 4 : S'exécute lorsque le focus change dans la boîte de dialogue. Figure 46-17 Boîte de dialogue Ouvrir fichier.cmdOK CancelButton 470. Pour plus d'informations. Exemple : Script d'une boîte de dialogue simple Ce script crée une boîte de dialogue simple qui ouvre un fichier de données. reportez-vous aux exemples et au prototype DialogFunc dans le fichier d'aide du langage Sax BASIC.. La chaîne strDlgItem représente l'élément qui reprend le focus et intSuppValue celui qui le perd (le premier élément est 0.280.7. intSuppValueest égale à 0.7.)."Ouverture du fichier de données".35.21.21. Définissez DialogFunc = Vrai afin de continuer à recevoir les actions restantes.txtDialogTitle TextBox 40.cmdCancel End Dialog Dim dlg As UserDialog Dialog dlg End Sub ..DialogFunc Text 40... le second 1.100."Fichier de données à ouvrir :". La chaîne strDlgItem est une chaîne vide .70.340.21.21. „ Cas 5 : Traitement restant.txtFilename OKButton 470. Reportez-vous aux sections apparentées pour obtenir des explications sur la sous-routine BuildDialog et sur la fonction de surveillance de la boîte de dialogue.

copiez le code de la fenêtre d'aide et collez-le dans la fenêtre de script. insérez des points d'arrêt dans la procédure que vous souhaitez mettre au point puis exécutez la procédure statistique qui déclenche l'autoscript. intAction As Integer. ferme la boîte de dialogue DialogFunc = False End Select End Select End Function Sub OpenDataFile(strFilename As Variant)'Ouvre le fichier de données correspondant au nom spécifié Dim objDataDoc As ISpssDataDoc Set objDataDoc = objSpssApp. intSuppValue As Integer) As Boolean Select Case intAction Case 1' son lors de l'initialisation de la boîte de dialogue Beep Case 2' changement de valeur ou sélection de bouton Select Case strDlgItem Case "cmdOK"'si l'utilisateur clique sur OK. Pour cela. Vous pouvez également insérer un point d'arrêt dans le script afin de faire une pause dans l'exécution à la ligne qui contient ce point d'arrêt. Vous pouvez tester ces exemples vous-même.682 Chapitre 46 'définir la fonction qui détermine le comportement de la boîte de dialogue Function DialogFunc(strDlgItem As String. Pour mettre au point un autoscript. ouvre le fichier de données corres strFilename = DlgText("txtFilename") Call OpenDataFile(strFilename) DialogFunc = False Case "cmdCancel"'si l'utilisateur clique sur Annuler.OpenDataDoc(strFilename) End Sub Ces exemples sont également accessibles dans l'aide en ligne. d'exécuter une ligne ou une sous-routine à la fois et de visualiser le résultat. Mise au point des scripts Le menu Mettre au point vous permet d'effectuer une exécution pas à pas du code(Avancer d'un pas). . ouvrez-le dans une fenêtre de script.

de même que la barre d'outils de mise au point. une ligne ou une sous-routine à la fois. exécute la sous-routine ou fonction dans la totalité. Activer/désactiver Séparer : Insère ou retire un point d'arrêt. l'exécution s'arrête à la première ligne de cette sous-routine ou fonction. Parcourir les objets : Affiche le navigateur des objets.683 Utilitaire de script SPSS Avancer d'un pas : Exécute la ligne active. Stack (pile) et Loaded (chargé) sont affichés dans la fenêtre de script. Les onglets Immediate (immédiat). Définir relation suivante : Définit l'instruction suivante à exécuter. Avancer jusqu'au curseur : Exécute jusqu'à la ligne active. Montrer relation suivante : Affiche l'instruction suivante à exécuter. Revenir d'un pas : Recule d'un pas dans la sous-routine ou dans la fonction appelée. L'exécution du script est suspendue au point d'arrêt et le volet de mise au point s'affiche. L'exécution du script est suspendue au point d'arrêt. . Exécution d'un script pas à pas E Dans le menu Mettre au point. Watch (espion). E Vous pouvez également sélectionner Activer/désactiver Séparer pour insérer un point d'arrêt dans la ligne active. Seules les instructions de la sous-routine/fonction peuvent être sélectionnées. sélectionnez l'une des options pour exécuter le code. Si la ligne active renvoie à une sous-routine ou à une fonction. Si la ligne active renvoie à une sous-routine ou à une fonction. Espion Express : Affiche la valeur de l'expression active. E Utilisez la barre d'outils (ou les touches de raccourci) pour continuer l'exécution pas à pas du script. Ajouter Espion : Ajoute l'expression active à la fenêtre espion. Sauter un pas : Exécute la ligne suivante.

puis appuyez sur Entrée pour passer au mode trace. puis appuyez sur Entrée pour afficher la valeur de expr. . Vous pouvez également évaluer une expression. Tapez var = expr. les onglets Immediate (immédiat). attribuer une variable ou un appel à une sous-routine. puis appuyez sur Entrée pour modifier la valeur de var. Entrez subname args. Stack (pile) et Loaded (chargé) sont affichés.684 Chapitre 46 Volet de mise au point (Script) Lorsque vous exécutez le code pas à pas (Avancer d'un pas). Le mode Trace permet d'imprimer chaque instruction dans la fenêtre immédiate lorsque le script est exécuté. Entrez Trace. Figure 46-18 Volet de mise au point affiché dans la fenêtre de script Onglet Immediate (immédiat) : Cliquez sur le nom de n'importe quelle variable puis sur l'icône Loupe pour afficher la valeur courante de la variable. „ „ „ „ Entrez ?expr. Watch (espion). puis appuyez sur Entrée pour appeler une sous-routine ou une instruction intégrée.

Les fichiers de syntaxe possèdent des commandes écrites dans le langage de commande qui vous permet d'exécuter les procédures statistiques et les transformations de données.685 Utilitaire de script SPSS Onglet Watch (espion) : Pour afficher une variable. Cliquez sur n'importe quelle ligne pour mettre en surbrillance cette ligne dans la fenêtre de modification. Vous pouvez associer les fichiers de script et de syntaxe pour plus de flexibilité. fonction ou expression. Les valeurs affichées sont mises à jour à chaque fois que l'exécution est suspendue. cliquez sur cet élément et sélectionnez Ajouter Espion dans le menu Mettre au point. Exécution d'une syntaxe de commande à partir d'un script Vous pouvez exécuter une syntaxe de commande à partir d'un script d'automation à l'aide de la méthode ExecuteCommands. La première ligne est l'instruction active. Cliquez sur Ctrl-Y pour supprimer la ligne. Alors que les scripts vous permettent de manipuler le résultat et d'automatiser les autres tâches que vous effectueriez normalement à l'aide de l'interface graphique des menus et des boîtes de dialogue. Onglet Loaded (chargé) : Présente la liste des scripts actifs. Cliquez sur une ligne pour visualiser ce script. Onglet Stack (pile) : Affiche les lignes qui ont renvoyé à l'instruction active. la seconde ligne est celle appelée en premier. etc.sps) ne sont pas les mêmes que les fichiers de script (*. La majeure partie de cette fonctionnalité ne peut pas être automatisée directement à partir des scripts de commande. Fichiers de script et de syntaxe Les fichiers de syntaxe (*. la partie du système qui effectue les calculs statistiques et les transformations de données). Pour cela. Cliquez sur Entrée pour mettre immédiatement à jour toutes les valeurs. Vous pouvez modifier l'expression à gauche de ->. exécutez un script à partir de la syntaxe de commande SPSS ou intégrez la syntaxe de commande dans un script. La syntaxe de commande vous permet d'exécuter les transformations de données et les procédures statistiques et de produire des diagrammes. le langage de commande propose une méthode de communication directe différente avec l'arrière-plan du programme. .sbs).

Sinon.686 Chapitre 46 La méthode la plus simple pour construire un fichier de syntaxe de commande consiste à effectuer des sélections dans les boîtes de dialogue et à coller la syntaxe de ces sélections dans la fenêtre de script. Figure 46-19 Coller une syntaxe de commande dans un script Lorsque vous ouvrez une boîte de dialogue à l'aide du menu de la fenêtre de script. et non pas dans celle des scripts. . les commandes sont collées dans la fenêtre de syntaxe. Remarque : vous devez utiliser les menus de la fenêtre de script pour ouvrir les boîtes de dialogue. le bouton Coller permet de coller tous les codes nécessaires à l'exécution des commandes à partir d'un script.

reportez-vous au manuel SPSS Command Syntax Reference. E Cliquez sur Coller. Exécution d'un script depuis la syntaxe de commande Vous pouvez utiliser la commande SCRIPT pour exécuter un script à partir d'une syntaxe de commande. E Effectuez des sélections dans la boîte de dialogue. Indiquez le nom du script que vous souhaitez exécuter. Remarque : vous devez utiliser les menus de la fenêtre de script pour ouvrir les boîtes de dialogue.SBS'.687 Utilitaire de script SPSS Pour coller une syntaxe de commande dans un script E A partir des menus de la fenêtre de script. . ce nom de fichier étant entre guillemets. Sinon. et non pas dans celle des scripts. comme dans l'exemple suivant : SCRIPT 'C:\PROGRAM FILES\SPSS\CLEAN NAVIGATOR. sélectionnez les commandes des menus Statistiques. Pour obtenir des renseignements complets sur la syntaxe. les commandes sont collées dans la fenêtre de syntaxe. Diagrammes et Outils pour ouvrir les boîtes de dialogue.

.

Pour obtenir des informations détaillées sur la commande OMS. la gestion des résultats est uniquement disponible avec la syntaxe de commande. des résultats texte et de nombreux graphiques au format XML. Command Syntax Reference). „ „ „ XML : Vous pouvez écrire des tableaux. Les différents formats sont les suivants : „ Format des fichiers de données SPSS (SAV) : Les résultats qui sont affichés dans les tableaux pivotants du Viewer peuvent être écrits dans un fichier de données SPSS. Vous pouvez l'utiliser pour coller une commande et des identificateurs de sous-type dans une fenêtre de syntaxe de commande. reportez-vous au manuel SPSS Command Syntax Reference (menu Aide. 689 . à l'aide de la commande OMS. Texte : Vous pouvez écrire des tableaux et des résultats texte sous forme de texte séparé par des tabulations ou des espaces. HTML : Vous pouvez écrire des tableaux et des résultats texte au format HTML. Ils peuvent ainsi être utilisés en tant qu'entrées pour les commandes suivantes. Actuellement. Identificateurs OMS La boîte de dialogue Identificateurs OMS vous aide à écrire la syntaxe de commande OMS.Système de gestion des résultats 47 Chapitre Le système de gestion des résultats permet d'écrire automatiquement des catégories de résultats données dans des fichiers de résultats différents et de sélectionner différents formats.

Par exemple : OMS /SELECT TABLES /IF COMMANDS=['Tableaux croisés' 'Descriptives'] SUBTYPES=['Tableau croisé' 'Statistiques descriptives'] /DESTINATION FORMAT=OXML OUTFILE='C:\temp\temp.xml'. et générera un fichier XML regroupant le contenu de ces tableaux. vous pouvez utiliser la sous-commande IF pour indiquer les résultats de commandes spécifiques et/ou les types de tableau à acheminer vers différentes destinations (y compris le Viewer). Certains sous-types sont uniquement générés par une commande alors que d'autres peuvent être générés par plusieurs commandes . ils ne font pas la distinction entre les majuscules et les minuscules. Vous pouvez également utiliser EXCEPTIF pour exclure certains résultats. Identificateurs de sous-type : Les sous-types sont les différents types de tableau pivotant qui peuvent être générés. Cette commande sélectionne les tableaux croisés et les tableaux de statistiques descriptives à partir des commandes CROSSTABS et DESCRIPTIVES suivantes. Comme les noms de commande.690 Chapitre 47 Figure 47-1 Boîte de dialogue Identificateurs OMS Avec la commande OMS. Identificateurs de commande : La plupart des identificateurs de commande sont identiques aux noms de commande. Indiquez les noms de commande avec le mot-clé COMMANDS sur les sous-commandes IF ou EXCEPTIF.

E Sélectionnez les identificateurs de commande ou de sous-type souhaités. étant donné que nous indiquons également les commandes. Si aucune commande n'est sélectionnée. Par exemple : /IF COMMANDS=['Tableaux croisés' 'Descriptives'] SUBTYPES=['Tableau croisé' 'Statistiques descriptives'] Copie des identificateurs OMS à partir de la légende du Viewer Vous pouvez copier et coller des identificateurs de sous-type et de commande OMS à partir du panneau de légende du Viewer. Les listes d'identificateurs des mots-clés COMMANDS et SUBTYPES doivent être mises entre crochets. Pour sélectionner plusieurs identificateurs dans chaque liste. l'emplacement actuel du curseur. Les deux sous-types indiqués dans l'exemple ci-dessus peuvent être générés par plusieurs commandes.691 Système de gestion des résultats (bien que les tableaux ayant le même nom de sous-type dans différentes procédures puissent avoir différentes structures et différents contenus). Utilisation de la boîte de dialogue Identificateurs OMS E A partir du menu. Si aucune fenêtre de syntaxe de commande n'est ouverte. utilisez la touche Ctrl. Par contre. Si plusieurs commandes sont sélectionnées. il est mis entre guillemets car la syntaxe de la commande OMS requiert des guillemets. . tous les sous-types sont répertoriés. la liste des sous-types disponibles regroupe tous les sous-types disponibles pour les commandes sélectionnées. à „ „ Lorsqu'un identificateur de commande et/ou de sous-type est collé. sélectionnez : Outils Identificateurs OMS. „ La liste des sous-types disponibles dépend des commandes sélectionnées. les résultats des autres commandes qui génèrent ces sous-types ne seront pas sélectionnés. „ Les identificateurs sont collés dans la fenêtre de syntaxe de commande désignée.. une nouvelle fenêtre de syntaxe est automatiquement ouverte.. E Cliquez sur Coller commandes et/ou sur Coller sous-types.

. onglet Général). procédez comme suit : E Dans le panneau de légende. Les étiquettes qui comprennent des informations sur les variables ou les valeurs sont affectées par les paramètres d'affichage des noms de variable/étiquettes et des valeurs/étiquettes de valeur dans le panneau de légende (menu Modifier. Options. les noms de variable ou les étiquettes). Options. vous pouvez le coller à l'emplacement de votre choix. Copie d'étiquettes OMS Au lieu de copier des identificateurs. Cette méthode est différente de celle liée à la boîte de dialogue Identificateurs OMS pour la raison suivante : L'identificateur copié n'est pas automatiquement collé dans une fenêtre de syntaxe de commande. cliquez avec le bouton droit de la souris sur l'entrée correspondant à l'élément concerné. Etant donné que les valeurs des identificateurs de commande et de sous-type sont identiques aux valeurs des attributs de commande et de sous-type correspondantes dans les résultats au format XML (OXML). vous pouvez copier des étiquettes pour les utiliser avec le mot-clé LABELS. l'identification des classes de fichier scindé peut être ajoutée à l'étiquette. cette méthode de copier/coller peut vous être utile lorsque vous écrivez des transformations XSLT. Cependant. il existe un certain nombre de facteurs qui peuvent avoir une incidence sur le texte de l'étiquette : „ „ Si le traitement du fichier scindé est activé. Il est simplement copié dans le Presse-papiers . sélectionnez Copier l'identificateur de commande OMS ou Copier le sous-type de table OMS. Les étiquettes sont affectées par le paramètre lié à la langue des résultats (menu Modifier.692 Chapitre 47 E Dans le panneau de légende. onglet Etiquettes Résultats). cliquez avec le bouton droit de la souris sur l'entrée correspondant à l'élément concerné. E Dans le menu contextuel qui apparaît. „ Pour copier des étiquettes OMS. Vous pouvez utiliser des étiquettes pour différencier des graphiques ou des tableaux de même type dans lesquels le texte de la légende reflète un attribut de l'objet de sortie particulier (par exemple.

Par exemple : /IF LABELS=['Catégorie d'emploi' 'Niveau d'enseignement'] .693 Système de gestion des résultats E Dans le menu contextuel qui apparaît. sélectionnez Copier l'étiquette OMS. Comme pour les identificateurs de commande et de sous-type. les étiquettes doivent apparaître entre guillemets et la liste entre crochets.

.

le niveau Département. Masquer des tableaux et des champs accessoires. Par exemple.Annexe Administrateur d'accès de base de données A L'Administrateur d'accès de base de données est un utilitaire conçu pour simplifier l'utilisation de sources de données volumineuses ou complexes avec l'assistant de base de données. Il permet aux utilisateurs et aux administrateurs de personnaliser leurs sources de données de : „ „ „ Créer des alias pour des tableaux et des champs de bases de données. 695 . Vous pouvez utiliser l'Administrateur d'accès de base de données pour spécifier jusqu'à trois affichages différents par base de données : le niveau Entreprise. la base de données des relevés d'heures de votre société et une base de données que vous utilisez pour effectuer le suivi de votre collection de CD.inf Niveau Département : dba02. A la place. le niveau Personnel.inf Niveau Personnel : dba03. L'Administrateur d'accès de base de données et l'assistant de base de données reconnaissent ces fichiers par les noms suivants : „ „ „ Niveau Entreprise : dba01. il génère des fichiers qui conservent toutes vos informations et jouent le rôle d' « affichage » de bases de données. Créer des noms de variables pour des champs. l'Administrateur d'accès de base de données ne change pas votre base de données.inf pourrait contenir des informations d'affichage Personnel pour une base de données de comptes sociétés.inf Chaque fichier contient des informations spécifiques sur un nombre de sources de données quelconque correspondant au niveau. En fait. votre fichier dba03.

noms de variables. Entreprise. au niveau Département : son nom est Modalités Emplois.'Modalités Emplois'. . Les fichiers de chaque niveau conservent les informations sur toutes vos sources de bases de données pour ce niveau. il est invisible aussi bien au niveau Département qu'au niveau Personnel. contenant les informations d'alias pour tous les affichages de bases de données établis pour le département marketing. Héritage et priorités : Chaque fois que vous utilisez l'assistant de base de données. et commandes masquées sont hérités du niveau supérieur.inf. Pour démarrer l'Administrateur d'accès de base de données. le champ d'origine (Ventes Employés. Département et Personnel. Exemple : le champ CATEMPL dans le tableau Ventes Employés n'a pas d'alias au niveau Entreprise mais en a un.inf. Dans l'Administrateur d'accès de base de données. en revanche. du plus élevé au plus bas. consultez l'Aide en ligne. contenant les affichages personnalisés de toutes les bases de données utilisées. il présente l'affichage du niveau le plus bas de votre source de données qu'il a pu trouver dans le chemin d'accès de votre système. dba02. il cherchera le chemin de ces fichiers dans le système et affichera automatiquement les informations pour l'ensemble des trois affichages de n'importe quelle source de données que vous avez configurée. les alias.JOBCAT) apparaîtra dans l'assistant de base de données comme 'Information Employés'. dba03. Exemple : si le tableau des Régions est masqué au niveau Entreprise. Pour plus d'informations sur l'Administrateur d'accès de base de données. les niveaux étant. exécutez le fichier spssdbca. Ce tableau ne sera pas affiché dans l'assistant de base de données. si le tableau Ventes Employés possède l'alias Information Employés au niveau Personnel. Chaque personne du département marketing aura un fichier. votre département marketing aura un fichier. Par exemple.exe installé dans votre répertoire SPSS. Il apparaît comme Modalités Emplois au niveau Personnel De plus.696 Annexe A Lorsque vous ouvrez l'Administrateur d'accès de base de données.

y compris : „ „ „ „ Titres de documents HTML Spécification du type de document Balises Meta et code du script (par exemple.txt (situé dans le répertoire d'installation de SPSS) dans un éditeur de texte. E Remplacez les commentaires dans les « champs » sur les lignes entre les doubles chevrons ouverts (<<) par le texte ou le code HTML à insérer dans vos documents HTML exportés. E Enregistrez le fichier en fichier texte.Annexe Personnalisation de documents HTML B Vous pouvez automatiquement ajouter le code HTML personnalisé aux documents exportés au format HTML. vous devez modifier le registre système pour utiliser le fichier afin de personnaliser votre résultat HTML exporté. Remarque : si vous modifiez le nom ou l'emplacement du fichier texte. JavaScript) Texte affiché avant et après la sortie exportée Pour ajouter du code HTML personnalisé à des documents de résultat exportés E Ouvrez le fichier htmlfram. 697 .

avis de copyright) << Texte et/ou code HTML inséré avant les résultats exportés (par exemple. code JavaScript) << Code HTML modifiant la balise <BODY> (par exemple. des commentaires comprenant les spécifications du type de document) << Texte utilisé comme titre du document (affiché dans la barre de titre) << Balises Meta ou code du script (par exemple.) Pour utiliser un autre fichier ou emplacement pour le code HTML personnalisé Si vous modifiez le nom ou l'emplacement du fichier htmlfram.698 Annexe B Contenu et format du fichier texte pour code HTML personnalisé Le code HTML à ajouter automatiquement à vos documents HTML doit être spécifié dans un fichier texte simple contenant six champs. code indiquant la couleur d'arrière-plan) << Texte et/ou code HTML inséré après les résultats exportés (par exemple. logo. etc. E Dans le menu Démarrer de Windows. choisissez Exécuter. . tapez regedit et cliquez sur OK.txt. vous devez modifier le registre du système pour utiliser le fichier dans le résultat HTML personnalisé. nom de société. chacun délimité par deux chevrons ouverts sur la ligne précédente (<<) : << Texte ou code à insérer en haut du document avant la spécification <HTML> (par exemple.

0 SPSSWIN E Dans la fenêtre de droite. c:\mesfichiers\html.2//EN"> <HTML> <HEAD> <TITLE> NVI. sélectionnez : HHKEY_CURRENT_USER Logiciel SPSS SPSS pour Windows 12. Inc. Exemple de fichier texte pour code HTML personnalisé << <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3. </TITLE> . bidules"> << bgcolor="#FFFFFF" << <H4 align=center>Page réalisée par.699 Personnalisation de documents HTML E Dans la fenêtre de gauche de l'éditeur de la base de registres. << <META NAME="keywords" CONTENT="trucs. gadgets. entrez le chemin complet et le nom du fichier texte contenant les spécifications HTML personnalisées (par exemple. <br><br> <IMG SRC="spss2. Inc.gif" align=center></H4> << <h2 align=center>Département Ventes de NVI</h2> <h3 align=center>Données régionales</h3> Exemple de source HTML pour code HTML personnalisé <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.. E Dans la zone Données de la valeur. double-cliquez sur la chaîne HTMLFormatFile.txt).2//EN"> << NVI..

gadgets.gif" align=center></H4> </BODY> </HTML> .. <br><br> <IMG SRC="spss2.700 Annexe B <META NAME="keywords" CONTENT="trucs.. bidules"> </HEAD> <BODY bgcolor="#FFFFFF"> <h2 align=center>Département Ventes de NVI</h2> <h3 align=center>Données régionales</h3> [Résult at exporté] <H4 align=center>Page réalisée par.

439 Enregistrement de prévisions. 435. 178. 564 T-carré de Hotelling. 14. 219 Titres. 82 Agrégation de données. 593 analyse des observations restantes. 437. 449 Procédures apparentées. 180. 449 Distance de Mahalanobis. 438 Prévision. 449 Matrices. 435 Enregistrement d'intervalles de prévision. 435. 438. 181 Fonctions d'agrégation. 608 Dans les cellules. 441 Options d'affichage. 431 Dans Moyennes. 273 Légendes. 562 Statistiques. 273. 447 Matrice de covariance. 562 Kuder-Richardson 20. 12 Aide contextuelle. 273 Notes de bas de page. 222. 435. 431. 289. 446 Courbe ROC pour les probabilités. 439 Hypothèses. 449 Probabilités a priori. 442 701 . 564 Procédures apparentées. 445 Diagrammes. 439 Ajustement de fonctions. 274 Lignes ou colonnes. 561 Caractéristiques. 274. 274 Résultats. 181 Aide avec le bouton droit de la souris. 564 Alpha-maximisation. 564 Corrélations et covariances entre éléments. 439 Analyse discriminante. 178. 352. 274 Affichage des données. 564 Coefficient de corrélation intra-classe . 273. 447 Définition d'intervalles. 219. 447 Méthodes pas à pas. 629 Etiquettes de dimension. 222. 439 Alignement. 442 Lambda de Wilks. 435 Dans ANOVA à 1 facteur. 451 Exemple. 564 Analyse de fichier scindé. 15 Assistant statistique. 435 Prévision. 475 Affichage. 375 Dans la régression linéaire. 14 Ajout d'étiquettes de groupe. 561 Dans l'analyse de fiabilité. 266 Recherche de définitions d'étiquette dans les tableaux pivotants.Index Affectation de mémoire Dans l'analyse TwoStep Cluster. 439 Enregistrement de résidus. 352 Analyse de séries chronologiques. 435 Analyse de séries chronologiques. 461 Analyse de données. 447 Enregistrement des variables du classement. 446 Méthodes de l'analyse discriminante. 564 Exemple. 608 Alpha de Cronbach. 629 Barres d'outils. 94 Résultats. 264 Ajustement de fonctions. 435 Inclusion de la constante. 13 Analyse de fiabilité. 561. 566 Hypothèses. 441. 94. 266 Aide en ligne. 435 Ajustement de fonctions. 447. 564 Tableau ANOVA. 561 Fonctionnalités supplémentaires. 654 Coefficients de la fonction. 564 Test d'additivité de Tukey. 12 Boîtes de dialogue. 441 Exportation des informations du modèle. 593 Critères. 562 Remarques sur les données. 289 éditeur de données. 435. 180 Noms de variable et étiquettes. 561. 439 Prévision d'observations. 439 Analyse de la variance. 182 Analyse de la variance. 451 Hypothèses. 274. 13 Etapes de base. 435 Modèles.

454 Sélection d'observations. 667. 382 Tests post hoc. 464 Exemple. 358. 375 Dans GLM . 682 Déclaration de variables. 461 Analyse factorielle. 533 Définition des vecteurs. 460 Cartes factorielles. 389 ANOVA à 1 facteur. 459 Statistiques. 667 Navigateur d'objets. 461 Méthodes de rotation. 475 Statistiques. 674. 445 Statistiques. 555 Caractéristiques. 352. 461. 658 Fonctionnement des scripts. 352. 467 Hypothèses. 375 Aperçu. 382 Statistiques. 661 Boîtes de dialogue personnalisées. 661 Assistant statistique. 668 Fenêtre de script. 352 Dans Récapituler. 668. 345. 454 Remarques sur les données. 653. 467 analyse des observations restantes. 677. 382 Variables actives. 464 Convergence. 325. 479 Hypothèses. 453. 446 Statistiques descriptives. 333 Tableaux croisés. 453. 382 Comparaisons multiples.Univarié. 385 Dans Moyennes. 672. 478 Enregistrer dans le fichier de travail. 379 Valeurs manquantes. 622 ANOVA. 467 Analyse multiréponses. 446 Valeurs manquantes. 385. 622 valeurs à deux chiffres. 386 Modèle. 677 Assistant script. 375. 389 Dans ANOVA à 1 facteur. 677 Débogage. 386. 695 Aplatissement. 325 Dans Fréquences. 458. 379. 661. 441. 673. 453 Caractéristiques. 674 Propriétés et méthodes. 376 Options. 454 Méthodes d'extraction. 555 Dans les tableaux de bord en lignes. 358 Dans les tableaux de bord en colonnes. 378 Contrastes polynomiaux. 548. 654 Aperçu. 345 Arbres hiérarchiques. 378 Hypothèses. 454. 441 Variables indépendantes. 271 Association linéaire par linéaire. 487 Assistant script. 682 Ajout d'une description. 466 Format d'affichage des projections. 460 Valeurs manquantes. 447 Analyse en composantes principale. 658. 333 Astuces de script. 453. 352 Hypothèses. 449 Variables de regroupement. 533 Définir les vecteurs multiréponses. 318. 376. 548 Dans Moyennes. 460. 670 Procédures. 325 Dans Explorer. 670. 533 Analyse TwoStep Cluster. 378. 487 Classification hiérarchique. 310. 14 Association de signets aux différents affichages d'un tableaupivotant. 379 Contrastes. 464 Procédures apparentées. 677. 471 Diagrammes. 442 Sélection d'observations. 473 Options. 441 V de Rao. 479 Andrew. 479 Enregistrer dans le fichier externe. 461. 673 Obtention d'objets d'automatisation. 453 Facteurs. 672 . 377. 325 Années.702 Index Remarques sur les données. 310 Dans les cubes OLAP. 466. 375. 464. 318 Dans Explorer.

9 Bouton Coller. 291. 352 Dans Récapituler. 395 boîtes à moustaches. 8. 631. 379 GLM. 632. 669. 670. 318. 8 Affichage. 395 Dans ANOVA à 1 facteur. 358 Dans les tableaux de bord en colonnes. 96 Automatisation OLE. 630 Affichage et masquage. 9 Bouton OK. 629. 9. 415 Cartes factorielles. 669. 633 Affichage dans des fenêtres différentes. 12 Ordre d'affichage des variables. 415 Distances. 632 Modification des icônes bitmap. 141. 326 Dans Explorer. 12. 633 Personnalisation. 379. 662. 9 Bouton Restaurer. 548. 11. 555 Caractéristiques. 464 Dans Analyse factorielle. 315. 11 Obtention d'aide. 395 Bordures. 282. 310 Dans les cubes OLAP. 315 Ordre d'affichage. 358. 379. 672 Scripts. 293 Affichage. 315. 10 Spécifications facultatives. 318 Carré de la distance euclidienne. 352. 274. 601. 252. 662 Evénements déclenchants. 325 Dans Fréquences. 629. 285. 289 . 310. 288. 280. 631 B de Tukey.703 Index Asymétrie. 672. 625. 606 Affichage des noms de variable. 9 Boutons. 629. 602 Script. 9. 664 Fichier d'autoscript. 633 Modification des icônes bitmap de la barre d'outils. 318 Statistiques. 11. 289. 284. 670. 606 commandes. 677. 672 propriétés. 283 Viewer en mode brouillon. 326 Comparaison des niveaux de facteur. 7. 8 Barres d'outils. 670. 679 Affichage des étiquettes de variable. 315 Hypothèses. 653 Utilisation d'objets. 666 Barre d'état. 9. 283 Affichage des bordures masquées. 144 Calcul de nouvelles variables chaîne. 395 Cellules de tableaux pivotants. 345 Attributs de variable. 272 Alignement. 316 Enregistrement des écarts z. 10. 379 GLM. 548 Dans Moyennes. 252 Bordures de cellules. 94. 673 Autoscripts. 667. 633 Calcul de variables. 601 Variables. 326 Boîtes de dialogue. 94. 379. 599. 290. 673 Aperçu. 606. 10 Utilisation de groupes de variables. 653. 555 Dans les tableaux de bord en lignes. 326 Comparaison des variables. 9 Définition de groupes de variables. 96 Copie et collage. 318 Dans Explorer. 252 Bouton Aide. 606 Réordonnance de listes cible. 667. 11 Sous-boîtes de dialogue. 679 Sélection de variables. 673 conventions d'appellation des variables. 379 GLM. 144 Caractéristiques. 252 Viewer en mode brouillon. 630. 325. 606. 395 Dans ANOVA à 1 facteur. 464 C de Dunnett. 664 Création. 629 Création. 677. 8 Masquage. 9 Affichage des étiquettes de variable. 599 Informations sur les variables. 631 Création d'outils. 395 Dans ANOVA à 1 facteur. 8 Bonferroni. 667. 669 Méthodes. 9 Bouton Annuler. 345.

403 Tableaux croisés. 431 Collage. 230. 608 Centrer-réduire. 481 Classification de variables. 403 Tableaux croisés. 431 Dans la régression linéaire. 403 Coefficient de corrélation r. 229 Tableaux pivotants. 231 Collage spécial d'objets. 481. 333 Tableaux croisés. 431 Coefficients de régression. 361 Dans les cubes OLAP. 579 Dans les statistiques de ratio.704 Index Contours. 487 Chaîne des agrégations. 481. 333 Coefficient de dispersion (COD). 315 Enregistrement sous forme de variables. 487 Procédures apparentées. 286 Sélection dans les tableaux pivotants. 485 Orientation du diagramme. 333 Coefficient de corrélation intra-classe. 230 Tableaux pivotants en tant que tableaux. 488 Classification d'observations. 304 Comparaison des groupes. 229 Colonne de total. 481 Matrices de distance. 431 Dans la régression linéaire. 481. 288 Largeurs. 333. 272 Modification de texte. 481 Diagrammes en stalactite. 493. 293 Ombrage. 229. 489 Classification hiérarchique. 564 Coefficient d'incertitude. 361 Dans les cubes OLAP. 333 Coefficient de corrélation de Spearman. 325 Dans Fréquences. 485 Transformation de valeurs. 325 Dans Explorer. 352 Tableaux croisés. 333. 293 Commande EXECUTE. 486 Transformation de mesures. 579 Coefficient de variation (COV). 310 Centrage de résultats. 361 Comparaisons multiples. 489. 481 Courbe ROC. 285 Marges. 481 Remarques sur les données. 315 Caractéristiques. 229. 556 Colonnes. 229. 486 Classes d'affectation. 485 Mesures de similarité. 379 Dans ANOVA à 1 facteur. 481 Statistiques. 361 Comparaison des variables. 403 Corrélations bivariées. 231 Diagrammes. 290 Masquage. 284 Centiles. 493 Nuées dynamiques. 291 Formats. 481. 333 Coefficients bêta. 315 Ordonner les observations. 157 Classification. 481 Arbres hiérarchiques. 485 Coefficient alpha. 485 Méthodes de classification. 157. 579 Dans les statistiques de ratio. 403 Corrélations bivariées. 593 Efficacité. 487 Enregistrement de nouvelles variables. 561. 561 Dans l'analyse de fiabilité. 481 Hypothèses. 293 Modification de la largeur des tableaux pivotants. 286. 379 . 403 Corrélations bivariées. 222. 304 Collée depuis les boîtes de dialogue. 310. 280 Formats des valeurs. 564 Dans l'analyse de fiabilité. 486. 593 Choix d'une procédure. 469 Classification hiérarchique. 556 Dans les tableaux de bord. 291 Polices. 333. 486 Mesures de distance. 333 Tableaux croisés. 579 Coefficient êta. 488 Exemple. 333 Coefficient de contingence. 352 Dans Moyennes. 564 Coefficient de corrélation par rang.

333 Tableaux croisés. 392. 682. 596 Remarques sur les données. 392. 532. 393 GLM. 358. 392. 494 Analyse de classification des nuées dynamiques. 333 Tableaux croisés. 390 GLM. 412 Couleurs de tableaux pivotants. 532 Définition des noms. 406 Corrélations partielles. 461. 461. 669 Dans des scripts. 682 Volet de débogage. 362 Hypothèses. 178 Cubes OLAP. 392. 412 Partielles. 358. 404. 392. 669 Décomposition hiérarchique. 494 Dans Analyse factorielle. 412 Variables de contrôle. 291 Arrière-plan des cellules. 379 Comptage d'occurrences. 668. 333 Débogage des scripts. 69 Contrastes. 392. 412 Valeurs manquantes. 406 Seuils de signification. 221. 532 Modalités. 431 Corrélations simples. 403 Hypothèses. 593 Création du contour d'une cellule. 392. 403 Corrélations bivariées. 532 . 403 Corrélations bivariées. 392. 393 Dans ANOVA à 1 facteur. 333 Tableaux croisés. 355. 403 Statistiques. 596 Diagrammes et statistiques. 358 Titres. 684 déclaration de variables Conventions d'appellation. 406. 282 Police. 412 Bivariée. 392. 227 Correction pour la continuité de Yates. 393 Contrastes polynomiaux. 403 Options. 410 Corrélations simples. 409. 393 Contrastes différence. 392. 393 Dans ANOVA à 1 facteur. 393 GLM. 291 Critères d'agrégation. 378. 412 Statistiques. 333 D de Somers. 669 Déclaration de variables. 355. 284. 431 Hypothèses. 333. 409 Tableaux croisés. 403 Tableaux croisés. 390 Définir les vecteurs multiréponses.705 Index Comparaisons multiples post hoc. 282. 464. 178 Dans Agréger les données. 407 Coefficients de corrélation. 333 Corrélation de Pearson. 410. 291 Courbe ROC. 393 GLM. 532 Dichotomies. 378 GLM. 412. 403 Dans Corrélations partielles. 284 Premier plan des cellules. 403. 333 Corrélations bivariées. 333 Corrélations. 409. 393 Contrastes déviation. 403. 684 Exécution pas à pas des scripts. 393 Contrastes de Helmert. 291 Bordures. 409 Options. 392. 221 Tableaux pivotants. 378 GLM. 393 GLM. 412 Dans la régression linéaire. 333. 378. 392. 412 Dans Corrélations partielles. 464 Copie. 409. 147 Connexion à un serveur. 533 Définition des étiquettes. 227 Résultats. 409 Ordre zéro. 409. 682 Points d'arrêt. 668. 362 D. 393 Contrastes simples. 356. 593. 593. 355 Statistiques. 403. 392. 393 Contrastes à la précédente GLM. 393 Convergence. 406 Valeurs manquantes. 227 Diagrammes.

431 Dans la régression linéaire. 426 Diagramme de répartition hors tendance. 487 Diagrammes interactifs. 426 Dans la régression linéaire. 426 Dans Explorer. 96. 587 Rapport hauteur/largeur. 400 Dans Explorer. 358 Dans Moyennes. 426 Dans la régression linéaire. 326 Dans Explorer. 431 Diagramme de répartition gaussien. 579 Dans les statistiques de ratio. 427 Dans la régression linéaire. 395 Différences entre les groupes. 461 Diagrammes. 400 Dans GLM . 361 Dans les cubes OLAP. 326. 478 Diagrammes de dispersion. 379 GLM. 395 Dans ANOVA à 1 facteur. 326 Diagrammes d'importance Dans l'analyse TwoStep Cluster. 583 Notes de bas de page. 579 Dimensionnement des diagrammes exportés. 91. 228 Options. 618 Incorporation en tant qu'objets ActiveX. 415 Différence de prévision. 593 Création. 227 Courbe ROC. 227 Enregistrement des données avec un diagramme. 238 . 581 Collage dans d'autres applications. 435. 379 GLM. 345. 427 Dans la régression linéaire. 427 Différence la moins significative. 588 Diagrammes en stalactite. 94. 426 Diagrammes tige et feuille. 96 Copie et collage d'attributs. 345 Diagnostic des observations. 227 Copie dans d'autres applications. 228.Univarié. 227. 53 Différence de bêta. 53. 361 Dans les cubes OLAP. 588 Diagrammes boîtes à moustaches. 352 Dans Récapituler. 219. 613 Modification. 226. 229. 581 Etiquettes d'observations. 478 Diagrammes d'importance des variables Dans l'analyse TwoStep Cluster. 379. 587 Valeurs manquantes. 415 Distances. 400 Diagrammes dispersion/niveau. 638 Aperçu. 361 Différences entre les variables. 90. 226 Masquage. 312 Dans Fréquences. 227. 400 Diagrammes en bâtons. 379. 358 Dans les cubes OLAP. 427 Différence de motif. 264 Dernier. 94. 227. 326. 312 Dans Fréquences. 88 Valeurs manquantes. 487 Classification hiérarchique. 638 Insertion dans le Viewer. 88. 92 Déplacement de lignes et de colonnes. 326 Dans GLM . 591. 232. 593. 326 Dans Explorer. 94. 312 diagrammes en secteurs. 232.Univarié. 613 Sous-titres. 326 Dans la régression linéaire. 84. 618. 435 Exportation. 618 Copie dans d'autres applications. 352. 96 Types de données. 618 Diagrammes partiels. 229 Copie. 94. 426 Diagrammes de profils. 219 Modèles. 326 Diagramme des valeurs propres. 91 Etiquettes de variable. 394 Diagrammes des résidus. 96 Etiquettes de valeurs. 326 Dictionnaire. 395 Dans ANOVA à 1 facteur. 394 GLM. 312 Titres. 395 Différentiel lié au prix (PRD). 361 Différence significative de Tukey. 587 Titres. 613. 92.706 Index Définition de variables. 90 Modèles.

101. 358 Dans les statistiques de ratio. 325 Dans Fréquences. 400 Dans les cubes OLAP. 337 . 104. 415. 555 Dans les tableaux de bord en lignes. 101 Insertion de nouvelles variables. 103 Restrictions concernant la valeur de données. 105 Insertion de nouvelles observations. 186 Echantillonnage. 416 Division. 163 Définition de variables de date. 318 Dans Explorer. 579 Dans les tableaux de bord en colonnes. 101 Largeur de colonne. 77 Ecart absolu moyen (AAD). 85. 427 Dans la régression linéaire. 166 Création de variables de séries chronologiques. 97 Effectif observé. 161.Univarié. 98 Saisie de données. 94 Modification de données. 94. 84. 82 Alignement. 569 Niveau de mesure. 98 Saisie de données numériques. 415 Distances. 98. 416 Transformation de valeurs. 415 Distance euclidienne. 415 Distances. 97. 555. 415 Mesures de similarité. 427. 310 Dans GLM . 186 Echelle. 413 Exemple. 413 Transformation de mesures. 415 Distance de Tchebycheff. 561 Dans le positionnement multidimensionnel. 103. 104 Options d'affichage. 447 Dans la régression linéaire. 105.707 Index Distance de Cook. 413 Calcul des distances existant entre des variables. 413 Mesures de dissimilarité. 400. 103 Observations filtrées. 447 Analyse discriminante. 398. 102. 161. 163. 627 Impression. 100 Modification du type de données. 146 Sélection. 166 Transformations de données. 556 Division dans les colonnes de tableaux. 104 Recherche d'observations. 415. 94. 186 Génération de nombres aléatoires. 325. 100 Modification de données. 415 Distances. 104. 415 Ecart type. 310. 358. 427 GLM. 556 Division de tableaux. 102 Envoi de données vers d'autres applications. 165 Remplacement de valeurs manquantes. 415 Distances. 100. 94 Définition de variables. 579 Dans les statistiques de ratio. 627 Affichage des données. 165. 416 Statistiques. 318. 96 Saisie de données non numériques. 345 Echantillon aléatoire. 398 Distance de Mahalanobis. 337 Tableaux croisés. 427 Distance de Manhattan. 96. 569 Dans l'analyse de fiabilité. 415 Distances. 98 Saisie de données. 295 Données chaîne. 415 Distances. 103. 101. 99. 186 Echantillon aléatoire. 295 Contrôle des sauts de tableau. 548 Dans Moyennes. 415 Distance de Minkowski. 103. 84 Déplacement de variables. 413 Calcul des distances existant entre des observations. 146. 98 Données de séries chronologiques. 103. 161 Droits d'accès. 81. 345. 548. 99. 579 Ecart de taille. 352. 561. 98. 100. 579 Caractéristiques. 161 Fonctions de transformation. 352 Dans Récapituler. 85 éditeur de données.

345. 424 Enregistrement de diagrammes. 240. 618 Fichiers BMP. 400. 358 Dans les cubes OLAP. 651 Enregistrement d'un résultat en mode brouillon en tant que texte. 259 En-têtes. 238. 91. 638 Enregistrement de fichiers. 352. 91 Panneau de légendes. 400 Estimations de Rankit. 232. 400 Dans Moyennes. 238. 240. 250 Publication sur le Web. 98. 358 Dans les cubes OLAP. 310 GLM. 242. 352 Dans Récapituler. 352 Etiquettes. 611 Boîtes de dialogue. 232. 352 Dans Récapituler. 157 Estimations de puissance. 264. 90. 232. 611 Utilisation pour la saisie de données.Univarié. 664 Autoscripts. 325 Dans Fréquences. 638 Fichiers EPS. 651 Résultat en mode brouillon. 74 Fichiers de données. 638 Métafichiers. 232. 175. 240.Univarié. 358 Dans Moyennes. 337 Elimination descendante. 345 Erreur standard d'asymétrie. 157 Estimations de la proportion. 400 Estimations de Tukey. 246. 54. 611 Evénements déclenchants. 54 Enregistrement des différents affichages d'un tableau pivotant. 242 Format WMF. 611 Tableaux pivotants. 259. 325. 264 Etiquettes de valeurs. 345. 400 Estimations de Blom. 352 Dans Récapituler. 104. 175 éditeur de données. 250. 241. 58. 241 Fichiers TIFF. 638 Fichiers PNG. 98 Etiquettes de variable. 240. 157 Estimations de Van der Waerden. 358 Dans les cubes OLAP. 352. 424 Dans la régression linéaire. 611 Dans des fichiers de données fusionnés. 265 Insertion d'étiquettes de groupe. 235 Format HTML.Univarié. 9. 241. 232. 271 Enregistrement des résultats. 638. 238. 398. 318. 232. 358 Dans Moyennes. 240. 400 Dans GLM . 259 Format Excel. 618. 345 Estimation de l'intensité des effets. 240 Fichiers PostScript. 104 Insertion de sauts de ligne. 239. 239. 232. 57. 91 Panneau de légendes. 240. 638 Format Word. 238. 611 Tableaux pivotants. 345 Erreur standard de la moyenne. 175. 596 Dans Explorer. 400 Dans GLM . 241. 236.708 Index Effectif théorique. 259.Univarié. 606. 664 . 638 Fichiers JPEG. 398. 400 Erreur standard d'aplatissement. 265 Etiquettes de groupe. 235 Format Word. 57. 232 Protection par mot de passe. 240 Fichiers WMF. 247 Erreur standard. 157 Estimations des paramètres. 400 Dans GLM . 232. 9. 596 Caractéristiques. 157 Eta carré. 345. 235. 238. 232. 352. 318 Dans Courbe ROC. 74 Fichiers de données SPSS. 638 Format texte. 638 Fichiers PICT. 264 Suppression. 400 Dans GLM . 232. 175 Insertion de sauts de ligne. 238. 157 Ordonner les observations. 337 Tableaux croisés. 236. 358 Dans Moyennes. 352. 232 Format Excel. 638 Enregistrement de diagrammes interactifs avec des données. 310. 238. 58. 606 Dans des fichiers de données fusionnés.

235 Format HTML. 238 Exportation de données. 57. 638. 638 Fichiers dBASE. 75 Transposition. 327. 235 Format Word. 22. 431 Facteurs. 635. 325 Dans Explorer. 627 Ajout d'éléments de menu pour l'exportation de données. 53. 673 Menu Mettre au point. 21. 322 Options. 23 Lecture des plages. 25. 232. 322. 57. 72. 461 F de R-E-G-W (Ryan-Einot-Gabriel-Welsch). 61 Enregistrement. 60 enregistrement des résultats sous forme de fichiers de données au format SPSS. 241. 635 Taille des diagrammes. 328 Diagrammes. 58. 627 Exportation de résultats. 561 Dans l'analyse de fiabilité. 379 GLM. 58 Enregistrement de sous-ensembles de variables. 327 Valeurs manquantes. 598 Enregistrement. 658. 21. 651 Extrêmes. 240. 689 informations sur les dictionnaires. 395 Fenêtre active. 238. 6 Fenêtre active. 61 Ecriture de noms de variable. 564 Dans l'analyse de fiabilité. 226 Ouverture. 61 Ecriture de noms de variable. 61 Lecture des noms de variable. 22 protection. 651 Format Excel. 325 Facteur d'inflation de la variance. 53. 53. 6 Fenêtres d'aide. 171 Serveurs distants. 321. 239. 61 Retournement. 54. 606 fichiers. 564 Fiabilité Split-half. 58 Ouverture. 328 Statistiques. 379. 431 Dans la régression linéaire. 23. 328 Exportation de diagrammes. 461 Factorisation en projections. 6 Fenêtre de script. 235 Format Word. 57. 232 Publication sur le Web. 58 Enregistrement. 25 Fichiers de données. 242. 561. 21. 23 Ouverture. 74. 238. 171 ajout de commentaires. 21 . 241. 4. 684 Onglet Espion. 325 Transformations de l'exposant. 24 Fichiers délimités par des tabulations. 75. 395 Dans ANOVA à 1 facteur. 53 Informations sur les fichiers. 171 Fichiers de feuille de calcul. 466 Factorisation en axes principaux. 240. 58 Lecture des noms de variable. 326 Hypothèses. 57. 6 Fenêtre désignée. 232. 240. 226 Ajout d'un fichier texte dans le Viewer. 23 Ouverture. 21. 57. 466 Facteurs d'Anderson-Rubin. 564 fichier-journal. 684 Onglet Immédiat. 57. 240. 323. 60. 325. 15 Fiabilité de Spearman-Brown. 72. 660. 21.709 Index Explorer. 24. 23. 240. 58. 638 Exportation de diagrammes. 232 Format Excel. 21 Fichiers BMP. 673 Onglet Chargé. 232. 684 propriétés. 638 Production automatisée. 684 Onglet Pile. 236. 74. 238. 232. 682 Navigateur d'objets. 240. 466 Facteurs de Bartlett. 54. 326. 53 Ouverture. 6 Fenêtres. 21. 53. 660 Fenêtre désignée.

238. 313 Statistiques. 88. 232. 239. 89 Format point. 89 Formats d'entrée. 235. 241. 232. 21. 238. 379 GLM. 175 Gamma. 175 informations sur les dictionnaires. 165 Fonction Lissage. 622 Formats monétaires. 307. 697 Ajout de code personnalisé. 175 Fichiers avec observations différentes. 313 Diagrammes. 145. 238. 638 Exportation de diagrammes. 146 Gestion des pages. 252. 309. 240. 232. 232. 89 Format Excel Exportation de résultats. 638 Exportation de diagrammes. 242. 252 Format chaîne. 88. 238. 333 Tableaux croisés. 165 Fonction Décalage positif. 241. 58. 622 années à deux chiffres. 240 Fichiers portables Noms de variable. 239. 623 Format virgule. 57. 232. 638. 165 Fonction Différence. 549 . 557 Dans les tableaux de bord en lignes. 232. 88 Format de colonne. 235. 242. 57. 310 Suppression de tableaux. 240. 21 Fichiers JPEG. 165 Formatage. 238. 21 Fichiers TIFF. 232. 175. 638 Fichiers Lotus 1-2-3. 232. 697 Exportation de résultats. 549. 145 Fonction Somme cumulée. 307. 165 Fonction Médiane mobile. 238. 235 Fréquences. 57. 638 Fichiers Excel. 238. 88. 21 Ouverture. 627 Ajout d'éléments de menu pour l'envoi de données vers Excel. 232. 240. 232. 232. 232. 546 Résultat en mode brouillon. 145. 58 Ouverture. 627 Enregistrement.710 Index Fichiers EPS. 638 F multiple de Ryan-Einot-Gabriel-Welsch. 165 Fonctions. 58. 241. 89. 623 Formats monétaires personnalisés. 57 Fichiers SYSTAT. 89 Formats d'affichage. 232. 58 Fichiers PostScript (encapsulés). 638 Format numérique. 88. 88. 313 Fréquences de classe Dans l'analyse TwoStep Cluster. 638 Fichiers WMF. 288 Format dollar. 172 Fichiers avec variables différentes. 333 Gamma de Goodman et Kruskal. 165 Fonction Moyenne mobile centrée. 89 Formats de date. 557 Dans les tableaux de bord en colonnes. 241. 172. 145 Traitement des valeurs manquantes. 89 Format Word Exportation de résultats. 165 Fonction Différence saisonnière. 638 Fichiers SAS Enregistrement. 333 Génération de nombres aléatoires. 313 Hypothèses. 240 Exportation de diagrammes. 546 Colonnes dans les tableaux de bord. 312. 638 Exportation de diagrammes. 175. 395 Fonction Décalage négatif. 310. 57. 333 Tableaux croisés. 627 Enregistrement. 638 Exportation de diagrammes. 379. 88. 638 Exportation de diagrammes. 232. 312 Formats. 232. 235 Format HTML. 232. 638 Fichiers PNG. 58 Ouverture. 21. 395 Dans ANOVA à 1 facteur. 240 Exportation de diagrammes. 232. 238. 238. 307 Ordre d'affichage. 175 Affectation d'un nouveau nom aux variables. 165 Fonction Moyenne mobile précédente. 479 Fusion des fichiers de données. 21 Fichiers PICT. 288 Modification dans les tableaux pivotants. 627 Ajout d'éléments de menu pour l'envoi de données vers Lotus.

392. 333 Tableaux croisés. 243 Taille des diagrammes. 392. 394. 461. 283 Résultat en mode brouillon. 257. 222. 312. 390 Tests post hoc. 400. 426 ICC. 400. 248 Mise en page. 400 Test T pour échantillons indépendants. 633 Modification des icônes bitmap de la barre d'outils. 283. 390. 258. 295 Diagrammes. 389. 389 Moyennes marginales estimées. 248 Index de concentration. 325. 312 Dans la régression linéaire. 382. 264 Intervalle multiple de Ryan-Einot-Gabriel-Welsch. 246. 389 Termes construits. 564 Icônes. 431 Enregistrement dans la régression linéaire. 401 Affichage. 278. 333 Kappa de Cohen. 461. 606 Justification. 601 Définition. 385. 400 Options. 243. 382 Dans Courbe ROC. 394 Enregistrement de matrices. 333 Khi-deux du rapport de vraisemblance Tableaux croisés. 246 Numéros de page. 333 Tableaux croisés. 431. 596 Dans ANOVA à 1 facteur. 379. 244 Contrôle des sauts de tableau. 333 . 244. 247. 439 Enregistrement dans la régression linéaire. 427. 243 Données. 564 Voir Coefficient de corrélation intra-classe. 464 Journal de session. 398. 228 Imbrication de tableaux pivotants. 599 Utilisation. 608 Kappa. 105 En-têtes et pieds de page. 427. 599. 393 Diagnostics. 395 Histogrammes. 379 GLM. 386.711 Index Gestion du bruit Dans l'analyse TwoStep Cluster. 395 Dans ANOVA à 1 facteur. 333 Tableaux croisés. 295 Aperçu avant impression. 633 Imbrication de diagrammes interactifs. 228 Impression. 390 Termes d'interaction. 608 Résultats. 246. 398 Enregistrement de variables. 494 Analyse de classification des nuées dynamiques. 283 Tableaux pivotants. 257. 367 Intervalles de prévision. 579 Dans les statistiques de ratio. 400. 264 Groupes de variables. 395 Intervalles de confiance. 475 GLM . 367. 53. 247 Espace entre les éléments de résultat. 53 Informations sur les variables. 400 Somme des carrés. 395 Dans ANOVA à 1 facteur. 596 Dans Explorer. 248. 333 Khi-deux de Pearson. 395 Groupement de lignes ou de colonnes. 379. 400 Contrastes. 326 Dans Fréquences. 243. 579 Informations sur les fichiers. 258 Résultats texte. 326. 398 Hypothèses. 387. 222. 597 Insertion d'étiquettes de groupe. 278. 392. 601 GT2 de Hochberg.Univarié. 386 Modèle. 395. 400 Diagrammes de profils. 400. 427 Itérations. 325 Dans la régression linéaire. 392. 105. 439 Enregistrement dans l'ajustement de fonctions. 278. 427 GLM. 389. 248 Redimensionnement de tableaux. 393. 426 Dans Explorer. 379 GLM. 494 Dans Analyse factorielle. 243 Strates.

165 Liste des observations. 345. 274 Lignes et colonnes. 294 Lignes. 325 Dans Explorer. 461 Médiane de groupes. 274. 358 Dans les cubes OLAP. 219. 325 M-estimateurs. 602 LSD de Fisher. 447 Langage Modification du langage des résultats. 278 Contrôle de la largeur par défaut. 274 Matrice de corrélation. 219 Résultats d'une procédure. 449 Analyse discriminante. 398 Matrice des projections factorielles. 564 Lambda. 453 Maximum. 606 menus. 278. 358 Dans Moyennes. 358. 352 Dans Récapituler. 345 Maximum de vraisemblance. 619 Contrôle de la largeur maximale. 224 Réduction. 395 GLM. 318 Comparaison des colonnes de tableaux. 352 Dans Récapituler. 294 Ajout à un tableau. 219. 310 Dans les cubes OLAP. 345 Mémoire. 222. 325 Dans Explorer. 453 Analyse discriminante. 325. 223. 223 Modification des niveaux. 325 Dans Explorer. 345. 556. 453. 602 Réordonnance de listes cible. 297 Largeur de colonne. 333 Lambda de Wilks. 602 Listes de variables. 431. 415 Mesure de distance du Phi-deux. 627 M-estimateur de Huber. 564 Dans l'analyse de fiabilité. 415 Distances. 352. 449 Dans la régression linéaire. 358 Dans les statistiques de ratio. 219. 579 Caractéristiques. 446. 325 M-estimateur redescendant de Hampel. 415 Mesure de distance du Khi-deux. 272 Notes de bas de page. 431 GLM. 325 Mesure de dissimilarité de Lance et Williams. 333 Lambda de Goodman et Kruskal. 310. 293 Sélection dans les tableaux pivotants. 415 Distances. 341 Listes cible. 629 Barres d'outils. 446 Dans Analyse factorielle. 629 Etiquettes de dimension. 77 Légende. 564 Kuder-Richardson 20. 222 Développement. 415 Distances. 333 Tableaux croisés. 286.712 Index KR20. 333 Tableaux croisés. 274. 606 langage de commande. 7. 453 Dans Analyse factorielle. 579 Dans Moyennes. 460 Matrice de covariance. 220. 325 Dans Fréquences. 246. 290 Dans les cellules. 352. 556 Dans Explorer. 290 Marges de page. 395 Marges. 272. 273. 94 Tableaux pivotants. 627 Personnalisation. 447 Analyse discriminante. 223 Légendes. 446. 398. 415 . 274 Résultats. 273 Légendes. 619 Contrôle de la largeur pour texte avec retour automatique à la ligne. 220 Titres. 94. 278 éditeur de données. 246 Masquage. 461 Dans Analyse factorielle. 564 Dans l'analyse de fiabilité. 453 Matrice de transformation. 446. 286 Lecteurs partagés. 224 Dans le Viewer. 318. 293 Lissage T4253H. 453 Dans Analyse factorielle.

416 Métafichiers. 100 . 490 Classification hiérarchique. 310 Dans les statistiques de ratio. 310. 638 Méthodes. 438 Modèle de Guttman. 238. 389 Modification de données. 561. 672 Méthodes de sélection. 75 Chemins UNC. 293 Minimum. 485. 310 Mode distribué. 389 GLM. 318. 591. 70. 325. 490 Analyse de classification des nuées dynamiques. 561 Dans l'analyse de fiabilité. 310 Dans les statistiques de ratio. 75. 485 Classification hiérarchique. 438 Ajustement de fonctions. 77 Système de production. 438 Modèle linéaire. 438 Ajustement de fonctions. 438 Modèle parallèle. 579 Caractéristiques. 481. 78. 318. 579 Dans Moyennes. 613 Définition de variable. 561. 77. 248 Modalité de référence. 561. 276 Application. 352 Dans Récapituler. 438 Modèle exponentiel. 72. 389 GLM. 293 Sélection de lignes et de colonnes dans des tableaux pivotants. 438 Modèle logarithmique. 74. 318 Dans Fréquences. 564 Modèle quadratique. 579 Mesures de similarité. 310. 94. 310 Dans les cubes OLAP. 481. 94. 318 Caractéristiques. 438 Ajustement de fonctions. 325 Dans Fréquences. 310. 310 Dans Fréquences. 96 Diagrammes. 438 Modèle de croissance. 564 Modèle parallèle strict. 438 Ajustement de fonctions. 238 Mise en page. 318 Comparaison des colonnes de tableaux. 415. 613 Modèles de tableaux. 438 Ajustement de fonctions. 247 Taille des diagrammes. 579 Mesures de la distribution. 389 Modèles personnalisés. 392. 68. 352. 438 Modèle inverse. 246. 96. 325. 561 Dans l'analyse de fiabilité. 318 Dans Explorer. 638 Exportation de diagrammes. 358 Dans les statistiques de ratio. 438 Ajustement de fonctions. 438 Modèle cubique. 481. 393 Mode. 78 Enregistrement de fichiers de données. 393 GLM. 248 En-têtes et pieds de page. 275. 276 Modèles factoriels complets. 238. 325 Dans Fréquences. 485 Distances. 564 Modèle de puissance. 556 Dans Explorer. 74 Procédures disponibles. 67. 485 Distances. 438 Ajustement de fonctions. 310. 644 Modèle composé. 561 Dans l'analyse de fiabilité. 310 Mesures de la tendance centrale. 358. 438 Modèle en S. 438 Ajustement de fonctions. 644 Accès aux fichiers de données. 438 Modèles. 275 Création. 438 Ajustement de fonctions. 556. 345 Mise à l'échelle des diagrammes exportés. 232. 579 Dans Explorer. 325 Dans Fréquences. 99.713 Index Mesures de distance. 72. 100. 579 Caractéristiques. 438 Ajustement de fonctions. 415 Mesures de la dispersion. 325. 392. 232. 438 Modèle logistique. 345. 438 Ajustement de fonctions. 481. 416. 275. 247. 69. 672 Objets d'automatisation OLE.

587 Marques. 556 Multiplication dans les colonnes de tableaux. 84. 400 Dans GLM . 288 Notes de bas de page. 345. 345 Moyenne harmonique. 2 Nuées dynamiques. 264 Moindres carrés généralisés. 654 Hypothèses. 349.Univarié. 88. 579 Moyennes. 345. 352 Résultats au format ASCII. 352. 579 Dans les statistiques de ratio. 358 Dans Moyennes. 382.714 Index Modification de l'ordre des lignes et des colonnes. 325. 395 Niveau de mesure. 345. 358 Dans les cubes OLAP. 345. 85 Nombre d'observations. 349. 606 Tableaux pivotants. 673 Newman-Keuls. 400 Moyenne tronquée. 279. 9. 325 Dans Fréquences. 310 Dans les cubes OLAP. 606 fichiers portables. 325 Dans Explorer. 318. 461 Dans Analyse factorielle. 419 Dans la régression linéaire. 349 Options. 495 Efficacité. 494 Distances entre les classes. 279. 493 Enregistrement des informations sur les classes. 352 Dans Récapituler. 489 Aperçu. 84 Notation scientifique. 400 Dans GLM . 352. 351. 495 Exemples. 294 Ajout à un tableau. 400 Moyennes observées. 9. 352 Dans Récapituler. 419 Moyenne. 495 Critères de convergence. 345 Des colonnes de tableaux multiples. 382 Dans Explorer. 355 Moyenne géométrique. 355 Moyennes des sous-groupes. 345 Nombre maximal de branches Dans l'analyse TwoStep Cluster. 358 Dans les cubes OLAP. 85 Noms. 489 Hypothèses. 490 Itérations. 555. 294 Diagrammes. 292 Nouvelles fonctionnalités SPSS 12. 489 Classes d'affectation.0. 325 Multiplication. 358 Dans Moyennes. 84 Règles. 475 Nominal. 395 GLM. 352 Dans Récapituler. 555 Dans les tableaux de bord en lignes. 358 Dans Moyennes. 345 Moyenne pondérée. 579 Caractéristiques.Univarié. 85 Niveau de mesure. 606 Suppression dans le résultat. 654 Sous-groupe. 579 Dans les tableaux de bord en colonnes. 318 Dans ANOVA à 1 facteur. 556. 358 Dans les statistiques de ratio. 494 . 556 Sous-groupe. 291. 355. 85 Définition. 58 noms de variables d'observation mixtes. 461 Moindres carrés non pondérés. 288. 352 Dans Récapituler. 548 Dans Moyennes. 349. 292. 349 Statistiques. 358 Dans les cubes OLAP. 84 Boîtes de dialogue. 358. 310. 606 affichage des noms de variables longs dans les résultats. 461 Dans Analyse factorielle. 70 Serveurs. 85. 352 Moyennes des groupes. 70 Noms de variable. 548. 291 Renumérotation. 352. 352. 461 moindres carrés pondérés. 556 Navigateur d'objets. 85. 349. 355 Moyennes marginales estimées. 352.

654 Ombrage. 670. 246. 21. 263. 684 Options. 667. 613 Diagrammes interactifs. 21. 618. 669 Utilisation dans les scripts. 489 Nombre de classes. 667. 684 Onglet Pile. 291 Dans les cellules. 157 Valeurs ex aequo. 622. 672 Types. 264 Ouverture de fichiers. 684 Fenêtre de script. 22 Fichiers de feuille de calcul. 21 Fichiers Excel. 670. 682 . 21 OXML. 246. 85 Ordonnancement des observations. 606 Modèle de tableau pivotant. 157 Rangs fractionnaires. 682 Dans des scripts. 654 Analyse. 667. 170. 158 Ordre d'affichage. 611. 606. 669. 490 Statistiques. 625 Viewer. 648 Système de production. 622 Etiquettes résultats. 24. 101 Pondération. 103. 101. 22. 157. 156. 684 Fenêtre de script. 611 Générales. 25 Fichiers de données. 490 Positionnement des variables. 495 Numéros de port. 608 Viewer en mode brouillon. 187 Tri. 622. 622 Diagrammes. 157 Scores de Savage. 104 éditeur de données. 495 Valeurs manquantes. 170 Observations filtrées. 670. 606. 157. 333 Pieds de page. 684 Fenêtre de script. 158 Centiles. 625 années à deux chiffres. 670. 183. 21. 333 Tableaux croisés. 689 utilisation de XSLT avec OXML. 673 Aperçu. 21. 648 Phi. 185. 669 Utilisation dans les scripts. 672. 623. 609. 619. 21. 691 Paramètres de ligne de commande. 549 Objets. 672 Navigateur d'objets. 247 Points d'arrêt. 21. 21. 673 conventions d'appellation des variables. 228 Objets d'automatisation. 291 OMS. 490 Remarques sur les données. 606 Scripts. 25 Fichiers dBASE. 103 Sélection de sous-groupes. 21. 673 Objets ActiveX. 691 Onglet Chargé. 673 Observations. 669 Méthodes. 558 Dans les tableaux de bord en colonnes. 490 Procédures apparentées. 619 Monnaie. 104 observations restantes. 489. 618 Données. 613 Ordinal. 24 Fichiers délimités par des tabulations. 669 conventions d'appellation des variables. 188 Insertion de nouvelles observations. 673 propriétés. 684 Fenêtre de script. 187. 21. 183. 684 Onglet Espion. 667. 188 Recherche dans l'éditeur de données. 21 Fichiers SYSTAT. 103. 70 Numérotation des pages. 623 Répertoire temporaire. 608. 669. 667.715 Index Méthodes. 609 Options de diagramme. 558 Dans les tableaux de bord en lignes. 103. 684 Onglet Immédiat. 248. 185. 21 Fichiers Lotus 1-2-3. 689. 21. 613. 85 Niveau de mesure. 549.

277 Protection par mot de passe. 675 Procédures sous-routines. 431 Dans Moyennes. 572 Pourcentages. 352. 572 Modèles de positionnement. 250 Proximités. 574 Définition de la forme des données. 569 Transformation de valeurs. 297 propriétés. 573 Exemple.716 Index Polices. 104 Panneau de légendes. 674 Production automatisée. 571 Dimensions. 278. 345 Hypothèses. 284. 337 Pourcentages en ligne. 152. 572 Critères. 674 Procédures globales. 358 Dans Moyennes. 284 Dans les cellules. 431. 149. 150. 439 Prévisions. 431 Dans la régression linéaire. 570 Mesures de distance. 333 Rapport hauteur/largeur. 650 Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch). 278 Tableaux pivotants. 569 Fonctionnalités supplémentaires. 672 Tableau. 188 Positionnement multidimensionnel. 188. 337 Pourcentages en colonne. 345. 431 Récapituler. 672 Objets d'automatisation OLE. 153. 352 Dans Récapituler. 431 Dans la régression linéaire. 574 Procédures apparentées. 344 Statistiques. 575 Hypothèses. 337 Tableaux croisés. 283 Tableaux pivotants. 674 Scripts. 427 Prévisions pondérées. 337 Pourcentages totaux. 344. 104. 352 Variation de R-deux. 337 Tableaux croisés. 379 GLM. 427 Rapport de risque relatif. 333 Tableaux croisés. 257 Pondération d'observations. 337 Premier. 278. 341 Options. 427. 337 Tableaux croisés. 342. 395 Dans ANOVA à 1 facteur. 481 Classification hiérarchique. 345 Prévision. 674 Procédures fonctions. 635 Profondeur d'arborescence Dans l'analyse TwoStep Cluster. 395 quadrillage. 337 Tableaux croisés. 188 Pondérations fractionnelles dans des tableaux croisés. 570 Remarques sur les données. 439 Enregistrement dans l'ajustement de fonctions. 310 Rapport de covariance. 481 Publication de résultat. 613 R-deux. 159 Redimensionnement de tableaux pivotants. 431 R-deux ajusté. 277. 345 Recodage de variables. 225 Viewer en mode brouillon. 475 programmation avec le langage de commande. 573 Niveaux de mesure. 225. 284 Couleurs. 573 Création de matrices de distance. 379. 570 Statistiques. 284 éditeur de données. 283 Quartiles. 569 Conditionnalité. 341. 398 Procédures. 310 Dans Fréquences. 439 Ajustement de fonctions. 625. 341. 352. 398 GLM. 651 Avec le système de production. 573 Options d'affichage. 439 Enregistrement dans la régression linéaire. 257. 427 Dans la régression linéaire. 283 . 358 Dans les cubes OLAP.

606 Variable d'environnement SPSSTMPDIR. 593 Régression multiple. 217 Retour à la ligne automatique. 97 Utilisation d'étiquettes de valeurs. 227. 593 Courbe ROC pour les probabilités. 464 Dans Analyse factorielle. 167 Tendance linéaire.717 Index Régression. 425 Régression logistique. 227 Copie et collage de plusieurs éléments. 293 Modification du langage des résultats. 251 Centrage. 419. 638 Affichage. 419 Remplacement de valeurs manquantes. 427 Statistiques. 427 Dans la régression linéaire. 251. 337. 98 Non numérique. 464 Rotation oblimin directe. 606 Suppression. 420 Méthodes de sélection des variables. 219. 220. 96. 419 Diagrammes. 427 GLM. 232. 278 Contrôle de la largeur de colonne pour texte avec retour automatique à la ligne. 426 Régression linéaire. 220. 464. 91 Sauts de tableau. 419 Résidus. 221. 337 Résidus de Student. 97. 98 Sauts de ligne étiquettes de variable et de valeur. 426 Enregistrement de nouvelles variables. 427 Résidus standardisés. 419 Dans la régression linéaire. 464 Rotation quartimax. 167 Interpolation linéaire. 333 R multiple. 419. 606 Résidu non standardisé. 167 Répertoire temporaire. 98. 424. 606. 426 Diagrammes. 431 Rotation d'étiquettes. 222. 419 Régression linéaire. 464 Dans Analyse factorielle. 439 Enregistrement dans l'ajustement de fonctions. 278 étiquettes de variable et de valeur. 220. 249 Exportation. 464 Dans Analyse factorielle. 333. 464 Saisie de données. 403 Tableaux croisés. 226. 265 Rotation equamax. 220. 232. 333 Risque. 420. 398 Résultats. 419 Régression multiple. 295 . 398 GLM. 230 déplacement. 464 Dans Analyse factorielle. 398 Résidus. 222. 427 Tableaux croisés. 249. 217. 219 Alignement. 91 Rho. 427 Dans la régression linéaire. 220 Enregistrement. 221 Viewer. 427 Exportation des informations du modèle. 422. 608 Brouillon. 167 Moyenne de la série. 606 Définition de la position en mode local. 608. 219 Modification. 98 numérique. 403 Corrélations bivariées. 431 Valeurs manquantes. 333 Tableaux croisés. 398. 432 Variable de sélection. 608 Collage dans d'autres applications. 431. 424. 427 GLM. 427. 398. 427 Hypothèses. 464 Rotation Varimax. 293. 432 Pondérations. 431 Dans la régression linéaire. 398 Résidus supprimés. 432 Blocs. 220. 167 Moyenne des points voisins. 230. 427 Dans la régression linéaire. 222. 167 Médiane des points voisins. 221 Copie dans d'autres applications. 226 Copie. 427. 96. 638 Masquage. 221. 439 Enregistrement dans la régression linéaire.

68. 661. 673 Scripts de procédures globales. 78. 358 Caractéristiques. 579 Caractéristiques. 74 Modification. 675 Utilisation d'objets d'automatisation. 333 Statistique de Durbin-Watson. 70 Ajout. 310 Dans les cubes OLAP. 667. 669 Exécution. 644 Accès aux fichiers de données. 660 Fichier d'autoscript. 185 Intervalle de temps. 310. 358 Dans les statistiques de ratio. 587 Sous-totaux. 345 Statistique de Brown-Forsythe. 75 Ajout. 662. 74. 69. 653 Assistant script. 390 Sous groupes d'observations. 333 Tableaux croisés. 358. 390 GLM. 70 Numéros de port. 666 Avec syntaxe de commande. 666 Fichier de procédures globales. 187 Plage d'observations. 352. 625. 186. 670. 271 Somme. 685. 70 Connexion. 661 Autoscripts. 69 Enregistrement de fichiers de données. 682. 345. 352. 183. 157 Ordonner les observations. 187 Plage de dates. 183. 185. 69 Modification. 677. 187 Sélection progressive. 675 Sélection ascendante. 655. 382 Dans ANOVA à 1 facteur. 632. 78 Connexion. 72. 669. 70 Noms. 653. 13 Nouvelles fonctionnalités. 658. 186 Sélection. 424 Dans la régression linéaire. 310 Dans les cubes OLAP. 70 Chemins UNC. 625. 72.718 Index Scores de Savage. 75. 70 Serveurs distants. 333 Statistique de Welch. 644 Seuil initial Dans l'analyse TwoStep Cluster. 187 Echantillon aléatoire. 77 Système de production. 345. 389. 70 Procédures disponibles. 318. 333 Tableaux croisés. 424 Sélection d'observations. 653 Exécution avec les boutons de la barre d'outils. 67. 627 Ajout d'une description. 662. 183. 632 Fenêtre de script. 653. 677. 70. 627. 157 Scripts. 185. 557 Dans les tableaux de bord en colonnes. 382 Statistique de Cochran. 186 En fonction de critères de sélection. 677 Aperçu. 684 Déclaration de variables. 382 . 310. 679 Création. 687 Boîtes de dialogue. 625. 185. 662. 358 Dans Moyennes. 187 Echantillon aléatoire. 352 Dans Récapituler. 77. 157 Scores normaux. 352 Dans Récapituler. 682 Ajout aux menus. 345 Somme des carrés. 431 Dans la régression linéaire. 382 Dans ANOVA à 1 facteur. 579 Dans Moyennes. 662 Débogage. 69. 187 Sous-titres Diagrammes. 318. 658. 2 Standardisation Dans l'analyse TwoStep Cluster. 655. 677. 318 Dans Fréquences. 654. 186. 318 Dans Fréquences. 668. 424 Serveurs. 424 Dans la régression linéaire. 70. 431 Statistique de Mantel-Haenszel. 389. 185. 187. 557 SPSS Etapes de base. 475 Statistique d'intervalle. 475 Signets. 658. 685.

637 Ajout aux menus. 647 Installation du manuel Command Syntax Reference. 579 Dans Explorer. 297.719 Index Statistique médiane. 300. 278. 627. 685. 297. 687 Avec scripts. 609. 358. 315 Dans Explorer. 648. 685. 627 Collage. 608. 310. 632 Fichier de résultat. 267. 278. 310 Dans les cubes OLAP. 608. 15 Journal. 579 Dans Moyennes. 299. 298. 606 Installation du manuel Command Syntax Reference. 288 Symbole pourcentage. 288 Syntaxe. 606. 243. 267. 15. 288 Tableaux pivotants. 345 Statistique R. 400. 283 Modification. 635. 302. 606. 577 Statistiques. 577. 288 Tableaux pivotants. 641. 579 Hypothèses. 687 Collage. 650 Règles de syntaxe. 298 Règles du système de production. 299 Collage dans des scripts. 243. 315. 332 Affichage. 606 Formatage du système de production. 637 Système de gestion des résultats. 15 Journal. 479 Dans les statistiques de ratio. 267 Impression. 298. 579 Dans Récapituler. 300 fichier-journal. 637. 302. 606. 283. 638. 302. 304 Suppression de résultats. 608. 579 Statistiques descriptives. 687 Exécution. 689. 569 Student-Newman-Keuls. 304 Exécution avec les boutons de la barre d'outils. 395 Dans ANOVA à 1 facteur. 606 Système de production. 645 Exportation de diagrammes. 300. 395 Suppression d'étiquettes de groupe. 221 Symbole dollar.Univarié. 269 Tableaux croisés. 638 Fichiers de résultat. 609. 577. 345. 635. 304. 648 Publication de résultat. 579 Caractéristiques. 689 Système de mesure. 609. 644. 638 Exportation de résultats. 304 Exécution de la syntaxe de commande avec les boutons de la barre d'outils. 345 Strates. 298 Règles du système de production. 325 Dans Fréquences. 569 Dans le positionnement multidimensionnel. 635 Options. 304. 637 . 431 Dans Moyennes. 267 Stress. 637 Syntaxe de commande. 300 fichier-journal. 650 Publication sur le Web. 352 Statistiques de ratio. 635. 325 Dans Fréquences. 352. 352. 569 Stress S. 648 Programmation des tâches de production. 352 Dans Récapituler. 304. 685. 332 Tableaux pivotants. 269 Création. 637. 644 Paramètres de ligne de commande. 269. 265 Suppression de plusieurs commandes EXECUTE dans les fichiers de syntaxe. 304. 304. 325. 609 Règles de syntaxe. 325. 400 Dans l'analyse TwoStep Cluster. 578. 302. 299 Exécution. 608. 310 Dans GLM . 358 Dans les statistiques de ratio. 299. 631. 650 Contrôle du format avec la syntaxe de commande. 647 Contrôle du format des tableaux pivotants. 304. 310. 569 Dans le positionnement multidimensionnel. 631 Fichier de résultat. 267. 431 Dans la régression linéaire. 644. 643. 345. 379 GLM. 645. 269. 609 Règles de syntaxe. 632. 379. 608. 15.

278. 283. 558 Tableaux de bord en lignes. 330. 295 Tableaux croisés. 295 Contrôle des sauts de tableau. 543. 556 Format de colonne. 280. 549. 559 Colonne de total. 278. 395 Dans ANOVA à 1 facteur. 307 Tableaux pivotants. 339. 546 Gestion des pages. 558 Valeurs manquantes. 333. 226. 552 Variables en colonnes. 395 T3 de Dunnett. 553. 295 Contrôle du format des tâches de production. 332 Suppression de tableaux. 226. 261. 229. 283. 549. 230 Déplacement de lignes et de colonnes. 267. 263. 261. 548 Mise en page. 265 Exportation au format HTML. 557 Syntaxe de commande. 227 Copie et collage de plusieurs tableaux. 556 Tableaux de bord en colonnes. 546. 552. 330 Pondérations fractionnelles. 553. 543 Syntaxe de commande. 556 Multiplication des valeurs de colonnes. 227. 645 Affichage des bordures masquées. 549 Variables dans les titres. 232. 645 Copie. 395 Tableau croisé. 230 Collage sous forme de tableaux. 559 Critères d'agrégation. 230. 379. 556 Comparaison des colonnes. 619. 265. 333 Strates. 325 Dans Explorer. 552 Valeurs manquantes. 548. 546 Gestion des pages. 277. 294 Ajustement de la largeur de colonne par défaut. 232. 553. 275. 557 Mise en page. 339 Hypothèses. 272. 333. 546. 379 GLM. 229. 557. 272 Ajout de légendes. 543 Totaux composites. 550 Numérotation des pages. 329. 556. 638. 228. 553 Tableaux de bord en lignes. 229 Contrôle des sauts de tableau. 329 tableaux de fréquences. 379 GLM. 263. 556 Tableaux de bord en colonnes. 556 Colonne de total. 558 Sous-totaux. 275. 329 Tableaux. 283 Affichage et masquage des cellules. 188 Statistiques. 395 Dans ANOVA à 1 facteur. 329 Variables de contrôle. 553. 332 Tableaux de bord. 279. 229 Collage en tant que texte. 294. 265. 295. 559 Total général. 293. 230. 556 Division des valeurs de colonnes. 282.720 Index Remplacement de valeurs dans des fichiers de syntaxe. 325 Dans Fréquences. 333. 556. 379. 331. 606 Utilisation de la syntaxe de commande à partir du journal. 329 Tableaux croisés. 282 Collage dans d'autres applications. 264 Dissociation de lignes ou de colonnes. 226. 219. 333. 243. 332. 333. 550. 227. 264. 543. 641 Sollicitation de macros. 638 . 333 Formats. 552 Séquences de tri. 643 Spécification d'un serveur distant. 558. 559 Titres. 264. 619 Bordures. 549 Pieds de page. 263. 337. 550 Numérotation des pages. 285. 266. 188. 543. 644 Utilisation de la syntaxe de commande à partir d'un fichier-journal. 543 Tableaux de contingence. 261. 550. 609 T2 de Tamhane. 339 Affichage de cellules. 307. 337 Diagrammes en bâtons juxtaposés. 608. 261. 227 Copie dans d'autres applications. 332. 262. 543 Espacement de ventilation. 226 Collage en tant que métafichiers. 548 Format de colonne.

326 Test de McNemar. 333 Tau-b de Kendall. 379 GLM. 460 Dans Analyse factorielle. 333 Tau de Goodman et Kruskal. 278. 326 Test de sphéricité de Bartlett. 228 Insertion d'étiquettes de groupe. 267 Suppression d'étiquettes de groupe. 564 Dans l'analyse de fiabilité. 333 T-carré de Hotelling. 503 Hypothèses. 379 GLM. 500. 333 Tableaux croisés. 333 Tau de Kruskal. 446 . 446 Analyse discriminante. 326.Univarié. 619 Modification. 379. 295 Impression de strates. 379. 261. 262 propriétés. 225 Tau-b. 333 test de Scheffé. 266 Rotation d'étiquettes. 275. 283 Recherche de définitions d'étiquette. 263 Impression de grands tableaux. 561 Dans l'analyse de fiabilité. 333 Tableaux croisés. 293 Strates. 382 Dans Explorer. 502 Valeurs théoriques. 264 Modification de plusieurs tableaux. 379 GLM. 395 Dans ANOVA à 1 facteur. 333 Tau-c de Kendall. 390 Test d'additivité de Tukey. 333. 333 Tableaux croisés. 225 Dans la légende. 382. 266 Redimensionnement à des fins d'ajustement à la page. 333 Test M de Box. 261 Pivotement. 502 Valeurs manquantes. 403 Tableaux croisés. 395 Test de Gabriel. 243 Incorporation en tant qu'objets ActiveX. 278 quadrillage. 333 Tableaux croisés. 333 Tableaux croisés. 460 Test du Khi-deux. 275 Modification de l'ordre d'affichage. 498. 395 Test de Shapiro-Wilks. 280 Groupement de lignes ou de colonnes. 379 GLM. 561 Test d'intervalle multiple de Duncan. 561. 501. 264 Identification des dimensions. 326 Dans GLM . 261. 333 Tableaux croisés. 501 Options. 395 Dans ANOVA à 1 facteur. 283 Rétablissement des valeurs par défaut. 379. 564 Termes d'interaction. 263 Utilisation d'icônes. 265 Sélection de lignes et de colonnes. 502. 333 Tau-c. 403 Corrélations bivariées. 561 Dans l'analyse de fiabilité. 264 Largeur des cellules. 379. 498 Intervalle théorique. 262 Tailles. 501 Test exact de Fisher. 333 Tableaux croisés.721 Index Formats de cellule. 261 Masquage. 395 Test de Games-Howell. 277 Propriétés des notes de bas de page. 261 Modification de l'aspect. 395 Dans ANOVA à 1 facteur. 326 Dans Explorer. 400 Test de Lilliefors. 263. 219 Modèle de tableau par défaut des nouveaux tableaux. 501. 395 Test de Levene. 326 Dans Explorer. 390 GLM. 400 Dans ANOVA à 1 facteur. 265 Texte de suite. 285 Manipulation. 498. 283 Transposition de lignes et de colonnes. 279 Propriétés générales. 502 Statistiques. 395 Dans ANOVA à 1 facteur.

283 Titres. 622 Calcul de variables. 395 Test t pour deux échantillons. 379 GLM. 364. 333 Tableaux croisés. 363. 431 Dans la régression linéaire.722 Index Tests d'homogénéité de la variance. 159. 163. 363 Test T pour échantillons indépendants. 159 Retardement de l'exécution. 638 Ajout au Viewer. 352 Tests de normalité. 362 Diagrammes. 400 Tests de colinéarité. 395 Dans ANOVA à 1 facteur. 558 Transformations conditionnelles. 226. 225. 141. 152. 366. 188 Agrégation de données. 152. 149. 172. 171. 150. 144. 333 Test à un échantillon. 236. 172. 326 Tests du Khi-deux. 366 Hypothèses.Univarié. 363 Test T pour échantillons indépendants. 366 Variables de regroupement. 379 GLM. 182 Fusion des fichiers de données. 395 Dans ANOVA à 1 facteur. 333 Indépendance. 293 Exportation d'un résultat en mode brouillon en tant que texte. 638 Texte d'étiquette vertical. 367 Variables chaîne. 170 . 654 Graissage automatique dans le résultat. 431 Tests de l'indépendance. 178. 145 Ordonnancement des observations. 395 test t de Student. 400 Test T pour échantillons indépendants. 326 Dans Explorer. 225 Ajout d'un fichier texte dans le Viewer. 283 Pour les tableaux pivotants. 333 Correction pour la continuité de Yates. 175 Pondération d'observations. 379 GLM. 170 Transposition de lignes et de colonnes. 143 Transformations de données. 400 Dans ANOVA à 1 facteur. 333 Tests de linéarité. 145. 178 Analyse de fichier scindé. 333. 400 Dans GLM . 382. 153. 232. 171 Tri d'observations. 156. 558 Dans les tableaux de bord en colonnes. 379. 143 Variables chaîne. 171 Tri d'observations. 333 Tests non paramétriques. 367 Options. 395 Test t de Sidak. 236. 182. 150.Univarié. 263 Transposition des variables et des observations. 153. 362 Ajout au Viewer. 293. 333 Rapport de vraisemblance. 188 Transposition des variables et des observations. 143. 232. 654 Totaux généraux. 364 Intervalles de confiance. 149. 395 Dans ANOVA à 1 facteur. 225. 366 Texte. 175. 379. 587 Tolérance. 431 Dans la régression linéaire. 141 Fonctions. 161. 622 Séries chronologiques. 251 Dans les cellules. 363 Test t de Dunnett. 367 Valeurs manquantes. 363 Test t de Waller-Duncan. 156 Recodage de valeurs. 225 Dans les cubes OLAP. 363. 498 Test du Khi-deux. 259 Exportation de résultat en tant que texte. 333 Pearson :. 251. 431 Totaux. 259. 161. 379. 352 Dans Moyennes. 333 Association linéaire par linéaire. 170. 163 Transformations conditionnelles. 265 Texte de suite. 498 Tests t. 144 Transformations de fichiers. 382 Dans GLM . 333 Khi-deux. 498 Test exact de Fisher. 365. 226 Création de résultats texte. 367 Définition de groupes.

103 V. 549 Définition. 102. 89 Modification. 92. 325 Dans Fréquences. 149. 166 Test du Khi-deux. 431. 325 Dans Explorer. 475 Dans la régression linéaire. 410 Tableaux croisés. 426 Valeurs influentes. 92 Valeurs manquantes spécifiées par l'utilisateur. 325 Dans l'analyse TwoStep Cluster. 427 Dans la régression linéaire. 150. 431 Valeurs standardisées. 288 Format d'affichage des tableaux pivotants. 159 Sélection dans des boîtes de dialogue. 382 Dans Corrélations partielles. 406. 315 Variable d'environnement SPSSTMPDIR. 92 Diagrammes. 333 Valeurs. 145. 432. 88 Devise personnalisée. 406 Dans Analyse factorielle. 166. 426 Dans Explorer. 310 Dans les cubes OLAP. 92. 150. 152. 11 Variables chaîne. 555 Caractéristiques. 345. 332. 333 Tableaux croisés. 89 Formats d'entrée. 8. 161 Variance. 175. 606 Variables de contrôle. 101 Ordre d'affichage dans les boîtes de dialogue. 425 Variables. 606 Recodage. 92 Valeurs propres. 92. 502 Test T pour échantillons indépendants. 92 Variables d'environnement. 88. 358 Dans les tableaux de bord en colonnes. 367 Variables chaîne. 328. 549. 606 SPSSTMPDIR.723 Index Tukey. 310. 11 Insertion de nouvelles variables. 427 GLM. 352 Dans Récapituler. 144. 145. 84. 89. 318 Dans Explorer. 432. 333 Tableaux croisés. 447 Analyse discriminante. 325. 288 Valeurs éloignées. 159 Valeurs manquantes. 88. 325. 159 Boîtes de dialogue. 467 Dans ANOVA à 1 facteur. 467. 425 Dans la régression linéaire. 382. 596 Dans Explorer. 447 . 11. 153. 11. 101. 558 Dans les tableaux de bord en lignes. 8. 461 Dans la régression linéaire. 8 Calcul de nouvelles variables chaîne. 599. 606 Affectation d'un nouveau nom aux fichiers de données fusionnés. 558. 315 Caractéristiques. 345 V de Cramer. 548. 153. 412 Dans Courbe ROC. 599 déplacement. 149. 623 Définition. 460 Dans Analyse factorielle. 102 Informations sur la définition. 623 Formats d'affichage. 460. 606 Variable de sélection. 325 Types de données. 175 Boîtes de dialogue. 410 Dans Corrélations partielles. 328 Dans la régression linéaire. 596 Corrélations bivariées. 555 Dans les tableaux de bord en lignes. 432 Dans les tableaux de bord en colonnes. 161 Définition pour des données de séries chronologiques. 152. 159. 8 Définition. 597 Informations sur les variables dans les boîtes de dialogue. 597. 318. 144 Recodage en nombres entiers consécutifs. 398 Valeurs manquantes. 84 Définition de groupes de variables. 88. 548 Dans Moyennes. 502. 333 V de Rao. 412. 367. 352. 145 Remplacement dans des données de séries chronologiques. 332 Variables de date. 358. 398. 103. 588 Fonctions.

220 Développement de la ligne de légende. 611 Affichage des noms de variable. 221. 225. 224. 221 Viewer en mode brouillon. 608 Panneau de légende. 226. 217. 608. 225 Options d'affichage. 225 Modification des niveaux de la ligne de légende. 217 Réduction de la ligne de légende. 249. 231. 651 XML enregistrement des résultats sous forme de fichiers XML. 258. 606. 257 Options d'affichage. 259 Format de résultat. 226 Légende. 258 Modification des polices. 609 Web. 651 Publication de résultat. 219. 217 Panneau de résultats. 611 Affichage des valeurs de données. 223 Suppression de résultats. 252 Bordures de colonnes. 248. 252 Enregistrement des résultats. 252. 611 Collage spécial d'objets. 223. 257. 222 Masquage de résultats. 249 Espace entre les éléments de résultat. 252 Bordures de lignes. 221 Déplacement du résultat. 611 Affichage des étiquettes de valeurs. 223 Enregistrement du document. 689 résultat OXML depuis OMS. 252. 252 Contrôle de l'affichage par défaut des résultats. 251. 224 Modification des tailles de la légende. 257. 252. 691 . 609 Bordures de cellules. 219 modification de la police de la légende. 222. 691 XSLT utilisation avec OXML.724 Index Viewer. 606 Définition du type de Viewer par défaut. 220. 259. 611 Affichage des étiquettes de variable. 221. 248 Insertion de diagrammes. 225. 257. 252 Impression. 252 Caractères de la boîte. 231 Copie de résultats.