Guide de l'utilisateur
© 2019 SAP SE ou société affiliée SAP. Tous droits réservés.
1 Bienvenue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4 Data Insight. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.1 Projet Enterprise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27
4.2 Assistant de qualité des données Data Insight. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3 Ajouter des tables et des fichiers aux projets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Ajout de tables par nom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Ajout de tables par exploration des métadonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Affichage de définitions de table lors de l'exploration des métadonnées. . . . . . . . . . . . . . . . . . . 32
Ajout de fichiers par exploration des métadonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Suppression d'une table ou d'un fichier d'un projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Recherche de tables ou de fichiers dans une connexion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.4 Gestion des métadonnées importées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Objets dépendants et dépendances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36
Rapprochement des métadonnées importées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Suppression des métadonnées importées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.5 Contrôle de l’ordre des colonnes de tables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.6 Formats de fichiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Création d'un format de fichier pour un fichier plat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Création d'un format de fichier pour un fichier Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Options d'organisation des champs dans un format de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . 49
Groupes de formats de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
Modification d'un format de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Copie d'un format de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Guide de l'utilisateur
2 PUBLIC Contenu
Affectation d'un format de fichier à un fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Affichage de l'utilisation d'un format de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Suppression d'un format de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.7 Vues Data Insight. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Fenêtre Editeur de vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Onglets de l'Editeur de vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Création d'une colonne de sortie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Modification d'une vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Ajout de sources à une vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Suppression de sources d'une vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62
Création d'une vue avec Join. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62
Conditions de jointure associées aux vues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Création d'un classement de jointures. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Expressions de condition de jointure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Editeurs d'expressions avancés pour les vues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Combinaison de sources à l’aide de Union ou Union de tous. . . . . . . . . . . . . . . . . . . . . . . . . . . .70
Modification du schéma de sortie pour personnaliser les vues. . . . . . . . . . . . . . . . . . . . . . . . . . 72
Affichage de l'utilisation d'une vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Copie d'une vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Utilisation de tables SAP dans des vues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Conditions de filtre associées aux vues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Expressions de condition d'agrégat et Group by. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.8 Afficher les données source. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Affichage des données source à partir de la fenêtre Parcourir les métadonnées. . . . . . . . . . . . . . 83
Affichage des données source à partir de la liste Tables source. . . . . . . . . . . . . . . . . . . . . . . . . .84
Affichage d'un sous-ensemble de colonnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Filtrage des données affichées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Tri des données affichées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Exportation des données affichées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.9 A propos du profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Création d'une tâche de profilage des colonnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87
Profilage de type de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Tâche de profilage des adresses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Création d'une tâche de profilage des dépendances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Création d'une tâche de profilage de redondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Création d'une tâche de profilage d'unicité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Options d'échantillonnage pour les données de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.10 Affichage des résultats de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Affichage des résultats de profilage de colonne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .98
Afficher les résultats du profilage Contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Afficher les résultats de profilage Adresses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Guide de l'utilisateur
Contenu PUBLIC 3
Affichage des résultats de profilage des dépendances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Affichage des résultats de profilage de redondances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Afficher les résultats de profilage Unicité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Affichage des résultats de profil et de scorecard dans Gestion des métadonnées. . . . . . . . . . . . 106
Valeurs des résultats de profil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.11 Gestion des tâches de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Modification d'une tâche de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Exécution d'une tâche de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .108
Exécution d'une tâche de profilage dans le projet Enterprise. . . . . . . . . . . . . . . . . . . . . . . . . . .109
Suppression d'une tâche de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Création d'un filtre de tâches de profilage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Visualisation et modification des paramètres d'affichage du profil. . . . . . . . . . . . . . . . . . . . . . . 111
Paramètres d'affichage du profil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Association de types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.12 Règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Calcul des scores des règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .114
Création de règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .116
Processus d'approbation de la règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Expressions avancées associées aux règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .137
Attributs personnalisés pour les règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Liaison de règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Création et planification d'une tâche d'exécution de règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . .149
Exécution d'une tâche d'exécution de règle dans le projet Enterprise. . . . . . . . . . . . . . . . . . . . . 151
Recherche de règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Ajout de règles publiques à votre projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
Suppression de règles publiques d'un projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Affichage de l'emplacement d'utilisation des règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Notifications par e-mail relatives à la règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle. . . . . . . . . . . . . . . . 158
Visualisation des résultats de règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.13 Assistant de nettoyage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .187
Nettoyage et correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Présentation du processus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Configuration d'une nouvelle solution de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . 189
Gestion de vos solutions de nettoyage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
Résultats de nettoyage et de correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
Résultats du nettoyage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .204
Résultats de la correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Codes d’information et de statut dans d’autres colonnes de données. . . . . . . . . . . . . . . . . . . . 239
Colonnes relatives aux codes d’information des données ne concernant pas l'adresse et de
statut. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
Guide de l'utilisateur
4 PUBLIC Contenu
Colonnes d'informations correspondantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
Résumé de la solution de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Publication de votre solution de nettoyage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Fermeture d'une solution de nettoyage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .265
4.14 Scorecards. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
Domaines de données clés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
Envoi de notifications par e-mail pour les domaines de données clés. . . . . . . . . . . . . . . . . . . . .270
Vues de scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
Liens de scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Calcul des scorecards. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
4.15 Analyse de la valeur commerciale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .288
Configuration des coûts par échec d'enregistrement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .289
Renseignement de la feuille de calcul de la valeur commerciale. . . . . . . . . . . . . . . . . . . . . . . . 290
Affichage de l'analyse de la valeur commerciale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .291
4.16 Langage de script. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
Catégories de création d'expressions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .295
Validation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
Syntaxe de langage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
4.17 Types de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
Descriptions de types de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
Traitement du type de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
4.18 Types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
Création de types de contenu personnalisés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
Affichage des dépendances de type de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
Gestion des types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
Meilleures pratiques relatives aux types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
4.19 Exportation et importation de projets et d'objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
Exportation d'un projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .430
Exportation d'un objet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430
Exportation de types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
Exportation des liaisons de règle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
Exportation de règles vers Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
Importation d'un projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436
Importation d'un objet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
Importation de types de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .439
Importation de règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .440
Importation des liaisons de règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
4.20 Exportation de résultats de profil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
4.21 Exportation de tâches pour le planificateur externe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444
Guide de l'utilisateur
Contenu PUBLIC 5
5.2 Catégories Metadata Management. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
5.3 Navigation dans les métadonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
5.4 Recherche d'objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
5.5 Paramètres de chaîne de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
5.6 Résultats de la recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
5.7 Navigation dans les détails de la recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
5.8 Recherche avancée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
Recherche avancée dans Gestion des métadonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
5.9 Relations des métadonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
Affichage de diagrammes d'impact et de lignage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .459
Développement de systèmes dans un diagramme relationnel. . . . . . . . . . . . . . . . . . . . . . . . . .459
Développement progressif de nœuds. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461
Recherche d'objets dans un diagramme d'impact ou de lignage. . . . . . . . . . . . . . . . . . . . . . . . 463
Options d'affichage dynamique pour les diagrammes d'impact et de lignage. . . . . . . . . . . . . . . 463
Autres métadonnées pour les diagrammes d'impact et de lignage. . . . . . . . . . . . . . . . . . . . . . 464
Modification des paramètres d'affichage de relations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
Vues graphique et tabulaire de relations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .466
5.10 Relations définies par l'utilisateur entre des objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
Établissement de relations définies par l'utilisateur à l'aide du bac à objets. . . . . . . . . . . . . . . . 470
Suppression d'une relation définie par l'utilisateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
Importation des relations définies par l'utilisateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
5.11 Ajout d'annotations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
5.12 Attributs personnalisés pour les objets de métadonnées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .472
5.13 Modifier les préférences des relations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473
Objet identique dans plusieurs systèmes source . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .473
Préférences d’impact et de lignage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474
Règles d'équivalence d'objet pour les relations identiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . 474
5.14 Exportation d'objets relationnels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475
Ajout d'objets relationnels au bac à objets pour exportation. . . . . . . . . . . . . . . . . . . . . . . . . . . 477
Exportation d'objets depuis le bac à objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477
Exportation d'objets pour créer un univers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479
5.15 Affichage de rapports de métadonnées personnalisés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
Interrogation de rapports Crystal utilisant des vues du référentiel. . . . . . . . . . . . . . . . . . . . . . .482
Scénarios d'utilisation de vues ou de tables pour la personnalisation des rapports Crystal. . . . . 483
5.16 Affichage des données de connexion Data Insight. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483
5.17 Affichage des tables et des scores Data Insight dans Metadata Management. . . . . . . . . . . . . . . . . 483
5.18 Affichage des résultats de profilage depuis les tables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
5.19 Affichage des résultats de profilage depuis les colonnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
5.20 Objets dans une source d'intégrateur SAP BusinessObjects Enterprise. . . . . . . . . . . . . . . . . . . . . 485
5.21 Relations d'objets SAP BusinessObjects Enterprise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
5.22 Métadonnées associées aux types de rapports. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
Guide de l'utilisateur
6 PUBLIC Contenu
5.23 Sources des vues des calculs SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491
5.24 Impact et lignage pour la vue des calculs SAP HANA en tant que source. . . . . . . . . . . . . . . . . . . . .492
5.25 Objets SAP NetWeaver BW comme sources. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
5.26 Types d’objets SAP BusinessObjects Business Intelligence (BI). . . . . . . . . . . . . . . . . . . . . . . . . . . 494
5.27 Métadonnées affichées pour les objets SAP BusinessObjects Enterprise. . . . . . . . . . . . . . . . . . . . 495
5.28 Affichage de l'analyse d'impact des champs de rapports Crystal. . . . . . . . . . . . . . . . . . . . . . . . . . 499
5.29 Affichage des résultats de la collection de dossiers personnels. . . . . . . . . . . . . . . . . . . . . . . . . . . 500
5.30 Relations pour objets d'univers et rapports. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
Analyse d'impact pour un objet d'univers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
Analyse de lignage pour un objet d'univers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
Analyse de lignage d'un rapport à partir d'un objet d'univers. . . . . . . . . . . . . . . . . . . . . . . . . . 506
5.31 Relations pour les espaces de travail OLAP et les applications Design Studio. . . . . . . . . . . . . . . . . 507
5.32 Relations pour les objets Lumira. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508
Analyse de lignage pour un récit Lumira depuis un univers. . . . . . . . . . . . . . . . . . . . . . . . . . . .508
5.33 Affichage du lignage des données Crystal Reports ou Web Intelligence depuis la zone de
lancement BI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
Affichage du lignage des données Crystal Reports ou Web Intelligence depuis la zone de
lancement BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .510
5.34 Relations des sources SAP NetWeaver BW. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .510
Objets SAP NetWeaver BW utilisés par un rapport Crystal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 510
Lignage des données d'un rapport à partir d'une requête BW. . . . . . . . . . . . . . . . . . . . . . . . . . 512
Lignage des données d'univers à partir d'un InfoCube. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512
Lignage des données de Crystal Report à partir d'un objet de banque de données. . . . . . . . . . . 513
5.35 Relations pour les utilisateurs et les groupes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513
Recherche de privilèges utilisateur pour les rapports et les univers. . . . . . . . . . . . . . . . . . . . . . 513
Recherche de privilèges de groupe pour les rapports et les univers. . . . . . . . . . . . . . . . . . . . . . 514
Affichage de l'analyse d'impact pour les utilisateurs et les groupes. . . . . . . . . . . . . . . . . . . . . . 514
Privilèges et droits sur les objets pour les utilisateurs et les groupes. . . . . . . . . . . . . . . . . . . . . 515
5.36 Objets de métadonnées SAP NetWeaver Business Warehouse. . . . . . . . . . . . . . . . . . . . . . . . . . . .516
Relations d'objets SAP NetWeaver BW. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525
Attributs d'objets SAP NetWeaver BW collectés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 526
Métadonnées affichées pour les objets SAP NetWeaver Business Warehouse. . . . . . . . . . . . . . 527
Affichage de diagrammes de lignage des données depuis la zone de lancement BI. . . . . . . . . . . 529
Relations pour les objets SAP NetWeaver BW. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
5.37 Métadonnées affichées pour Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535
Types d'attributs supplémentaires pour les flux de données. . . . . . . . . . . . . . . . . . . . . . . . . . . 537
Relations d'objets Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537
Objets SAP Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 538
Exploration de métadonnées de sources Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540
Exploration d'objets Data Services . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540
Définition de métadonnées de flux de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541
Guide de l'utilisateur
Contenu PUBLIC 7
Affichage d'une instance de flux de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541
Définition de métadonnées de banque de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542
Affichage de métadonnées pour une colonne ou une table. . . . . . . . . . . . . . . . . . . . . . . . . . . . 542
Exploration d'une instance de colonne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543
Relations d'objets Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544
Affichage de l'auto-documentation de Data Services . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
5.38 Intégrateur de métadonnées Hadoop. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549
Objets de métadonnées Hadoop. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550
5.39 Intégrateur de métadonnées SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
Objets de base de données SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
Limitation de la collection de packages SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
Prise en charge de plusieurs versions de SAP HANA Studio. . . . . . . . . . . . . . . . . . . . . . . . . . . 554
Vues Modèle d'informations et vues de colonnes SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . 554
Affichage de relations dans une source de base de données SAP HANA. . . . . . . . . . . . . . . . . . 555
5.40 Intégrateur de métadonnées SAP Sybase PowerAMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555
Objets de métadonnées PowerAMC pour la gestion des métadonnées. . . . . . . . . . . . . . . . . . . 556
Relations de l'intégrateur de métadonnées PowerAMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 557
5.41 Objets d’intégrateur de métadonnées SAP ERP Central Component. . . . . . . . . . . . . . . . . . . . . . . 558
Métadonnées affichées pour les objets SAP ERP Central Component. . . . . . . . . . . . . . . . . . . . 559
5.42 Métadonnées affichées pour les objets de modélisation des données. . . . . . . . . . . . . . . . . . . . . . . 561
Affichage de relations d'objets CWM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562
5.43 Métadonnées affichées pour Data Federator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563
Relations d'objets Data Federator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 565
Navigation dans les métadonnées Data Federator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566
Affichage de relations d'objets Data Federator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566
5.44 Objets de base de données relationnelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570
Exploration d'une instance de vue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
Affichage de relations dans une source de base de données. . . . . . . . . . . . . . . . . . . . . . . . . . . 571
5.45 Intégrateur de métadonnées Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574
Modèle d'intégrateur de métadonnées Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575
Instructions de configuration de modèles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 579
5.46 Intégrateur de métadonnées Amazon Redshift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580
Objets de métadonnées Amazon Redshift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .581
6 Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
6.1 Mise en forme de l’onglet Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .584
6.2 Utilisateurs et groupes Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
6.3 Attributs personnalisés pour Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
6.4 Notifications par e-mail pour les termes et les stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 588
6.5 Importer et exporter avec Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590
Filtres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 591
Exportation vers Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592
Guide de l'utilisateur
8 PUBLIC Contenu
Contenus du fichier Excel après exportation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593
Importation à partir d'un fichier au format standard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 596
Importation à partir d'une importation de fichiers au format personnalisé. . . . . . . . . . . . . . . . . 599
Résolution des chemins d'accès du nom des objets associés à importer. . . . . . . . . . . . . . . . . . 603
6.6 Recherche Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604
Résultats de recherche Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604
Exécution d'une recherche avancée dans Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605
6.7 Présentation des termes et des catégories. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607
Informations détaillées pour les termes et catégories. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607
Utilisation de termes et de catégories Metapedia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609
Informations du glossaire PowerAMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .637
6.8 Compression des sets et des instructions de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 638
Exemple de set de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640
Processus d'approbation des stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641
Création de sets de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644
Création d'instructions de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 646
Modification des sets et des instructions de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649
Copie d'instructions de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649
Rétablissement des sets et des instructions de stratégies sur la dernière version approuvée
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
Association d'instructions de stratégies à des termes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651
Associer des instructions de stratégies à d'autres instructions de stratégies. . . . . . . . . . . . . . . 651
Association d'instructions de stratégies à des règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652
Association d'instructions de stratégies à des objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653
Affichage de l'historique d'un set ou d'une instruction de stratégie. . . . . . . . . . . . . . . . . . . . . . 656
Utilisation de la date d'expiration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .656
Suppression des sets et des instructions de stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657
Moniteur de la conformité des stratégies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658
Guide de l'utilisateur
Contenu PUBLIC 9
Liste de contrôle de planification pour les packages de nettoyage des données personnalisés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673
Workflow : Création d'un package de nettoyage des données personnalisé. . . . . . . . . . . . . . . . 675
7.10 Planification, création et ajustement d'un package de nettoyage des données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677
Liste de contrôle de planification pour les packages de nettoyage des données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .678
Workflow : Ajustement et test d'un package de nettoyage des données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .679
7.11 Cycle de vie du package de nettoyage des données : développement, déploiement et gestion. . . . . 682
7.12 Création de packages de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687
Création d'un package de nettoyage des données personnalisé avec l'assistant. . . . . . . . . . . . . 688
Importation des fichiers de packages de nettoyage des données Data Services 3.2. . . . . . . . . . 696
7.13 Packages de nettoyage des données personnelles et professionnelles. . . . . . . . . . . . . . . . . . . . . . 707
Attributs personnels et professionnels dans les champs de données discrets. . . . . . . . . . . . . . 708
Données d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709
À propos du format de sortie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710
Analyse des noms doubles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712
Données internationales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712
Numéros de téléphone internationaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712
Classifications pour les données japonaises. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713
Ajout de noms de famille écrits en scripts CJC ou Kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713
Exemple : Ajout d'un nom de famille japonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715
Ajout de prénoms écrits en scripts CJC ou Kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 716
Ajout de préfixes de nom écrits en scripts CJC ou Kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718
Ajout de suffixes de nom écrits en scripts CJC ou Kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719
Ajout de noms doubles écrits en CJC ou en kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 720
Ajout de noms de sociétés japonaises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722
Ajout de noms de société chinois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724
Ajout de fonctions écrites en scripts CJC ou Kana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .727
Ajout d'autres noms pour le processus de correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . 729
7.14 Création d'un package de nettoyage des données personnelles et professionnelles. . . . . . . . . . . . . 731
Création d'un package de nettoyage des données personnelles et professionnelles : méthode
préférée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 732
Création manuelle d'un package de nettoyage des données personnelles et professionnelles
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733
7.15 Validation des modifications apportées au package de nettoyage des données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733
Modification des colonnes visibles dans l'onglet Valider. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735
Ajout d'exemples de données pour la validation de packages de données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .736
Modification des options Data Cleanse dans l'onglet Valider. . . . . . . . . . . . . . . . . . . . . . . . . . . 737
Modification des options Data Cleanse dans l'onglet Valider. . . . . . . . . . . . . . . . . . . . . . . . . . . 739
Guide de l'utilisateur
10 PUBLIC Contenu
Gestion de la séquence du domaine de contenu dans l'onglet Valider. . . . . . . . . . . . . . . . . . . . .741
Gestion de séquence de l'analyseur multiligne 1 à 12 dans l'onglet Valider. . . . . . . . . . . . . . . . . 742
7.16 A propos du mode Conception. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743
Attributs IGNORED et EXTRA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745
Affectation de formats standard et de variantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746
A propos des phrases. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 752
A propos du contexte et des modèles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .754
Comparaison entre les phrases et la définition de contexte. . . . . . . . . . . . . . . . . . . . . . . . . . . .772
Définition du format de catégorie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .773
Ajout d'exemples de données supplémentaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 774
Valeurs analysées affectées à plusieurs attributs (résolution de conflit). . . . . . . . . . . . . . . . . . . 775
Résolution de conflits. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 777
Recherche en mode Conception. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779
Exploration de groupes d'enregistrements vers le bas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779
7.17 A propos du mode Avancé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 780
À propos des domaines. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .781
Recherche en mode Avancé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 786
Remarques relatives à la gestion des variantes et classifications en mode Avancé. . . . . . . . . . . 788
7.18 Données d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 805
Définitions des règles d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .807
Actions des règles d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 809
Notation et calcul de la confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821
Ajout de règles d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 823
Modification des règles d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 824
Copie des règles d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Affichage de l'historique d'une règle d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Réactivation de règles d'analyse supprimées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
Exemple de règle d'analyse : modification du mode d'affectation des données aux attributs
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826
Exemple de règle d'analyse : modification du séparateur affiché . . . . . . . . . . . . . . . . . . . . . . . 828
7.19 Publication d'un package de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 830
Exportation d'un fichier ATL pour Data Services . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .830
Mise à jour d'un package de nettoyage des données public. . . . . . . . . . . . . . . . . . . . . . . . . . . .831
Affichage des packages de nettoyage des données publics. . . . . . . . . . . . . . . . . . . . . . . . . . . 832
7.20 Analyse des types de données communs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833
A propos des analyseurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .834
A propos des numéros de téléphone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 835
Ajout de modèles de numéros de téléphone internationaux. . . . . . . . . . . . . . . . . . . . . . . . . . . 837
Modification des modèles de numéros de téléphone internationaux. . . . . . . . . . . . . . . . . . . . . 837
Ajout de noms de domaines de messagerie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 838
Modification des noms de domaines de messagerie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 839
Guide de l'utilisateur
Contenu PUBLIC 11
A propos de l'analyse du numéro de sécurité sociale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .839
Données de la sécurité sociale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 840
7.21 A propos des règles de correspondance au modèle définies par l'utilisateur. . . . . . . . . . . . . . . . . . 840
Exemple de règle simple définie par l'utilisateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .841
Exemple de règle personnalisée complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 842
Ajout de modèles personnalisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 843
Ajout de règles personnalisées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 843
Modification de modèles ou de règles personnalisés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 844
Suppression d'une règle ou d'un modèle personnalisé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845
Eléments des règles de modèle définies par l'utilisateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .845
7.22 Présentation de l'analyse de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845
Analyser et classer les données d'entrée pour les packages de nettoyage des données
personnelles et professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 846
Analyse et classification de l'entrée pour les packages de nettoyage des données
personnalisés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 850
Analyse basée sur les règles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852
7.23 Sortie et standardisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853
Attribut composite PERSONNEL pour nom simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853
Attribut composite PERSONNEL pour noms doubles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 854
Composite PRENOM_COMPLET pour les prénoms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 854
Composite NOM_FAMILLE_COMPLET pour nom de famille. . . . . . . . . . . . . . . . . . . . . . . . . . . 855
Attribut composite PROFESSIONNEL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855
Attribut personnalisé composite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855
Mise en forme d'autres types de données communs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855
7.24 Expressions régulières et modèles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 856
Expressions régulières dans le Générateur de packages de nettoyage des données. . . . . . . . . . 856
Etude de la stratégie d'analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 857
Fonctionnement des expressions régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 858
Opérateurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 858
Caractères spéciaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 860
Liste entre crochets correspondant à un caractère d'entrée . . . . . . . . . . . . . . . . . . . . . . . . . . 860
Regroupement de caractères à l'aide de parenthèses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .861
Définition d'un modèle d'expression régulière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .861
Exemples d'expressions régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864
7.25 Options de la transformation Data Cleanse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 866
Rapport et analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .866
Package de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 867
Options de standardisation des personnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 870
Options de sexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 874
Options de standardisation de la société. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 876
Autres options de standardisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 877
Guide de l'utilisateur
12 PUBLIC Contenu
Groupe d'options téléphoniques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 881
Options de date. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 884
7.26 Mise à niveau du contenu pour les packages de nettoyage des données personnelles et
professionnelles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 887
Notification de mise à niveau du contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 887
Que se passe-t-il pendant une mise à niveau du contenu ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . 888
Réalisation d'une mise à niveau du contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 888
États de la mise à niveau du contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 889
7.27 FAQ Dépannage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 890
Questions générales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 890
Enregistrement des modifications. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 891
Questions relatives au mode Conception. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 892
Questions relatives au mode Avancé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 892
Déverrouillage d'un package de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .893
7.28 Raccourcis clavier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .894
7.29 Mots réservés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .894
7.30 Longueur maximale du champ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 897
7.31 États et statuts des packages de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 898
États du package de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .898
Statuts du package de nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 900
Guide de l'utilisateur
Contenu PUBLIC 13
8.17 Déplacement d'enregistrements. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 930
Déplacement d'enregistrements vers un groupe existant. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 931
Déplacement d'enregistrements dans le groupe en cours de vérification. . . . . . . . . . . . . . . . . . 932
Déplacement d'enregistrements vers un nouveau groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933
Affectation de l'enregistrement principal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 934
8.18 Modification d'un groupe de correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 934
8.19 Table de lignage du meilleur enregistrement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 935
8.20 Table d'activité de la vérification des correspondances. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 937
8.21 Fichier de configuration de l'examen des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 939
Guide de l'utilisateur
14 PUBLIC Contenu
1 Bienvenue
Bienvenue dans SAP Information Steward, un environnement unique qui vous permet de découvrir, d’évaluer,
de définir, de contrôler et d’améliorer la qualité de vos données d'entreprise.
Information Steward fournit un module pour la prise en charge des zones spécifiques de la gestion des
données d'entreprise :
● Data Insight : Les analystes d’entreprise et les administrateurs de données profilent les données, créent et
exécutent les règles de validation et surveillent la qualité des données au moyen des scorecards.
● Gestion des métadonnées : Les analystes d’entreprise et les administrateurs de données cataloguent les
données et comprennent les relations entre les données de l'entreprise.
● Metapedia : Les administrateurs de données définissent les termes d’entreprise pour les données et créent
des catégories pour l’entreprise.
● Générateur de packages de nettoyage des données : Les administrateurs de données définissent des
packages de nettoyage des données pour normaliser et standardiser les données.
Guide de l'utilisateur
Bienvenue PUBLIC 15
2 Accès à Information Steward
Avant d'accéder à Information Steward, vous devez avoir paramétré vos droits d'utilisateur et créé un projet
dans la Central Management Console (CMC).
Accédez à Information Steward en entrant le nom de l'ordinateur auquel vous accédez dans votre navigateur.
Par exemple : http://webserver:8080/BOE/InfoSteward
Vous pouvez également accéder à Information Steward via la zone de lancement SAP BusinessObjects
Business Intelligence (BI) (modules Metapedia et Metadata Management uniquement).
Pour pouvoir exécuter certaines tâches dans Information Steward, vous devez obtenir les autorisations
appropriées ou être affecté par un administrateur à un rôle d'utilisateur ou de groupe donné. En fonction de vos
autorisations, vous pourrez effectuer certaines tâches sur les systèmes de développement ou de test, mais pas
forcément sur les systèmes de production de l'application SAP. Utilisez l'une des options suivantes comme
solution de contournement :
● Contactez l'administrateur système pour obtenir les droits de développement au niveau de l'application
SAP.
● Effectuez la tâche sur un système de développement ou de test. Exportez ensuite le projet, puis importez-
le dans le système de production.
Vous trouverez de plus amples informations sur l'accès à Information Steward dans la section « Accès aux
tâches d'administration d'Information Steward » dans le Guide d'administration.
Accéder à SAP Information Steward depuis la zone de lancement BI pour afficher les diagrammes de lignage
des données pour des rapports Crystal ou des documents Web Intelligence, ou pour afficher des termes et des
définitions Metapedia associés à un rapport Crystal ou à un document Web Intelligence.
Informations associées
Affichage du lignage des données Crystal Reports ou Web Intelligence depuis la zone de lancement BI [page
509]
Guide de l'utilisateur
16 PUBLIC Accès à Information Steward
Affichage de termes Metapedia depuis la zone de lancement BI [page 633]
Guide de l'utilisateur
Accès à Information Steward PUBLIC 17
3 Gestion des préférences
Les utilisateurs disposant des droits d'administrateur peuvent définir des valeurs globales pour divers
paramètres dans Information Steward à l'aide de la boîte de dialogue Préférences.
Définition de règles d'équivalence d'objet pour des relations identiques [page 24]
Ajoutez une étiquette en haut du système Information Steward dans lequel vous travaillez pour vous aider à
identifier le système.
Si vous travaillez dans plusieurs systèmes Information Steward en même temps, il se peut que vous trouviez
difficile de se souvenir du système que vous avez ouvert. Lorsque vous ajoutez un identifiant du système dans
chaque système, vous pouvez déterminer le système dans lequel vous travaillez en jetant un œil en haut de la
fenêtre Information Steward.
1. Dans Information Steward, sélectionnez Gérer Préférences à partir du menu Explorer dans le coin
supérieur droit.
2. Dans Préférences, saisissez le texte applicable dans la zone de texte Identifiant du système.
Par exemple, saisissez « Environnement de test » pour marquer le système comme étant votre système de
test.
3. Cliquez sur Enregistrer.
Guide de l'utilisateur
18 PUBLIC Gestion des préférences
Votre texte apparaît en haut de votre interface utilisateur Information Steward. Il se peut que vous deviez
rafraîchir votre écran avant que cela apparaisse.
Exemple
Par exemple, dans votre système de test, vous pourriez saisir Système de test comme texte de
l’identifiant du système. Par conséquent, en haut de l’écran Information Steward, Information Steward -
Système de test s’affiche.
Informations associées
Modifiez le format de fichier Excel par défaut pour l’exportation de différents fichiers dans Information Steward.
XLSX est le format par défaut lorsque vous installez Information Steward. Vous pouvez définir le format de
fichier sur XLS. Avant de définir le format de fichier Excel par défaut pour l'exportation, tenez compte des
informations suivantes :
L’option de format de fichier Excel par défaut a des répercussions sur les processus Information Steward
suivants :
Guide de l'utilisateur
Gestion des préférences PUBLIC 19
Data Insight Exportez les données ayant échoué :
● Au niveau de la table
● Au niveau de la colonne
● Au niveau de la liaison de règle
● Au niveau du domaine de données clés
Gestion des métadonnées Exportez des vues de relations de métadonnées vers une
feuille de calcul Microsoft Excel.
Informations associées
Modifiez le format de fichier Excel par défaut de XLSX, qui est défini comme valeur par défaut lors de
l'installation, au format XLS.
1. Sélectionnez Gérer Préférences à partir du menu Explorer dans le coin supérieur droit.
Lorsque vous exportez les éléments suivants, le logiciel utilise automatiquement le format de fichier Excel que
vous avez défini dans les préférences :
Guide de l'utilisateur
20 PUBLIC Gestion des préférences
3.3 Gestion du seuil des règles suggérées
Gérer le seuil qui détermine si Data Insight suggère automatiquement des règles. L'ajustement du seuil permet
de contrôler le nombre de règles suggérées, si vous recevez trop de suggestions ou pas assez.
Après l'exécution d'une tâche de profilage de colonnes, suivez ces étapes pour gérer le seuil des règles
suggérées :
Option Description
Pourcentage de Le pourcentage de valeurs nulles, vides et zéro inférieur à la valeur définie génère la suggestion
détection de valeurs de règle automatique. Par exemple, si une colonne comporte un pourcentage de données vides
hors norme inférieur au paramètre par défaut de 2 %, la règle non vide est automatiquement suggérée. De la
même manière, si le pourcentage de fréquence renvoie 2,1 % de données vides, la règle n'est
alors pas automatiquement suggérée.
Nombre maximal Nombre de valeurs hors norme détectées (valeurs ou modèles différents de la majorité des don
de valeurs hors nées) utilisées pour générer la suggestion de règles automatique. A titre d'exemple, si une co
norme à exclure lonne compte moins des 5 valeurs hors norme définies par défaut, la règle est alors automati
d'une règle quement suggérée. De la même manière, lorsque les valeurs détectées sont supérieures à ce
chiffre, aucune suggestion n'est générée pour la colonne en question.
Informations associées
Guide de l'utilisateur
Gestion des préférences PUBLIC 21
3.4 Définition des préférences d'impact et de lignage des
données
Définissez les préférences d'impact et de lignage des données pour les systèmes source d'intégrateur de
métadonnées de Gestion des métadonnées.
Pour définir les Préférences d'impact et de lignage des données, vous devez appartenir au groupe d'utilisateurs
Metadata Management.
1. Cliquez sur Gérer Préférences dans le coin supérieur droit de la fenêtre Information Steward.
2. Saisissez le Nombre d'objets Metadata Management par page. La valeur par défaut est de 15 objets par
page.
3. Définissez les options requises dans la section Préférences d'impact et de lignage des données de la fenêtre
Préférences sur la base des descriptions suivantes :
Option Description
Quel est le niveau le plus élevé utilisé pour déterminer si Le niveau « le plus élevé » fait référence au nom complet
deux objets de relations sont identiques ? d'un objet. Pour en savoir plus, voir la rubrique Objet iden
tique dans plusieurs systèmes source [page 473].
Server-01.ForenzaDW.sa.customer
CMS-server1.SalesDW.DBO.customer
La comparaison d'objets doit-elle respecter la casse ? Le paramètre par défaut est Oui. Sélectionnez Oui si vous
voulez tenir compte de la casse pour déterminer si deux
objets sont identiques. Sinon, sélectionnez Non.
Guide de l'utilisateur
22 PUBLIC Gestion des préférences
Si vous utilisez des rapports d'impact et de lignage des données, vous devez recalculer le contenu de la table
intermédiaire de lignage des données afin d'intégrer vos valeurs modifiées pour les Préférences d'impact et de
lignage des données. Vous pouvez configurer une planification similaire pour calculer la table intermédiaire de
lignage des données à intervalles réguliers.
Informations associées
Les notifications par e-mail sont activées par défaut. Si personne n'a modifié ce paramètre, vous ne devriez
donc pas être obligé d'activer cette option. Vous pouvez suivre cette procédure pour vérifier et vous assurer
qu'elle est définie selon vos exigences.
Vous devez disposer des droits correspondants pour accomplir ces étapes.
1. Ouvrez Information Steward et sélectionnez Gérer Préférences dans le menu situé dans le coin
supérieur droit de la fenêtre.
2. Dans la section Paramètres des notifications par e-mail, cochez (activez) ou décochez (désactivez) Envoyer
des notifications.
3. Sélectionnez les paramètres régionaux dans le menu déroulant Paramètres régionaux.
Remarque
La configuration des Paramètres régionaux détermine la langue dans laquelle est rédigé le courrier
électronique. Les options disponibles dépendant des paramètres définis à l'installation.
Remarque
Assurez-vous de définir les paramètres applicables dans la CMC pour les notifications par e-mail.
Retrouvez les instructions dans le Guide d'administration.
Guide de l'utilisateur
Gestion des préférences PUBLIC 23
Présentation des tâches : Gestion des préférences [page 18]
Informations associées
Pour définir des règles d'équivalence d'objet pour des relations identiques :
1. Choisissez Gérer Préférences dans l'angle supérieur droit de la fenêtre Information Steward.
2. Accédez à la section Règles d'équivalence d'objet dans les Paramètres de gestion des métadonnées.
Remarque
Si vous utilisez des rapports d'impact et de lignage des données dans Afficher Rapports , dans le coin
supérieur droit de la fenêtre Information Steward, vous devez recalculer le contenu de la table temporaire
de lignage des données pour intégrer vos modifications dans les Règles d'équivalence d'objet.
Guide de l'utilisateur
24 PUBLIC Gestion des préférences
Informations associées
La devise par défaut pour l'analyse de la valeur commerciale est le dollar américain ($).
Notez que la modification du symbole de la devise ne convertit par la valeur du montant en fonction d'un taux
de change (les valeurs restent les mêmes).
Informations associées
Guide de l'utilisateur
Gestion des préférences PUBLIC 25
3.8 Définition des niveaux de seuils des scores de
conformité
Les groupes d'utilisateurs Administrateur et Approbateur Metapedia peuvent définir les seuils des scores de
conformité.
Le niveau de seuils minimal et maximal est défini au niveau Gestion des stratégies d'information et non au
niveau du set de stratégies ou de l'instruction de stratégie. Le score dans la section Conformité, en regard du
nom de l'instruction change de couleur en fonction des seuils que vous choisissez.
Rouge Le score est inférieur au seuil de conformité minimum. Vos stratégies ne sont pas conformes
aux objectifs de gouvernance des données de votre société.
Jaune Le score se trouve entre le seuil minimal et le seuil maximal et est donc considéré comme
acceptable. Revoyez vos stratégies pour vous assurer qu'elles ne se trouvent pas en dessous
du seuil minimal.
Vert Le score est supérieur au seuil maximal. Vos stratégies sont conformes aux objectifs de gou
vernance des données de votre société.
Remarque
Pour que les modifications apportées à un niveau de seuil prennent effet, vous devez vous déconnecter
d'Information Steward puis vous connectez à nouveau.
Informations associées
Guide de l'utilisateur
26 PUBLIC Gestion des préférences
4 Data Insight
Utilisez Data Insight pour rechercher des problèmes de qualité des données, valider la façon dont les relations
respectent les normes et pour contrôler, mesurer et améliorer la qualité des données.
Data Insight vous indique le retour sur investissement et l'impact des données de mauvaise qualité sur
l'entreprise. C'est un outil précieux à utiliser si vous envisagez de faire l'acquisition d'une nouvelle technologie.
Vous pouvez utiliser Data Insight pour obtenir un aperçu général de la qualité des données et descendre dans la
hiérarchie pour examiner les scores de qualité des tables et des colonnes ainsi que pour afficher un exemple
des données qui ont échoué aux règles. Utilisez ces fonctionnalités pour surveiller les tendances en matière de
qualité des données au fil du temps.
Chaque déploiement de SAP Information Steward prend en charge plusieurs utilisateurs dans le cadre de
différents projets Data Insight en vue d'évaluer et de contrôler la qualité des données issues de sources
diverses. Un projet Data Insight est un espace de travail collaboratif dans lequel les administrateurs et les
analystes de données peuvent évaluer et contrôler la qualité des données d'un domaine spécifique et à des fins
spécifiques (évaluation de la qualité côté client, migration du système de ventes et contrôle de la qualité des
données de référence, par exemple).
Un utilisateur avec privilèges d’administrateurs crée et définit un projet Data Insight. Il peut y avoir plusieurs
projets dans Data Insight. Cependant, il existe un projet par défaut inclut dans Data Insight appelé Projet
d’entreprise.
Les administrateurs créent des projets et accordent des autorisations dans la Central Management Console
(CMC) de la Plateforme SAP Business Intelligence. Pour des informations complètes sur la création de projets,
la définition d’autorisations et la création de connexions, voir le Guide d'administration.
Chaque fois que vous ouvrez Data Insight, vous affichez la page Projets. Le logiciel répertorie tous les projets
pour lesquels l’utilisateur a des autorisations, et le projet d’entreprise. Triez les projets par nom ou par création
à l’aide de l’option Trier les projets par. Sélectionnez le projet applicable pour continuer avec les tâches dans
Data Insight.
Remarque
Le projet d’entreprise par défaut est toujours répertorié en premier, quelle que soit la sélection de tri.
SAP Information Steward fournit le projet Enterprise pour permettre l’affichage des connexions Data Insight et
des objets associés, dans la page du répertoire Metadata Management.
Toutes les connexions Data Insight créées dans le projet Enterprise apparaissent sous la catégorie Connexion
Data Insight dans Metadata Management si elles ont des objets associés. Affichez tous les objets appartenant
aux connexions incluant les tables et les schémas. Affichez les détails des tables et des schémas pour voir les
résultats de profilage, les résultats de règles et les scores de qualité des données.
Guide de l'utilisateur
Data Insight PUBLIC 27
Informations associées
L'Assistant de qualité des données comprend plusieurs fonctionnalités qui guident les administrateurs de
données dans le développement rapide d'une solution destinée à mesurer et à améliorer la qualité de leurs
informations.
En tant qu'administrateur de données, vous pouvez utiliser l'Assistant de qualité des données pour évaluer vos
données et sélectionner des règles de validation et de nettoyage recommandées. De plus, vous pouvez réviser
les règles de nettoyage et les affiner en fonction de vos besoins spécifiques.
L'Assistant de qualité des données vous permet d'évaluer les données à l'aide du profilage du type de contenu.
Vous pouvez en outre recevoir des recommandations en matière de règles de nettoyage et de validation en
utilisant l'Assistant de validation de données et l'Assistant de nettoyage.
Profilage du contenu des Fournit une suggestion de signification d'après les attributs des données et des métadon
données nées de la colonne. Après l'exécution d'une tâche de profilage du contenu des données, utili
sez les types de contenu suggérés pour déterminer les règles de validation appropriées.
Assistant de validation de Génère des règles de validation suggérées, basées sur l'analyse statistique des résultats de
données profilage pour les tâches de profilage de colonne, type de contenu, dépendance, redon
dance et unicité.
Assistant de nettoyage Recommande une solution de nettoyage pour vos données. La solution de nettoyage des
données recommandée est basée sur les résultats de profilage du type de contenu de vos
données et les meilleures pratiques SAP pour vos données spécifiques.
Informations associées
Guide de l'utilisateur
28 PUBLIC Data Insight
4.3 Ajouter des tables et des fichiers aux projets
Ajoutez des tables et des fichiers dans un projet afin qu’ils soient disponibles pour les processus Data Insight.
Pour pouvoir utiliser des tables et des fichiers dans une connexion, vous devez disposer des privilèges
d'administrateur vous autorisant à ajouter et accéder à la connexion. Le logiciel répertorie uniquement les
connexions pour lesquelles vous avez des autorisations lorsque vous ouvrez ou créez un projet Data Insight.
Avant d'ajouter un fichier dans un projet, créez le format de fichier. Vous sélectionnez le format de fichier
lorsque vous ajoutez un fichier dans un projet.
Après avoir ajouté des tables et des fichiers dans les projets, leur nom apparaît dans Accueil de l’espace de
travail dans la colonne Tables. Lorsque vous ajoutez des tables et des fichiers, Information Steward stocke la
table et les métadonnées du fichier dans votre référentiel. Parfois, nous faisons référence à la table ou aux
métadonnées du fichier lorsque nous parlons de l'importation ou de l’ajout de ces éléments dans un projet.
Le logiciel fournit des options pour l'ajout de tables et de fichiers via le menu Ajouter dans la fenêtre Accueil de
l'espace de travail.
Vous pouvez ajouter des tables, des fichiers et des formats de fichier en utilisant le nom exact ou vous pouvez
parcourir les connexions Data Insight pour rechercher la table ou le fichier.
Remarque
Lors de l'utilisation des connexions d'applications SAP, certains utilisateurs peuvent ne pas être en mesure
d'effectuer les tâches sur le système de production car ils ne disposent peut-être pas des autorisations
nécessaires pour la lecture des métadonnées des systèmes SAP. Utilisez l'une des options suivantes
comme solution de contournement :
Guide de l'utilisateur
Data Insight PUBLIC 29
Informations associées
1. Dans Accueil de l’espace de travail, cliquez sur Ajouter Tables par nom dans la barre de menu
supérieure.
La boîte de dialogue Ajouter une table au projet s'ouvre.
2. Sélectionnez le nom de connexion dans la liste déroulante Connexion.
Les connexions qui apparaissent dans la liste sont celles pour lesquelles vous avez une autorisation.
3. Requis. Saisissez le nom de la table dans la zone de texte Nom de la table.
4. Cliquez sur Ok pour ajouter la table à la connexion.
5. Ajoutez d’autres tables, le cas échéant. Vous pouvez ajouter une autre table dans la connexion actuelle, ou
sélectionner une connexion différente dans la liste déroulante Connexion. Après avoir terminé l’ajout de
tables, cliquez sur OK.
Le nom de table apparaît dans l’onglet Accueil de l’espace de travail répertorié sous le nom de la connexion
applicable.
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Parcourez les métadonnées dans chaque connexion pour retrouver une table à ajouter au projet.
1. Dans Accueil de l’espace de travail, cliquez sur Ajouter Tables dans la barre de menu supérieure.
La fenêtre Parcourir les métadonnées s'ouvre. Le volet gauche de la fenêtre répertorie les noms de vos
connexions autorisées.
Guide de l'utilisateur
30 PUBLIC Data Insight
2. Sélectionnez le nom de la connexion applicable dans la liste à gauche.
Les objets qui sont dans la connexion apparaissent dans le volet de droite. Les types d’objets répertoriés
sont basés sur le type de connexion : Base de données ou application SAP. Les métadonnées qui
s'affichent dans le volet de droite sont basées sur la vue que vous sélectionnez en haut du volet de droite :
Métadonnées externes ou Métadonnées importées.
Options d'affichage
Vue Description
Métadonnées externes Liste les schémas et les noms de tables, les colonnes et
les attributs pour la connexion sélectionnée.
Métadonnées importées Liste les schémas et les noms de tables, les colonnes et
les attributs pour les tables importées uniquement.
3. Cochez la case en face du nom de chaque objet que vous souhaitez ajouter à votre projet et cliquez sur
Ajouter au projet dans la barre de menu supérieure.
Après avoir ajouté une table à votre projet Data Insight, le logiciel effectue les actions suivantes :
● Si ce n'est pas déjà fait pour un autre projet, il importe les métadonnées de la source externe vers le
référentiel Information Steward pour tous les projets.
● Affiche une coche dans la colonne Importé de la table, lorsque vous sélectionnez la vue Métadonnées
externes.
● Affiche le nom de la table et une description, le cas échéant, lorsque vous sélectionnez la vue Métadonnées
importées.
● Ajoute le nom de la table à la liste des tables dans la fenêtre Accueil de l'espace de travail de votre projet.
● Si vous êtes dans le projet Enterprise, ajoute la connexion et la définition de la table à l'onglet Gestion des
métadonnées dans la zone Connexions Data Insight.
Remarque
Si vous supprimez une table, une vue ou un fichier de votre projet, les métadonnées existent toujours dans
le référentiel et d'autres projets peuvent les utiliser.
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 31
Ajout de fichiers par exploration des métadonnées [page 32]
Suppression d'une table ou d'un fichier d'un projet [page 33]
Recherche de tables ou de fichiers dans une connexion [page 34]
Exportation et importation de projets et d'objets [page 429]
Lorsque vous parcourez les métadonnées, vous pouvez également afficher la définition de la base de données
ou de l'application.
Pour afficher la définition de table pour une connexion à une base de données ou une application, procédez
comme suit :
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Lorsque vous parcourez les fichiers par métadonnées, vous pouvez ajouter des fichiers à un projet en fonction
des formats de fichier que vous avez créés pour la source.
Créez le format de fichier. Dans Data Insight, vous pouvez définir des formats de fichiers plats et des formats
de fichier Excel.
1. Dans Data Insight, sélectionnez Ajouter Fichiers dans la barre de menu supérieure.
La boîte de dialogue Parcourir les métadonnées s'ouvre. Le volet gauche de la boîte de dialogue liste les
noms des connexions pour lesquelles vous êtes autorisé.
Guide de l'utilisateur
32 PUBLIC Data Insight
2. Sélectionnez la connexion appropriée dans la liste des connexions située à gauche.
3. Recherchez le ou les fichiers correspondants dans le volet principal.
4. Sélectionnez le format de fichier concerné dans la liste déroulante Nom du format dans la colonne Nom du
format pour chaque fichier applicable.
5. Cochez la case en face des fichiers concernés et cliquez sur Ajouter au projet dans la barre de menu
supérieure.
6. Le logiciel affiche un message indiquant la réussite.
○ Cliquez sur Oui pour fermer la boîte de dialogue Parcourir les métadonnées.
○ Cliquez sur Non pour garder ouverte la boîte de dialogue Parcourir les métadonnées.
Une fois que vous avez fermé la boîte de dialogue Parcourir les métadonnées, les fichiers que vous avez ajoutés
apparaissent dans Accueil de l'espace de travail pour le projet approprié sous la connexion appropriée.
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Supprimez une table ou un fichier dont vous n'avez pas besoin pour un projet.
Attention
Lorsque vous supprimez une table ou un fichier d'un projet, vous supprimez tous les résultats de profil, les
exemples de données, les résultats de règle et les exemples de données ayant échoué du référentiel
Information Steward.
Avant de supprimer une table ou un fichier d'un projet, commencez par supprimer les objets suivants qui
utilisent la table ou le fichier dans ce projet :
● Liaison de règle
● Tâche de profilage ou d'exécution de règle
● Vue
● Règle associée à la fonction de recherche se référant à la table
Pour plus d'informations sur les objets dépendants, voir Objets dépendants et dépendances [page 36].
Guide de l'utilisateur
Data Insight PUBLIC 33
1. Ouvrez le projet approprié.
2. Dans Data Insight, sélectionnez la connexion et développez le nom du schéma qui contient la table ou le
fichier à supprimer.
3. Sélectionnez le nom de la table ou du fichier.
4. Si vous n'avez pas encore supprimé les objets dépendants de la table ou du fichier, sélectionnez Afficher
l'utilisation dans la barre de menu supérieure.
Vous pouvez choisir de ne pas supprimer l'objet dépendant. Si vous ne voulez pas supprimer l'objet
dépendant, vous ne pouvez pas supprimer la table ou le fichier de votre projet.
7. Cliquez sur l'icône X dans le coin supérieur droit de la boîte de dialogue Utilisation pour les tables
sélectionnées pour quitter.
8. Sélectionnez le nom de la table ou du fichier et cliquez sur Supprimer.
9. Cliquez sur OK pour afficher le message d'avertissement qui permet de vérifier la suppression de la table
ou du fichier.
Le logiciel supprime la table du projet. Le logiciel supprime également les résultats de profil, les exemples
de données, les résultats de règle et les exemples de données ayant échoué qui lui sont associés du
référentiel Information Steward. L'utilitaire de purge supprime physiquement les éléments lors de sa
prochaine exécution.
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Sélectionnez Ajouter Table ou Ajouter Fichiers pour ouvrir la boîte de dialogue Parcourir les
métadonnées.
Guide de l'utilisateur
34 PUBLIC Data Insight
Remarque
Vous ne pouvez pas utiliser cette méthode de recherche pour rechercher un nom de hiérarchie.
Remarque
Lors de l'utilisation des connexions d'applications SAP, certains utilisateurs peuvent ne pas être en mesure
d'effectuer cette tâche sur le système de production car ils ne disposent peut-être pas des autorisations
nécessaires pour la lecture des métadonnées.
1. Sélectionnez une connexion dans la liste du volet gauche de la boîte de dialogue Parcourir les métadonnées
pour afficher une liste des tables et des fichiers dans le volet principal.
2. Utilisez l'une des trois méthodes décrites dans la table suivante pour saisir des chaînes de recherche dans
la zone de texte Rechercher.
Pour les applications SAP, toute sous-chaîne de descrip 1. Sélectionnez Description dans la flèche déroulante si
tion tuée à côté de l'icône Rechercher.
2. Cliquez sur l'icône Rechercher.
La liste des objets comprend uniquement les noms qui contiennent le nom exact, la sous-chaîne ou le
synonyme que vous avez saisi.
Exemple
Par exemple, si vous saisissez le mot « ordre » et que cliquez sur l’icône Rechercher, les tables
suivantes peuvent apparaître :
○ Production.WorkOrder
○ Production.WorkOrderRouting
○ Purchasing.PurchaseOrderDetail
○ Purchasing.PurchaseOrderHeader
3. Si nécessaire, effacez le filtre de recherche en cliquant sur l'icône Supprimer à droite de la zone de texte
Rechercher située au dessus de la liste des noms d'objet.
Présentation des tâches : Ajouter des tables et des fichiers aux projets [page 29]
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 35
Ajout de tables par exploration des métadonnées [page 30]
Affichage de définitions de table lors de l'exploration des métadonnées [page 32]
Ajout de fichiers par exploration des métadonnées [page 32]
Suppression d'une table ou d'un fichier d'un projet [page 33]
Afficher les données source [page 82]
Exportation et importation de projets et d'objets [page 429]
Chaque fois que vous ajoutez une table ou un fichier à un projet, vous importez des métadonnées que le logiciel
stocke dans votre référentiel.
Si deux ou plusieurs projets ajoutent la même table ou le même fichier, Information Steward ne stocke qu'une
seule copie des métadonnées du fichier ou de la table de base de données dans le référentiel Information
Steward. Par conséquent, tous les projets qui contiennent la même table ou le même fichier partagent la même
copie des métadonnées importées de la table ou du fichier. N’oubliez pas les conditions suivantes concernant
les tables et les fichiers partagés :
● Si le schéma a été modifié dans la source externe et qu'un utilisateur réimporte les métadonnées dans un
projet, les métadonnées réimportées seront visibles dans tous les projets.
● Un utilisateur ne peut pas supprimer les métadonnées de la table ou du fichier dans la boîte de dialogue
Parcourir les métadonnées si d'autres projets utilisent encore la table.
Si vous supprimez un objet dans l'espace de travail de votre projet Data Insight, ses objets dépendants sont
également supprimés. Cependant, vous ne pouvez pas supprimer un objet si un autre projet utilise un ou
plusieurs de ses objets dépendants. La table suivante présente les dépendances et les dépendants des objets
que vous supprimez de votre espace de travail dans Data Insight.
Guide de l'utilisateur
36 PUBLIC Data Insight
Objet à supprimer de l'espace de tra Dépendances d'objet qui empêchent Objets dépendants qui seront égale
vail d'un projet dans Data Insight la suppression ment supprimés
Règle Pour supprimer une règle, vous devez ● Exemples de données ayant
supprimer du projet en cours les objets échoué à la règle
suivants qui utilisent la règle : ● Paramètres de seuil
● Liaison de règle
● Domaine de données clés
Domaine de données clés Non applicable Les objets suivants qui sont liés au do
maine de données clés :
● Dimension de qualité
● Règle
● Scores et pondérations de liaison
de règle
Supprimer une table ou un fichier Pour supprimer une table ou un fichier ● Résultats de profil
d'un projet, vous devez supprimer les ● Exemple de données
objets suivants qui utilisent la table ou
● Résultats de règle
le fichier dans ce projet :
● Exemples de données ayant
● Liaison de règle échoué à la règle
● Tâche de profilage ou d'exécution
de règle
● Vue
● Règle associée à la fonction de re
cherche se référant à la table
● Table
● Fichier
Guide de l'utilisateur
Data Insight PUBLIC 37
Objet à supprimer de l'espace de tra Dépendances d'objet qui empêchent Objets dépendants qui seront égale
vail d'un projet dans Data Insight la suppression ment supprimés
Colonne, lorsqu'elle est supprimée Pour supprimer une colonne, vous de
suite à la réimportation d'une table vez supprimer de tous les projets les
dans la boîte de dialogue Parcourir les objets suivants qui utilisent la colonne
métadonnées supprimée :
Informations associées
Les métadonnées de vos tables externes peuvent se modifier après avoir importé les tables d’importation dans
vos projets, ce qui peut entraîner l’échec des tâches des règles.
Les métadonnées externes peuvent se modifier lorsqu’il y a eu une modification dans une source externe. Par
exemple, si un nom de colonne est modifié ou une colonne supprimée, les métadonnées sont modifiées. Par
conséquent, il est préférable de rapprocher les métadonnées importées.
Avant de rapprocher les métadonnées importées, assurez-vous de supprimer les objets, comme les tâches ou
les liaisons de règles, qui sont associés aux colonnes dans la source. Si vous n’êtes pas le propriétaire,
communiquez avec les propriétaires des objets associés de vos plans, pour rapprocher les métadonnées
importées. Le propriétaire de l’objet doit supprimer la dépendance avant de pouvoir rapprocher les
métadonnées importées.
Guide de l'utilisateur
38 PUBLIC Data Insight
Si la table sélectionnée n’a pas de dépendance, le logiciel met à jour les métadonnées. S’il n’y a pas de
dépendance, le logiciel affiche un avertissement et ne rapproche pas les tables sélectionnées.
Supprimez les objets dépendants de la table avant de tenter de rapprocher les métadonnées importées pour
cette table.
Informations associées
Si vous n'avez besoin de métadonnées de la table pour aucun de vos projets, vous pouvez les supprimer.
Vous ne pouvez pas supprimer les métadonnées de la table si la table est utilisée dans un autre projet. Avant de
procéder à ces étapes, ouvrez chaque projet et supprimez la table du projet.
1. Ouvrez le projet correspondant dans Data Insight et sélectionnez Ajouter Tables dans la barre de
menu supérieure.
Le logiciel affiche uniquement les tables importées et active des options spécifiques dans la barre de menu
supérieure.
4. Dans la liste du volet droit, cochez la case en face du nom de la table contenant les métadonnées que vous
souhaitez supprimer.
5. Si vous n'avez pas encore supprimé la table utilisée dans d'autres projets, vérifiez qu’il n’y a pas de
dépendances en sélectionnant Afficher l'utilisation dans la barre de menu supérieure.
Si des projets utilisent la table importée, ouvrez chaque projet, puis supprimez la table. Reprenez ensuite
ces étapes.
7. Fermez la boîte de dialogue Projets et fonctions utilisant les tables sélectionnées.
8. Cochez la case en face du nom de la table contenant les métadonnées que vous souhaitez supprimer et
cliquez sur Supprimer.
Guide de l'utilisateur
Data Insight PUBLIC 39
Informations associées
Contrôlez l’ordre dans lequel les colonnes de tables apparaissent, afin que vous ayez un ordre de colonnes
cohérent d’une tâche à l’autre.
Après avoir exécuté ces étapes, les colonnes de tables doivent apparaître de manière cohérente dans l’ordre
défini lorsque vous visualisez les colonnes de tables et lorsque vous affichez les données ayant échoué pour les
règles et les scorecards.
○ Base de données : Répertorie les colonnes dans l'ordre indiqué dans la base de données lorsque vous
avez importé la table ou dans l’ordre utilisé lorsque vous avez créé ou modifié une vue.
○ Ordre alphabétique : Répertorie les colonnes par ordre alphabétique.
Vous pouvez modifier les options d’affichage à tout moment et le logiciel rafraîchit la vue pour respecter
votre sélection.
Notez que lorsque vous affichez les colonnes dans une table, elles apparaissent dans l’ordre que vous avez
indiqué. Par exemple, dans Accueil de l’espace de travail, ouvrez l’onglet Résultats de profilage, développez une
connexion et une table dans la connexion à gauche.
● Ordre alphabétique : Les colonnes listées sous la table ou la vue sélectionnée apparaissent par ordre
alphabétique.
● Base de données : Les colonnes listées sous la table ou la vue sélectionnée apparaissent telles qu’elles ont
été saisies dans la base de données.
L’ordre des colonnes que vous choisissez contrôle aussi l'ordre des colonnes lorsque vous affichez les modèles
de données ayant échoué dans l’onglet Résultats de règle et lorsque vous affichez plus de modèles de données
ayant échoué.
Informations associées
Affichage des données ayant échoué à partir des règles [page 164]
Affichage d'exemples de données ayant échoué à partir d’un scorecard [page 279]
Guide de l'utilisateur
40 PUBLIC Data Insight
4.6 Formats de fichiers
Les formats de fichier contiennent des métadonnées sur un fichier plat ou un fichier Excel, comme les
informations de champ ou de colonne, les types de séparateurs, les noms de classeurs, les plages de données,
etc.
Avant d’exécuter les tâches de profilage, d’affecter les règles et de créer des scorecards avec un fichier plan ou
Excel, créez un format de fichier et affectez-le au fichier plat ou Excel. Lorsque le format de fichier est affecté à
un fichier, vous pouvez exécuter des processus sur les données dans le fichier, comme si c’était un objet de la
table.
Pour afficher les formats de fichier, ouvrez l’onglet Data Insight et cliquez sur l’icône de formats de fichier, à
gauche Lorsque vous cliquez sur un format de fichier existant, le logiciel affiche les propriétés en lecture seule.
Après avoir exécuté les tâches sur le format de fichier, le format de fichier et tous les objets associés
apparaissent dans la catégorie Connexions Data Insight dans la page du répertoire principal Metadata
Management.
Un fichier plat stocke les données dans un fichier de texte brut. Pour traiter les fichiers plats, vous définissez le
format dans un format de fichier. La définition de format de fichier contient des métadonnées sur le fichier plat.
Par exemple, le format de fichier contient des informations de séparateurs de lignes et de colonnes.
Un classeur Excel est un fichier contenant une ou plusieurs feuilles de calculs. Chaque classeur pourrait
contenir des métadonnées uniques, afin que vous puissiez créer un format de fichier pour chaque classeur.
Pour traiter les classeurs Excel dans Information Steward, définissez un format de fichier et affectez-le au
fichier Excel. La définition du format de fichier Excel inclut le nom de classeur, les pages d’index, les noms de
colonnes, ou encore les attributs de colonnes.
Guide de l'utilisateur
Data Insight PUBLIC 41
Affectation d'un format de fichier à un fichier [page 54]
Pour utiliser un fichier plat ou un fichier Excel dans un projet, affectez le fichier à un format de fichier
que vous avez créé spécialement pour le fichier.
Un format de fichier plat contient des métadonnées sur un fichier plat, comme les séparateurs de champs et
de lignes et le schéma.
1. Dans Data Insight, sélectionnez l’onglet Formats de fichier à partir des onglets à gauche.
Vous n’avez pas besoin de sélectionner un modèle de fichier. Vous pourriez saisir les informations du
schéma manuellement. SI vous ne sélectionnez pas un modèle de fichier, notez les inconvénients suivants :
○ Vous ne pouvez pas utiliser les options Afficher les exemples de données ou Proposer un schéma.
○ Le format de fichier que vous créez ne sera pas disponible dans la page du répertoire de Metadata
Management dans la catégorie Connexions Data Insight.
Les étapes restantes supposent que vous sélectionnez un exemple de fichier à l’aide de Parcourir.
6. Sélectionnez le nom du fichier et cliquez sur Appliquer.
7. Sélectionnez La première ligne contient des noms de champs lorsque votre modèle de fichier contient des
noms de champs dans la première ligne.
8. Cliquez sur Proposer un schéma.
Le logiciel renseigne l’espace de travail avec une liste de types et de noms de champs en fonction du
modèle de fichier.
9. Modifiez les types de champs si nécessaire en cliquant sur le type applicable et en sélectionnant un
nouveau type dans la liste déroulante.
10. Organisez les champs si nécessaire à l'aide de Déplacer vers le haut et Déplacer vers le bas.
11. Cliquez sur Afficher les exemples de données pour valider le schéma.
Remarque
Lorsque vous sélectionnez un exemple de fichier, les longueurs et les types de champs sont basés sur
quelques exemples de lignes. Avant de terminer le format de fichier, vous devez ajuster le schéma afin
que le schéma prenne en charge toutes les lignes du fichier. Vérifiez soigneusement les longueurs et les
types de champs.
Les modèles de données apparaissent dans le format des informations du schéma proposé ou créé.
Guide de l'utilisateur
42 PUBLIC Data Insight
12. Si le schéma vous convient, cliquez sur Enregistrer.
Informations associées
Lorsque vous créez un format de fichier plat, vous pouvez cliquer sur Plus d'options pour ouvrir une boîte de
dialogue incluant des options supplémentaires pour renseigner les métadonnées relatives au fichier plat.
Pour ouvrir la fenêtre Plus d’options, ouvrez l’onglet Formats de fichier, cliquez sur Nouveau Format de
fichier plat , puis cliquez sur Plus d'options.
Général
Type Délimité ou Largeur ● Les fichiers délimités contiennent un indicateur, tel qu'une virgule ou
fixe une tabulation, entre chaque champ et chaque enregistrement.
● Les fichiers à largeur fixe ont une longueur de champ et d'enregistre
ment spécifique.
Guide de l'utilisateur
Data Insight PUBLIC 43
Nom Valeur Description
● Oui indique que le schéma est adaptable. Le fichier actuel peut conte
nir plus ou moins de colonnes que ce qui est indiqué par le format de
fichier. Si une ligne contient moins de colonnes que prévu, l'application
charge des valeurs nulles dans les colonnes avec des données man
quantes. Si une ligne contient plus de colonnes que prévu, l'application
ignore les données supplémentaires.
● Non indique que le schéma est fixe. L'application requiert que le nom
bre de colonnes dans chaque ligne corresponde au nombre de colon
nes spécifié dans le format de fichier. Si les données contiennent plus
ou moins de colonnes que prévu, une erreur se produit. Référez-vous
aux options avancées pour les erreurs de traitement.
Remarque
Le lecteur de fichier lit autant d'octets dans une colonne en fonction de
la longueur de la colonne. Pour les pages de codes multioctets, un ca
ractère peut être supérieur à 1 octet. Il peut arriver que les octets de fin
du dernier caractère de la colonne dépassent la longueur de la colonne.
Lorsque les octets de fin dépassent la longueur de la colonne, le lecteur
poursuit jusqu'à atteindre la longueur totale du caractère.
Séparateurs
Guide de l'utilisateur
44 PUBLIC Data Insight
Nom Valeur Description
Ligne {nouvelle ligne}, Séquence de caractères qui indique où se termine une ligne de données et
{nouvelle ligne
où commence la suivante.
Windows}, {nouvelle
ligne Unix}, ou toute
séquence de caractè
res
Texte Guillemets simples, Indique le début et la fin d'une chaîne de texte. Tous les caractères, y com
guillemets doubles ou
pris ceux spécifiés comme séparateurs de colonnes, entre la première et la
{aucun}
seconde occurrence de ce caractère dans une chaîne de texte unique.
Format
Caractère Toute séquence de ca Séquence de caractères spéciale qui permet à l'application d'ignorer le sé
d'échappement ractères, ou {aucun}
parateur de colonne normal. Les caractères suivant la séquence de carac
tères d'échappement ne sont jamais utilisés comme séparateurs de co
lonne.
Par exemple, vous spécifiez une barre oblique en tant que caractère
d'échappement et une virgule en tant que séparateur de colonnes. Vous de
vez donc utiliser une barre oblique pour faire apparaître une virgule dans un
champ.
Indicateur de valeur Toute séquence de ca Séquence de caractères spéciale que l'application interprète comme des
nulle ractères ou {aucun}
données nulles.
Ignorer les Toute séquence de ca Séquence de caractères qui, lorsqu'elle se trouve au début des lignes, per
marqueurs de lignes ractères ou {aucun}
met à l'application d'ignorer la ligne lors de la lecture du fichier ou de la
création automatique de métadonnées. Pour saisir plusieurs séquences de
caractères, séparez chacune d'elles par un point-virgule. Pour inclure un
point-virgule ou une barre oblique inverse comme caractère de marquage,
faites le précéder d'une barre oblique inverse.
Date aaaa.mm.jj ou {aucun} Format de date pour la lecture des valeurs de date vers/depuis le fichier.
Heure hh24:mi:ss ou {aucun} Format de l'heure pour la lecture des valeurs d'heure vers/depuis le fichier.
Date et heure aaaa.mm.jj hh24:mi:ss Format de date et heure pour la lecture des valeurs de date et d'heure vers/
ou {aucun}
depuis le fichier.
Remplissage avec Pour les fichiers de lar Méthode pour supprimer les espaces vides supplémentaires avant ou
des espaces geur fixe : Début ou Fin
après les champs. Le paramétrage de cette option indique à l'application
l'emplacement du remplissage.
En-têtes
Guide de l'utilisateur
Data Insight PUBLIC 45
Nom Valeur Description
Ignorer les lignes Entier Lorsque le fichier contient des informations d'en-tête, des commentaires
ou d’autres informations qui ne font pas partie des données, saisissez le
nombre de lignes que l'application doit ignorer lors de la lecture du fichier.
Ignorer l'en-tête de Non ou Oui Lorsque le fichier contient des informations d'en-tête, Ignorer l'en-tête de
ligne ligne indique au logiciel d'ignorer la première ligne car elle contient des in
formations d’en-tête. Sélectionnez Oui pour que l'application utilise les don
nées de la première ligne en tant que noms de colonne.
Paramètres régionaux
Langue L'abréviation en trois Spécifie la langue (par exemple coréen, japonais, ou anglais) dans laquelle
lettres de la langue les données sont stockées et traitées.
spécifiée dans la
norme ISO 639-2T
Page de codes Pages de code prises Spécifie la séquence de bits qui définit un caractère. Par exemple, la page
en charge de code du japonais contient des caractères ASCII, grecs, cyrilliques et ja
ponais, prenant ainsi en charge les langues suivantes : anglais, grec, russe
et japonais.
Erreur de traitement
Journaliser les Non ou Oui Détermine l'ajout ou non des avertissements de conversion des données
avertissements de type dans le journal d'erreurs.
conversion des
données
Nombre maximal Nombre entier supéri Si l'option Journaliser les avertissements de conversion des données est ac
d'avertissements à eur à 0 ou Aucune tivée, limitez le nombre d'avertissements journalisés par l'application.
journaliser limite
Capturer les erreurs Non ou Oui Détermine la capture ou non des erreurs de conversion des données type
de conversion des lors du traitement.
données
Capturer les erreurs Non ou Oui Détermine la capture ou non des erreurs de format de ligne en cours de
de format de lignes traitement.
Nombre maximal Nombre entier supéri Si l'option Capturer les erreurs de conversion de données ou Capturer les
d'erreurs avant eur à 0 ou Aucune erreurs de format de ligne est activée, limitez le nombre de lignes non vali
d'arrêter le processus limite des traitées par l'application avant l'arrêt du job.
Écrire les erreurs Non ou Oui Si l'option Capturer les erreurs de format de ligne est activée, écrivez les li
dans le fichier gnes non valides dans un fichier d'erreurs.
d'erreurs
Fichier d'erreurs Nom du fichier, nom Si l'option Ecrire les lignes d'erreur dans le fichier est activée, entrez le nom
du fichier comprenant du fichier dans lequel enregistrer les lignes non valides.
le nom du chemin
complet, ou vide
Guide de l'utilisateur
46 PUBLIC Data Insight
4.6.2 Création d'un format de fichier pour un fichier Excel
Un format de fichier Excel contient des métadonnées sur un classeur de fichiers Excel, comme le nom de
classeur, l’index du classeur, les plages nommées, les informations de schéma, etc.
Exécutez ces étapes pour chaque classeur dans le classeur Excel que vous voulez traiter avec Data Insight.
Vous n’avez pas besoin de sélectionner un modèle de fichier à l’aide de Parcourir. Vous pourriez saisir les
informations du format de fichier manuellement. SI vous ne sélectionnez pas un modèle de fichier, notez
les inconvénients suivants :
○ Vous ne pouvez pas utiliser les options Afficher les exemples de données ou Proposer un schéma.
○ Le format de fichier que vous créez ne sera pas disponible dans la page du répertoire de Metadata
Management dans la catégorie Connexions Data Insight.
Restriction
Lorsque vous sélectionnez un fichier Excel pour l’exemple de fichier, assurez-vous qu’il fasse moins de
15 Mo. Les fichiers dont la taille est supérieure à 15 Mo peuvent ralentir l’exécution. Enregistrez plutôt
une copie du fichier Excel à l’aide d’un sous-ensemble des données, afin que l’exemple de fichier fasse
moins de 15 Mo. Après avoir créé le format de fichier Excel, utilisez le fichier Excel original et non
l’exemple de fichier plus petit, avec le format de fichier Excel pour exécuter les processus Data Insight
comme le profilage.
6. Sélectionnez les paramètres Accès aux données. Votre sélection affecte les options restantes. La table
suivante contient les descriptions de la méthode d’accès aux données.
Option Description
Nom du classeur Cliquez sur la flèche déroulante et sélectionnez le nom de classeur applicable.
Information Steward accède aux données à partir du classeur sélectionné.
Index du classeur Saisissez le numéro lié au classeur sélectionné. L’index représente la position du clas
seur dans le classeur Excel. Le classeur le plus à gauche correspond à l'index 1, le sui
vant à l'index 2, et ainsi de suite.
Par exemple, si votre fichier Excel possède 5 classeurs, le logiciel affiche Index du
classeur (1-5).
Plage nommée Facultatif. Sélectionnez la plage nommée applicable dans la liste déroulante.
Une plage nommée est un champ qui spécifie une plage de cellules dans un classeur
donné. Si vous sélectionnez cette option, Information Steward prend en compte uni
Guide de l'utilisateur
Data Insight PUBLIC 47
Option Description
quement les données dans les cellules identifiées dans la plage nommée. L’exemple
de classeur de fichier doit aussi avoir une plage nommée pouvant être dans un em
placement différent de celui utilisé pour créer le format. La plage nommée doit être
une sélection de cellules finie.
7. Si la première ligne de données, à laquelle on a accédé avec la méthode choisie, contient les noms de
champs, sélectionnez La première ligne contient des noms de champs.
8. (Facultatif) Sélectionnez Plus d'options pour définir plus d'options avancées pour la mise en forme, les en-
têtes, etc.
9. Cliquez sur Proposer un schéma. Le logiciel remplit les définitions de champs dans la zone du schéma en
fonction des données dans l’exemple de fichier.
10. Facultatif. Renommez les champs et modifiez le type de champ.
11. Facultatif. Organisez les champs à l'aide de Déplacer vers le haut et Déplacer vers le bas.
12. Pour valider la définition du format de fichier, cliquez sur Afficher les exemples de données.
Remarque
Lorsque vous sélectionnez un exemple de fichier, les longueurs et les types de champs sont basés sur
quelques exemples de lignes. Avant de terminer le format de fichier, vous devez ajuster le schéma afin
que le format de fichier s’applique au fichier entier. Par exemple, recherchez la longueur du champ le
plus long dans le fichier, et assurez-vous que votre schéma s’accommode à cette taille. Vérifiez
soigneusement les longueurs et les types de champs.
Les modèles de données apparaissent dans le format des informations du schéma proposé ou créé.
13. Si le schéma vous convient, cliquez sur Enregistrer.
Informations associées
Guide de l'utilisateur
48 PUBLIC Data Insight
4.6.2.1 Format de fichier Excel - Plus d'options
Lorsque vous créez un format de fichier Excel, vous pouvez cliquer sur Plus d'options pour ouvrir une boîte de
dialogue incluant des options supplémentaires pour renseigner les métadonnées relatives au fichier plat.
Élargir la plage Oui ou Non Visible uniquement si la valeur de l'option Plage n'est pas définie sur <{toutes
les cellules}>.
Oui : le logiciel examine toutes les lignes dans une plage donnée.
Non : le logiciel examine uniquement les lignes de données dans une plage donnée.
Ignorer l'en-tête de Oui ou Non Oui : le logiciel ignore la première ligne car elle contient les noms de colonne.
ligne
Non : le logiciel tient compte de la première ligne car elle ne contient pas les noms
de colonne.
Page de codes Pages de code Spécifie la séquence de bits qui définit un caractère.
prises en charge.
Par exemple, la page de code du japonais contient des caractères ASCII, grecs, cy
rilliques et japonais, Par conséquent, la page de code du japonais prend en charge
l’anglais, le grec, le russe et le japonais.
Informations associées
Utilisez les icônes de menu dans l'Editeur de format de fichier pour organiser les champs dans un format de
fichier que vous ajoutez ou que vous modifiez.
Guide de l'utilisateur
Data Insight PUBLIC 49
Description des icônes
Nom de l'icône Description
Ajouter une ligne Ajoute une ligne dans la table pour un nouveau champ. Saisissez le nom du champ et les infor
mations liées pour chaque ligne que vous ajoutez.
Déplacer vers le haut Déplace la ligne vers le haut ou vers le bas selon l'ordre voulu pour les champs.
Informations associées
Créez des groupes de formats de fichier pour traiter tous les formats de fichier comme un fichier logique.
Les formats de fichier pour les fichiers plats et les classeurs Excel contiennent des métadonnées comme les
définitions de champs, les noms de feuilles, les plages de lignes et de colonnes, la taille de champ, entre autres.
Utilisez un modèle avec un caractère générique pour regrouper les fichiers avec les noms de fichier qui
correspondent au modèle. Par exemple, vous pouvez créer un groupe de fichiers appelé « Enregistrements des
ventes », qui utilise un modèle de nom de fichier Ventes*.txt. Le logiciel regroupe tous les fichiers ayant des
noms de fichier correspondant au modèle. S’ils sont présents dans la même connexion, le groupe de fichiers
pourrait contenir les fichiers suivants :
● ventes_est.txt
● ventes_central.txt
● ventes_année.txt
Si le nom du fichier correspond au modèle, le logiciel ajoute les fichiers qui sont ajoutés après avoir créé le
groupe dans le groupe de formats de fichier.
Guide de l'utilisateur
50 PUBLIC Data Insight
Le logiciel crée un lien statique entre le nom du format de fichier et la tâche de profilage lorsque vous ajoutez
un format de fichier à un groupe. Assurez-vous que les nouvelles données ont le même nom de fichier.
Informations associées
Regroupez les formats de fichier du même type de format à l’aide d’un modèle de nom de fichier.
Avant de créer un groupe de formats de fichier, un administrateur crée une connexion et des formats de fichier
associés à cette connexion dans la Central Management Console (CMC).
1. Sélectionnez un projet de l'onglet Data Insight et ouvrez la page Accueil de l'espace de travail (si elle n'est
pas déjà affichée).
Option Description
Toujours traiter tous les fi- Traite un groupe de formats de fichier comme une seule entité. Le logiciel traite les enre
chiers de ce groupe gistrements à partir de plusieurs sources, sans les fusionner physiquement. Le processus
de profilage lit tous les enregistrements pour tous les fichiers et donne un résultat agrégé.
Guide de l'utilisateur
Data Insight PUBLIC 51
Option Description
Traiter les fichiers dont Traite la dernière version des mêmes données. Le logiciel regarde l'horodatage du fichier
l'horodatage est ultérieur à pour traiter le dernier fichier ainsi que les fichiers qui n'ont pas été traités depuis la der
la dernière exécution nière exécution.
Le nouveau groupe de fichiers apparaît dans la liste Tables dans Accueil de l’espace de travail.
Informations associées
Pour pouvoir modifier un format de fichier, vous devez ouvrir un projet de l'onglet Data Insight et cliquez sur
l'onglet Formats de fichiers pour ouvrir la fenêtre Formats de fichiers.
Remarque
Il est impossible de modifier un format de fichier lorsqu'il est utilisé par un projet.
1. Sélectionnez un format de fichier dans la liste Nom à gauche de la fenêtre et cliquez sur Modifier dans la
barre de menus supérieure.
La fenêtre Editeur de format de fichier s'ouvre.
2. Effectuez les modifications souhaitées et cliquez sur Enregistrer.
Informations associées
Guide de l'utilisateur
52 PUBLIC Data Insight
Affectation d'un format de fichier à un fichier [page 54]
Affichage de l'utilisation d'un format de fichier [page 55]
Suppression d'un format de fichier [page 55]
Création d'un format de fichier pour un fichier plat [page 42]
Affectation d'un format de fichier à un fichier [page 54]
Options d'organisation des champs dans un format de fichier [page 49]
Création d’un groupe de formats de fichier à l’aide d'un modèle de nom de fichier [page 51]
Copie d'un format de fichier [page 53]
Suppression d'une table ou d'un fichier d'un projet [page 33]
Si le format de votre fichier est modifié (par exemple, un champ est ajouté ou la longueur du champ de
données change), la façon la plus rapide de mettre à jour le fichier de format est de faire une copie d'un fichier
de format existant puis de modifier la copie.
1. Dans l'onglet Formats de fichiers de votre projet dans l'onglet Data Insight, sélectionnez un format de
fichier à gauche puis cliquez sur Copier dans la barre de menus supérieure.
2. Dans la fenêtre Editeur de format de fichier, entrez un nouveau nom et une nouvelle description du format
de fichier.
3. Effectuez les modifications souhaitées.
4. Cliquez sur Enregistrer.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 53
4.6.7 Affectation d'un format de fichier à un fichier
Pour utiliser un fichier plat ou un fichier Excel dans un projet, affectez le fichier à un format de fichier que vous
avez créé spécialement pour le fichier.
Avant de pouvoir exécuter les étapes suivantes, vous devez créer un format de fichier pour le fichier que vous
voulez inclure dans un projet.
La fenêtre Parcourir les métadonnées s’ouvre sur la gauche et affiche une liste des connexions pour
lesquelles vous avez une autorisation.
2. Sélectionnez une connexion de fichiers.
Une liste des fichiers dans la connexion apparaît à droite de la liste de connexions.
3. Sélectionnez un format de fichier à partir de la liste déroulante Sélectionner un format de fichier à côté du
fichier que vous voulez sélectionner.
Le fichier ne peut pas être sélectionné tant que vous n’avez pas sélectionné un format de fichier dans la
liste déroulante.
Facultatif. Affichez les noms de colonnes et les attributs en développant un nœud de fichier.
4. Cliquez sur la case à côté du fichier ou des fichiers applicable(s).
5. Cliquez sur Fermer.
Informations associées
Guide de l'utilisateur
54 PUBLIC Data Insight
4.6.8 Affichage de l'utilisation d'un format de fichier
Pour plus d'informations sur le mode d'utilisation d'un format de fichier dans votre projet :
1. Dans l'onglet Formats de fichier de votre projet dans Data Insight, sélectionnez un format de fichier à
gauche et cliquez sur Afficher l'utilisation dans la barre de menu supérieure.
2. Dans la fenêtre Utilisation des formats de fichier sélectionnés, cliquez sur le symbole + pour développer les
éléments affichés.
Vous pouvez voir les règles, les profils et les tâches associés au format de fichier.
Informations associées
1. Dans l'onglet Formats de fichier de votre projet Data Insight, sélectionnez un format de fichier à gauche.
2. Cliquez sur Supprimer dans la barre de menu supérieure.
Le format de fichier est supprimé.
Guide de l'utilisateur
Data Insight PUBLIC 55
Informations associées
Les vues Data Insight de SAP Information Steward s'adressent aux utilisateurs professionnels. Elles leur
permettent d'analyser les données pouvant résider dans plusieurs tables ou fichiers de différentes connexions
ou vues. Contrairement aux vues de base de données, qui permettent d'analyser les données d'une base de
données sous-jacente, les vues Data Insight permettent à l'utilisateur professionnel d'analyser les données de
différentes sources de données. Les vues sont spécifiques à un projet. Chaque projet peut comporter une ou
plusieurs vues.
Vous pouvez effectuer les tâches suivantes avec les vues Data Insight :
Guide de l'utilisateur
56 PUBLIC Data Insight
Informations associées
La création et la gestion des vues s'effectuent via la boîte de dialogue de l'Editeur de vue.
L’Éditeur de vue est la page principale qui s'ouvre lorsque vous sélectionnez un élément dans le menu déroulant
Gérer les vues de la page Accueil de l'espace de travail. Utilisez des expressions de mappage, des jointures, des
unions et des filtres pour créer une vue spécifique à vos besoins et à même de réduire le volume de données
que le logiciel doit analyser.
Créez des expressions de mappage, des conditions de jointure et de filtre simples en saisissant les expressions
directement dans les colonnes appropriées ou à l'aide de l'Editeur avancé, qui fournit des outils permettant de
créer des expressions plus complexes.
La boîte de dialogue Éditeur de vue affiche les sources sélectionnées pour la vue. La fenêtre contient des
groupes d'informations dans des zones et volets divers.
Supérieur Contient les zones de texte Nom et Description dans lesquelles vous pouvez ajouter le nom et
la description d'une nouvelle vue, modifier la description d'une vue modifiée ou encore modifier
le nom et la description d'une vue copiée.
Gauche Contient la liste des sources incluses dans la vue. Utilisez les boutons Ajouter des sources et
Supprimer les sources sélectionnées pour ajouter des sources à votre sélection ou y apporter
des modifications. Si une tâche de profilage a été exécutée sur une table source, une icône d'in
formation s'affiche dans la colonne Résumé, après le nom de la table. Placez le pointeur sur
l'icône pour afficher les statistiques du profileur, telles que le nombre de lignes de la table.
Droit Contient les onglets suivants : Schéma de sortie, Conditions de jointure, Conditions de filtre et
Group By.
Les onglets de la boîte de dialogue Editeur de vue fournissent des outils permettant d'optimiser le type de
données dans la vue.
Guide de l'utilisateur
Data Insight PUBLIC 57
Nom de l'onglet Description
Conditions de jointure Créez des jointures internes et des jointures externes gauche, puis classez les jointures et con
figurez les options de mise en cache pour une performance optimale. Si une tâche de profilage
de colonnes a été exécutée, le nombre de lignes dans chaque table est indiqué, pour vous aider
à déterminer l'ordre optimal pour relier les tables.
Conditions de filtre Créez des expressions de condition de filtre pour affiner le niveau des données dans votre vue.
La boîte de dialogue Editeur de vue contient un bouton Valider dans le coin inférieur droit. Cette validation
permet de garantir que les expressions sont logiques, complètes et syntaxiquement correctes. Si l'une des
expressions définies présente un problème, une icône d'avertissement ( ) ou d'erreur ( ) s'affiche dans
l'onglet approprié.
Informations associées
L'Editeur de vue contient des onglets qui permettent de créer différents aspects de la vue.
Schéma de sortie Personnalisez les colonnes de table pour l'affichage. Utilisez l'onglet Schéma de sortie pour
effectuer les tâches suivantes :
Guide de l'utilisateur
58 PUBLIC Data Insight
Nom de l'onglet Description
Conditions de jointure Créer des jointures internes et des jointures externes gauche. Optimisez les jointures comme
suit :
Remarque
Si le nombre de lignes dans la table est vide, déplacez votre curseur sur la colonne
Lignes vide. Un message apparaît indiquant que vous devez exécuter un profilage de
colonne.
● Sélectionner les champs à inclure dans le filtre ainsi que l'opérateur de champ.
● Saisir une expression simple dans le champ Valeur.
● Ouvrir une boîte de dialogue de l'Editeur d'expressions avancé pour créer des expres
sions plus complexes.
● Renseigne automatiquement la liste Nom de colonne avec les colonnes de sortie requi
ses en cliquant sur Proposer des colonnes.
Remarque
S’il y a des colonnes déjà présentes dans la liste Nom de colonne, cliquez sur
Proposer des colonnes pour les écraser. Un message demandant si vous souhaitez
remplacer les colonnes actuelles s'affiche.
● Affectez manuellement les colonnes requises en cliquant deux fois sur la colonne dans le
volet Tables source pour ajouter chaque fichier dans la liste Nom de colonne.
● Supprimez une ligne en mettant en surbrillance la ligne dans la liste Nom de colonne et
en cliquant sur Supprimer.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 59
Création d'un classement de jointures [page 64]
Modification du schéma de sortie pour personnaliser les vues [page 72]
Conditions de filtre associées aux vues [page 77]
Afficher les données source [page 82]
Langage de script [page 294]
Expressions de condition de filtre dans les éditeurs de vue [page 300]
Lorsque vous créez ou modifiez des vues, vous pouvez créer des colonnes de sortie faisant référence à une ou
plusieurs colonnes. Vous pouvez créer une colonne de différentes façons :
Exemple
Vous pouvez par exemple créer un champ FullName contenant une colonne LastName et une colonne
FirstName séparées par une virgule. Dans ce cas de figure, l'expression de mappage se présentera de la
sorte : <nom_connexion>.<nom_table>.LastName || ',' ||
<nom_connexion>.<nom_table>.FirstName.
Vous pourriez créer une colonne représentant les trois premiers chiffres d'un code postal. Dans ce cas de
figure, l'expression de mappage se présentera de la sorte : substr(PostCode, 1, 3).
Informations associées
● Si une colonne est définie dans une tâche ou qu'elle est liée à une règle, il n'est pas possible de la
supprimer du schéma de sortie.
● Vous pouvez supprimer uniquement une vue dans son intégralité dès lors qu'elle ne comporte aucune
liaison de règle ni aucune tâche associée.
● Vous ne pouvez pas ajouter de vues ou de tables déjà associées à la vue.
Guide de l'utilisateur
60 PUBLIC Data Insight
2. Sélectionnez la vue à modifier et cliquez sur Gérer les vues Modifier la vue .
La boîte de dialogue Editeur de vue s'ouvre.
3. Apportez les modifications souhaitées à la vue.
Pour en savoir plus sur les conditions que vous pouvez modifier, voir les rubriques dans les informations
associées.
4. Cliquez sur Valider.
La validation des modifications permet de vérifier qu'aucun avertissement ni aucune erreur n'est émis lors
de la génération, de la jointure ou du filtrage des colonnes.
5. Cliquez sur Enregistrer.
Pour afficher les tâches et les règles associées à la vue, utilisez l'option Afficher l'utilisation.
Informations associées
Ouvrez le projet approprié dans la fenêtre Projets de Data Insight. Pour ajouter des sources supplémentaires à
une vue existante, suivez ensuite les étapes suivantes :
1. Dans la page Accueil de l'espace de travail, développez le noeud Vues de la colonne Tables et sélectionnez la
vue à modifier.
Une coche apparaît en regard de la vue choisie.
Remarque
Certaines sources sont grisées et ne peuvent pas être mises en surbrillance. Placez votre curseur sur la
source pour voir apparaître une explication permettant de comprendre pourquoi vous ne pouvez pas
sélectionner la source. Par exemple, vous ne pouvez pas ajouter de vue qui engendrerait une référence
Guide de l'utilisateur
Data Insight PUBLIC 61
croisée. Une référence croisée se produit lorsque la Vue A contient la Vue B et que la Vue B contient la
Vue A. Autre cas, vous ne pouvez pas ajouter de table déjà incluse dans la vue.
Informations associées
Supprimez des sources d'une vue lors de la création ou de la modification d'une vue. Pour pouvoir supprimer
une source d'une vue, supprimez toute instance de la vue, table ou colonne des jointures, des expressions, des
filtres et des expressions d'agrégation existants.
Pour supprimer une source d'une vue, suivez les étapes suivantes :
1. Dans la page Accueil de l'espace de travail, développez le noeud Vues de la colonne Tables et sélectionnez la
vue à modifier.
Une coche apparaît en regard de la vue choisie.
Informations associées
Vous pouvez regrouper plusieurs sources (vues, tables, fichiers) dans un seul objet appelé "vue". Vous pouvez
ensuite profiler et créer des tâches d'exécution de règle pour mieux comprendre vos données.
Guide de l'utilisateur
62 PUBLIC Data Insight
1. Ouvrez le projet approprié dans la page Projets de Data Insight.
2. Développez les nœuds de votre choix (vues et connexions) dans la liste Tables du volet droit, puis
sélectionnez les objets (vues, tables ou fichiers) que vous souhaitez inclure dans la nouvelle vue.
3. Cliquez sur Gérer les vues Créer une vue avec Join .
La boîte de dialogue Editeur de vue s'ouvre.
4. Saisissez un nom pour la vue (requis) dans la zone de texte Nom ainsi qu'une brève description (facultatif)
dans la zone de texte Description.
5. Si la vue contient une ou plusieurs tables applications SAP, décidez si vous souhaitez modifier la méthode
de transfert de données pour la lire.
6. Développez chaque source dans la liste Sources, puis sélectionnez les colonnes que vous souhaitez inclure
dans la vue.
7. Cliquez sur le bouton en forme de flèche droite pour ajouter les colonnes sélectionnées à l'onglet Schéma
de sortie.
Les colonnes s'affichent dans cet onglet Schéma de sortie, sous Nom de colonne.
8. (Facultatif) Utilisez Définir la clé primaire et/ou Supprimer la clé primaire pour définir ou supprimer la clé
primaire, le cas échéant.
9. (Facultatif) Apportez vos modifications dans l'onglet Schéma de sortie pour personnaliser la vue.
10. (Facultatif) Si vous avez inclus plusieurs tables dans la vue, ouvrez l'onglet Conditions de jointure pour
créer des expressions de condition de jointure.
11. (Facultatif) Ouvrez l'onglet Conditions de filtre pour créer des filtres.
12. (Facultatif) Créez une vue globale ou définissez les colonnes Group By suite à l'utilisation des fonctions
d'agrégat de l'onglet Schéma de sortie.
13. Cliquez sur Valider pour vérifier qu'aucun avertissement ni aucune erreur n'est émis(e) lors de la définition
de la vue.
Un message de validation s'affiche dans le coin supérieur gauche lorsque la définition de vue obtient la
validation. Si c'est le cas, le symbole applicable s'affiche au niveau de l'onglet contenant l'erreur ou
l'avertissement.
14. Corrigez les éventuelles erreurs et (facultatif) avertissements (ceux-ci peuvent énoncer les conséquences
possibles s'ils ne sont pas pris en compte) et lorsqu'il ne reste plus d'erreur, cliquez sur Enregistrer.
15. (Facultatif) Une fois la vue validée et enregistrée, sélectionnez-la dans la fenêtre Accueil de l'espace de
travail et cliquez sur Visualisation des données pour afficher les données dans les colonnes de sortie, y
compris la colonne agrégée.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 63
Méthodes de transfert des données pour les tables SAP dans des vues [page 76]
Langage de script [page 294]
Combinaison de plusieurs sources de profilage à l’aide de Union [page 71]
Utilisez l'onglet Conditions de jointure pour spécifier des critères pour relier plusieurs tables et fichiers.
Outre les relations clé primaire et clé étrangère, la fonctionnalité Proposer une jointure utilise le type de
contenu, les résultats de données profilées et la correspondance des noms de colonne, pour proposer des
jointures entre tables et fichiers, dans différents systèmes source.
Servez-vous de la fonctionnalité Définir un ordre optimal pour classer vos jointures et ainsi, accélérer les temps
de traitement. La première table (ou vue) de la liste a le classement le plus élevé, ce qui signifie qu'elle sera
traitée en premier. L'ordre de classement par défaut correspond à l'ordre dans lequel les tables sont
répertoriées dans l'onglet Conditions de jointure. Basez l'ordre optimal sur la taille de la table. La boîte de
dialogue Définir un ordre optimal affiche le nombre de lignes dans une table pour vous aider. Les tables les plus
volumineuses doivent figurer en haut du classement.
Remarque
Si le nombre de lignes n'est pas renseigné pour une table, un message s'affiche, indiquant que vous devez
exécuter un profilage de colonne lorsque vous placez le curseur dans chaque colonne vide.
Vous pouvez utiliser un sous-ensemble de langage de script SAP pour créer des expressions de condition de
jointure lors de la création ou de la modification de vues. Pour ouvrir l'éditeur avancé, sélectionnez les tables
pour lesquelles vous souhaitez créer la vue dans la fenêtre Accueil de l'espace de travail, puis cliquez sur
Gérer les vues Créer une vue . Ou, si vous modifiez une vue, sélectionnez la vue applicable et cliquez sur
Gérer les vues Modifier la vue . Ouvrez ensuite l'onglet Conditions de jointure dans la boîte de dialogue
Editeur de vue et commencez à créer la jointure. Ouvrez l'éditeur avancé. Pour ce faire, placez le curseur sur la
zone de texte Condition de jointure et cliquez sur l'icône d'Editeur avancé ( ) qui s'affiche. Saisissez
l'expression directement dans la zone de travail de l'éditeur avancé ou sélectionnez des fonctions au niveau des
icônes de menu pour créer l'expression.
Informations associées
Le classement des jointures désigne un processus avancé et doit être effectué uniquement par les utilisateurs
avancés SAP Information Steward. Avant de passer aux étapes suivantes, vérifiez que vous avez bien assimilé
Guide de l'utilisateur
64 PUBLIC Data Insight
les principes d'évolutivité et de performance, ainsi que l'utilisation du classement et de la mise en cache des
jointures en vue d'optimiser les performances.
Vous trouverez de plus amples informations sur le classement des jointures dans les rubriques Tri des jointures
et Utilisation des caches du Guide d'optimisation de la performance SAP Data Services. Lisez les « Remarques
relatives aux performances et à l'évolutivité » du Guide d'administration.
Pour créer un classement de jointures, vous devez déjà disposer d'une vue dans laquelle sont spécifiées
plusieurs tables et jointures, ou vous devez créer une vue en y spécifiant plusieurs tables et jointures.
1. Dans l'onglet Conditions de jointure, cliquez sur le bouton Définir un ordre optimal situé dans la barre de
menu, en haut de l'onglet.
La boîte de dialogue Définir un ordre optimal s'ouvre.
2. Utilisez les flèches Déplacer vers le haut ou Déplacer vers le bas pour déplacer la table en haut ou en bas
dans la liste.
L'ordre de classement par défaut correspond à l'ordre dans lequel les tables sont répertoriées dans l'onglet
Conditions de jointure. Basez l'ordre optimal sur la taille de la table. La boîte de dialogue Définir un ordre
optimal affiche le nombre de lignes dans une table pour vous aider. Les tables les plus volumineuses
doivent figurer en haut du classement.
Remarque
Si le nombre de lignes n'est pas renseigné pour une table, un message s'affiche indiquant que vous
devez exécuter un profilage de colonne lorsque vous placez le curseur dans chaque colonne vide.
3. Lorsque vous avez terminé de configurer l'ordre de la table et les options de mise en cache, cliquez sur OK.
Le système traite vos jointures selon l'ordre que vous avez défini. La table de classement la plus élevée est
traitée en premier, suivie de la deuxième, etc. L'effet escompté est un temps de traitement accéléré. Si votre
ordre de classement n'accélère pas les temps de traitement, changez de vue et modifiez les paramètres de
classement.
Lors du classement des jointures, vous pouvez configurer les options de mise en cache en vue d'optimiser
l'efficacité du traitement. Le Cache indique si le logiciel doit lire les données de la source et les charger dans la
mémoire ou le cache paginable. La mise en cache d'une source améliore les performances uniquement si la
source de données est utilisée comme portion de table droite d'une jointure. La mise en cache n'affecte pas
l'ordre de jointure des tables.
Oui Le traitement devrait être plus efficace, car la mise en cache limite le nombre de fois où le
système doit accéder à la base de données. La source est mise en cache.
Non Le traitement n'est pas affecté par la mise en cache. La base de données n'est pas mise en
cache dans la mémoire.
Guide de l'utilisateur
Data Insight PUBLIC 65
Option de mise en cache Affecte le traitement
Automatique Information Steward détermines le comportement de la mise en cache. Les tables sont tou
jours mises en cache lorsque l'option de cache Automatique est définie.
En choisissant de mettre en cache une source, assurez-vous que vous disposez de suffisamment d'espace ou
de cache paginable.
Utilisez l'Editeur d'expressions de condition de jointure pour créer des expressions de jointure.
Vous pouvez créer deux types de jointures dans l'onglet Conditions de jointure de l'Editeur de vue : jointures
internes et externes gauches.
Jointure interne Combine les lignes de deux tables uniquement si les valeurs des champs reliés correspondent.
Jointure externe gau Combine l'ensemble des enregistrements de la table répertoriée à gauche de la jointure avec les
che valeurs correspondantes de la table de droite.
Exemple
L'exemple Exemple : Création d'une expression de condition de jointure [page 67] illustre la création d'une
expression de jointure à l'aide de l'Editeur d'expressions de condition de jointure. Votre installation n'inclut
pas les tables utilisées dans l'exemple. Par conséquent, vous ne pourrez pas créer l'expression spécifique
utilisée dans l'exemple. Cet exemple vise à illustrer la méthode utilisée pour créer des expressions de
jointure et non à créer les expressions de jointure spécifiques à l'exemple.
L'exemple d'expression utilise le langage SQL. Bien que SAP Information Steward n'utilise pas le langage
SQL dans le cadre des expressions, nous l'utilisons dans cet exemple à titre pratique pour les utilisateurs
non familiarisés avec le langage de script SAP.
Cet exemple illustre le nom de famille de l'employé et le nom de la société d'expédition associés à chaque
commande en combinant l'ID des employés mis en correspondance des tables des employés et des
commandes à l'aide d'une jointure externe gauche. Il combine ensuite les résultats de la première jointure
avec l'ID des expéditeurs de la table des expéditeurs à l'aide d'une jointure interne.
Guide de l'utilisateur
66 PUBLIC Data Insight
Informations associées
Lisez l'introduction à cet exemple dans Expressions de condition de jointure [page 66].
1. Dans la fenêtre Accueil de l'espace de travail, sélectionnez les tables applicables pour les expressions de
jointure dans la liste Tables, puis cliquez sur Gérer les vues Créer une vue . Pour les besoins de
l'exemple, nous avons choisi les tables des employés, des commandes et des expéditeurs.
L'Editeur de vue s'ouvre.
2. Saisissez un nom et une description pour la vue dans les zones Nom et Description.
3. Sélectionnez l'onglet Schéma de sortie dans le volet principal de l'Editeur de vue.
4. Développez le nœud de chaque table source répertoriée sous Tables source (à gauche), puis cliquez deux
fois sur les colonnes appropriées. Les colonnes s'affichent sous Nom de la colonne dans le volet principal.
Pour notre exemple, nous avons sélectionné les tables et les colonnes suivantes :
Employés Nom_famille
Expéditeurs Nom_société
Commandes ID_commande
Remarque
Les tables ne peuvent être incluses qu'une seule fois dans l'expression de jointure. Par conséquent,
lorsque vous sélectionnez une table pour la colonne de table gauche, elle n'est plus disponible pour la
table de droite, ni pour les jointures suivantes.
9. Cliquez sur l'icône Editeur avancé ( ) qui s'affiche lorsque vous placez le curseur sur la zone de texte
Condition de jointure et suivez les étapes indiquées dans Exemple : création de la première expression de
jointure [page 68] pour créer la première expression de jointure.
10. Cliquez sur l'icône Ajouter dans la barre de menu supérieure de l'onglet Conditions de jointure pour ajouter
une ligne à la deuxième jointure.
L'option Table de gauche ne comporte aucune liste déroulante car la table de gauche de la deuxième
jointure est celle obtenue suite à la première jointure. Le message <Résultat de jointure
précédent> est ainsi disponible en lieu et place de la liste.
Guide de l'utilisateur
Data Insight PUBLIC 67
11. Sélectionnez Jointure interne dans la liste déroulante Type de jointure.
12. Sélectionnez la table des expéditeurs dans la liste déroulante Table de droite. Cette table est la seule à
figurer dans la liste car trois tables ont été choisies pour la vue, et la table des expéditeurs est la seule à ne
pas avoir été utilisée dans la jointure précédente.
13. Pour compléter la deuxième expression de jointure, utilisez l'éditeur avancé et procédez de la même
manière que pour la première expression de jointure. Effectuez les sélections suivantes dans le menu
Colonnes source lors de la création d'une deuxième jointure :
Table Colonne
Commandes Expédier_via
Expéditeurs ID_expéditeur
Veillez à bien saisir « = » entre les deux parties de la jointure. Cliquez sur Valider.
La deuxième expression de jointure se présente comme suit :
connNorthwind.dbo.Orders.ShipVia=connNorthwind.dbo.Shippers.ShipperID
Informations associées
Les étapes ci-dessous représentent les sous-étapes de l'étape 9 dans Exemple : Création d'une expression de
condition de jointure [page 67].
Cliquez sur l'icône Éditeur avancé ( ) qui s'affiche lorsque vous placez le curseur sur la zone de texte
Condition de jointure et suivez les étapes ci-dessous pour créer la première expression de jointure :
Guide de l'utilisateur
68 PUBLIC Data Insight
5. Sélectionnez à nouveau l'icône Colonnes source et développez le nœud de la table Commandes. Cliquez
sur ID employé pour terminer l'expression de jointure.
La première expression de jointure se présente comme suit :
connNorthwind.dbo.Employees.EmployeeID=connNorthwind.dbo.Orders.EmployeeID
6. Cliquez sur Valider la syntaxe (en bas à gauche) pour confirmer que la syntaxe est correcte. Corrigez les
éventuelles erreurs (cet exemple ne devrait pas en comporter), puis cliquez sur OK pour fermer l'éditeur
avancé et revenir à l'onglet Conditions de jointure.
Informations associées
Les éditeurs d'expressions avancés pour les vues proposent des fonctionnalités pour créer des conditions
d'expression complexe. Il existe différents types d'éditeurs d'expression avancés pour les vues :
Les éditeurs avancés prennent en charge l'utilisation de fonctions, de variables, d'opérateurs, de chaînes, etc.,
pour la création d'expressions. Les expressions créées dans les éditeurs d'expression avancés prennent en
charge les multioctets et ne prennent pas en compte la casse.
Chaque éditeur avancé contient un bouton Valider la syntaxe. Lorsque vous cliquez sur ce bouton, le logiciel
vous alerte avec des avertissements et des erreurs si quelque chose ne va pas dans la syntaxe des expressions.
Utilisez les fonctions d'agrégat dans l'onglet Schéma de sortie lorsque vous créez ou modifiez des vues.
Saisissez l'expression dans la colonne Mappage de l'onglet Schéma de sortie, ou créez des expressions plus
complexes dans la boîte de dialogue Editeur d'expressions avancé pour la colonne : <nom_colonne>. L'éditeur
d'expressions avancé contient une icône de menu nommée Agrégat contenant une liste des fonctions à utiliser
dans l'expression. L'icône Agrégat est située dans la barre de menu en haut de la boîte de dialogue de l'éditeur
avancé.
Remarque
Lorsque vous utilisez une fonction d'agrégat sur une colonne dans le schéma de sortie, vous devez
compléter l'onglet Group By.
Lorsque vous créez ou modifiez des expressions dans les éditeurs d'expressions avancés, les options de
création d'expressions sont aussi déterminées par le type de données d'expression autorisé pour le type
Guide de l'utilisateur
Data Insight PUBLIC 69
d'expression. Le tableau ci-dessous contient les types de données nécessaires pour chaque type d'expression
de condition de vue.
Expression de condition de jointure Doit être une valeur booléenne. Le logiciel génère une erreur de validation si l'expres
sion n'est pas booléenne.
Expression de condition de filtre Doit être une valeur booléenne. Le logiciel génère une erreur de validation si l'expres
sion n'est pas booléenne.
Expression de mappage de colonne Doit correspondre au type de données défini pour la colonne. Le logiciel génère une
erreur de validation si les types de données sont incompatibles.
Informations associées
Une union combine plusieurs sources de profilage dans un résultat unique et inclut toutes les lignes
appartenant à toutes les demandes des sources sélectionnées.
Les sources de profilage peuvent inclure des tables, des vues et des fichiers plats.
Les options de l’union sont dans la boîte de dialogue Éditeur de vue. Il existe deux options d’union :
Option Description
Union de tous Combine plusieurs sources dans une source unique et inclut
tous les doublons.
Les sources que vous choisissez de combiner doivent respecter les règles suivantes :
Remarque
Les colonnes de chaque source peuvent avoir des noms de colonne différents.
Guide de l'utilisateur
70 PUBLIC Data Insight
Exemple
Vous exécutez une union de trois sources : Source1 a cinq colonnes avec les types de données suivants :
VarChar, Int, VarChar, Date and Time, and VarChar. Source 2 et Source 3 doivent avoir chacun cinq
colonnes avec les mêmes types de données que Source 1.
Informations associées
4. Cliquez sur Gérer les vues Créer une vue avec Union .
La boîte de dialogue Éditeur de vue s'ouvre avec les sources listées sur la gauche.
5. Saisissez un nom pour la vue dans Nom et une courte description dans Description.
Guide de l'utilisateur
Data Insight PUBLIC 71
12. Cliquez sur Enregistrer.
Après avoir fermé la vue, visualisez les données dans l’union en sélectionnant la vue dans Accueil de l’espace de
travail et en cliquant sur Afficher les données.
Informations associées
1. Mettez un nom de colonne en surbrillance dans Nom de la colonneet saisissez un nom plus intuitif (jusqu'à
30 caractères).
2. Sélectionnez la ligne applicable et utilisez les boutons Déplacer vers le haut et Déplacer vers le bas pour
réorganiser les colonnes.
3. Saisissez une nouvelle expression de mappage en cliquant sur la cellule Mappage et en y saisissant votre
expression. Ou acceptez le mappage automatique du logiciel.
4. Cliquez sur l'icône de l'Editeur d'expressions avancé (qui apparaît à la fin de la cellule Mappage
sélectionnée) dans la colonne pour laquelle vous souhaitez créer des expressions de mappage plus
complexes.
5. Cliquez sur la cellule Description applicable pour une ligne, puis saisissez une description permettant de
mieux identifier la colonne modifiée.
6. Créez une colonne de sortie qui n'existe pas dans les tables source. Par exemple, créez une colonne de
sortie de nom complet en concaténant une colonne de prénom et une colonne de nom de famille. Ou créez
une colonne à l'aide d'une fonction permettant d'extraire une valeur de la colonne d'origine. Par exemple,
utilisez la fonction de sous-chaîne substr(PostCode 1, 3) pour extraire les trois premiers chiffres de la
colonne de code postal.
Informations associées
Guide de l'utilisateur
72 PUBLIC Data Insight
4.7.14 Affichage de l'utilisation d'une vue
1. Dans la fenêtre Espace de travail de l'onglet Data Insight, sélectionnez une vue à gauche et cliquez sur
Informations associées
Pour utiliser une vue existante dans le but de créer une vue, suivez les étapes suivantes :
1. Dans la fenêtre Accueil de l'espace de travail, cochez la case en regard du nom de la vue à copier dans la
colonne Tables.
2. Cliquez sur Gérer les vues Copier la vue dans la barre de menu supérieure.
3. Dans la boîte de dialogue Editeur de vue, modifiez le nom et la description de la vue.
4. Apportez les modifications souhaitées à la vue : modifiez ou créez des conditions de jointure ou de filtre si
vous le souhaitez.
5. Cliquez sur Valider pour vérifier qu'aucun avertissement ni aucune erreur n'est émis lors de la génération,
de la jointure ou du filtrage des colonnes.
6. Cliquez sur Enregistrer.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 73
4.7.16 Utilisation de tables SAP dans des vues
Il se peut que les tables SAP dans des vues nécessitent des programmes ABAP pouvant être générés par
Information Steward ou par des applications SAP.
Les vues Data Insight peuvent contenir des données provenant de plusieurs types de source, notamment des
bases de données, des fichiers texte et des applications telles que SAP Business Suite et SAP NetWeaver
Business Warehouse (applications SAP). Les tables SAP peuvent être liées à d'autres tables, fichiers de base
de données et fichiers plats SAP provenant de la même source ou de sources différentes. Vous pouvez créer
des mappages de champ, des conditions de jointure, des conditions de filtre de profil et des scorecards pour
manipuler davantage et analyser les tables SAP dans des vues.
Lorsque des tables SAP sont incluses à des vues, un fichier de programme ABAP est nécessaire. Les
programmes ABAP contiennent toutes les métadonnées et données correspondant à la table SAP qu'ils
représentent. Les administrateurs peuvent choisir de précharger un programme ABAP généré dans le système
SAP ou faire en sorte qu'Information Steward génère le programme ABAP. Les administrateurs peuvent choisir
de précharger un programme ABAP, par exemple, lors de la migration d'Information Steward d'un
environnement de test vers un environnement de production si la stratégie de sécurité de l'environnement de
production requiert que les applications telles qu'Information Steward ne soient pas autorisées à générer de
programmes ABAP.
Parfois, plusieurs programmes ABAP sont requis. Par exemple, lorsque votre vue contient deux tables SAP ou
davantage provenant de connexions différentes, un programme ABAP est nécessaire pour les tables de chaque
connexion. Lorsque les tables SAP proviennent de la même source, un seul programme ABAP est requis.
Pour améliorer les performances de traitement des vues contenant des tables SAP, suivez ces suggestions de
meilleures pratiques :
Si vous ne respectez pas ces suggestions, les performances peuvent s'en trouver affectées. Dans certains cas,
le logiciel affiche un avertissement vous rappelant le moyen le plus efficace de configurer vos vues contenant
des tables SAP.
Informations associées
Affichage d'un maximum de 500 enregistrements à partir de tables SAP [page 75]
Création d'un classement de jointures [page 64]
Guide de l'utilisateur
74 PUBLIC Data Insight
4.7.16.1 Tables SAP et fonctions prises en charge par ABAP
Pour bénéficier de meilleures performances, utilisez des fonctions prises en charge par ABAP dans les vues
contenant des tables SAP.
Il existe des fonctions prises en charge pour l'utilisation de tables SAP et de programmes ABAP. Vous pouvez
utiliser toutes les fonctions disponibles lors de la composition de vos expressions, mais les fonctions non prises
en charge par ABAP sont traitées différemment de celles prises en charge par ABAP et leur traitement se
révélera par conséquent probablement plus long.
● Absolue (abs)
● Décoder (decode)
● Supprimer à gauche de la chaîne (ltrim)
● Supprimer à gauche de la chaîne étendu (ltrim_blanks_ext)
● Remplacer la valeur nulle (nvl)
● Supprimer à droite de la chaîne (rtrim)
● Supprimer à droite de la chaîne étendu (rtrim_blanks_ext)
● Longueur de chaîne (length)
● Sous-chaîne (substr)
● Date système (sysdate)
● Heure système (systime)
● Minuscule (lower)
● Majuscule (upper)
Le logiciel affiche jusqu'à 500 enregistrements lorsque vous affichez les données d'une table SAP.
Les vues contenant des tables SAP peuvent se révéler assez volumineuses, en particulier lorsqu'elles sont liées
à d'autres tables SAP. La limite de 500 enregistrements lors de l'affichage des données évite à votre ordinateur
de traîner ou de ne jamais parvenir à achever la tâche en raison de tables trop volumineuses. Outre la limite de
500 enregistrements, vous pouvez prendre des mesures visant à améliorer les performances comme suit :
● Réduisez la taille du fichier en mappant les champs, conditions de jointure, filtres etc. afin de limiter les
données de la table aux informations dont vous avez réellement besoin.
● Utilisez des fonctions prises en charge par SAP ABAP lorsque vous créez des expressions dans les vues.
L'utilisation de fonctions non prises en charge est autorisée mais risque de nuire aux performances.
● Utilisez les outils de filtrage Visualisation des données lorsque vous affichez et exportez des données
depuis des tables SAP.
Avec une limite de 500 enregistrements pour l'affichage des données de table SAP, il est possible qu'aucun
enregistrement n'apparaisse dans la fenêtre Visualisation des données. Cela peut se produire, par exemple,
lorsque la vue contient une vue enfant, que la vue enfant contient une ou plusieurs tables SAP et qu'une
jointure est configurée pour lier l'ensemble des données.
Guide de l'utilisateur
Data Insight PUBLIC 75
Un message s'affiche en haut de la fenêtre Visualisation des données, vous suggérant d'exporter les données
vers une source externe (fichier texte, CSV ou Excel) afin de visualiser la totalité des enregistrements.
Informations associées
Lorsque vous créez ou modifiez une vue Data Insight contenant deux tables SAP ou plus, vous avez la
possibilité de modifier la méthode de lecture depuis la valeur spécifiée dans la définition de connexion pour
l'application SAP.
Voici les méthodes de transfert des données pour lire les tables SAP dans les vues Data Insight :
Par défaut La vue utilisera la valeur de la méthode de transfert de données spécifiée dans la CMC
(Central Management Console) lorsque votre administrateur définit la connexion pour ce
système SAP.
La méthode de transfert par défaut est Remote Function Call (RFC). Cette méthode prendra
plus de temps pour lire les jeux de données de grande ampleur, mais la vue peut être expor
tée et importée dans une autre application Information Steward sans dépendances externes.
Pour en savoir plus sur les options de connexion que vous pouvez spécifier dans la CMC, voir
« Paramètres de connexion aux applications » dans le Guide d'administration.
Guide de l'utilisateur
76 PUBLIC Data Insight
Méthode de transfert des
données Affecte le traitement
ABAP Pour lire des jeux de données de grande taille, ABAP permet de bénéficier de meilleures per
formances.
L'utilisation d'ABAP nécessite un programme ABAP pour lire les données depuis une table
SAP. Les administrateurs utilisent le paramètre de connexion SAP ABAP Générer et exécuter
pour spécifier l'emplacement où est généré ce programme ABAP :
Remarque
Lorsque vous sélectionnez Exécuter les éléments préchargés, vous devez exporter
les programmes ABAP utilisés par Information Steward sur le système SAP où se
trouve la vue Data Insight de sorte qu'ils puissent être chargés dans l'application
SAP.
● Générer et exécuter : Génère un nouveau programme ABAP. Si vous spécifiez cette va
leur, spécifiez l'option Répertoire ABAP généré ou n'indiquez rien pour utiliser l'emplace
ment système par défaut. D'une manière générale, cette option est utilisée uniquement
lors des phases de développement et de test d'un projet d'application. En effet, dans la
version 4.2.3, nous suggérons d'utiliser les scripts ABAP pour les tables SAP de grande
ampleur.
Créez des expressions simples pour les filtres dans la boîte de dialogue Editeur de vue. Pour cela, sélectionnez
une colonne et un opérateur, et spécifiez une chaîne de valeurs dans la colonne Valeur de l'onglet Conditions de
filtre.
Vous pouvez utiliser un sous-ensemble de langage de script SAP pour créer des expressions de condition de
filtre dans l'éditeur avancé. Pour ouvrir la fenêtre Editeur d'expressions avancé dans l'onglet Conditions de filtre,
cliquez sur le bouton Editeur avancé situé à droite de l'onglet.
Dans la boîte de dialogue Editeur d'expressions avancé, saisissez l'expression directement dans la zone de
travail ou sélectionnez des composants au niveau des icônes de menu pour créer les expressions.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 77
4.7.17.1 Création d'une expression de condition de filtre
Cette rubrique utilise un exemple pour illustrer la création d'une expression de condition de filtre dans une vue
existante.
Cet exemple d'expression de condition de filtre illustre uniquement les enregistrements comportant une date
antérieure à la date système en cours :
Pour créer cet exemple d'expression de condition de filtre, vous devez modifier une vue pré-existante. La table
source de la vue doit comporter une colonne de type date/heure. Pour les besoins de cet exemple, la base de
données source, la table source et la colonne source seront respectivement nommées dbo, source_table et
datetime_column.
1. Sélectionnez une vue existante à modifier dans la fenêtre Accueil de l'espace de travail, puis sélectionnez
Gérer les vues Modifier la vue .
2. Dans la fenêtre Editeur de vue, ouvrez l'onglet Conditions de filtre et cliquez sur le bouton Editeur avancé.
3. Dans la fenêtre Editeur avancé, sélectionnez le menu Colonnes source, développez la banque de données et
la table appropriées et sélectionnez datetime_column.
L'expression ci-dessous est insérée dans la fenêtre.
dbo.source_table.datetime_column
Remarque
Vous pouvez également sélectionner Less than dans le menu Opérateur pour créer une expression
utilisant cet opérateur à l'aide de la fenêtre Fonction : Less than. Toutefois, dans le cadre de cet
exemple, nous n'utiliserons pas cette fenêtre pour créer une expression comportant la fonction Less
than.
L'expression de condition de filtre est désormais disponible dans l'onglet Conditions de filtre de l'Editeur de vue.
Informations associées
Guide de l'utilisateur
78 PUBLIC Data Insight
4.7.18 Expressions de condition d'agrégat et Group by
Lors de la création ou de la modification de vues, créez une expression d'agrégat pour une colonne de table
source dans l'onglet Schéma de sortie. Une fois l'expression d'agrégat créée, déterminez la méthode utilisée
pour regrouper les informations agrégées dans la table source via l'onglet Group by.
Pour créer une expression d'agrégat, sélectionnez une colonne dans l'onglet Schéma de sortie et créez
l'expression à l'aide de l'Editeur d'expressions avancé. Le menu Agrégat répertorie les fonctions suivantes :
● Moyenne
● Nombre
● Compter les éléments uniques
● Max
● Min
● Somme
Informations associées
Remarque
Votre installation n'inclut pas les tables utilisées dans l'exemple ci-dessous. Par conséquent, vous ne
pourrez pas créer l'expression d'agrégat présentée ici. Cependant, utiliser l'exemple permet d'expliquer
clairement comment exécuter cette tâche.
Avant de procéder à la création d'une expression d'agrégat, il est recommandé de bien maîtriser la
configuration d'une vue, la création d'une expression de filtre ainsi que la création d'une expression de filtre de
jointure dans Information Steward.
1. Effectuez une copie de la vue applicable. (Pour ces étapes, nous utiliserons la vue créée dans Exemple :
Création d'une expression de condition de jointure [page 67].)
2. Cliquez sur la ligne que vous souhaitez supprimer (par exemple la colonne IDCommande) dans l'onglet
Schéma de sortie et sur Supprimer.
3. Renommez une colonne existante (par exemple renommez la colonne FraisTransport
TotalFraisTransport).
4. Ouvrez la boîte de dialogue Editeur d'expressions avancé associée à la colonne renommée
(TotalFraisTransport).
Guide de l'utilisateur
Data Insight PUBLIC 79
5. Supprimez toute expression existante de la zone de travail.
6. Cliquez sur l'icône Agrégat et sélectionnez Somme dans la liste déroulante.
La boîte de dialogue Fonction : somme s'ouvre.
7. Cliquez sur la flèche vers le bas en regard du champ Colonne et développez la connexion et la table
applicables.
8. Sélectionnez le champ approprié (par exemple, le champ FraisTransport) et cliquez sur OK.
9. Cliquez sur Valider la syntaxe pour vérifier que la syntaxe est correcte. Corrigez les éventuelles erreurs, puis
cliquez sur OK.
Pour vous rappeler que vous devez encore regrouper vos données de sortie, une erreur s'affiche en haut de
la boîte de dialogue Editeur de vue vous indiquant de renseigner l'onglet Group By. L'erreur répertorie les
colonnes requises dans l'onglet Group By.
10. Ouvrez l'onglet Group By et cliquez sur Proposer des colonnes.
Le logiciel renseigne automatiquement les champs Nom de colonne en fonction des colonnes de l'onglet
Schéma de sortie. Le logiciel inclut toutes les colonnes à l'exception de la colonne agrégée. Conformément
aux principes régissant les bases de données, la colonne comportant une expression agrégée ne doit en
aucun cas figurer dans la liste des colonnes regroupées.
11. Cliquez sur Valider. Corrigez les éventuelles erreurs associées à chaque onglet de l'Editeur de vue, puis
cliquez sur Enregistrer.
Exemple
Dans la boîte de dialogue Visualisation des données, les frais de transport sont répertoriés par <nom de
famille du salarié> et <nom de la société de transport(Shipping.CompanyName)> tel que
configuré dans l'onglet Group By. La fenêtre Visualisation des données affiche la somme des frais de
transport pour chaque combinaison employé/société de transport.
Un salarié nommé Davolio peut avoir expédié différentes commandes via Federal Shipping. Toutefois, la vue
que vous venez de créer comporte une seule liste associée à l'employé Davolio répertoriant un seul coût de
transport total pour Federal Shipping.
Remarque
La sortie répertorie les colonnes dans l'ordre défini dans l'onglet Schéma de sortie.
Informations associées
Guide de l'utilisateur
80 PUBLIC Data Insight
Exemple 2 : modification d'une vue pour créer différents résultats [page 81]
Création d'une vue avec Join [page 62]
Création d'une expression de condition de filtre [page 78]
Exemple : Création d'une expression de condition de jointure [page 67]
Cette rubrique utilise un exemple de vue pour illustrer comment modifier une vue pour créer un ensemble
différent de résultats.
Votre installation n'inclut pas les tables utilisées dans cet exemple. Par conséquent, vous ne pourrez pas
modifier cette vue spécifique. Cet exemple est basé sur la vue utilisée dans Exemple 1 : création d'expressions
d'agrégat et regroupement de résultats [page 79].
Suivez les étapes suivantes pour modifier la vue de sorte que le coût de transport total s'affiche pour chaque
salarié :
1. Copiez la vue applicable en suivant les étapes définies dans Copie d'une vue [page 73].
2. Dans l'onglet Schéma de sortie, supprimez la colonne applicable (par exemple, la colonne NomSociété).
3. Dans l'onglet Conditions de jointure, supprimez la jointure applicable (par exemple, supprimez la deuxième
jointure contenant la table des expéditeurs).
4. Dans l'onglet Group By, supprimez la colonne applicable (par exemple, supprimez la colonne
Shippers.CompanyName).
5. Dans la liste Tables, sélectionnez la table applicable (par exemple la table des expéditeurs) et cliquez sur le
bouton Supprimer les sources sélectionnées.
6. Cliquez sur Valider. Corrigez les éventuelles erreurs associées à chaque onglet de l'Editeur de vue, puis
cliquez sur Enregistrer.
Suivez les étapes indiquées dans Affichage d'expressions d'agrégat et regroupement de résultats [page
82] pour apprendre à afficher les résultats.
Exemple
Le tableau ci-dessous indique l'impact de la suppression de la table des expéditeurs de la vue sur les
données. Notez que les résultats varient d'une liste de salariés et de leurs dépenses pour une société de
transport spécifique à une liste de coûts totaux de transport par salarié.
Buchanan 3918.7100
Callahan 7487.8800
Davolio 8836.6400
Dodsworth 3326.2600
Guide de l'utilisateur
Data Insight PUBLIC 81
Informations associées
Après la création ou la modification d'une vue contenant des paramètres tels que des jointures et des
expressions d'agrégat, vous pouvez afficher les résultats en suivant les étapes ci-dessous :
1. Développez le noeud Vues dans la fenêtre Accueil de l'espace de travail et sélectionnez la vue applicable.
2. Cliquez sur Visualisation des données dans le menu supérieur de la boîte de dialogue.
Informations associées
Vous pouvez afficher le contenu des fichiers et tables de base de données dans Information Steward pour
plusieurs raisons. L'affichage des données peut vous aider à déterminer les paramètres de profil ou d'affichage.
Par exemple, quand vous créez des jointures de tables, elles peuvent être plus efficaces si vous connaissez le
contenu des tables avant de configurer les jointures.
Quand vous affichez les colonnes et les lignes d'une source dans la fenêtre Visualisation des données, vous
pouvez utiliser les outils de la fenêtre pour limiter l'affichage des données à des colonnes spécifiques ou vous
pouvez définir des critères de filtre pour afficher certaines données.
Lors de l'affichage des données d'une base de données et de fichiers, les métriques de lignes de l'angle
supérieur droit de la fenêtre Visualisation des données affichent le nombre de lignes extraites et le nombre total
de lignes du fichier. Par exemple, vous pouvez voir Lignes extraites : 510 sur 510. Après avoir défini un filtre, les
métriques de lignes reflètent le nombre de lignes extraites après application du filtre. Par exemple, après
application du filtre, le nombre de lignes devient : Lignes extraites : 100 sur 510. Si la taille de la base de
données ou du fichier est importante, Information Steward peut mettre beaucoup de temps à déterminer le
nombre de lignes. Dans ce cas, Information Steward affiche la taille du fichier en kilo-octets.
Les informations des métriques de lignes servent de plusieurs façons. Par exemple, utilisez les informations sur
les lignes ou les tailles quand vous effectuez la planification des tâches afin que les fichiers dont le traitement
peut être long (gros fichiers) soient planifiés en dehors des heures de travail. Sinon, utilisez les métriques de
lignes pour déterminer les effets des critères de filtre que vous avez définis.
Guide de l'utilisateur
82 PUBLIC Data Insight
Pour pouvoir afficher les données, vous devez disposer des droits de visualisation des données pour la
connexion Data Insight ou vous devez être membre de l'un des groupes d'utilisateurs suivants :
Remarque
Lors de l'utilisation des connexions d'applications SAP, certains utilisateurs peuvent ne pas être en mesure
d'afficher les données source sur le système de production car ils ne disposent peut-être pas des
autorisations nécessaires pour la lecture des données des systèmes SAP.
Informations associées
Affichage des données source à partir de la fenêtre Parcourir les métadonnées [page 83]
Affichage des données source à partir de la liste Tables source [page 84]
Affichage des données de connexion Data Insight [page 483]
Affichage d'un sous-ensemble de colonnes [page 84]
Filtrage des données affichées [page 84]
Tri des données affichées [page 85]
Exportation des données affichées [page 85]
Ouvrez votre projet dans le module Data Insight de Information Steward et suivez ces étapes pour afficher les
données depuis la fenêtre Parcourir les métadonnées :
Guide de l'utilisateur
Data Insight PUBLIC 83
4.8.2 Affichage des données source à partir de la liste Tables
source
Ouvrez votre projet dans le module Data Insight de Information Steward et suivez ces étapes pour afficher les
données source depuis la fenêtre Tables source :
1. Développez le nœud de la connexion appropriée dans la colonne Tables à gauche de la fenêtre Accueil de
l'espace de travail.
2. Sélectionnez la table ou le fichier de base de données approprié dans la liste (une coche s'affiche).
3. Cliquez sur Afficher les données dans la barre de menu supérieure.
La fenêtre Visualisation des données s'ouvre, elle affiche le contenu de la source.
Lorsque vous affichez les données source dans une connexion Data Insight, la table ou le fichier peut contenir
un grand nombre de colonnes.
1. Dans la fenêtre Visualisation des données, cliquez sur Afficher les colonnes dans la barre de menu
supérieure.
2. Décochez les cases devant les colonnes que vous ne voulez pas afficher.
3. Cliquez sur OK.
Informations associées
Lorsque vous affichez les données source dans une connexion Data Insight, vous pouvez vouloir les filtrer afin
d'afficher un sous-ensemble de lignes ou d'enregistrements.
1. Dans la fenêtre Visualisation des données, cliquez sur Critères de filtre dans la barre de menu supérieure.
2. Sélectionnez le nom du champ que vous souhaitez filtrer dans la première liste déroulante.
3. Sélectionnez une condition de filtre dans la deuxième liste déroulante.
4. Sélectionnez une valeur de filtre dans la troisième liste déroulante.
5. Pour ajouter un autre critère de filtre, sélectionnez AND ou OR et répétez les étapes 2 à 4.
6. Cliquez sur OK.
Guide de l'utilisateur
84 PUBLIC Data Insight
Informations associées
Lorsque vous affichez les données sources dans une connexion Data Insight, vous pouvez vouloir trier les lignes
ou les enregistrements pour analyser plus facilement les données.
1. Dans la fenêtre Visualisation des données, cliquez sur Critères de tri dans la barre de menu supérieure.
2. Sélectionnez le nom du champ que vous souhaitez trier dans la première liste déroulante.
3. Sélectionnez un ordre de tri dans la deuxième liste déroulante.
4. Cliquez sur OK.
Informations associées
Lorsque vous affichez les données source dans une connexion Data Insight, vous pouvez vouloir exporter les
lignes ou les enregistrements dans un tableur Excel ou un fichier CSV afin de pouvoir analyser les données
dans une application différente.
Remarque
Pour exporter les données affichées, vous devez être un utilisateur appartenant au groupe
d'administrateurs ou au groupe d'analystes Data Insight.
1. Dans la fenêtre Visualisation des données, cliquez sur Exporter les données dans la barre de menus
supérieure.
Une boîte de dialogue Exporter les options s'affiche, vous permettant de choisir entre les options
d'exportation suivantes :
Guide de l'utilisateur
Data Insight PUBLIC 85
Description des options d'exportation
Option d'exportation Description
Exporter au format CSV Exporte toutes les données vers un fichier CSV.
Exporter les données filtrées Exporte la totalité des lignes et colonnes des données en fonction des options Afficher
vers le fichier CSV les colonnes, Critères de filtre et Critères de tri définies dans la boîte de dialogue
Visualisation des données. Les données sont exportées vers un fichier CSV.
Exporter les données de la vue Exporte directement vers Excel l'ensemble des données actuellement affichées dans
en cours vers le fichier Excel la fenêtre Visualisation des données.
Informations associées
Le profilage permet d'étudier les données pour en comprendre le contenu, la structure et les dépendances de
qualité.
Vous pouvez profiler un ou plusieurs fichiers plats, Excel, tables et/ou vues. Les résultats de profilage
permettent de déterminer si les données correspondent aux définitions, aux standards et aux attentes de
gestion. Vous pouvez examiner le degré d'intégralité ou de redondance des données et visualiser les modèles
associés à ces dernières.
Remarque
Avant de pouvoir profiler un fichier plat ou un fichier Excel, affectez le format du fichier plat ou du fichier
Excel dans un fichier. Pour de plus amples instructions, voir Affectation d'un format de fichier à un fichier
[page 54].
Créez des règles en fonction de vos exigences en matière de données et les résultats de la tâche de profilage.
L'assistant de validation de données génère des règles que vous pouvez sélectionner. Les règles générées
automatiquement permettent de gagner du temps par rapport à la création d'une règle. Les scores des règles
permettent de déterminer rapidement si vos données sont conformes à vos règles de gestion.
Remarque
Il n'est pas possible de profiler les valeurs présentant un type de données long, clob ou blob.
Guide de l'utilisateur
86 PUBLIC Data Insight
Le tableau ci-dessous répertorie les types de tâches de profilage et leur objectif général.
Tâches de profilage
Tâche de profilage Objectif
● Valide
● Corrigeable
● Non valide
Après avoir créé une tâche de profilage, enregistrez-la et exécutez-la plus tard, ou sélectionnez-la
immédiatement.
Remarque
Vous pouvez également modifier ou planifier les tâches de profilage via la Central Management Console.
Informations associées
Colonnes de profil permettant d'examiner les valeurs et caractéristiques des éléments de données.
Suivez cette procédure pour créer une tâche de profilage des colonnes :
Guide de l'utilisateur
Data Insight PUBLIC 87
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez les tables que vous souhaitez profiler dans la colonne Tables située à gauche.
Remarque
Vous pouvez ajouter des tables ultérieurement en cliquant sur Ajouter des tables à la tâche dans le coin
supérieur droit de la boîte de dialogue Définir la tâche : profilage de colonne.
Remarque
Chaque valeur entrée peut augmenter le temps de traitement requis. Pour en savoir plus, voir la
rubrique « Remarques relatives aux performances et au dimensionnement » dans le Guide de
l'administrateur.
8. (Facultatif) Saisissez une condition de filtre simple dans la colonne Condition de filtre correspondant à la
table concernée.
9. (Facultatif) Pour créer plus de filtres avancés, cliquez sur l'icône Editeur avancé située en bas de la colonne
Condition de filtre.
Pour plus d'informations sur l'Editeur avancé, voir Expressions de condition de filtre dans les tâches de
profilage de colonnes [page 301].
10. (Facultatif) Une fois la condition de filtre simple créée, cliquez sur Valider la condition de filtre (en bas de la
boîte de dialogue Définir la tâche : profilage de colonne) pour contrôler les erreurs de la syntaxe du filtre.
11. Créez la tâche de profilage de l'une des manières suivantes :
Informations associées
Guide de l'utilisateur
88 PUBLIC Data Insight
4.9.1.1 Types de profilage pour les colonnes
Lorsque vous créez une tâche de profilage de colonnes, vous sélectionnez des types de profilage pour chaque
colonne.
Chaque type de profilage donne des informations spécifiques que vous pouvez utiliser pour comprendre tous
les aspects de vos données. Les types de profilage s'affichent dans la boîte de dialogue Définir la tâche :
Profilage de colonne.
Le tableau ci-dessous répertorie les types de profilage, leur description et les résultats de profilage lorsque
vous l'utilisez pour profiler vos colonnes.
Simple Calcule la valeur, la longueur de chaîne et l'in Valeur : Minimale, maximale, moyenne, médiane
tégralité de la colonne.
Longueur de chaîne : Minimale, maximale,
moyenne, médiane
Médiane et Fournit des informations de distribution pour Distribution de valeurs : nombre de valeurs d'élé
distribution
chaque colonne. ments uniques dans une colonne. Par exemple, si
les valeurs de la colonne sont Grande pizza, Pizza
moyenne et Petite pizza, la distribution de données
est de 3.
Distribution des mots Fournit des informations de distribution des La distribution des mots divise une chaîne en mots
mots pour chaque colonne. individuels, puis fournit une distribution des mots
distincts dans la colonne. Les mots sont séparés
par des espaces.
Remarque
Vous ne pouvez sélectionner Distribution des
mots que pour les colonnes avec le type de
données Varchar.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 89
4.9.2 Profilage de type de contenu
Le profilage de type de contenu fournit une suggestion de signification d'après les données personnelles,
professionnelles et liées aux adresses des colonnes.
Les résultats de profilage identifient le type de données dans une colonne donnée. Par exemple, une colonne
nommée Contact_Info peut comporter des données telles que l'adresse de courrier électronique, le numéro
de téléphone ou l'adresse. Vous pouvez déterminer et affecter le type de contenu le plus approprié.
Le profilage de type de contenu utilise une logique personnalisée telle que la proximité d'autres champs,
modèles, etc. pour fournir une étiquette qui donne une signification aux « données tierces » telles que Fonction,
Date ou Code postal. Les types de contenu sont utiles lors de la définition des règles et pour que les règles soit
automatiquement suggérées après le profilage.
Remarque
Aucun type de contenu ne peut être affecté aux colonnes dont le type de données est BLOB, CLOB et Long.
Pour en savoir plus sur les types de contenu automatiquement affectés, voir Types de contenu [page 423].
Informations associées
Le profilage du type de contenu vous aide à déterminer le type de données d'une colonne spécifique.
Suivez cette procédure pour créer une tâche de profilage du type de contenu :
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez la table que vous souhaitez profiler dans la colonne Tables située à gauche.
Remarque
Vous pouvez sélectionner uniquement une table pour le profilage du type de contenu
Guide de l'utilisateur
90 PUBLIC Data Insight
Remarque
Chaque valeur entrée peut augmenter le temps de traitement requis. Pour en savoir plus, voir la
rubrique « Remarques relatives aux performances et au dimensionnement » dans le Guide
d'administration.
7. Cochez la case Ecraser les éléments existants si vous souhaitez que Data Insight écrase les types de
contenu actuels pour les colonnes sélectionnées avec le type de contenu généré par le système.
8. Créez la tâche de profilage du type de contenu de l'une des manières suivantes :
Informations associées
Déterminez la qualité de vos adresses en examinant les résultats de la tâche de profilage des adresses.
Utilisez la tâche de profilage des adresses pour déterminer la qualité de vos adresses. Les résultats vous
indiqueront la validité de vos données d'adresse. Les résultats peuvent aussi vous indiquer si une adresse est
valide, corrigeable ou non valide.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 91
4.9.3.1 Création d'une tâche de profilage des adresses
Utilisez la tâche de profilage des adresses pour déterminer la qualité de vos données d'adresses.
La tâche de profilage des adresses requiert les données du dictionnaire d'adresses pour fonctionner
correctement. Assurez-vous auprès de votre administrateur que cette fonctionnalité est autorisée et activée.
Pour en savoir plus, voir le Guide d'installation.
Procédez comme suit pour définir une tâche de profilage des adresses :
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez la table que vous souhaitez profiler dans la colonne Tables située à gauche.
Remarque
Vous pouvez sélectionner uniquement une table pour lancer la tâche de profilage des adresses.
Remarque
Data Insight fournit les noms de champ de la table sélectionnée dans les listes déroulantes de chaque
champ d'étiquette d'adresse. Par exemple, pour l'étiquette Adresse1, la liste déroulante contient
uniquement les champs de la table sélectionnée. Ainsi, si vous sélectionnez une table ne contenant pas
de champs d'adresses, telle qu'une table de produit ne comportant pas d'informations d'adresses, les
champs répertoriés ne seront pas des champs du type adresse, mais du type produit. Data Insight
exécutera la tâche même dans ce cas, mais les résultats afficheront toutes les « adresses » comme non
valides.
Les champs Adresse1, Localité1 et Code postal sont requis. Le champ Région est facultatif. Toutefois, nous
vous recommandons d'inclure le champ Région pour les adresses des États-Unis et du Canada. Les autres
champs sont facultatifs. Plus vous sélectionnez de champs, plus la validation de l'adresse sera précise.
Remarque
Si la valeur du champ Pays est nulle, les informations concernant le pays seront tirées de la liste Pays
par défaut.
Remarque
Guide de l'utilisateur
92 PUBLIC Data Insight
7. Complétez les options d'échantillonnage en bas de la fenêtre. Pour les descriptions d'options, voir Options
d'échantillonnage pour les données de profilage [page 97].
Remarque
Utilisez Taille maximale de l'entrée, Fréquence d'échantillonnage d'entrée et Taille maximale des
exemples de données avec précaution car ces paramètres augmenteront la durée de traitement
requise. Pour en savoir plus, voir les « Remarques relatives aux performances et au dimensionnement »
dans le Guide d'administration de SAP Information Steward.
Remarque
Une fois la tâche de profilage des adresses terminée, une coche verte s'affiche ( ) sous la colonne
Adresse de la vue avancée. Cliquez sur la coche pour afficher les résultats.
Informations associées
Le profilage des dépendances recherche les valeurs dans une ou plusieurs colonnes dépendantes qui
dépendent des valeurs d'une colonne principale. Par exemple, pour chaque nom de ville américaine (colonne
principale) vous pouvez trouver le nom de l'Etat américain correspondant (colonne dépendante). Un profilage
des dépendances peut également proposer des règles en fonction de vos données et des données que vous
souhaitez profiler.
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez la table contenant vos colonnes principales et dépendantes.
Remarque
Guide de l'utilisateur
Data Insight PUBLIC 93
6. Sélectionnez les colonnes que vous souhaitez utiliser comme colonnes dépendantes dans la liste de Tables
et cliquez sur Ajouter.
Remarque
7. Complétez les options d'échantillonnage en bas de la boîte de dialogue Définir la tâche : dépendance. Pour
les descriptions d'options, voir Options d'échantillonnage pour les données de profilage [page 97].
Remarque
Utilisez les options d'échantillonnage Taille maximale de l'entrée, Fréquence d'échantillonnage d'entrée
et Taille maximale des exemples de données avec précaution car ces paramètres peuvent augmenter la
durée de traitement requise. Pour en savoir plus, voir la rubrique « Remarques relatives aux
performances et au dimensionnement » dans le Guide d'administration.
Remarque
Une fois la tâche de profilage des dépendances terminée, une coche verte s'affiche ( ) sous la
colonne Dépendance de la vue avancée. Cliquez sur la coche pour afficher les résultats.
Informations associées
Utilisez la tâche de profilage de redondance pour déterminer le degré de superposition des valeurs ou la
duplication entre deux paires de colonnes.
Les résultats de la tâche de profilage affichent une liste de toutes les valeurs correspondantes et non
correspondantes entre le set de colonnes. Chaque liste de champs (de la table principale et de la table de
comparaison) peut contenir une ou plusieurs colonnes. Une tâche de profilage de redondance peut également
proposer des règles en fonction de vos données et des données que vous souhaitez profiler.
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez les deux tables que vous souhaitez utiliser pour la table principale et la table de comparaison.
Guide de l'utilisateur
94 PUBLIC Data Insight
4. Saisissez un nom de tâche dans le champ Nom.
5. Cliquez dans la liste déroulante pour le premier champ sous la liste Table principale et sélectionnez un
champ.
6. Cliquez dans la liste déroulante pour le champ de comparaison sous la liste Table de comparaison et
sélectionnez un champ.
Remarque
Les champs que vous sélectionnez dans la table principale et la table de comparaison sont ceux que
Data Insight comparera.
Continuez à sélectionner des paires de champs pour contrôler la redondance des tables principale et de
comparaison, le cas échéant. Le logiciel ajoute une nouvelle ligne une fois une paire définie. Cliquez sur le
« X » en regard d'une ligne de la liste de la Table de comparaison pour supprimer des paires ou des lignes
que vous ne souhaitez pas utiliser.
7. Complétez les options d'échantillonnage en bas de la boîte de dialogue. Pour les descriptions d'options,
voir Options d'échantillonnage pour les données de profilage [page 97].
Remarque
Utilisez les options d'échantillonnage Taille maximale de l'entrée, Fréquence d'échantillonnage d'entrée
et Taille maximale des exemples de données avec précaution car ces paramètres peuvent augmenter la
durée de traitement requise. Pour en savoir plus, voir la rubrique « Remarques relatives aux
performances et au dimensionnement » dans le Guide d'administration.
Remarque
Une fois la tâche de profilage de redondance terminée, une coche verte s'affiche ( ) sous la colonne
Redondance en regard de la table. Cliquez sur la coche pour afficher les résultats.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 95
4.9.6 Création d'une tâche de profilage d'unicité
La tâche de profilage d'unicité renvoie le nombre et le pourcentage de lignes qui contiennent des données non
uniques, pour le set de colonnes sélectionné.
Par exemple, vous pouvez exécuter un profilage d'unicité sur une colonne ID du salarié, afin de vous assurer
que chaque salarié détient un ID unique.
Une tâche de profilage d'unicité peut également proposer des règles en fonction de vos données et des
données que vous souhaitez profiler.
1. Dans Accueil de l'espace de travail, ouvrez l'onglet Résultats de profil situé en haut à droite.
2. Sélectionnez la table contenant la colonne principale de la liste de Tables.
Remarque
Vous pouvez sélectionner uniquement une table pour la tâche de profilage d'unicité.
Remarque
Utilisez Taille maximale de l'entrée, Fréquence d'échantillonnage d'entrée et Taille maximale des
exemples de données avec précaution car ces paramètres peuvent augmenter la durée de traitement
requise. Pour en savoir plus, voir la rubrique « Remarques relatives aux performances et au
dimensionnement » dans le Guide d'administration.
Informations associées
Guide de l'utilisateur
96 PUBLIC Data Insight
4.9.7 Options d'échantillonnage pour les données de
profilage
Lorsque vous définissez un type de profilage, vous devez sélectionner les options d'échantillonnage.
Taille maximale de l'entrée Nombre total d'enregistrements à profiler. Par exemple, si vous saisissez une Taille
maximale de l'entrée de 1 000, seuls 1 000 enregistrements seront profilés, même s'il en
existe 100 000 au total. Le paramètre par défaut est Tout.
Fréquence d'échantillonnage Méthode de sélection des enregistrements. Par exemple, si vous sélectionnez une Taille
d'entrée maximale de l'entrée de 1 000 enregistrements et que vous saisissez une fréquence égale à
1, seuls les 1 000 premiers enregistrements seront profilés. Si vous saisissez une fré
quence égale à 2, un enregistrement sur deux de l'ensemble des enregistrements de la ta
ble (jusqu'à 1 000 enregistrements) seront profilés, etc.
Taille maximale des exemples Quantité maximale d'enregistrements qui seront stockés dans le référentiel pour chaque
de données attribut de profilage.
Valeurs maximales d'éléments Nombre maximum de valeurs d'éléments uniques pour la colonne principale et les colon
uniques (applicable aux profi- nes dépendantes.
lages de type de contenu, de
dépendance, de redondance
et d'adresse)
Remarque
Utilisez les options d'échantillonnage Taille maximale de l'entrée, Fréquence d'échantillonnage d'entrée et
Taille maximale des exemples de données avec précaution car ces paramètres peuvent augmenter la durée
de traitement requise. Pour en savoir plus, voir la rubrique « Remarques relatives aux performances et au
dimensionnement » dans le Guide de l'administrateur.
Après l'exécution d'une tâche de profilage, vous pouvez afficher les résultats dans l'onglet Résultats de
profilage. Vous pouvez choisir l'affichage de base ou avancé en fonction du type des résultats de tâche de
profilage que vous souhaitez afficher. Basculez entre les différents affichages en utilisant les boutons Basique
et Avancé en haut à droite de l'onglet Résultats de profilage.
Vous pouvez voir les icônes suivantes dans la colonne Résumé, à côté des noms de colonne :
Guide de l'utilisateur
Data Insight PUBLIC 97
Icône Nom de l'icône Description
Faible cardinalité Le nombre de valeurs d'éléments uniques dans la colonne est infé
rieur à 2 %.
Vous pouvez également voir les icônes suivantes dans la colonne Assistants :
Lancer l'assistant de validation de Ouvre la boîte de dialogue Assistant de validation de données qui affi-
données che une liste des règles suggérées pouvant s'appliquer à une colonne
spécifique. Vous pouvez examiner la règle avant de la lier à une co
lonne. Vous pouvez également modifier la règle si vous disposez des
droits de gestion des règles.
Lancer l'Assistant de nettoyage Ouvre la boîte de dialogue Assistant de nettoyage que vous pouvez
utiliser pour créer des solutions de nettoyage de données.
Informations associées
Les résultats des tâches de profilage de colonne apparaissent dans la vue Basique de l'onglet Accueil de
l'espace de travail.
● Valeur
● Longueur de chaîne
● Intégralité
● Distribution
De plus, pour certains résultats de profilage, vous pouvez lancer l'Assistant de nettoyage pour afficher ou
modifier les solutions de nettoyage des données, ou l'Assistant de validation de données pour afficher et
modifier les nouvelles règles ou les règles existantes.
Guide de l'utilisateur
98 PUBLIC Data Insight
Informations associées
Lorsque vous affichez les résultats des tâches Colonne ou Type de contenu, des valeurs de couleur bleue
s'affichent sous les regroupements de colonnes Valeur, Longueur de chaîne ou Intégralité, le cas échéant.
Valeur ● Min
● Max
● Moyenne
● Médiane
Intégralité ● Valeur
● Modèle
● Mot
Cliquez sur une valeur de couleur bleue pour afficher les données associées à la valeur dans volet inférieur de la
fenêtre. Vous pouvez modifier l'affichage du volet inférieur à l'aide des outils situés dans la barre d'outils. Vous
pouvez glisser-déposer les colonnes pour les réorganiser, trier une colonne en particulier, sélectionner les
colonnes à afficher, créer un filtre et exporter les enregistrements vers Excel.
Remarque
Les valeurs qui ne s'affichent pas en bleu ne sont pas associées à des exemples de données.
Exemple
Lorsque vous cliquez sur une valeur dans la section Intégralité dans la colonne % de valeurs nulles, le volet
inférieur affiche des exemples de lignes qui ont des valeurs nulles dans les colonnes de la table source
associée.
Remarque
Les attributs Moyenne sous Valeur et Longueur de chaîne n'ont pas d'exemples de données associés.
Guide de l'utilisateur
Data Insight PUBLIC 99
Informations associées
Cliquez sur une valeur de couleur bleue dans les colonnes Distribution (Valeur, Modèle ou Mot) pour ouvrir le
volet latéral et afficher les détails de distribution. Dans le volet latéral, vous pouvez cliquer sur une valeur de la
colonne Pourcentage (#) pour afficher les exemples d'enregistrements associés dans le volet inférieur.
Vous pouvez personnaliser les exemples de données dans le volet inférieur à l'aide des outils situés dans la
barre d'outils. Vous pouvez glisser-déposer les colonnes pour les réorganiser, trier une colonne en particulier,
sélectionner les colonnes à afficher, créer un filtre ou exporter les enregistrements vers Excel.
Vous pouvez afficher des informations supplémentaires (si disponibles) sur les valeurs de couleur bleue dans la
table des résultats en plaçant le curseur sur une valeur. Vous pouvez également placer le curseur sur une
valeur dans une cellule pour afficher la valeur complète si la colonne est trop étroite pour afficher l'intégralité
du contenu.
Remarque
Vous pouvez apercevoir en haut des résultats dans le volet de droite une ligne appelée <Autres> sous la
colonne Valeur. Le nombre et le pourcentage de la catégorie <Autres> comprennent des modèles ou des
valeurs d'éléments uniques rassemblés par Data Insight en fonction de vos paramètres dans la Central
Management Console (CMC) pour les valeurs d'éléments uniques, les modèles ou les mots. Ces valeurs
sont rassemblées sous la catégorie <Autres> car Data Insight enregistre uniquement un certain nombre de
résultats de distribution de valeurs et de modèles. Lorsque le nombre de valeurs d'éléments uniques ou de
modèles est supérieur aux valeurs définies dans la CMC, les valeurs sont regroupées sous la catégorie
<Autres> Data Insight n'affiche pas plus de détails sur ces valeurs. Pour en savoir plus sur les paramètres
ci-dessus, consultez la section relative aux paramètres d'une tâche de profilage et d'une tâche d'exécution
de règle dans le Guide d'administration.
Après avoir exécuté une tâche de profilage Colonnes, certaines icônes apparaissent dans la colonne Assistant.
L'icône Lancer l'assistant de validation de données ( ) apparaît en regard de la table ou du fichier que vous
avez profilé, le cas échéant. Cliquez sur l'icône pour ouvrir la fenêtre Assistant de validation de données. Dans
l'Assistant de validation de données, vous pouvez afficher une ou plusieurs règles (nouvelles ou existantes)
pouvant s'appliquer aux données présentes dans l'une des colonnes. Vous pouvez accepter la règle et la liaison
de règle. Si vous disposez de l'autorisation adéquate (gestion des règles), vous pouvez modifier la règle avant
Guide de l'utilisateur
100 PUBLIC Data Insight
de la lier à une colonne. Pour plus d'informations, voir Création d'une règle à l'aide de l'Assistant de validation
de données [page 123].
L'icône Lancer l'Assistant de nettoyage ( ) apparaît en regard de la table que vous avez profilée, le cas
échéant. Cliquez sur l'icône pour ouvrir l'Assistant de nettoyage où vous pouvez afficher ou modifier une ou
plusieurs solutions de nettoyage des données. Pour plus d'informations, voir Assistant de nettoyage [page
187].
Informations associées
Les types de contenu sont suggérés en fonction du pourcentage de Correspondance des critères de données
(score de confiance).
Les résultats d'une tâche de profilage Type de contenu apparaissent en bleu en regard de la colonne applicable
sous la colonne Type de contenu. Vous pouvez modifier le type de contenu suggéré si vous pensez que le type
de contenu généré n'est pas correct.
Pour afficher d'autres suggestions de type de contenu et leur score de confiance pour une colonne de tale,
cliquez sur la valeur de type de contenu de couleur bleue. Un volet latéral s'ouvre sur la droite. Le type de
contenu actuellement affecté (le cas échéant) et son pourcentage de confiance sont répertoriés en tête. Les
autres types de contenu potentiels et leurs scores de confiance sont répertoriés en ordre décroissant par
pourcentage. Le pourcentage de confiance peut s'élever à plus ou moins de 100 car il s'agit de valeurs
suggérées. Par exemple, une certaine donnée peut être suggérée à la fois comme numéro de téléphone et
comme numéro d'article si le type de contenu personnalisé de numéro d'article a un modèle semblable à celui
d'un numéro de téléphone.
Il arrive que le type de contenu suggéré en premier ait un score de confiance inférieur à celui d'autres types de
contenu suggérés pour une colonne donnée. Cela est dû au fait qu'un seuil minimum de score de confiance doit
être atteint avant qu'un type de contenu puisse être suggéré comme type de contenu primaire. Les types de
contenu prédéfinis doivent atteindre un seuil de score de confiance supérieur pour être suggérés comme type
de contenu primaire. Les seuils de type de contenu personnalisé sont bien inférieurs.
Exemple
Si vous avez un type de contenu personnalisé Numéro_Article dont le modèle est semblable à celui d'un
numéro de téléphone, le type de contenu Numéro_Article peut être suggéré comme type de contenu
primaire, même si le type de contenu prédéfini Téléphone a un score de confiance supérieur. Cela se
produit lorsque Téléphone ne répond pas au seuil de score minimum. Inversement, si Téléphone atteint le
seuil de score minimum, il peut être répertorié comme type de contenu primaire au détriment de
Numéro_Article.
Guide de l'utilisateur
Data Insight PUBLIC 101
Informations associées
Affichez les résultats de profilage pour déterminer la qualité de vos données d'adresse.
Les résultats des tâches de profilage Adresses sont affichés dans l'affichage avancé.
En affichage avancé, des coches ( ) apparaissent lorsqu'une tâche de profilage a bien été exécutée. Cliquez
sur une coche pour ouvrir le volet latéral à droite et afficher les détails des résultats de la tâche de profilage.
Dans le volet latéral de droite, vous pouvez voir les valeurs suivantes dans le diagramme à secteurs :
Valeur Description
Corrigeable Les données comportent de petits écarts par rapport aux données de référence d'adresse qui
doivent être corrigées.
Remarque
Le champ Motif de l'erreur peut indiquer la partie de l'adresse qui doit être corrigée.
Non valide Les données comportent des écarts importants par rapport aux données de référence
d'adresse ou les données ne peuvent pas être interprétées comme une adresse valide.
Cliquez sur une valeur du diagramme pour ouvrir le volet inférieur et afficher les enregistrements associés aux
valeurs. Les colonnes qui ont été profilées sont affichées en gras. Lorsque vous cliquez sur les sections Non
valide ou Corrigeable du diagramme, le volet inférieur affiche la colonne Motif de l'erreur. Cette colonne donne
un motif au fait que l'enregistrement associé ne corresponde pas au critère de validité de l'adresse.
Dans le volet inférieur, vous pouvez déplacer et trier des colonnes, choisir quelles colonnes afficher, filtrer les
enregistrements ou les exporter vers Excel.
Informations associées
Guide de l'utilisateur
102 PUBLIC Data Insight
4.10.4 Affichage des résultats de profilage des dépendances
La tâche de profilage des dépendances recherche les valeurs dans une ou plusieurs colonnes dépendantes qui
dépendent des valeurs d'une colonne principale.
Lorsque la tâche de profilage des dépendances est terminée, les résultats sont indiqués par une coche verte
( ) qui s'affiche dans la colonne Dépendance en regard de la table applicable. Cliquez sur la coche verte pour
ouvrir un volet des résultats à droite, qui indique les détails des résultats.
Le volet latéral de droite affiche les valeurs pour les colonnes Principale et Dépendante. La colonne Principale
affiche toutes les valeurs d'éléments uniques de la table pour la colonne principale applicable.
Exemple
Si votre colonne principale est Ville, la liste Colonne principale contient le nom de chaque ville unique
trouvée dans la table suivi du nombre d'occurrences uniques en fonction des colonnes dépendantes. Dans
cet exemple, les colonnes dépendantes sont CodePostal et Pays. Imaginons que la colonne Colonne
primaire contienne une liste pour la ville Rio de Janeiro (3). Lorsque vous développez le nom de la
ville, trois éléments représentant chaque combinaison unique des colonnes dépendantes dans la table
apparaissent :
● 05454-876, Brazil
● 02389-890, Brazil
● 02389-673, Brazil
Les deux colonnes les plus à droite contiennent des données affichées en bleu suivies d'un diagramme à
barres vert qui représente le nombre d'enregistrements dans la table qui contiennent la combinaison du
code postal et du pays, et le pourcentage du nombre total d'enregistrements. Pour 05454-876, Brazil,
vous voyez 14(41.2%). Cela signifie qu'il existe 14 enregistrements avec le code postal 05454-876 et le
pays Brésil dans toute la table, et que cela représente 41,2 % des enregistrements de la table.
Remarque
Le paramètre Valeurs maximales d'éléments uniques spécifié dans la tâche de profilage définit le nombre
de valeurs d'éléments uniques des colonnes principale et dépendante qui seront stockées par Data Insight.
Dans la liste Colonne principale, vous pouvez voir des données dans <Autre>. Elle représente le nombre de
valeurs de la colonne principale ou dépendante qui dépassent le paramètres Valeurs maximales d'éléments
uniques. Vous ne pouvez pas développer <Autre> ni afficher plus d'informations sur les données.
Si vous cliquez sur une valeur de couleur bleue, le volet inférieur s'ouvre et affiche les enregistrements associés
à la valeur. Pour l'exemple ci-dessus, si vous cliquez sur le nombre bleu 14(41,2 %), le volet inférieur affiche
les 14 enregistrements. Utilisez les outils dans le volet inférieur pour déplacer et trier des colonnes, choisir les
colonnes à afficher, filtrer les enregistrements ou les exporter vers Excel.
Le cas échéant, l'icône Assistant de validation de données apparaît en regard du nom de table sous la colonne
Assistant dans le volet de gauche. Lorsque vous cliquez sur l'icône, la fenêtre Assistant de validation de données
s'ouvre et affiche les suggestions de règle. Si vous choisissez d'intégrer la règle, l'Assistant de validation de
données peut lier automatiquement la règle à la colonne applicable.
Guide de l'utilisateur
Data Insight PUBLIC 103
Informations associées
Lorsque la tâche de profilage de redondances est terminée, les résultats sont indiqués par une coche verte
( ) qui s'affiche dans la colonne Redondance en regard de la table applicable. Cliquez sur la coche verte pour
ouvrir le volet latéral droit qui affiche les détails des résultats.
Le diagramme de Venn dans le volet latéral droit représente le degré de superposition des données entre deux
sets de colonnes. Dans le diagramme, le cercle jaune représente les valeurs d'éléments uniques dans les
colonnes principales. Le cercle bleu représente les valeurs d'éléments uniques dans les colonnes de
comparaison. Lorsque vous placez le curseur sur le numéro à l'intérieur du cercle bleu ou du cercle jaune, les
catégories de valeurs suivantes apparaissent :
Valeur Description
Pourcentage de lignes Le pourcentage de lignes dans la source entière qui ont eu des résultats dans la colonne profi-
lée.
Le cercle vert du diagramme présente les lignes se superposant entre les colonnes principales et de
comparaison. Lorsque vous placez le curseur sur le cercle vert, les valeurs qui apparaissent indiquent le
nombre de lignes superposées issues de la colonne principale et le nombre de lignes superposées issues des
colonnes de comparaison.
Vous pouvez cliquer sur un nombre dans le diagramme pour ouvrir le volet inférieur et afficher les
enregistrements associés à la valeur. Dans le volet inférieur, vous pouvez déplacer et trier des colonnes, choisir
quelles colonnes afficher, filtrer les enregistrements ou les exporter vers Excel.
Lorsque vous cliquez sur le numéro dans le cercle vert, le volet inférieur affiche les enregistrements de l'une
des tables. Vous pouvez modifier la table en sélectionnant le nom de la table dans la liste déroulante située
dans la barre d'outils du volet inférieur.
Le cas échéant, l'icône Assistant de validation de données apparaît en regard du nom de table sous la colonne
Assistant. Lorsque vous cliquez sur l'icône, les suggestions de règles apparaissent dans la fenêtre Assistant de
validation de données. Si vous choisissez d'intégrer la règle, l'Assistant de validation de données peut lier
automatiquement la règle à la colonne applicable.
Guide de l'utilisateur
104 PUBLIC Data Insight
Informations associées
Une fois la tâche de profilage Unicité terminée, une coche verte ( ) apparaît sous la colonne Unicité en regard
de la table. Cliquez sur la coche pour ouvrir le volet latéral et afficher les détails des résultats de la tâche de
profilage.
Le volet des résultats affiche un diagramme en anneau qui affiche les pourcentages d'unicité. La section rouge
représente les valeurs uniques basées sur les colonnes sélectionnées. La section rouge représente les valeurs
non uniques basées sur les colonnes sélectionnées. Survolez les sections verte ou rouge du diagramme pour
afficher les pourcentages uniques/non uniques et le nombre de lignes uniques/non uniques.
Cliquez sur la section unique (verte) du diagramme pour ouvrir le volet inférieur et afficher les enregistrements
uniques. Cliquez sur la section non unique (rouge) du diagramme pour ouvrir le volet inférieur et afficher les
enregistrements non uniques.
Pour les enregistrements non uniques, Data Insight stocke une seule ligne d'exemple de données par valeur en
double spécifique. De plus, il n'affiche pas l'ensemble des lignes comportant des valeurs en double. Cependant,
il existe une colonne appelée Nombre dupliqué qui affiche le nombre d'instances pour les valeurs en double
dans le jeu de données.
Dans le cadre des données uniques et non uniques du volet inférieur, les colonnes répondant au critère
d'unicité sont mises en surbrillance. Utilisez la barre d'outils inférieure pour déplacer et trier des colonnes,
choisir les colonnes à afficher, filtrer les enregistrements ou les exporter vers Excel.
Le cas échéant, l'icône Assistant de validation des données apparaît en regard du nom de table sous la colonne
Assistant. Lorsque vous cliquez sur l'icône, les suggestions de règles apparaissent dans la fenêtre Assistant de
validation des données. Si vous choisissez d'intégrer la règle, l'Assistant de validation des données lie
automatiquement la règle à la colonne applicable.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 105
Création d'une règle à l'aide de l'Assistant de validation de données [page 123]
Vous pouvez afficher les données de résultats de profil dans l'onglet Gestion des métadonnées.
Informations associées
Apprenez-en davantage sur les valeurs qui peuvent être incluses dans la fenêtre Résultats de profil.
Les options suivantes de la fenêtre Modifier les paramètres d'affichage contrôlent les attributs à générer dans
l'onglet Résultats de profil.
Assistant Affiche que les règles de validation des données et de nettoyage des données générées automatique
ment peuvent être appliquées à une ou plusieurs colonnes de la table. Disponible après les tâches de
profilage de colonne ou de type de contenu.
Type de contenu Affiche les types de contenu affectés après exécution d'une tâche de profilage du type de contenu.
Options de valeur
Valeur Description
Min La ligne qui contient le plus petit nombre dans une colonne spécifique.
Max La ligne qui contient le plus grand nombre dans une colonne spécifique.
Moyenne La valeur qui représente la moyenne. C'est la somme de toutes les valeurs de la colonne divisée par le
nombre de valeurs.
Guide de l'utilisateur
106 PUBLIC Data Insight
Options de longueur de chaîne
Valeur Description
Min La ligne qui contient le plus petit nombre de caractères dans une colonne spécifique.
Max La ligne qui contient le plus grand nombre de caractères dans une colonne spécifique.
Moyenne La valeur qui représente la moyenne. C'est la somme de toutes les valeurs de la colonne divisée par le
nombre de valeurs.
Options d'intégralité
Valeur Description
Valeurs nulles Le nombre de lignes vides ou contenant une valeur nulle dans une colonne spécifique.
Vides Le nombre de lignes vides ou contenant une valeur vide dans une colonne spécifique.
Zéros Le nombre de lignes ayant une valeur zéro dans une colonne spécifique.
Options de distribution
Valeur Description
Données Nombre de valeurs uniques. Par exemple, si vos données incluent des adresses aux USA et au Roy
aume-Uni, le chiffre 2 s'affichera dans la colonne de distribution de données Pays.
Modèle Nombre de modèles uniques. Par exemple, les formats de date peuvent être yyyy/mm/dd, mm-dd-
yy ou yy.mm.dd etc.
Mot Nombre de mots uniques. Par exemple, si vos données contiennent Royaume-Uni en tant que valeur
de pays, chaque instance de "Royaume" et "Uni" est comptée séparément, tandis que dans la distri
bution de données, "Royaume-Uni" est compté comme une seule instance.
Options avancées
Valeur Description
Validation d'adresse Compare les données d'adresse d'entrée avec les données du répertoire officiel. Vous devez acheter
les répertoires et disposer d'une connexion à Data Services pour effectuer une validation d'adresse.
Dépendance des Identifie si les données d'une colonne sont basées sur les données d'une ou plusieurs autres colon
données nes.
Redondance des Identifie si les données d'une colonne contiennent les mêmes informations que celles d'une ou plu
données sieurs autres colonnes.
Unicité Identifie si les données d'une seule colonne sont identiques à d'autres entrées ou si elles sont la
seule occurrence parmi toutes les lignes de la colonne.
Guide de l'utilisateur
Data Insight PUBLIC 107
Suppression d'une tâche de profilage [page 110]
1. Dans l'onglet Tâches, à gauche, sélectionnez la tâche de profilage que vous voulez modifier.
2. Cliquez sur Modifier.
3. Apportez les modifications souhaitées dans la fenêtre qui s'ouvre alors.
4. Enregistrez les modifications en procédant de l'une des manières suivantes :
Informations associées
Vous pouvez exécuter les tâches de profilage à la demande dans Information Steward.
Remarque
Vous pouvez également planifier leur exécution via la Central Management Console. Pour en savoir plus sur
la planification des tâches, voir la rubrique « Planification d'une tâche » du Guide d'administration SAP
Information Steward.
1. Dans l'onglet Tâches situé à gauche, sélectionnez les tâches de profilage à exécuter.
CTRL + CLIC pour sélectionner plusieurs tâches.
Guide de l'utilisateur
108 PUBLIC Data Insight
2. Cliquez sur Exécuter maintenant.
Si vous profilez des données à partir d'une base de données SAP HANA, les résultats commencent à s'afficher
pour les attributs de base (tels que min, max, nul, cellules vides, zéro) pendant que Information Steward
génère encore d'autres attributs de profilage tels que la distribution de mots et de modèles. Information
Steward pousse vers le bas les processus de profilage exécutés dans le serveur de base de données SAP HANA
dans les cas suivants :
Remarque
Pour afficher les données ou exécuter des tâches de profilage ou d'exécution de règle sur les vues et tables
HANA, vous devez disposer de l'autorisation de lecture du catalogue de bases de données et des tables et
vues sur lesquelles vous devez travailler.
En règle générale, pour les bases de données autres que SAP HANA, les résultats de profilage d'une table
changent instantanément. Pour optimiser l'utilisation du traitement par ordinateur, les résultats de profilage
d'une table d'une tâche de profilage planifiée ne sont pas remplacés, sauf s'ils ont été calculés avant la période
d'optimisation. La valeur de la période d'optimisation est définie dans la CMC (Central Management Console).
Les tâches de profilage exécutées à la demande remplacent toujours les résultats de profilage de la table. Pour
en savoir plus sur la période d'optimisation, voir le Guide d'administration.
Remarque
En fonction du paramètre Période d'optimisation de la Central Management Console, une tâche de profilage
inchangée peut ne pas être actualisée si elle est de nouveau exécutée. Par exemple, si la Période
d'optimisation (nombre d'heures) est définie sur 1 et que vous exécutez à nouveau la même tâche de
profilage moins d'une heure après la première exécution, les résultats ne seront pas actualisés.
Pour afficher les résultats de profilage du module Metadata Management, vous devez ajouter les tables et
exécuter les tâches de profilage dans le projet Enterprise du module Data Insight.
Pour exécuter une tâche de profilage dans le projet Enterprise et afficher les résultats dans la catégorie
Connexions Data Insight de l'onglet Metadata Management, suivez les étapes suivantes :
Guide de l'utilisateur
Data Insight PUBLIC 109
4. Quand le statut de la tâche de profilage indique qu'elle est terminé, ouvrez l'onglet Gestion des
métadonnées.
5. Cliquez sur le nom de la connexion Data Insight appropriée dans la catégorie Connexion Data Insight.
6. Sélectionnez Afficher les détails dans la liste déroulante.
7. Cliquez sur le nom de la table que vous avez profilée, puis sur Afficher le profil dans la liste déroulante.
La fenêtre Afficher le profil s'ouvre.
Informations associées
Vous pouvez supprimer toute tâche de profilage dans l'onglet Tâches, à gauche.
1. Dans l'onglet Tâches, sélectionnez la tâche de profilage que vous souhaitez supprimer.
CTRL + CLIC pour sélectionner plusieurs tâches.
Vous pouvez filtrer les tâches affichées dans l'onglet Tâches à gauche pour montrer tous les types de tâches,
seulement les tâches de profilage ou seulement les tâches d'exécution de règle.
Par défaut, l'onglet Tâches affiche tous les types de tâches. Dans l'onglet Tâches, sélectionnez l'une des options
de filtrage en haut à droite du tableau Tâches :
Remarque
Vous pouvez également trier les tâches en cliquant sur les en-têtes de colonne.
Guide de l'utilisateur
110 PUBLIC Data Insight
4.11.6 Visualisation et modification des paramètres
d'affichage du profil
Utilisez les paramètres d'affichage du profil pour configurer le mode d'affichage des résultats de profil dans la
table Résultats de profil. Les paramètres seront enregistrés pour toutes les sessions de connexion.
1. Dans l'onglet Résultats de profil, cliquez sur le bouton Modifier les paramètres d'affichage ( ).
2. Effectuez des modifications dans les cases à cocher et dans la liste pour configurer les paramètres
d'affichage de la règle.
3. Cliquez sur Appliquer pour enregistrer les paramètres modifiés.
Informations associées
En savoir plus sur les options à afficher ou à masquer dans la fenêtre Résultats de profil.
Les paramètres suivants commandent les informations à générer et à afficher dans l'onglet Résultats de profil.
Accédez à ces paramètres en cliquant sur le bouton Modifier les paramètres d'affichage ( ).
Option Description
Afficher uniquement les tables avec Affiche uniquement les tables avec profil.
profil
Trier les colonnes par Choisissez l'ordre dans lequel les colonnes de la table seront affichées : ordre
alphabétique ou ordre des bases de données.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 111
4.11.8 Association de types de contenu
Après exécution d'une tâche de profilage du type de contenu, vous pouvez voir les valeurs de distribution
concernant les données d'une colonne en cliquant sur le type de contenu généré. Un volet apparaît à droite, il
affiche les types et le pourcentage des critères correspondant à ce type de contenu. Cliquez sur la valeur de
distribution pour voir un exemple de données de ce type de contenu en bas de la fenêtre.
L'identification précise du type de contenu aide à suggérer des règles de gestion appropriées et à créer des
règles de nettoyage et de correspondance après l'exécution d'une tâche de profilage de colonne ou de type de
contenu.
Plusieurs types de contenu suggérés peuvent s'afficher. Lorsque la case est cochée sous Correspondance
des métadonnées, le système génère le type de contenu d'après des métadonnées telles que nom de
colonne, nom de table, système source, etc. Quand la colonne Correspondance des métadonnées est vide,
le type de contenu est piloté par les données en utilisant les valeurs et modèles de la colonne pour
déterminer le type de contenu. Lorsque vous saisissez manuellement un type de contenu qui n'est pas
affiché dans la liste, la valeur du critère de correspondance n'est pas générée.
Les valeurs sous Correspondance des critères de données affichent le pourcentage des données qui
correspondent aux règles d'identification du type de contenu pour le type de contenu particulier. Par
conséquent, s'il existe plusieurs possibilités de type de contenu pour une colonne et que vous additionnez
les pourcentages des valeurs sous Correspondance des critères de données, cela peut donner un nombre
supérieur ou inférieur à 100 %.
Si les types de contenu suggérés ne correspondent pas bien à la colonne, vous pouvez créer un type de
contenu personnalisé.
Informations associées
Guide de l'utilisateur
112 PUBLIC Data Insight
4.12 Règles
Une règle de validation est un type particulier de règle de gestion qui vérifie si les données respectent les
contraintes et les exigences professionnelles.
Les règles de validatio Data Insight sont des fonctions réutilisables. Chaque règle peut contenir un ou plusieurs
paramètres que vous pouvez lier aux colonnes de la table pour mesurer la qualité des données. Chaque
paramètre d'entrée peut posséder un type de contenu associé. Le logiciel utilise le type de contenu dans les
règles de validation générées automatiquement dont la définition contient le même type de contenu.
L'Assistant de qualité des données crée des règles de validation automatique. Avec l'Assistant de qualité des
données, vous pouvez développer rapidement une solution pour mesurer et améliorer la qualité de vos
informations.
Les règles commencent avec un projet spécifique. Une fois que vous avez créé une règle, vous l'envoyez pour
approbation. Un approbateur de règles rejette ou accepte la règle. Une fois la règle acceptée, elle reste privée et
seulement visible dans son propre projet. L'approbateur de règles doit la rendre publique avant qu'elle puisse
être utilisée dans d'autres projets.
Pour utiliser la règle dans un projet, vous liez la règle à une ou plusieurs colonnes de tables contenues dans le
projet. Vous pouvez disposer par exemple d'une règle déterminant le nombre de lignes non nulles. Vous pouvez
lier la règle à tout ou partie des colonnes de la table et vous pouvez également utiliser la règle dans d'autres
projets.
Lorsque des règles approuvées sont traitées, le logiciel valide les données comme ayant réussi ou échoué, puis
génère un score de 0 à 10. Un score de 10 signifie que 100 % des lignes ont réussi la soumission à la règle de
validation. Vous pouvez aussi définir une alerte pour être prévenu lorsqu'un score atteint une certaine valeur de
seuil. Les règles peuvent aussi être exportées et importées dans une autre instance de Information Steward.
Certaines règles de validation sont automatiquement suggérées par l'application après l'exécution d'une tâche
de profilage de colonne. Vous pouvez afficher et modifier les règles suggérées mais aussi les lier aux colonnes
où l'icône Lancer l'Assistant de validation de données s'affiche.
Guide de l'utilisateur
Data Insight PUBLIC 113
Exécution d'une tâche d'exécution de règle dans le projet Enterprise [page 151]
Pour afficher les scores du module Metadata Management, vous devez ajouter les tables, lier les règles
et exécuter les tâches de profilage dans le projet Enterprise du module Data Insight.
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Définissez Data Insight pour qu’il envoie automatiquement des notifications aux utilisateurs
professionnels lorsqu'un score de règle satisfait un paramètre de sensibilité spécifique.
Informations associées
Le logiciel calcule les scores lorsque vous exécutez une tâche d'exécution de règle.
Il les calcule au niveau de la liaison de règle, au niveau de la colonne et au niveau de la table. Les scores sont
compris entre 0 et 10. Un score de 10 signifie que toutes les lignes ont réussi la règle.
Le fait principal à ne faut pas oublier par rapport au score de qualité au niveau de la liaison de règle est que le
logiciel supprime les lignes filtrées du nombre total de lignes.
Guide de l'utilisateur
114 PUBLIC Data Insight
Scores de qualité au niveau de la colonne
Le logiciel base le score de qualité sur toutes les règles appliquées à la colonne. Plusieurs règles peuvent être
liées à la même colonne. Le logiciel détermine le score par le nombre de lignes qui ont respecté toutes les
règles appliquées à la colonne. Le logiciel considère les lignes filtrées comme ayant respecté la règle.
Le logiciel base le score de qualité sur toutes les règles appliquées à toutes les colonnes de la table. Le logiciel
considère les lignes filtrées comme ayant respecté la règle.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 115
4.12.2 Création de règles
Créez des règles qui s'appliquent à des colonnes spécifiques de vos données pour vérifier que les données
respectent les contraintes et les exigences métier établies.
Créez manuellement des règles et des liaisons ou acceptez les règles proposées par le logiciel. Le logiciel
propose automatiquement des règles après avoir exécuté les tâches de profilage pour les types de profilage
suivants :
● Colonne
● Type de contenu
● Unicité
● Dépendance
● Redondance
Exemple
Le logiciel peut suggérer une règle pour la colonne Nom qui compte les enregistrements avec les valeurs
vides ou nulles dans la colonne Nom.
Lors du profilage de colonne, le logiciel identifie les valeurs hors norme. Les valeurs hors norme sont des
valeurs de colonnes différentes de la majorité des informations fournies dans une colonne. Le logiciel propose
alors des règles que vous pouvez accepter et lier à la colonne. La suggestion de règles automatique permet de
gagner du temps par rapport à la création d’une règle et à la liaison de la règle à la colonne.
De la même manière, le logiciel peut suggérer que vous appliquiez des règles approuvées existantes à une
autre colonne du même projet ou d'un projet différent.
Lorsque vous utilisez l’Éditeur de règles pour créer une règle, vous soumettez la règle pour approbation par un
utilisateur qui dispose des autorisations d’approbation pour les règles. Si vous disposez des autorisations
d’approbation pour les règles, vous pouvez approuver la règle. L'approbateur affecté accepte ou rejette la règle.
Après approbation, vous pouvez rendre la règle publique pour que d'autres utilisateurs puissent l’utiliser. Vous
pouvez utiliser uniquement les règles approuvées dans les projets.
Vous pouvez éventuellement sélectionner un observateur lorsque vous créez la règle. Afin d’être inclus dans la
liste des observateurs, l'utilisateur doit avoir au moins des autorisations d'affichage Data Insight ou être
membre du groupe d'utilisateurs Data Insight. Les observateurs reçoivent des notifications par e-mail lorsque
la règle est approuvée ou lorsqu'une règle approuvée est supprimée.
Guide de l'utilisateur
116 PUBLIC Data Insight
Création d'une règle à l'aide de l'Assistant de validation de données [page 123]
Lorsque vous profilez vos données, vous pouvez utiliser l'Assistant de validation de données pour créer
des règles en fonction des résultats du profilage.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 117
4.12.2.1 Editeur de règles
Utilisez l’Éditeur de règles pour créer et modifier des règles de gestion, appliquer des attributs personnalisés et
accéder à la feuille de calcul de la valeur commerciale pour l'impact financier.
Créez et modifiez les propriétés de règles, les paramètres et l’expression dans l’Éditeur de règles. Les
paramétrages que vous effectuez dans chaque section de l’Éditeur de règles contribuent à différents aspects
de la règle :
● Volet Propriétés : Saisissez un nouveau nom de règle, une description et les informations relatives à l'auteur
et à l'approbateur.
● Volet Paramètres : Configurez les paramètres à inclure dans la définition de règle.
● Volet Expressions : Configurez les fonctions, les filtres et les expressions à appliquer aux paramètres.
Accédez à l'Éditeur avancé pour configurer des expressions plus complexes.
Le tableau suivant décrit les sections et les onglets de la fenêtre Éditeur de règles.
Section Description
Onglet L'onglet Propriétés se trouve dans la partie supérieure gauche de l’Éditeur de règles. Le volet Propriétés
Propriétés et vo se trouve dans le tiers supérieur de l’Éditeur de règles. Le logiciel ouvre l’Éditeur de règles avec le volet
let Propriétés Propriétés ouvert.
Pour créer d'autres valeurs de la dimension de qualité, cliquez sur l'icône située en regard de l’op
tion Dimension de qualité.
Ajoutez des paramètres qui incluent le type de données, le type de contenu et la description. Indiquez
également que le logiciel doit utiliser le paramètre dans le scoring.
En sélectionnant la case Score pour le paramètre, vous l’incluez dans calcul du score. Le logiciel requiert
la sélection d’au moins un paramètre pour le scoring.
Si vous créez une condition de filtre dans l’onglet Filtres de l’expression qui inclut deux paramètres, envi
sagez d'appliquer le score à un seul des paramètres. Si vous utilisez un paramètre pour l'expression de
filtre, n’incluez pas ce paramètre dans le score.
Exemple
Par exemple, vous créez une règle de validation d'un numéro de sécurité sociale basée sur les para
mètres SSN et Country. Dans la règle vous filtrez les enregistrements qui correspondent au critère
Country='US'. Cochez la case Score en regard du paramètre SSN afin que les résultats du filtrage
(enregistrements correspondant au filtre) contribuent au score de qualité.
Guide de l'utilisateur
118 PUBLIC Data Insight
Section Description
personnalisés Ouvre la feuille de calcul Attributs personnalisés dans laquelle vous pouvez éditer les dimensions de qua
lité. Associez la règle à des valeurs d'attributs personnalisés existants.
Informations associées
1. Dans Data Insight, sélectionnez l'onglet Règles dans les onglets à gauche, puis cliquez sur Nouvelle.
Guide de l'utilisateur
Data Insight PUBLIC 119
Remarque
Si vous prévoyez d'exporter le fichier de règles dans Data Services, créez un nom qui ne peut contenir
que des caractères alphanumériques et des traits de soulignement. N’incluez pas d'espace. Le nom de
la règle Data Services peut contenir les scripts d'Asie orientale.
La description que vous saisissez ici apparaît dans la section Règles de validation du scorecard.
4. Sélectionnez votre nom en tant qu'auteur ou sélectionnez un groupe auquel vous appartenez dans la liste
déroulante Auteur.
5. Sélectionnez un approbateur dans la liste déroulante Approbateur.
L'approbateur peut être une personne unique ou un groupe d'utilisateurs. Si vous disposez de droits
d'approbation, sélectionnez votre nom en tant qu’approbateur.
6. Facultatif. Sélectionnez un observateur dans la liste déroulante Observateur.
L'observateur doit disposer de droits d'affichage du dossier Data Insight ou être membre du groupe
d'utilisateurs Data Insight. L'observateur peut recevoir des notifications par e-mail lorsque la règle est
approuvée ou lorsqu'une règle approuvée est supprimée.
7. Sélectionnez une valeur de dimension de qualité pour la règle à partir de la liste déroulante Dimension de
qualité.
Les dimensions de qualité sont les attributs par défaut fournis par le logiciel qui servent à regrouper les
règles dans l'onglet Règles.
8. Cliquez sur Ajouter un paramètre dans le coin supérieur droit du volet Paramètres.
Utiliser un type de contenu dans votre règle permet de générer automatiquement la règle vers d'autres
tables avec le type de contenu sélectionné.
12. Facultatif. Pour créer un type de contenu personnalisé :
a. Cliquez sur Nouveau type de contenu personnalisé dans le coin supérieur droit du volet Paramètres.
b. Entrez un nom dans la zone de texte Nom.
c. Saisissez une description dans la zone de texte Description.
d. Cliquez sur Enregistrer.
13. Cochez la case Score pour utiliser le paramètre de score.
14. Définissez une expression en cliquant sur Ajouter une expression dans le coin supérieur droit de l'onglet
Définition de l’expression.
Le logiciel ajoute une ligne dans l'onglet Définition de l’expression. Le nom du paramètre généré
automatiquement est le même nom que celui du paramètre dans le volet Paramètres.
15. Si vous avez inclus plusieurs paramètres dans le volet Paramètres, sélectionnez le paramètre
correspondant dans la liste déroulante.
Guide de l'utilisateur
120 PUBLIC Data Insight
16. Exécutez les sous-étapes suivantes pour définir une expression pour le paramètre sélectionné.
a. Sélectionnez une fonction existante dans la liste déroulante Fonction.
b. Entrez une valeur dans la colonne Valeur si cela s'applique à la fonction sélectionnée.
c. Facultatif. Cliquez sur Éditeur avancé dans le coin supérieur droit de l'onglet Définition de l’expression.
L'expression que vous créez dans la ligne des paramètres et l’Éditeur avancé s'affiche dans la zone de
texte en bas de l'onglet Définition de l’expression.
17. Facultatif. Ouvrez l'onglet Filtres de l’expression pour configurer un filtre qui sélectionne un sous-ensemble
de données remplissant certains critères.
18. Facultatif. Cliquez sur Valider pour valider la syntaxe de la règle.
Même si le logiciel valide automatiquement la règle lorsque vous sauvegardez la règle, il s’avère utile de
corriger toutes les erreurs avant de sauvegarder la règle.
19. Cliquez sur Enregistrer pour enregistrer la règle.
20.Si la règle comporte des erreurs de validation, le logiciel émet un message indiquant : « La règle contient
des erreurs de validation. Voulez-vous quand même enregistrer ? »
a. Cliquez sur Enregistrer pour enregistrer la règle.
b. Cliquez sur Annuler pour corriger les erreurs avant d’enregistrer la règle.
21. Facultatif. Après avoir validé la règle sans erreur et l’avoir sauvegardée, cliquez sur Test.
a. Dans la boîte de dialogue Tester la règle, cliquez sur la ligne après le paramètre et saisissez les données
de test. Cliquez sur Tester.
Le logiciel valide les données et met à jour la colonne Statut avec un statut Réussite ou Échec. Si
certaines données échouent de façon inattendue, revenez en arrière et modifiez votre règle.
b. Cliquez sur Fermer lorsque vous avez terminé le test.
22. Lorsque vous avez terminé la création de la règle, effectuez l’une des actions suivantes :
○ Cliquez sur Enregistrer pour continuer à travailler sur la règle à une date ultérieure.
○ Cliquez sur Soumettre pour approbation.
○ Approuvez la règle si vous disposez de l'autorisation appropriée.
23. Si vous sélectionnez cette option pour soumettre la règle pour approbation ou que vous approuvez vous-
même la règle :
a. Sélectionnez l’option pour soumettre la règle pour approbation dans la liste déroulante Soumettre pour
approbation. Vous pouvez également sélectionner Approuver pour approuver la règle.
La tâche d'exécution de règle s'affiche dans la liste de travail de l'approbateur et inclut la date d'échéance
spécifiée.
Guide de l'utilisateur
Data Insight PUBLIC 121
Présentation des tâches : Création de règles [page 116]
Informations associées
Les résultats de profil peuvent indiquer qu'une règle de gestion est nécessaire. Créez une règle de gestion à
l'aide des résultats de profil.
Exemple
Vous pouvez être en train de vérifier des résultats de valeur ou de modèle dans la colonne Distribution de
l'onglet Résultats de profilage et vous rendre compte qu'une zone clé de vos données nécessite une ou
plusieurs règles. En fonction du type de données que vous vérifiez, l'application vous aide à commencer le
paramétrage de la règle.
1. Cliquez sur une statistique des attributs Valeur ou Modèle sous la section Distribution pour la colonne à
laquelle vous souhaitez lier la règle.
Un volet contribution s'ouvre sur la droite. Ou bien le logiciel le renseigne à nouveau s'il était déjà ouvert
avec le nom de la colonne et l'attribut sélectionné.
2. Sélectionnez une valeur à utiliser dans la règle depuis le volet contribution et cliquez sur Créer une règle.
La valeur ne peut pas être Nulle, vide ou Autre.
Remarque
Actuellement, le logiciel ne crée pas de règle à partir des résultats de distribution des mots.
Une fenêtre de confirmation apparaît, vous demandant si vous souhaitez lier la colonne sélectionnée à la
règle.
Guide de l'utilisateur
122 PUBLIC Data Insight
3. Cliquez sur Oui. Si vous cliquez sur Non, vous pourrez tout de même créer la règle, mais elle ne sera pas
liée à la colonne.
Le logiciel génère automatiquement des valeurs dans le volet Paramètres et les onglets Définition de
l’expression et Filtres de l’expression en fonction de l’attribut et des données que vous choisissez dans les
résultats de profil. Vous pouvez modifier les paramètres en fonction de vos exigences.
5. Continuez en procédant à l'enregistrement, à la validation et au test de la règle.
Informations associées
Lorsque vous profilez vos données, vous pouvez utiliser l'Assistant de validation de données pour créer des
règles en fonction des résultats du profilage.
Ce processus s'applique aux tâches de profilage de Colonne, Type de contenu, Dépendance, Redondance et
Unicité.
1. Exécutez la tâche de profilage et ouvrez l'onglet Résultats de profilage (en haut à droite) dans Accueil de
l'espace de travail.
Guide de l'utilisateur
Data Insight PUBLIC 123
Exemple
Par exemple, si la tâche de profilage Unicité calcule que 2 % des valeurs ne sont pas uniques et que le
paramètre Pourcentage de détection de valeurs hors norme est 3, l'icône apparaît. Si le résultat est
supérieur au pourcentage de valeurs hors norme, aucune icône n'apparaît.
La fenêtre Assistant de validation de données s'ouvre, indiquant les règles existantes et les règles
proposées.
Remarque
Lorsqu'une règle comprend plusieurs champs, l'Assistant de validation de données répertorie chaque
champ avec la même règle. Par exemple, si une règle de redondance comprend les champs Ville, Pays
et État, le logiciel répertorie les trois champs avec la même règle proposée.
Action Résultat
Remarque
La colonne Type dans la fenêtre Assistant de
validation de données passe de Règle proposée à
Existante.
Vous pouvez gérer les seuils de suggestion d'une règle pour une colonne.
Informations associées
Guide de l'utilisateur
124 PUBLIC Data Insight
Création d'une règle à partir des résultats de profil [page 122]
Statut de règle de l'assistant de validation de données [page 125]
Validation d'une règle [page 126]
Test d'une règle [page 126]
Modification des règles [page 127]
Suppression d'une règle [page 128]
Copie d'une règle [page 129]
Gestion du seuil des règles suggérées [page 21]
Lorsque vous consultez des règles suggérées automatiquement dans l'Assistant de validation de données, la
colonne Type indique le statut de la règle.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 125
Copie d'une règle [page 129]
Utilisez l'outil de validation des règles pour vous assurer que votre règle est syntaxiquement correcte.
Familiarisez-vous avec la bonne syntaxe pour comprendre les messages de validation et arranger la règle afin
qu'elle soit valide.
Informations associées
Définissez les données de test et appliquez-les à la règle pour analyser les résultats.
Guide de l'utilisateur
126 PUBLIC Data Insight
3. Cliquez sur Tester pour voir le statut de chaque paramètre.
Lors du test, le logiciel enregistre les paramètres et les résultats de statut. Cliquez sur Fermer pour revenir
à la fenêtre Editeur de règles. Le logiciel enregistre les données de test et les résultats de manière à ce que
vous puissiez les utiliser pour un nouveau test.
Informations associées
Modifiez les règles dans différents états, y compris les règles approuvées, les règles publiques et les règles
privées pour lesquelles vous avez une autorisation.
Avant de vous décider à modifier une règle, gardez à l'esprit les informations suivantes.
Si la règle que vous traitez est liée à une ou plusieurs colonnes, vous ne pouvez modifier que la définition,
l'expression et les filtres.
● Jusqu'à 50 caractères
● Si vous prévoyez d’exporter dans Data Services, utilisez uniquement des caractères alphanumériques, des
traits de soulignement et des espaces. Vous pouvez utiliser les scripts d’Asie orientale.
Si vous traitez une règle approuvée, soumettez à nouveau la règle pour approbation une fois que vous avez
terminé le traitement de la règle.
Guide de l'utilisateur
Data Insight PUBLIC 127
Informations associées
Modifiez les règles pour modifier les options existantes et pour ajouter d'autres paramètres et expressions.
Remarque
Cliquez sur Rétablir. Le logiciel rétablit la règle dans l’état où elle se trouvait avant sa sélection pour la
modifier.
6. Si la validation et le test de la règle sont corrects, cliquez sur Soumettre pour approbation.
Lorsque vous supprimez une règle, commencez par supprimer les liaisons de règles associées à la règle.
Les utilisateurs des groupes suivants disposent des droits nécessaires pour supprimer une règle :
Guide de l'utilisateur
128 PUBLIC Data Insight
3. Cliquez sur OK pour confirmer la suppression.
Informations associées
1. Dans l'onglet Règles, mettez en surbrillance la règle que vous voulez copier.
2. Cliquez sur l'icône Copier dans la barre de menus.
3. Saisissez un nouveau nom pour la règle dans la zone de texte Nom. Veillez à suivre les conventions
d'appellation requises.
4. Modifiez d'autres aspects de la règle.
5. Cliquez sur Enregistrer.
6. Cliquez sur Soumettre pour approbation.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 129
Validation d'une règle [page 126]
Test d'une règle [page 126]
Modification des règles [page 127]
Suppression d'une règle [page 128]
Lorsque des règles sont créées, elles sont locales au projet. Les règles peuvent être partagées dans plusieurs
projets uniquement lorsqu'elles sont approuvées. Avant que la règle soit approuvée, elle passe par différents
statuts constituant le processus d'approbation.
Le processus d'approbation commence par la création de l'auteur et l'enregistrement d'une règle. Une fois la
définition de la règle achevée, l'auteur peut envoyer la règle à l'approbateur. Une tâche de liste de travail est
créée et affectée à l'approbateur. Si l'auteur réalise que la règle doit encore être modifiée après la soumission
de celle-ci pour approbation, il peut alors annuler la tâche.
Lorsque l'approbateur voit la tâche d'exécution de règle dans la Liste de travail, il peut vérifier la règle et
l'approuver si elle est conforme aux instructions de l'entreprise, ou la rejeter si l'auteur doit encore la mettre à
jour. Il peut fournir des commentaires à l'attention de l'auteur, à prendre en considération lors de la
modification de la règle. La règle de la liste de travail est ensuite affectée à l'auteur.
Si la règle a été rejetée, l'auteur voit une tâche dans la liste de travail. L'auteur dispose de plusieurs options.
Option Description
Modifier la règle L'auteur peut apporter des modifications à la définition de la règle, puis la soumettre à nou
veau pour approbation. Cette option affecte la tâche d'exécution de règle à l'approbateur dans
la liste de travail.
Annuler la tâche d'exécu L'auteur peut annuler la tâche d'exécution de règle et conserver celle-ci à l'état de modification
tion de règle jusqu'à ce qu'il soit satisfait de la définition et prêt à la soumettre à nouveau pour approbation.
Après annulation de la tâ Si la règle a été approuvée et que l'auteur a ensuite modifié la définition, l'a à nouveau soumise
che d'exécution de règle pour approbation mais que celle-ci a été rejetée, l'auteur peut rétablir la règle telle qu'elle était
dans la dernière version approuvée. La dernière version ayant été approuvée, la règle est auto
matiquement approuvée et aucune tâche de liste de travail n'est créée. Cependant, la règle ne
peut pas être rétablie si elle est associée à une tâche de liste de travail. Par exemple, vous ne
pouvez pas rétablir la règle si elle a été soumise pour approbation.
Après annulation de la tâ L'auteur peut supprimer la règle s'il la juge inutile ou obsolète. Une tâche de liste de travail
che d'exécution de règle, n'est pas créée lors de la suppression d'une règle.
supprimez la règle
Etat de la
Etape Utilisateur Action règle Tâche de la liste de travail//Notes
Guide de l'utilisateur
130 PUBLIC Data Insight
Etat de la
Etape Utilisateur Action règle Tâche de la liste de travail//Notes
5 Approbateur ● Rend la règle publique Approuvé La règle peut être ajoutée à d'autres projet pour
une liaison à des colonnes propres à ce projet.
Remarque
L'auteur peut soumettre à nouveau la règle
pour approbation.
Rejeté La règle a été vérifiée et jugée non acceptable. Vous pouvez modifier la règle ou la sup
primer.
Guide de l'utilisateur
Data Insight PUBLIC 131
Etat de la liste de travail Description
A vérifier La tâche d'exécution de règle est disponible pour qu'un approbateur l'approuve ou la
rejette.
Annulé La tâche d'exécution de règle est annulée par l'auteur qui a créé la règle.
Rejeté La tâche d'exécution de règle est rejetée par l'approbateur qui l'envoie à l'auteur pour
modification.
Les règles n'ayant pas été approuvées sont visibles pour le projet spécifique dans lequel elles ont été créées.
Les règles dont l'état est Approuvé, Verrouillé ou Modifier peuvent être liées. Les règles dont l'état est Soumis
ou Rejeté ne peuvent pas être liées. Donc, une règle qui n'a pas été approuvée peut être liée à une colonne dans
un projet et exécutée pour affichage des résultats.
Les utilisateurs disposant des droits d'analyste Data Insight peuvent créer, modifier, supprimer et lier des
règles. Vous devez disposer des droits d'approbateur de règles Data Insight pour approuver ou rejeter des
règles. L'analyste crée la règle et lorsqu'elle est prête il ajoute quelques commentaires à l'intention de
l'approbateur de règles, puis il la soumet pour approbation. L'approbateur de règle ouvre et vérifie la règle. Si la
règle est valide et acceptable, l'approbateur de règles approuve la règle. Sinon, l'approbateur de la règle la
rejette et l'analyste peut alors la modifier ou la supprimer.
Informations associées
Guide de l'utilisateur
132 PUBLIC Data Insight
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Visualisation des résultats de règle [page 160]
Création d'une règle [page 119]
Approbation d'une règle [page 133]
Réception de notifications par e-mail pendant le processus d'approbation [page 136]
Après avoir créé une règle, l'auteur l'envoie pour approbation. Vous devez disposer des droits d'approbation
pour approuver ou rejeter une règle.
○ Dans l'onglet Ma liste de travail, cliquez deux fois sur la tâche d'exécution de règle.
○ Dans l'onglet Règles de l'onglet Data Insight, cliquez sur Vérifier.
2. (Facultatif) Si la règle a déjà été soumise pour vérification, cliquez sur Afficher l'historique pour examiner
les commentaires.
3. Vérifiez l'exactitude de la règle, puis cliquez sur Approuver ou Rejeter.
4. (Facultatif) Vous pouvez rendre la règle publique en cliquant sur le bouton Rendre public dans le coin
inférieur droit.
5. (Facultatif) Saisissez un commentaire. Cliquez sur OK.
Informations associées
Pour afficher le nom de la personne qui a créé ou modifié une règle, accédez à la fenêtre Historique des règles.
Guide de l'utilisateur
Data Insight PUBLIC 133
4. Mettez en surbrillance la modification à afficher, puis cliquez sur Afficher la règle.
La fenêtre Éditeur de règles s'affiche telle qu'elle a été enregistrée aux date et heure concernées.
5. Cliquez sur le bouton Fermer pour fermer l'Editeur de règles, puis cliquez à nouveau sur Fermer pour
fermer la fenêtre Historique.
Informations associées
Vous pouvez rétablir les derniers paramètres approuvés d'une règle. Lorsque vous rétablissez les paramètres
d'une règle, toutes les modifications apportées à celle-ci depuis sa dernière approbation sont supprimées.
Remarque
Une règle ne peut pas être rétablie lorsqu'elle est associée à une tâche de liste de travail en cours.
Procédez comme suit pour annuler les modifications apportées à une règle :
Informations associées
Guide de l'utilisateur
134 PUBLIC Data Insight
Affichage de l'historique d'approbation de règles [page 133]
Définition d'une règle comme publique ou privée [page 135]
Réception de notifications par e-mail pendant le processus d'approbation [page 136]
Affichage de l'emplacement d'utilisation des règles [page 156]
Création d'une règle [page 119]
Lorsque les règles sont approuvées, elles sont privées et ne peuvent être utilisées que par le projet dans lequel
elles ont été créées. Une règle doit être rendue publique avant de pouvoir être utilisée par d'autres projets.
Les règles doivent être approuvées avant de pouvoir être rendues publiques. Pour rendre une règle publique ou
privée :
Remarque
Vous pouvez aussi rendre la règle publique par le biais de l'éditeur de définition si elle a le statut
approuvé.
Si vous rendez une règle publique, une flèche verte s'affiche dans la colonne Public de la règle dans
l'espace de travail. Les analystes et administrateurs Data Insight peuvent désormais ajouter la règle à
différents projets.
Si vous rendez la règle privée, la colonne Public reste vide et la règle n'est pas disponible pour les autres
projets.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 135
4.12.3.5 Réception de notifications par e-mail pendant le
processus d'approbation
L'auteur de règles, l'approbateur spécifié et l'observateur spécifié (facultatif) reçoivent un courrier électronique
pour les tâches d'exécution de règle spécifiques.
Le contenu du courrier électronique dépend de la tâche ayant déclenché le courrier électronique. Il contient les
détails de la tâche ainsi qu'un lien vers la réserve de travail contenant la tâche.
Une règle est approuvée ou rejetée Auteur, observateur (uniquement pour les approbations)
Vous devez définir des paramètres dans la CMC (Central Management Console) et dans Information Steward
pour activer les notifications par e-mail :
Vous trouverez les instructions relatives à la définition des tâches dans la CMC dans le Guide d'administration.
Exemple
Envoi d'un courrier électronique lorsqu'une règle est soumise pour approbation
Lorsque John Dory, un auteur de règles, soumet une règle pour approbation, le système envoie un courrier
électronique à Anne Ortha, l'approbatrice de règles qu'il a choisie lors de la création de la règle. Anne reçoit
le courrier électronique suivant de la part de John lorsqu'il soumet la règle nommée "jd_règle25" pour
approbation :
De : John Dory
Envoyé le : Lundi, 16 sept. 2013 10 h 00
À Anne Ortha
Action requise : Approbation de la règle de validation
Chère Anne Ortha,
Le règle de validation répertoriée ci-dessous nécessite votre approbation.
Nom : jd_règle25
Date de création : 16/9/13
Date d'échéance : 23/9/13
Commentaire : Pour colonne DOB
Pour en savoir plus, voir <lien_page_liste de travail>.
Anne peut cliquer sur <lien_page_réserve_de_travail> pour ouvrir sa réserve de travail et afficher la
tâche à réaliser.
Guide de l'utilisateur
136 PUBLIC Data Insight
Rubrique parent : Processus d'approbation de la règle [page 130]
Informations associées
Créez des expressions avancées pour vos règles à l'aide de l’Éditeur de règles avancé.
Créez des expressions avancées lorsque vous créez ou modifiez une règle dans l'Éditeur de règle. Créez des
expressions de règles à l'aide de fonctions, de variables, d'opérateurs, de chaînes, etc. Les expressions
possèdent un support multioctets et ne sont pas sensibles à la casse.
Créez des expressions de définitions dans l'onglet Définition de l’expression situé dans la partie inférieure de la
boîte de dialogue Éditeur de règles. De la même manière, créez des expressions de filtres dans l'onglet Filtres de
l’expression. Accédez à l’Éditeur de règles avancé à partir de n’importe quel onglet.
Onglet Définition de l’expression Accès rapide aux informations de règles et à la syntaxe, ré
pertoriées comme points de menu dans la barre de menu :
● Modèle
● Mot clé
● Paramètre
Guide de l'utilisateur
Data Insight PUBLIC 137
Informations associées
Le logiciel détermine les options disponibles pour créer des expressions par le type de données autorisé pour
le type d'expression.
Définition Doit être une valeur booléenne. Si l'expression n'est pas booléenne, le logiciel génère une erreur
de validation.
Filtre Doit être une valeur booléenne. Si l'expression n'est pas booléenne, le logiciel génère une erreur
de validation.
Chaque éditeur avancé comporte un bouton Valider la syntaxe qui signale les erreurs et autres avertissements
relatifs à l'expression. La vérification garantit qu'il n'y a pas d'erreurs de syntaxe lorsque vous sauvegardez
votre règle.
Guide de l'utilisateur
138 PUBLIC Data Insight
Informations associées
L'exemple illustre la création d’une expression de définition de règle en utilisant le langage de script SAP
Information Steward complet.
Appliquez les étapes de base de cet exemple à vos propres situations pour créer une expression de définition
de règle.
Exemple
Cet exemple valide une table d'informations relatives aux employés. La règle détermine si les
enregistrements de numéro d'assurance sociale du Canada et ceux de numéro de sécurité sociale des
Etats-Unis présentent des modèles valides pour leur pays respectif. L'exemple de code suivant est
l'expression résultante :
BEGIN
IF ($Country='USA')
BEGIN
IF (match_pattern($SSN, '999-99-9999')) RETURN TRUE;
ELSE RETURN FALSE;
END
ELSE IF ($Country='CAN')
BEGIN
IF (match_pattern($SSN, '999-999-999')) RETURN TRUE;
ELSE RETURN FALSE;
END
ELSE
RETURN FALSE;
END
1. Dans l'Accueil de l'espace de travail, ouvrez l'onglet Règles et cliquez sur Nouveau.
La boîte de dialogue Éditeur de règles s'ouvre avec l'onglet Propriétés.
2. Saisissez SSN_Format_Check_for_USA_CAN dans la zone de texte Nom.
3. Facultatif. Saisissez une description de la règle dans la zone de texte Description.
4. Sélectionnez l'auteur et l'approbateur applicables dans les listes déroulantes respectives.
5. Sélectionnez Précision dans la liste déroulante Dimension de qualité.
6. Dans le volet Paramètres de la boîte de dialogue Éditeur de règles, cliquez sur l’icône Ajouter un paramètre
dans le coin supérieur droit pour créer un paramètre à utiliser dans l'expression de définition de règle.
Le paramètre correspond par exemple à la colonne varchar SSN, qui répertorie les numéros de sécurité
sociale. Commencez chaque paramètre par un symbole dollar ($).
7. Utilisez les spécifications suivantes pour créer le paramètre :
Guide de l'utilisateur
Data Insight PUBLIC 139
○ Score : Sélectionnez Oui.
○ Description : Type : Colonne SSN de la table source.
8. Cliquez à nouveau sur l'icône Ajouter un paramètre pour créer un deuxième paramètre.
Ce paramètre correspond à la colonne Country qui contient les valeurs de pays pour l'enregistrement.
9. Utilisez les spécifications suivantes pour créer le paramètre :
○ Nom : $Country
○ Type : varchar
○ Score : Sélectionnez Oui.
○ Description : Type : Colonne Country de la table source.
10. Ouvrez l'onglet Définition de l’expression dans le volet inférieur et cliquez sur l'icône Éditeur avancé dans le
coin supérieur droit du volet.
La boîte de dialogue Editeur de règles avancé.
11. Supprimez les informations de modèle dans l'espace de travail pour supprimer toutes les syntaxes de
l'éditeur.
12. Vous pouvez soit saisir les fonctions directement dans la zone de travail, soit sélectionner les fonctions
spécifiées dans les sous-étapes ci-dessous. Appuyez toujours sur la touche Entrée pour passer à une
nouvelle ligne, et insérez des espaces si nécessaire.
La première partie de l'expression vérifie les enregistrements contenant la valeur « USA » dans la colonne
Country. Pour ces enregistrements, la règle passe en revue les valeurs des colonnes SSN pour vérifier si
elles correspondent au modèle de numéro de sécurité sociale américain 999-99-9999 souhaité. La règle
renvoie VRAI si les enregistrements correspondent, et FAUX dans le cas contraire.
BEGIN
Guide de l'utilisateur
140 PUBLIC Data Insight
IF ($Country='USA')
BEGIN
IF (match_pattern($SSN, '999-99-9999')) RETURN TRUE;
ELSE RETURN FALSE;
END
m. La partie suivante de l'expression indique au logiciel de renvoyer VRAI lorsqu'un numéro de sécurité
sociale canadien correspond au modèle 999-999-999 souhaité. Créez la syntaxe suivante à l'aide des
méthodes utilisées pour la première partie de la règle :
ELSE IF ($Country='CAN')
BEGIN
IF (match_pattern($SSN, '999-999-999')) RETURN TRUE;
ELSE RETURN FALSE;
END
ELSE
RETURN FALSE;
END
Remarque
Si vous tentez de valider la syntaxe avant d'avoir complété toutes les parties de l'expression, le logiciel
émet une erreur.
Une fois la règle approuvée par l'approbateur de règle répertorié, vous pouvez sélectionner
SSN_Format_Check_for_USA_CAN dans l'onglet Règles sous Précision.
Présentation des tâches : Expressions avancées associées aux règles [page 137]
Informations associées
Créez des attributs personnalisés pour fournir des informations spécifiques concernant la règle ou pour
catégoriser et regrouper les règles de façon plus intuitive pour vos utilisateurs.
Affectez des attributs personnalisés à vos règles à la place ou en plus des attributs prédéfinis.
Guide de l'utilisateur
Data Insight PUBLIC 141
Le logiciel fournit un attribut personnalisé nommé Dimension de qualité, qui contient des valeurs par défaut
pour vous aider à déterminer la qualité de vos données. Vous pouvez utiliser n'importe quelle valeur de
Dimension de qualité pour regrouper vos règles.
Créez et utilisez des attributs personnalisés pour regrouper et organiser les règles en fonction d'autres
dimensions telles que :
Vous pouvez créer des attributs personnalisés pour les règles de différentes façons.
● Sélectionnez Gérer Attributs personnalisés depuis le menu en haut à droite du menu SAP
Information Steward.
● Sélectionnez l’onglet Attributs personnalisés dans l’Éditeur de règles lors de la création ou de la
modification de règles.
Dans l’Éditeur de règles, cliquez dans l’onglet Attributs personnalisés pour afficher une liste d’attributs
personnalisés que vous avez le droit d’utiliser.
Informations associées
Guide de l'utilisateur
142 PUBLIC Data Insight
Visualisation des résultats de règle [page 160]
Création et association d'attributs personnalisés [page 942]
Création d'une règle [page 119]
Regroupement des règles à afficher [page 145]
Valeurs par défaut de la dimension de qualité [page 143]
Recherche de règles [page 152]
Suppression d'un attribut personnalisé [page 946]
Modification des valeurs de la dimension de qualité [page 144]
Le logiciel fournit des valeurs par défaut pour l'attribut Dimension de qualité.
Guide de l'utilisateur
Data Insight PUBLIC 143
Valeur par défaut Description Modèle d'expression
Informations associées
Ajoutez ou supprimez des valeurs de la dimension de qualité dans la feuille de calcul Attributs personnalisés.
○ Lorsque vous créez ou modifiez une règle dans l’Éditeur de règles, cliquez sur l'icône Clé Attributs
personnalisés à droite de la zone de texte Dimension de qualité.
○ Dans l’onglet Accueil de l'espace de travail de Data Insight, cliquez sur Gérer Attributs
personnalisés dans la barre de menu supérieure de droite.
2. Recherchez la dimension de qualité dans la colonne Étiquette.
3. Déplacez-vous vers la droite pour rechercher la colonne Valeurs valides. Cliquez sur la cellule Valeurs
valides dans la ligne Dimension de qualité.
Guide de l'utilisateur
144 PUBLIC Data Insight
4. Pour supprimer une valeur, sélectionnez-la dans la liste et cliquez sur Supprimer.
5. Pour ajouter une nouvelle valeur, saisissez la valeur dans la zone de texte Liste de valeurs, puis cliquez sur
Ajouter.
6. Cliquez sur OK pour fermer la boîte de dialogue Valeurs valides.
7. Affichez le contenu de la colonne Valeurs valides dans la ligne Dimension de qualité. Vérifiez que la liste
inclut les nouvelles valeurs de la dimension de qualité. Ou bien vérifiez que la liste ne contient pas les
dimensions de qualité que vous supprimées.
8. Cliquez sur Enregistrer et fermer pour enregistrer les modifications et fermer la feuille de calcul Attributs
personnalisés.
Présentation des tâches : Attributs personnalisés pour les règles [page 141]
Informations associées
Regroupez les règles répertoriées dans l'onglet Règles par catégories définies par les valeurs d'un ou de
plusieurs attributs personnalisés.
Sélectionnez les attributs selon la manière dont vous souhaitez regrouper les règles dans l'onglet Règles.
L'ordre dans lequel vous sélectionnez les attributs détermine la hiérarchie réelle de l'affichage des règles.
4. Cliquez sur Ajouter en face de la liste Regrouper par.
Remarque
Le nombre maximum de niveaux de regroupement par défaut est de trois. Pour modifier cette valeur
par défaut, cliquez sur Gérer Préférences et entrez une nouvelle valeur pour le Nombre maximal
d'attributs personnalisés Group By pour les règles.
5. Pour afficher la valeur affectée des attributs personnalisés pour chaque règle, sélectionnez un ou plusieurs
attributs personnalisés dans la liste Attributs personnalisés disponibles.
6. Cliquez sur Ajouter en face de la liste Afficher les attributs personnalisés.
L'ordre dans lequel vous sélectionnez les attributs détermine la séquence réelle dans laquelle ils
apparaîtront.
Guide de l'utilisateur
Data Insight PUBLIC 145
7. Cliquez sur Appliquer.
● Le logiciel affiche les noms de règles, regroupés par valeurs d'attributs personnalisés dans la liste
Regrouper par.
● Le logiciel affiche les valeurs des attributs personnalisés de la liste Afficher les attributs personnalisés dans
les colonnes à droite de la colonne Statut.
Présentation des tâches : Attributs personnalisés pour les règles [page 141]
Informations associées
Pour utiliser une règle approuvée et publique dans un projet, vous liez la règle à une ou plusieurs colonnes de
tables contenues dans le projet.
Vous pouvez disposer par exemple d'une règle déterminant le nombre de lignes non nulles. Vous pouvez lier la
règle à tout ou partie des colonnes de la table et vous pouvez également utiliser la règle dans d'autres projets.
Après avoir créé une règle et obtenu approbation, liez la règle à une ou plusieurs colonnes. Après avoir lié une
règle, le logiciel peut calculer les scores dans les colonnes liées afin de déterminer visuellement la qualité des
données.
Vous ne pouvez pas modifier une règle qui est liée à une colonne. Toutefois, vous pouvez modifier la définition
de la règle liée. Par ailleurs, lorsque le statut d’une règle est Soumis ou Rejeté, vous ne pouvez pas modifier la
règle.
Guide de l'utilisateur
146 PUBLIC Data Insight
Informations associées
Sélectionnez la règle dans l'onglet Règles pour créer les liaisons de règles de la colonne.
1. Dans l'onglet Règles, sélectionnez la règle que vous souhaitez lier, puis cliquez sur Lier dans la barre de
menu.
La source est la table ou le fichier qui contient la colonne ou le champ que vous voulez lier.
3. Sélectionnez la colonne dans la première ligne de la liste déroulante Colonne.
4. Utilisez les objets du curseur dans la barre Seuil pour définir les seuils minimum et maximum pour la règle.
Tout score au-dessous du seuil minimum devient rouge dans l'onglet Résultats de règle. Un score rouge
signifie que les données n'ont pas passé le seuil minimum. Tout score au-dessus du seuil maximal devient
vert dans l'onglet Résultats de règle. Un score vert signifie que les données ont passé le seuil maximum.
Tout score compris entre le seuil minimum et le seuil maximum devient jaune. Un score jaune signifie que
le score est acceptable. Vous pouvez paramétrer une alerte qui vous signale lorsqu'un score tombe en
dessous du seuil.
5. Une fois que vous avez sélectionné et défini toutes les colonnes ou tous les champs appropriés de la
source, cliquez sur Enregistrer et fermer.
Après avoir enregistré la liaison, vous pouvez ouvrir la source dans Accueil de l'espace de travail et calculer
les scores.
Guide de l'utilisateur
Data Insight PUBLIC 147
Informations associées
1. Dans la page Accueil de l'espace de travail, cliquez sur l'onglet Résultats de règle en haut à droite de la
fenêtre.
2. Sélectionnez la table ou le fichier, puis sélectionnez la colonne que vous souhaitez lier à la règle.
3. Cliquez sur Lier à la règle dans la barre de menu.
Informations associées
Supprimez une liaison d’une règle lorsque vous n'avez plus besoin de la liaison.
Affichez l'utilisation de liaison de règle pour déterminer les projets qui sont affectés lorsque vous supprimez la
liaison de règle.
Guide de l'utilisateur
148 PUBLIC Data Insight
1. Sélectionnez la liaison de règle applicable dans l'onglet Règles.
2. Cliquez sur la liste déroulante Supprimer dans la barre de menus supérieure, puis choisissez Liaisons de
règles.
3. Cliquez sur OK pour confirmer la suppression.
Informations associées
1. Dans la page Accueil de l'espace de travail, sélectionnez l'onglet Résultats de règle en haut à droite de la
fenêtre.
2. Développez l'arborescence dans le volet de gauche et sélectionnez la ou les tables contenant la colonne
liée par une règle appropriée.
3. Dans la barre de menus, cliquez sur Calculer les scores.
Remarque
Les noms des connexions s'affichent dans le menu déroulant uniquement lorsqu'un administrateur a
créé des connexions dans la CMC (Central Management Console) spécifiques aux données ayant
échoué.
Remarque
Si vous sélectionnez une connexion à des données ayant échoué, le logiciel enregistre les données
ayant échoué et les autres métadonnées à cet emplacement.
Guide de l'utilisateur
Data Insight PUBLIC 149
7. (Facultatif) Sélectionnez Inclure la source pour télécharger les données source avec les données ayant
échoué dans la connexion aux données ayant échoué.
Vous devez avoir choisi une connexion à des données ayant échoué pour activer cette option. La sélection
de cette option pourrait affecter la performance. Elle améliore toutefois la possibilité de rechercher à l'aide
de requêtes les tables et les vues de données ayant échoué.
8. Pour ajouter des tables, des fichiers ou des vues supplémentaires qui contiennent une liaison de règle,
cliquez sur le bouton Ajouter des tables à la tâche situé en haut à gauche, puis sélectionnez les tables
souhaitées.
9. Renseignez les options restantes en fonction des descriptions ci-dessous.
Remarque
10. Sélectionnez Ignorer les valeurs nulles pour que la règle ignore les champs affichant une valeur nulle.
11. Cliquez sur Enregistrer et exécuter maintenant, ou sélectionnez Enregistrer pour planifier l'exécution
ultérieure de la tâche d'exécution de règle.
Informations associées
Guide de l'utilisateur
150 PUBLIC Data Insight
Création de règles [page 116]
Processus d'approbation de la règle [page 130]
Expressions avancées associées aux règles [page 137]
Attributs personnalisés pour les règles [page 141]
Liaison de règle [page 146]
Exécution d'une tâche d'exécution de règle dans le projet Enterprise [page 151]
Recherche de règles [page 152]
Ajout de règles publiques à votre projet [page 154]
Suppression de règles publiques d'un projet [page 155]
Affichage de l'emplacement d'utilisation des règles [page 156]
Notifications par e-mail relatives à la règle [page 157]
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Visualisation des résultats de règle [page 160]
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Visualisation des résultats de règle [page 160]
Affichage des données ayant échoué à partir des règles [page 164]
Analyser plus de données ayant échoué à une règle [page 169]
Pour afficher les scores du module Metadata Management, vous devez ajouter les tables, lier les règles et
exécuter les tâches de profilage dans le projet Enterprise du module Data Insight.
Pour exécuter des tâches de profilage dans le projet Enterprise et afficher les scores dans la section
Connexions Data Insight de l'onglet Metadata Management, suivez les étapes suivantes :
1. Dans votre projet, notez le nom de la table, de la colonne et de la règle à afficher dans l'onglet Gestion des
métadonnées.
2. Si le projet Enterprise ne comporte pas les règles créées dans votre projet, exportez-les, puis importez-les
dans le projet Enterprise en suivant les instructions de la rubrique « Importation et exportation des
règles. »
a. Dans votre projet, sous l'onglet Règles, sélectionnez les règles que vous souhaitez.
b. Cliquez sur l'icône Exporter et sélectionnez l'option de menu Règles appliquées au fichier.
c. Dans la fenêtre de message, cliquez sur Enregistrer pour télécharger le fichier sur votre disque dur
local.
d. Dans la fenêtre Sélection de l'emplacement de téléchargement, acceptez le nom par défaut
(Objet_yyyymmdd_hhmmss.zip) ou saisissez un nom différent et choisissez un emplacement pour le
fichier .zip qui contient l'objet exporté. Cliquez sur Enregistrer.
e. Dans le projet Enterprise, importez les règles tel que décrit dans « Importation de règles ».
3. Dans la page répertoriant les projets Data Insight, sélectionnez le projet Enterprise.
4. Ajoutez des tables en suivant les instructions de la rubrique « Ajout de tables et de fichiers aux projets. »
5. Liez la ou les règles à la colonne en suivant les instructions de la rubrique « Liaison d'une règle à partir de
l'onglet Règles. »
Guide de l'utilisateur
Data Insight PUBLIC 151
6. Créez et exécutez la tâche d'exécution de règle en suivant les instructions de la rubrique « Création et
planification d'une tâche d'exécution de règle. »
7. Pour afficher les scores dans Gestion des métadonnées, cliquez sur l'onglet Gestion des métadonnées.
8. Sélectionnez une connexion sous Data Insight, puis sélectionnez la table.
Le score est disponible aux emplacements suivants :
○ Dans la section Attributs de la page des métadonnées de la table.
○ Dans les diagrammes d'impact et de lignage lorsque vous cliquez sur Afficher l'impact ou Afficher le
lignage des données.
9. Cliquez sur le score pour afficher les informations de tendance de la table et des enregistrements de la
table dont les règles ont échoué, ou sélectionnez une colonne dotée d'un score pour afficher les
informations de tendance de la colonne et des enregistrements dont la règle de colonne a échoué.
Informations associées
Vous pouvez rechercher un sous-ensemble de règles dans l'onglet Règles de l'une des façons suivantes :
Guide de l'utilisateur
152 PUBLIC Data Insight
Pour une liste des statuts de règle et leurs descriptions, voir Processus d'approbation de la règle [page
130].
● Utiliser la fonctionnalité de recherche avancée pour définir les critères de recherche par attribut de règle et
méthode de correspondance
1. A gauche de l'onglet Règles, cliquez sur la flèche vers le bas à côté de l'icône de recherche ( ).
La boîte de dialogue Recherche avancée apparaît.
2. Choisissez soit Correspondre à l'un des critères, soit Correspondre à tous les critères pour déterminer le
critère qui doit être respecté avant qu'un élément n'apparaisse dans la liste de règles.
3. Sélectionnez l'un des attributs de règle suivants dans la première liste déroulante :
○ Commence par
○ Contient
○ Correspondance exacte
5. Saisissez le mot ou la phrase à rechercher dans la zone de texte.
6. Cliquez sur Rechercher.
L'onglet Règles ne liste maintenant que les règles qui correspondent au critère de recherche. Si aucune règle ne
correspond au critère, aucune règle n'est listée.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 153
Notifications par e-mail relatives à la règle [page 157]
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Visualisation des résultats de règle [page 160]
Afin d'utiliser des règles créées, approuvées et rendues publiques dans un autre projet, vous devez les ajouter à
votre projet. Pour ajouter une règle à votre projet :
Remarque
Pour afficher plus de détails d'une règle, sélectionnez la règle dans une colonne et cliquez sur le bouton
Afficher la règle sélectionnée. Vous pouvez également trier les règles par nom en cliquant sur le bouton
de tri par ordre croissant/décroissant.
4. Cliquez sur l'icône de flèche dirigée vers la droite pour déplacer les règles sélectionnées dans la colonne
Règles associées.
5. Cliquez sur OK.
Informations associées
Guide de l'utilisateur
154 PUBLIC Data Insight
4.12.11 Suppression de règles publiques d'un projet
Remarque
Pour afficher les détails d'une règle particulière, sélectionnez la règle dans une colonne et cliquez sur le
bouton Afficher la règle sélectionnée. Vous pouvez également trier les règles par nom en cliquant sur le
bouton de tri par ordre croissant/décroissant.
4. Cliquez sur l'icône de flèche dirigée vers la gauche pour déplacer les règles sélectionnées dans la colonne
Règles publiques disponibles.
Remarque
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 155
4.12.12 Affichage de l'emplacement d'utilisation des règles
Information Steward permet d’afficher l’emplacement d’utilisation d’une règle spécifique de façon à savoir si
vous pouvez modifier ou supprimer la règle.
Affichez l'emplacement d'utilisation des règles pour afficher les informations suivantes sur les règles :
● Affichez les projets qui utilisent la règle. Le logiciel affiche des informations uniquement sur les projets que
vous gérez.
● Affichez le projet dans lequel la règle a été créée.
● Affichez les projets qui ont importé la règle, mais qui n’ont pas lié la règle à une colonne.
● Affichez l'emplacement de liaison des règles.
Le logiciel affiche les noms de projets sous chaque règle publique sélectionnée seulement si vous avez ajouté la
règle publique sélectionnée à ces projets et qu'il existe des liaisons de règles associées à la règle
correspondante dans ces projets.
Vous pouvez également supprimer ou modifier l'utilisation ou les liaisons d'une règle, mais uniquement si vous
disposez des autorisations appropriées et que les règles ne sont liées à aucune colonne.
Si vous ne disposez pas des autorisations pour afficher le contenu d'un projet, le logiciel n’affichera que le nom
du projet et pas les liaisons de règles correspondantes sous chaque projet.
Le logiciel affiche également les informations d'utilisation de la règle pour les cas où la tâche n’a pas pu être
réalisée, permettant d’indiquer la raison pour laquelle il n'a pas pu terminer l'action. Les informations
d'utilisation de la règle affichent uniquement les tâches que vous avez initiées.
Si vous disposez des autorisations appropriées, vous pouvez modifier ou supprimer les règles et les liaisons de
règles depuis la fenêtre d'utilisation de la règle en sélectionnant Supprimer ou Modifier dans la barre d'outils
d'utilisation de la règle. Si vous ne disposez pas de ces autorisations, le logiciel désactive les options Supprimer
et Modifier.
Informations associées
Guide de l'utilisateur
156 PUBLIC Data Insight
Expressions avancées associées aux règles [page 137]
Attributs personnalisés pour les règles [page 141]
Liaison de règle [page 146]
Création et planification d'une tâche d'exécution de règle [page 149]
Exécution d'une tâche d'exécution de règle dans le projet Enterprise [page 151]
Recherche de règles [page 152]
Ajout de règles publiques à votre projet [page 154]
Suppression de règles publiques d'un projet [page 155]
Notifications par e-mail relatives à la règle [page 157]
Ajout d'une notification par e-mail relative aux tâches d’exécution de règle [page 158]
Visualisation des résultats de règle [page 160]
Suppression d'une règle [page 128]
Création d'une règle [page 119]
Modification des règles [page 128]
Liaison de règle [page 146]
Envoyez des notifications aux utilisateurs professionnels lorsque les résultats de la tâche d'exécution de règle
répondent, dépassent ou ne répondent pas aux seuils spécifiés.
Vous pouvez envoyer plusieurs notifications par e-mail par tâche d'exécution de règle. Par exemple, vous
pouvez notifier une ensemble d'utilisateurs en fonction du paramètre de sensibilité Sous le seuil maximal et un
autre ensemble d'utilisateurs en fonction du paramètre de sensibilité Modification du score.
Les notifications par e-mail au format texte brut contiennent les informations suivantes :
● Nom du projet
● Nom de la tâche d'exécution de règle
● Nom ou noms de la table
● Nom ou noms de la colonne
● Scores actuels de la table et de la colonne
● Scores précédents de la table et de la colonne
● Nombre d'enregistrements ayant échoué
● Nombre d'enregistrements ayant réussi
● Statuts des seuils de la table et de la colonne (Bon, Avertissement, Mauvais)
Avant de pouvoir envoyer des notifications par e-mail, vous ou un utilisateur disposant des privilèges
correspondants doit effectuer les tâches de configuration suivantes :
Guide de l'utilisateur
Data Insight PUBLIC 157
Informations associées
Assurez-vous que l’adresse électronique de tous les utilisateurs concernés est configurée dans la CMC (Central
Management Console). Assurez vous également de configurer le Job Server Information Steward pour les
notifications par e-mail.
1. Dans la boîte de dialogue Définir la tâche, cliquez sur Gérer les notifications par e-mail.
Si des notifications existent déjà, elles s’affichent à gauche de la boîte de dialogue Gérer les notifications
par e-mail et les détails associés s’affichent à droite. Vous pouvez modifier ou supprimer des notifications
existantes.
2. Cliquez sur Nouveau et saisissez un nom pour la notification dans Nom.
3. Saisissez les adresses électroniques, les noms d'utilisateur et/ou les groupes d'utilisateurs dans la zone de
texte À.... Ou bien cliquez sur À... pour ouvrir la boîte de dialogue Modifier les destinataires.
4. Dans la boîte de dialogue Modifier les destinataires, renseignez l’adresse électronique, le nom d’utilisateur
ou le groupe d'utilisateurs concerné dans le champ Cliquez pour ajouter un destinataire…. Ou bien
sélectionnez-les dans la liste déroulante.
Le cas échéant, incluez plusieurs adresses électroniques, noms d'utilisateur et/ou groupes d'utilisateurs.
Information Steward affiche une astérisque en regard des adresses e-mail, utilisateurs ou groupes
invalides.
5. Dans Objet, saisissez un objet compréhensible pour le destinataire.
Si vous n'ajoutez pas d’objet, Information Steward utilise l’ID de la notification et le nom de la notification
que vous avez ajoutés précédemment au format suivant : <ID de la notification> :<nom de la
notification>
Guide de l'utilisateur
158 PUBLIC Data Insight
6. Sélectionnez une option dans la liste déroulante Sensibilité.
Remarque
Vous pouvez sélectionner une seule option de Sensibilité par notification par e-mail.. Pour créer des
notifications pour plusieurs sensibilités, configurez une notification distincte pour chaque sensibilité.
Sous le seuil maximal Envoie un e-mail lorsqu'un score de liaison de règle pour la
colonne de la table est en-dessous de son seuil élevé.
Sous le seuil minimal Envoie un e-mail lorsqu'un score de liaison de règle pour la
colonne de la table est en-dessous de son seuil bas.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 159
Exécution d'une tâche d'exécution de règle dans le projet Enterprise [page 151]
Recherche de règles [page 152]
Ajout de règles publiques à votre projet [page 154]
Suppression de règles publiques d'un projet [page 155]
Affichage de l'emplacement d'utilisation des règles [page 156]
Notifications par e-mail relatives à la règle [page 157]
Visualisation des résultats de règle [page 160]
Configuration des préférences générales de notification par e-mail [page 23]
Suite à l'exécution d'une tâche de règle, le logiciel affiche les résultats sous forme de scores et de listes à côté
du nom des tables et des noms de colonnes liées à la règle.
Si une ou plusieurs colonnes ne passent pas le seuil de liaison de règle, la cellule de table de score à côté de la
table est en rouge. Si toutes les colonnes passent le seuil de liaison de règle, la cellule de score à côté de la
table est en vert.
Le volet des détails est situé à droite de l’onglet Résultats de règle. Le volet des détails affiche les informations
décrites dans le tableau suivant.
Détail Description
Graphique des tendances Suit les tendances de qualité des données au fil du temps, en
fonction des scores de table ou de colonne, le nombre de li
gnes ayant respecté et n'ayant pas respecté les règles et le
nombre total de lignes.
Statistiques des résultats Contient des statistiques, telles que le nombre de lignes de
table ou de colonne valides et non valides, et statistiques des
liaisons de règles pour la colonne sélectionnée.
Données ayant échoué Contient la table incluant jusqu’à 100 lignes de données dont
la liaison de règle d’une colonne sélectionnée a échoué
Lorsqu’une colonne a plusieurs liaisons de règles, le logiciel base le score de la colonne sur le plus mauvais
score, où 0 est le plus mauvais score et 10 le plus élevé.
Par exemple, lorsque vous avez deux règles liées à une colonne et qu’un résultat de règle est en rouge et l’autre
en vert, le score de la colonne affiche le score rouge car le rouge indique un score qui n’atteint pas le seuil défini
dans la liaison de règles pour cette colonne.
Guide de l'utilisateur
160 PUBLIC Data Insight
Informations associées
Lorsque vous appliquez des liaisons de règles aux données, le logiciel représente la qualité de données par
scores, en fonction des options de seuil.
Par défaut, les scores s'affichent avec une couleur d'arrière-plan correspondant à la plage seuil de score.
Chaque couleur représente le niveau du seuil atteint. Les couleurs fournissent une impression visuelle rapide
de la qualité des données.
Vert Le score est supérieur à la valeur du seuil maximal La qualité des données est souhaitable.
Jaune Le score est compris entre les valeurs du seuil maximal et du La qualité des données est acceptable.
seuil minimal.
Rouge Le score est inférieur à la valeur du seuil minimal. La qualité des données n'est pas accep
table.
Vous pouvez modifier la façon dont le logiciel affiche les informations relatives aux résultats de règle via les
options Modifier les paramètres d’affichage. Cliquez sur l’icône Clé situé en haut à droite de l’onglet Résultats de
règle pour ouvrir la liste Modifier les paramètres d’affichage. La table suivante décrit chaque option.
Afficher uniquement les tables/ Sélectionnez pour afficher uniquement les tables et les colonnes auxquelles un score est
colonnes avec score associé.
Guide de l'utilisateur
Data Insight PUBLIC 161
Option Description
En dessous du seuil minimum Désélectionnez pour supprimer la surbrillance en rouge pour les scores en dessous du
seuil.
Entre les seuils minimum et Désélectionnez pour supprimer la surbrillance en jaune pour les scores situés entre les
maximum seuils minimum et maximum.
Au-dessus du seuil maximum Désélectionnez pour supprimer la surbrillance en vert pour les scores au-dessus du seuil.
Informations associées
Exécutez une tâche d’exécution de règle pour que les scores soient calculés et affichés dans l’onglet Résultats
de règles de Accueil de l’espace de travail.
1. Dans l’onglet Résultats de règles, développez la table ou la vue pour voir les scores de toutes les colonnes.
2. Recherchez la colonne pour laquelle vous voulez afficher les résultats de règle.
3. Cliquez sur le score à code couleur à côté de la colonne.
Les informations de score apparaissent dans le volet de droite de l’onglet Résultats de règle.
Informations associées
Effectuez le suivi de la qualité de vos données pendant un certain temps à l'aide du graphique des tendances.
Le graphique des tendances s'affiche dans l'onglet Résultats de règle pour les règles. Le graphique des
tendances s'affiche dans la vue Scorecard pour les scorecards.
Le logiciel détermine les points de données du graphique des tendances par le nombre de données correctes
et ayant échoué d'une exécution à l'autre. Lorsque vous exécutez des tâches d'exécution de règle spécifiques
Guide de l'utilisateur
162 PUBLIC Data Insight
ou un scorecard régulièrement, le graphique des tendances illustre la qualité des données au fil du temps. La
ligne de tendance se déplace vers le haut ou le bas en fonction des aspects suivants :
● Intervalle d'exécution
● Score
● Nombre de lignes ayant échoué
● Nombre de lignes correctes
● Nombre total de lignes
Option Description
Plage de score Plage de score pour l'objet sélectionné : Déplacer les indica
teurs de plage dans l'indicateur Plage de score pour voir l'im
pact sur les données.
Pour en savoir plus sur des points spécifiques du graphique, sélectionnez un point de données dans ce dernier.
Le logiciel affiche une boîte de dialogue contenant les informations suivantes :
● Score
● Date
● Nombre total de lignes
● Lignes ayant échoué
● Lignes correctes
Le graphique des tendances vous permet d'effectuer un suivi des tendances de qualité des données au fil du
temps.
1. Dans la page Accueil de l'espace de travail, cliquez sur l'onglet Résultats de règle en haut à droite.
2. Développez la source, la table, la colonne ou la règle dans l'arborescence située à gauche.
Guide de l'utilisateur
Data Insight PUBLIC 163
La couleur des cellules dans la colonne Score vous permet d'évaluer de manière visuelle la qualité de vos
données.
3. Cliquez sur le score à code couleur pour la colonne ou la règle appropriée dans la colonne Score.
Le volet des résultats s'affiche à droite. Les résultats incluent graphique des tendances et un modèle de
données ayant échoué.
4. Contrôlez le nombre d'exécutions à afficher dans le graphique des tendances en cliquant sur un numéro
dans l'option Dernière exécution, en haut du graphique.
Faire glisser l’indicateur de plage vous permet de vous axer sur le sous-ensemble de scores dans les scores
minimum et maximum calculés.
6. Sélectionnez un point de données sur la ligne de tendance dans le graphique.
Informations associées
Affichez le modèle de données dont la règle a échoué dans l’onglet Résultats de règle dans Data Insight.
Par défaut, le logiciel affiche un modèle de 100 lignes de données ayant échoué, lesquelles sont enregistrées
temporairement dans le référentiel Information Steward. Les administrateurs peuvent ajuster le nombre de
modèles de lignes dans la CMC (Central Management Console).
Avant de pouvoir afficher d’autres données ayant échoué, ou exporter toutes les données ayant échoué, votre
administrateur détermine le type de connexion sur lequel baser les données ayant échoué. Les options sont les
types de connexion aux données ayant échoué ou les types de connexion à la source. Votre administrateur
accorde ensuite les autorisations individuelles pour l’accès aux connexions de ce type.
Lorsque vous avez les autorisations correctes, vous pouvez cliquer pour afficher davantage de données ayant
échoué à partir du scorecard. Le logiciel affiche jusqu'à 500 lignes de données ayant échoué. Vous pouvez
Guide de l'utilisateur
164 PUBLIC Data Insight
ensuite décider d’exporter toutes les données ayant échoué, afin de pouvoir utiliser d’autres outils pour
l’analyse des informations.
Les administrateurs peuvent réduire le temps que le logiciel met pour traiter les montants importants de
données ayant échoué. Les administrateurs peuvent définir des options de Chargement par lots et de Lignes
par validation lorsqu’ils créent ou modifient la connexion dans la CMC.
Lorsque vous affichez les données ayant échoué dans Information Steward, modifiez et personnalisez votre
vue en utilisant les diverses options de filtres de colonnes dans la table de données ayant échoué du scorecard.
Critères de filtre Créez des expressions de filtre à l'aide des fonctions « And » et « Or ».
Par exemple, vous pouvez créer une expression indiquant à l'application de n'afficher que
les exemples de données ayant échoué provenant de la colonne Titre qui contiennent une
salutation en particulier. Vous pouvez définir plusieurs expressions pour les mêmes exem
ples de données.
Afficher les colonnes Déterminez les colonnes à afficher ou à masquer dans l'exemple de table de données ayant
échoué.
Exporter les données Exportez les données ayant échoué dans un fichier ouvrable avec Excel.
Afficher plus de données Affichez davantage de données ayant échoué (jusqu'à 500 lignes) et exportez toutes ces
ayant échoué données dans Excel.
Vous pouvez aussi contrôler l’ordre dans lequel les colonnes sont répertoriées. Vous pouvez choisir d’afficher
les colonnes par ordre alphabétique ou dans l’ordre des bases de données. Pour apprendre à configurer l’ordre
des colonnes, voir Contrôle de l’ordre des colonnes de tables [page 40].
Les utilisateurs doivent avoir les autorisations spécifiques à une connexion spécifique et un type de connexion
spécifique, pour pouvoir afficher plus de données ayant échoué et exporter les données ayant échoué pour les
règles et les scorecards.
Les administrateurs définissent l’option dans la CMC (Central Management Console). L’option est Connexion
sur laquelle baser les données ayant échoué dans la section Autorisations des Paramètres Information Steward.
L’administrateur peut choisir Connexion Source ou Connexion aux données ayant échoué.
Pour des détails complets concernant ces autorisations, voir le Guide d'administration.
Votre système peut posséder plusieurs de ces types de connexion. Par conséquent, votre administrateur doit
vous accorder les autorisations spécifiques pour chaque connexion avant de pouvoir afficher plus de données
ayant échoué ou exporter les données ayant échoué à partir des tâches d’exécution de règle ou de scorecards.
Guide de l'utilisateur
Data Insight PUBLIC 165
Vous devez avoir les autorisations suivantes dans la connexion nommée spécifique du type de connexion
choisi :
Même si vous avez l’autorisation d’accéder au référentiel de données ayant échoué ou à une connexion source,
il se peut que vous ne puissiez pas afficher plus de données ayant échoué ou exporter les données ayant
échoué pour la connexion spécifique, définie dans la tâche d’exécution de règle ou de scorecard.
Exemple
Par exemple, votre administrateur choisit de baser l’accès aux données ayant échoué sur une connexion
source. Il existe trois connexions source existantes dans votre système, source 1, 2 et 3. Cependant, votre
administrateur vous a accordé l’autorisation requise pour l’une de ces connexions source uniquement,
source 3. Si vous exécutez les tâches d’exécution de règle ou de scorecard qui utilisent la source 1 ou 2,
vous ne pouvez pas afficher plus de données ayant échoué ou exporter les données ayant échoué. Vous
pouvez uniquement afficher plus de données ayant échoué ou exporter les données ayant échoué si la
tâche d’exécution de règle ou de scorecard utilise la source 3 comme connexion.
Vous devez être un administrateur ou un utilisateur avec autorisations applicables pour exécuter ces étapes.
Définissez et exécutez au moins une tâche d'exécution de règle afin de générer les scores dans la colonne
Score de l'onglet Résultats de règle.
Informations associées
Affichage des données ayant échoué à partir des règles [page 164]
Connexion aux données ayant échoué et autorisations [page 165]
Guide de l'utilisateur
166 PUBLIC Data Insight
4.12.15.4.3 Exportation d'exemples de données ayant échoué
Exportez des exemples de données ayant échoué pour la dernière exécution de la tâche d'exécution de règle.
Vous devez être un administrateur ou un utilisateur avec autorisations applicables pour exécuter ces étapes.
Définissez et exécutez au moins une tâche d'exécution de règle afin de générer les scores dans la colonne
Score de l'onglet Résultats de règle.
Ces étapes exportent des modèles de données ayant échoué, jusqu’à 100 lignes, en fonction du nombre de
lignes que votre administrateur a défini pour les modèles de données ayant échoué.
Une table apparaît dans le volet résultats-détails, contenant les exemples de données ayant échoué.
4. Cliquez sur Exporter les données au-dessus de la table des exemples de données ayant échoué.
Le logiciel enregistre les exemples de données ayant échoué à l'emplacement spécifié à l'aide du format de
fichier Excel par défaut.
Informations associées
Affichage des données ayant échoué à partir des règles [page 164]
Exportation de toutes les données ayant échoué [page 167]
Définition du format de fichier Excel par défaut [page 19]
Exportez toutes les données ayant échoué dans un fichier afin de pouvoir l'afficher dans Excel ou une
application similaire.
Seuls les administrateurs ou les utilisateurs qui disposent des autorisations applicables peuvent effectuer ces
étapes.
Définissez et exécutez au moins une tâche d'exécution de règle afin de générer les scores dans la colonne
Score de l'onglet Résultats de règle.
1. Dans l'onglet Résultats de règle, développez la table applicable et cliquez sur le score applicable en regard
de la colonne liée.
Si la colonne a échoué la liaison de règle, le logiciel met en surbrillance le score en rouge.
Guide de l'utilisateur
Data Insight PUBLIC 167
2. Si nécessaire, cliquez sur la grande flèche à droite des colonnes du score pour ouvrir un volet résultats-
détails. Le volet résultats-détails contient la table de données ayant échoué et les informations sur les
résultats de la liaison de règle.
3. Cliquez sur Afficher plus de données ayant échoué dans le volet résultats-détails de l’onglet Résultats de
règle.
La table Données ayant échoué s'ouvre, affichant jusqu'à 500 enregistrements de données ayant échoué.
4. Cliquez sur Exporter.
Une boîte de dialogue Options d'exportation s'affiche, vous permettant de choisir entre les options
d'exportation suivantes :
Exporter vers un fichier Exporte toutes les données ayant échoué vers un fichier CSV.
CSV
Exporter les données Exporte la totalité des lignes et colonnes des données ayant échoué en fonction des op
filtrées vers le fichier CSV tions Afficher les colonnes, Critères de filtre et Critères de tri. Les données sont exportées
vers un fichier CSV.
Exporter les données de la Exporte 500 lignes des données ayant échoué actuellement affichées dans la fenêtre
vue en cours vers le fichier Données ayant échoué directement vers Excel. (cette option n'exporte pas toutes les don
Excel nées ayant échoué) Le logiciel utilise le format de fichier Excel par défaut (XLS ou XLSX).
Une fois que vous avez exporté les données ayant échoué, ouvrez le fichier exporté pour afficher les données.
Si vous choisissez Exporter les données de la vue en cours vers le fichier Excel, Excel crée les feuilles de calcul
suivantes :
Version Version de SAP Information Steward et date et heure de création du fichier Excel.
Paramètres Filtrez les critères utilisés pour sélectionner les données exportées et le résumé de l'exécution.
Données 500 lignes de données ayant échoué que vous avez choisi d’exporter en fonction des critères
de colonne et de filtre.
Informations associées
Guide de l'utilisateur
168 PUBLIC Data Insight
4.12.15.4.5 Analyser plus de données ayant échoué à une
règle
Vous pouvez examiner plus en détails les données ayant échoué afin de mieux comprendre pourquoi les
enregistrements ont échoué et pour découvrir comment arranger les sources de données pour faire diminuer
le nombre d'échecs dans les enregistrements.
Pour optimiser votre analyse des données ayant échoué, vous pouvez :
● Inclure une connexion aux données ayant échoué lors de la création d'une tâche d'exécution de règle
(requis pour visualiser davantage de données ayant échoué).
● Inclure le fichier source lors de la création d'une tâche d'exécution de règle (facultatif mais très utile).
● Utiliser les informations de la colonne FAILED_RULE_NAMES de la table de données ayant échoué.
● Utiliser votre SGBD pour effectuer une requête sur les tables et vues de métadonnées des données ayant
échoué.
Remarque
Si vous travaillez avec une base de données volumineuse, le traitement de la table des données ayant
échoué par le logiciel risque de prendre un certain temps. Vous pouvez améliorer les performances du
logiciel en sélectionnant les options Chargement par lots et Lignes par validation (si disponibles) lors de la
création ou de la modification d'une connexion aux données ayant échoué dans la CMC (Central
Management Console).
Votre capacité à accéder aux données ayant échoué et à les exporter dépendent des options spécifiques que
votre administrateur sélectionne dans la Central Management Console. Pour en savoir plus, voir Connexion aux
données ayant échoué et autorisations [page 165].
Informations associées
Le logiciel génère les données ayant échoué et les données source dans le référentiel de données ayant échoué
que vous avez établi dans la connexion aux données ayant échoué. Les données source vous permet de mieux
filtrer et naviguer dans les enregistrements ayant échoué et ainsi mieux comprendre les problèmes de
données.
Remarque
Vous devez sélectionner une connexion aux données ayant échoué dans la liste déroulante de la fenêtre
Définir la tâche : règle pour activer l'option Inclure la source.
Guide de l'utilisateur
Data Insight PUBLIC 169
Votre capacité à accéder aux données ayant échoué et à les exporter dépendent des options spécifiques que
votre administrateur sélectionne dans la Central Management Console. Pour en savoir plus, voir Connexion aux
données ayant échoué et autorisations [page 165].
Lorsque votre source a une clé primaire, les données source améliorent également la capacité d'analyse des
tendances du logiciel car elle surveille les informations de date et d'heure lorsque les données source
changent. De même, si vous avez une clé primaire définie, le logiciel peut exécuter des chargements de delta
sur la seconde exécution de la tâche et sur les suivantes. Le chargement de delta met à jour uniquement les
données source ayant été ajoutées, supprimées ou modifiées et surveille la date et l'heure de ces
modifications.
Si les données source ne possèdent aucune clé primaire, vous perdez quelques avantages liés à l'inclusion du
fichier source aux données ayant échoué. Définissez une clé primaire de l'une des manières suivantes :
● Utilisez votre gestionnaire de base de données correspondant pour accéder à la table des données et
définissez ou modifiez la clé primaire actuelle. Vous devez ensuite réimporter la table dans Information
Steward avant de l'utiliser pour les tâches d'exécution de règle.
● Créez une vue Information Steward pour la table source et utilisez les outils d'affichage pour définir une
colonne de clé primaire.
Pour analyser et naviguer dans les enregistrements de données ayant échoué, créez des scripts de type SQL.
Informations associées
Exemples pour des requêtes de tables de données ayant échoué [page 175]
Création et planification d'une tâche d'exécution de règle [page 149]
Utilisez votre système de base de données relationnelle pour accéder aux informations à partir des tables et
des vues des données ayant échoué.
Vous pouvez accéder à des informations supplémentaires sur les données ayant échoué à une règle en
effectuant une requête sur des données spécifiques dans des tables de données ayant échoué dans votre
système de base de données relationnelle. La table suivante contient une liste des tables de données ayant
échoué et les descriptions du contenu.
IS_FD_TABLES_MAP Informations sur le projet, la connexion et les tables qui ont généré les données ayant
échoué.
IS_FD_RUN_HISTORY Historique d'exécution de toutes les tâches qui ont généré les données ayant échoué.
IS_FD_RULES_INFO Toutes les règles ayant échoué pour une exécution donnée.
<ALIAS_TABLE>_FD Toutes les lignes d'une table ayant échoué pour une ou plusieurs règles.
Guide de l'utilisateur
170 PUBLIC Data Insight
Nom de la table Contenu
<ALIAS_TABLE>_FR Toutes les règles ayant échoué pour une ligne donnée d'une table.
Les données source sont disponibles uniquement lorsque vous choisissez d'inclure les
données source au moment de l'exécution de la tâche d'exécution de règle.
Utilisez des requêtes de type SQL et ces tables pour approfondir les causes des données ayant échoué. Par
exemple :
● Rechercher toutes les règles pour lesquelles un enregistrement donné a échoué lors d'une exécution
particulière.
● Rechercher les scores pour les attributs source avec des règles ayant échoué pour une exécution
particulière.
● Rechercher le score d'une règle pour une exécution particulière.
● Filtrer les données ayant échoué et explorer les enregistrements ayant échoué en joignant la table
<TABLE_ALIAS>_SOURCE aux données ayant échoué et aux tables d'enregistrements ayant échoué.
Informations associées
4.12.15.4.5.2.1 IS_FD_TABLES_MAP
Cette table contient des informations sur le projet, la connexion et les tables qui ont généré les données ayant
échoué.
TABLE_ALIAS Varchar(30), valeur nulle Préfixe du nom de table généré, auquel « _FR » ou « _FD » est
ajouté.
CONNECTION_NAME Varchar(128), valeur nulle Nom de la connexion à laquelle la table appartient. Ce nom
est créé par l'utilisateur dans la CMC.
PROJECT_NAME Varchar(128) Nom du projet pour lequel cette table de données ayant
échoué est générée.
Guide de l'utilisateur
Data Insight PUBLIC 171
4.12.15.4.5.2.2 IS_FD_RUN_HISTORY
Cette table contient l'historique d'exécution de toutes les tâches qui ont généré les données ayant échoué.
RUN_ID Double, valeur non nulle (PK) ID unique pour identifier une exécution
particulière.
RUN_ID est la clé primaire et est utilisée dans les tables IS_FD_RULE_INFO et « _FD » et « _FR ».
FD_TABLE_ALIAS_NAME aide à localiser la table de données ayant échoué dans laquelle les lignes ayant
échoué sont écrites.
4.12.15.4.5.2.3 IS_FD_RULE_INFO
Cette table contient la liste de toutes les règles ayant échoué pour une exécution particulière. Pour chaque
exécution, un nouveau jeu de règles est enregistré. Cela permet d'identifier les règles exécutées lors d'une
exécution donnée ; c'est également utile pour l'historique, l'archivage et la purge.
RUN_ID Double, valeur non nulle ID unique pour identifier une exécution particulière.
(PK)
Guide de l'utilisateur
172 PUBLIC Data Insight
4.12.15.4.5.2.4 <TABLE_ALIAS>_FD
Lorsque vous choisissez d'inclure la source dans une tâche d'exécution de règle, c'est une vue qui contient une
ligne pour chaque enregistrement qui fait échouer la tâche d'exécution de règle.
IS_GEN_ROW_ID Double, valeur nulle ID de ligne interne pour l'enregistrement. Connecte cette table à la
table <TABLE_ALIAS>_FR.
COLUMNS* TOUTES les colonnes liées à la règle depuis la table source de don
nées.
Informations associées
4.12.15.4.5.2.5 <TABLE_ALIAS>_FR
Cette table contient toutes les règles pour lesquelles une ligne a échoué.
IS_GEN_ROW_ID Double, valeur nulle ID de ligne interne pour l'enregistrement. Connecte cette table à la
table <TABLE_ALIAS>_FD.
RULE_ID Entier, valeur nulle ID de la règle ayant échoué pour cette ligne
COLUMN_NAME * TOUTES les colonnes liées à la règle depuis la table source de don
nées.
4.12.15.4.5.2.6 <TABLE_ALIAS>_SOURCE
Lorsque vous choisissez d'inclure la source à une tâche d'exécution de règle, cette table contient les données
source.
Vous devez sélectionner l'option pour inclure la source dans la tâche d'exécution de règle si vous voulez que le
logiciel génère cette table source dans le référentiel de données ayant échoué. De plus, pour rendre plus
efficace le chargement de delta de la seconde exécution et des suivantes, votre fichier source doit posséder
une clé primaire.
Guide de l'utilisateur
Data Insight PUBLIC 173
Nom de colonne Spécification Description
IS_GEN_SOURCE_ROWID Double, valeur non nulle (PK) ID de ligne interne pour la ligne dans la
source.
Informations associées
Ce diagramme représente la relation entre les tables de données ayant échoué. Utilisez ce diagramme et
collaborez avec votre administrateur de base de données afin de créer des requêtes SQL pour votre système
de base de données relationnelle spécifique.
Guide de l'utilisateur
174 PUBLIC Data Insight
4.12.15.4.5.2.8 Exemples pour des requêtes de tables de
données ayant échoué
Pour ces exemples de SQL, IDCommande est la clé primaire pour la règle nommée Demo_Order_Task. L'alias
de la table de fichier source est ORDERS_P4123T824.
Exemple
Lorsque vous créez une tâche Demo_Order_Task, vous sélectionnez une connexion à des données ayant
échoué et activez l'option Inclure la source. Lorsque vous exécutez la tâche, le logiciel génère les tables
suivantes et les enregistre dans le référentiel de données ayant échoué dans la connexion aux données
ayant échoué que vous avez spécifiée :
Exemple
Récupération du préfixe
Pour rechercher le préfixe de données ayant échoué dans le référentiel de données ayant échoué, exécutez
l'instruction SQL suivante :
Guide de l'utilisateur
Data Insight PUBLIC 175
Le logiciel renvoie les informations suivantes :
Exemple
Exemple
Pour grouper les données par attribut (par exemple CUSTOMERID), utilisez l'instruction SQL suivante :
Guide de l'utilisateur
176 PUBLIC Data Insight
Exemple
Pour descendre dans la hiérarchie de n'importe quel attribut (par exemple CUSTOMERID « BLONP »),
utilisez l'instruction SQL suivante :
Exemple
Pour afficher des informations sur les règles ayant échoué, utilisez l'instruction SQL suivante :
Pour inclure le COLUMN_NAME avec les informations ci-dessus, utilisez l'instruction SQL suivante :
Guide de l'utilisateur
Data Insight PUBLIC 177
max(distinct t.TOTAL_ROWS)-COUNT(r.RULE_ID) pass,
10- CAST(COUNT(r.RULE_ID) as DECIMAL(9,2))/CAST( max(distinct
t.TOTAL_ROWS) as DECIMAL(9,2))*10 as score
from IS_FD_RUN_HISTORY t
inner join ORDERS_P4123T824_SOURCE c on
(t.START_TIME >= c.VALID_FROM and t.START_TIME < c.VALID_TO
and t.run_id in (select run_id from IS_FD_RUN_HISTORY, IS_FD_Tables_map m
where IS_FD_RUN_HISTORY.fd_table_alias_name = m.TABLE_ALIAS
and m.project_name='Demo' and m.fq_table_name = 'dbo.Orders')
)
left outer join ORDERS_P4123T824_FR r
on c.IS_GEN_SOURCE_ROWID = r.IS_GEN_SOURCE_ROWID
and t.RUN_ID = r.RUN_ID
where r.RULE_ID is not null
group by t.START_TIME, t.RUN_ID, r.RULE_ID, r.COLUMN_NAME;
CO
START_TIME RUN_ID RULE_ID LUMN_NAME failed pass score
Chaque groupe d'enregistrements ayant échoué se voit attribuer un ID de groupe unique utilisant la syntaxe
suivante :
IDrègle_IDcol1_IDcol2...._séq#
IDcol# Colonne à laquelle la règle est liée (il peut y avoir plus d'une colonne)
SAP Information Steward attribue plusieurs ID de groupe lorsqu'une règle est liée à la même table mais avec
différentes colonnes, ou lorsque différentes règles sont liées à la même table avec les mêmes colonnes ou
d'autres.
Remarque
Guide de l'utilisateur
178 PUBLIC Data Insight
Informations associées
Affichage des données ayant échoué à partir des règles [page 164]
Vos référentiels de données ayant échoué peuvent devenir volumineux et peuvent avoir besoin de maintenance
régulière pour assurer la continuité de leur fonctionnement.
Lorsque vous réimportez des données source (table ou vue) après avoir effectué des modifications
structurelles, des incohérences structurelles dans le référentiel de données ayant échoué peuvent provoquer
l'échec des tâches d'exécution de règle.
Le logiciel fournit les options suivantes pour vous aider à gérer la taille et le contenu de vos référentiels de
données ayant échoué :
● Utilitaire de nettoyage des données ayant échoué : il se situe dans la CMC (Central Management Console).
L'utilitaire nettoie les données ayant échoué anciennes et obsolètes de toutes vos connexions à des
données ayant échoué.
● Bouton Supprimer les données ayant échoué et exécuter : il se situe dans l'onglet Tâches de Data Insight. Le
bouton permet de nettoyer les incohérences dans la structure des données dans votre référentiel en cas
d'échec d'une tâche d'exécution de règle.
● Option Supprimer les données ayant échoué et exécuter : elle se situe dans page de statut de la tâche dans
la CMC (Central Management Console). L'option permet de supprimer les incohérences dans la structure
des données dans votre référentiel en cas d'échec d'une tâche d'exécution de règle.
Informations associées
Gérez la taille et le contenu de vos référentiels de données ayant échoué à l'aide de l'utilitaire de nettoyage des
données ayant échoué.
Le logiciel exécute automatiquement l'utilitaire de nettoyage des données ayant échoué, tous les jours. Vous
pouvez modifier la fréquence dans la CMC (Central Management Console). L'utilitaire est également défini par
défaut sur 0 jours pour la Période de rétention de l'historique.
L'Utilitaire de nettoyage des données ayant échoué nettoie également l'historique des données ayant échoué
de toutes vos connexions au référentiel de données ayant échoué en fonction du nombre de jours défini dans le
Guide de l'utilisateur
Data Insight PUBLIC 179
paramètre Période de rétention de l'historique. Le paramétrage par défaut sur 0 empêche l'utilitaire de nettoyer
le référentiel de données ayant échoué. Il permet de protéger l'historique existant de toute suppression lorsque
vous mettez à niveau votre logiciel. Si vous définissez la fréquence sur un ou plusieurs jours, l'utilitaire effectue
le nettoyage des données ayant échoué tous les « X » jours. Par exemple, lorsque la fréquence est définie sur 1,
l'utilitaire nettoie les référentiels de données ayant échoué 1 fois par jour.
L'utilitaire effectue le nettoyage des anciennes données et des données obsolètes accumulées dans vos
référentiels de données ayant échoué Par exemple, les scores ayant dépassé la période de rétention des scores
s'accumulent avec le temps dans le référentiel de données ayant échoué, ce qui peut ralentir la performance.
Les objets (tables ou vues) liés par une règle peuvent contenir des données ayant échoué dans le référentiel
même s'ils ont été supprimés d'un projet.
L'utilitaire effectue le nettoyage des enregistrements de données ayant échoué des tables suivantes, en
fonction du nombre de jours défini dans la Période de rétention de l'historique :
● <TABLE_ALIAS>_SOURCE
● <TABLE_ALIAS>_FD
● IS_FD_RUN_HISTORY
● IS_FD_RULES_INFO
● <TABLE_ALIAS>_FR
L'utilitaire supprime les tables ou vues suivantes lorsque les tables ou vues avec des liaisons de règles dans
Data Insight sont supprimées du projet :
● <TABLE_ALIAS>_SOURCE
● <TABLE_ALIAS>_FD
● <TABLE_ALIAS>_FR
● <TABLE_ALIAS>_VIEW
● <TABLE_ALIAS>_VW
L'utilitaire supprime les enregistrements anciens de données ayant échoué dans les objets suivants lorsque les
tables ou vues avec des liaisons de règles dans Data Insight sont supprimées du projet :
● IS_FD_TABLES_MAP
● IS_FD_RUN_HISTORY
● IS_FD_RULES_INFO
Pour en savoir plus sur l'utilitaire de nettoyage des données ayant échoué, voir le Guide d'administration.
Informations associées
Guide de l'utilisateur
180 PUBLIC Data Insight
4.12.15.4.6.2 Incohérences dans la structure des données
ayant échoué
Les tâches d'exécution de règle échouent lorsque le logiciel trouve des incohérences dans la structure des
données dans le référentiel de données ayant échoué.
Ces incohérences se produisent si vous sélectionnez Oui à l'option Ajouter les données ayant échoué pour votre
connexion aux données ayant échoué dans la CMC (Central Management Console). Chaque fois que vous
exécutez une tâche d'exécution de règle, le logiciel ajoute les données ayant échoué au référentiel.
Les tâches d'exécution de règle peuvent échouer si vous apportez les modifications structurelles suivantes
d'une exécution de tâche d'exécution de règle à l'autre :
● Modification d'une source existante utilisée dans un projet Data Insight, telle que l'ajout d'une colonne.
● Modification de la désignation d'une clé primaire dans une source existante utilisée dans un projet Data
Insight. Par exemple, passer de ne pas avoir de désignation de clé primaire à en avoir une.
● Modification aux fonctions is_unique ou is_data_dependent dans la liaison de règle.
Lorsque le logiciel détecte une incohérence dans les données source lors d'une tâche d'exécution de règle,
celle-ci échoue mais vous avez la possibilité de choisir l'option Supprimer les données ayant échoué. Cette
option apparaît dans l'onglet Tâches de Data Insight ou sur la page d'informations de statut de la CMC.
L'option Supprimer les données ayant échoué et exécuter supprime automatiquement les objets associés du
référentiel de données ayant échoué. Vous pouvez alors relancer l'exécution de la tâche d'exécution de règle.
Remarque
Supprimer les données ayant échoué et exécuter est disponible seulement si la tâche d'exécution de règle
échoue en raison d'incohérences dans la structure des données (et seulement si vous sélectionnez la tâche
d'exécution de règle). Si l'option n'est pas disponible et que le statut de job indique l'échec du job, examinez
le fichier de journal pour en savoir plus.
Informations associées
Suppression des données sources incohérentes dans Data Insight [page 185]
Une tâche d'exécution de règle peut échouer si vous réalisez des modifications dans la structure de données
dans la vue ou la table Data Insight lors du traitement de la tâche d'exécution de règle.
Dans ce scénario, l'utilisateur configure et réussit l'exécution d'une tâche d'exécution de règle en fonction d'une
planification. La tâche d'exécution de règle suppose deux colonnes depuis la vue ORDER_SUMMARY_VIEW
(VUE_RÉCAPITULATIVE_COMMANDE) : order_id (id_commande) et order_amount (montant_commande).
Quelques semaines plus tard, l'utilisateur vérifie le statut de la tâche d'exécution de règle et remarque qu'elle a
échoué.
Guide de l'utilisateur
Data Insight PUBLIC 181
Exemple
Paramètres initiaux
Champs de la vue :
Les paramètres de connexion aux données ayant échoué dans la CMC incluent Ajouter les données ayant
échoué : Oui
Résultat :
Un autre utilisateur modifie ORDER_SUMMARY_VIEW dans Data Insight dans un environnement de test en
ajoutant une colonne nommée order_date (date_commande) à la source. Après avoir importé la table
modifiée de l'environnement de test à celui de production, la tâche d'exécution de règle échoue lors de son
exécution planifiée suivante.
Motif : La tâche d'exécution de règle ne trouve pas la colonne order_date dans la table existante
ORDER_SUMMARY_VIEW_SOURCE du référentiel de données ayant échoué.
L'option Supprimer les données ayant échoué et exécuter supprime automatiquement les objets obsolètes
afin de garantir la réussite de l'exécution de la tâche d'exécution de règle. Le fichier de journal répertorie le
code d'erreur des données ayant échoué pour afficher le motif exact de l'échec de la tâche d'exécution de
règle. Dans ce cas, le code d'erreur est FD 10011: Found extra column order_date in table
ORDER_SUMMARY_VIEW_SOURCE in failed data database failed_data_1. (Une colonne
supplémentaire date_commande a été trouvée dans la table ORDER_SUMMARY_VIEW_SOURCE dans la
base de données de données ayant échoué failed_data_1).
Informations associées
Codes d'erreur pour les règles de données ayant échoué [page 185]
Suppression des données sources incohérentes dans Data Insight [page 185]
Guide de l'utilisateur
182 PUBLIC Data Insight
4.12.15.4.6.3 Objet préexistant dans un référentiel de
données ayant échoué
Une tâche d'exécution de règle échoue si le logiciel trouve des objets préexistants dans le référentiel de
données ayant échoué d'une exécution de tâche d'exécution de règle à l'autre.
Lorsque vous modifiez un paramètre dans une tâche d'exécution de règle, le logiciel crée des vues et des tables
en utilisant le même format de nom. Par exemple, si l'option Inclure la source est sélectionnée, l'exécution de la
tâche crée un objet <TABLE_ALIAS>_FD (sous forme de table). En revanche, si vous désélectionnez l'option
Inclure la source et relancez l'exécution de la règle, le logiciel tente de nouveau de créer l'objet
<TABLE_ALIAS>_FD (sous forme de vue) mais il trouve l'objet existant et la tâche d'exécution de règle échoue.
Lorsque l'échec provient d'un objet préexistant, le logiciel vous propose l'option Supprimer les données ayant
échoué et exécuter dans l'onglet Tâches de Data Insight ou sur la page d'informations de statut de la CMC.
Une fois cette option sélectionnée, le logiciel supprime tous les objets préexistants du référentiel de données
ayant échoué. Vous pouvez alors relancer l'exécution de la tâche d'exécution de règle.
Remarque
L'option Supprimer les données ayant échoué et exécuter est active seulement lorsqu'une tâche d'exécution
de règle échoue en raison d'incohérences dans la structure des données, comme un objet préexistant (et
uniquement si la tâche d'exécution de la règle a été sélectionnée dans l'onglet Tâches). Si l'option
Supprimer les données ayant échoué et exécuter n'est pas active et que le statut affiche l'échec de la tâche
d'exécution de règle, l'échec n'est peut-être pas dû à une modification structurelle dans le référentiel. Dans
ce cas, examinez le fichier de journal pour comprendre pourquoi la tâche d'exécution de règle a échoué.
Informations associées
Lorsque l'option de tâche d'exécution de règle Inclure la source est décochée d'une exécution de tâche
d'exécution de règle à l'autre, celle-ci échoue.
Exemple
L'utilisateur crée une règle order_date_rule (règle_date_commande) à l'aide de la vue Data Insight
nommée ORDER_DATE_VIEW.
Guide de l'utilisateur
Data Insight PUBLIC 183
● Ajouter les données ayant échoué : Oui
La tâche d'exécution de règle order_date_rule est définie avec les options suivantes :
Résultats :
L'exécution de la tâche d'exécution de règle order_date_rule a réussi. Le logiciel génère la table et la vue
suivantes :
● Table ORDER_DATE_VIEW_SOURCE
● Vue ORDER_DATE_VIEW_FD
L'utilisateur modifie la tâche d'exécution de règle en décochant Inclure la source puis il relance
manuellement l'exécution de la tâche d'exécution de règle.
Motif : Le logiciel tente de créer la table ORDER_DATE_VIEW_FD dans le référentiel de données ayant
échoué ; mais il trouve une vue existante ORDER_DATE_VIEW_FD depuis la tâche d'exécution de règle
précédente et détermine donc que la table _FD existe déjà. Cela entraîne l'échec de la tâche d'exécution de
règle.
Lorsque la tâche d'exécution de règle échoue, le logiciel active l'option Supprimer les données ayant échoué
et exécuter pour la tâche d'exécution de règle dans l'onglet Tâches. Lorsque l'utilisateur sélectionne
l'option, le logiciel supprime automatiquement les objets préexistants. L'utilisateur ouvre le fichier de
journal et trouve le code d'erreur Found a ORDER_DATE_VIEW_FD FD view that already exists
in the failed database failed_data_1. (une vue FD ORDER_DATE_VIEW_FD qui existe déjà dans
la base de données ayant échoué failed_data_1 a été trouvée).
Remarque
Si l'utilisateur a initialement créé et exécuté la tâche d'exécution de règle sans avoir coché Inclure la
source puis qu'il modifie la tâche d'exécution en la cochant, la tâche d'exécution de règle échoue. Le
code d'erreur répertorié dans le fichier de journal est : Found a ORDER_DATE_VIEW_FD FD table
that already exists in the failed database failed_data_1. (une table FD
ORDER_DATE_VIEW_FD qui existe déjà dans la base de données ayant échoué failed_data_1 a été
trouvée).
Informations associées
Suppression des données sources incohérentes dans Data Insight [page 185]
Codes d'erreur pour les règles de données ayant échoué [page 185]
Guide de l'utilisateur
184 PUBLIC Data Insight
4.12.15.4.6.4 Suppression des données sources incohérentes
dans Data Insight
Utilisez l'option Supprimer les données ayant échoué et exécuter dans l'onglet Tâches de Data Insight pour
supprimer les données incohérentes du référentiel de données ayant échoué.
Suivez cette procédure après avoir exécuté une tâche d'exécution de règle pour la seconde fois et les fois
ultérieures en raison de modification structurelles dans les données sources.
1. Ouvrez l'onglet Tâches dans Data Insight et sélectionnez la tâche d'exécution de règle échouée applicable.
Le bouton Supprimer les données ayant échoué et exécuter en haut de la fenêtre devrait être actif. Si ce
n'est pas le cas, téléchargez le fichier de journal pour comprendre pourquoi la tâche d'exécution de règle a
échoué. L'option est active seulement si la tâche d'exécution de règle a échoué en raison de modification
structurelles dans les données sources.
2. Cliquez sur Supprimer les données ayant échoué et exécuter.
Une fenêtre de confirmation apparaît, contenant un code d'erreur de données ayant échoué.
3. Cliquez sur OK dans la fenêtre de confirmation.
Une fois la suppression terminée, et s'il n'y a pas d'autres problèmes avec la tâche d'exécution de règle, celle-ci
s'exécute.
Remarque
Vous pouvez également supprimer les informations des données ayant échoué à l'aide de l'option
Supprimer les données ayant échoué et exécuter dans la CMC. Pour en savoir plus, voir le Guide
d'administration.
Informations associées
Codes d'erreur pour les règles de données ayant échoué [page 185]
Lorsque le logiciel exécute une tâche d'exécution de règle et qu'il trouve des données source en conflit dans le
référentiel de données ayant échoué, la tâche d'exécution de règle échoue et le logiciel génère un code d'erreur.
Le logiciel génère un code d'erreur en cas de non-correspondance entre les tables ou vues
<TABLE_ALIAS>_FD et <TABLE_ALIAS>_SOURCE dans le référentiel de données ayant échoué. Le logiciel
fournit l'option Supprimer les données ayant échoué et exécuter pour purger automatiquement les anciens
objets du référentiel de données ayant échoué.
Le code d'erreur indique la cause de l'incohérence des données source. Tous les codes d'erreur de données
ayant échoué commencent par « FD ».
Guide de l'utilisateur
Data Insight PUBLIC 185
Codes d'erreur de données ayant échoué
10010 Impossible de trouver la colonne <nom Le logiciel ne trouve pas la nouvelle co
de colonne> dans la table <nom de lonne dans le référentiel de données ay
table> dans la base de données ayant ant échoué existant.
échoué <nom de base de
données>.
10011 Une colonne supplémentaire <nom de Le logiciel a trouvé une colonne supplé
colonne> a été trouvée dans la table mentaire dans le référentiel de données
<nom de table> dans la base de don ayant échoué existant qui n'est plus in
nées ayant échoué <nom de base de cluse dans les résultats de la nouvelle
données>. tâche d'exécution de règle.
10030 Une modification de définition de la clé Le logiciel a trouvé une désignation dif
primaire à l'origine d'une colonne man férente de clé primaire dans le référen
quante <nom de colonne> a été trou tiel de données ayant échoué par rap
vée dans la table <nom de table> port à celle de l'exécution précédente
dans la base de données ayant échoué de la tâche d'exécution de règle.
<nom de base de données>.
10050 Une modification de liaison de règle Le logiciel ne trouve pas la même co
d'unicité ou de dépendance fonction lonne GROUP_ID_<X> dans le réfé
nelle à cause de laquelle la colonne rentiel de données ayant échoué car
<nom de colonne> est manquante l'unicité ou la dépendance de liaison de
dans la table <nom de table> dans la règles a été modifiée depuis la dernière
base de données ayant échoué <nom exécution de tâche d'exécution de rè
de base de données> a été trouvée. gle.
10060 Une vue FD <nom de vue> qui existe Le logiciel a trouvé un paramètre modi
déjà dans la base de données ayant fié de l'option Inclure la source entre les
échoué <nom de base de données> exécutions de tâche d'exécution de rè
a été trouvée. gle : De sélectionné à non sélectionné.
Guide de l'utilisateur
186 PUBLIC Data Insight
Code d'erreur Message d'erreur Description
10061 Une table FD <nom de table> qui exi Le logiciel a trouvé un paramètre modi
ste déjà dans la base de données ayant fié de l'option Inclure la source entre les
échoué <nom de base de données> exécutions de tâche d'exécution de rè
a été trouvée. gle : De non sélectionné à sélectionné.
L'Assistant de nettoyage est une fonctionnalité de Data Insight et fait partie de l'assistant de qualité des
données. L'Assistant de nettoyage simplifie le processus de nettoyage des données en vous recommandant
intelligemment une solution de nettoyage des données. La recommandation est basée sur les résultats de
profilage du type de contenu de vos données et les meilleures pratiques SAP pour vos données spécifiques.
Vous trouverez de plus amples informations sur l'assistant de qualité des données sur Assistant de qualité des
données Data Insight [page 28].
Une solution de nettoyage des données est une collection de règles de nettoyage et de correspondance pour
les données tierces que vous pouvez publier en vue de leur utilisation dans le Workbench de Data Services. Les
données tierces sont des données concernant des personnes ou des organisations, par exemple nom, adresse
et téléphone. Exemples de données tierces : données clients et données fournisseur.
Dans l'Assistant de nettoyage, vous pouvez voir les effets de la solution de nettoyage sur vos données en
affichant les résultats de nettoyage et de correspondance, y compris les statistiques, les diagrammes et un
aperçu des données. Si l'aperçu des données révèle des résultats non satisfaisants, vous pouvez modifier les
options et voir un nouvel aperçu des résultats sur vos données.
Rappelez-vous que les modifications des données dont vous voyez l'aperçu dans l'Assistant de nettoyage sont
temporaires et destinés uniquement à une planification. L'Assistant de nettoyage crée des données
intermédiaires d'après vos données réelles et travaille uniquement sur les données intermédiaires. Aucune
modification des données réelles n'a lieu tant que le job n'a pas été traité dans le Workbench de Data Services.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 187
4.13.1 Nettoyage et correspondance
L'Assistant de nettoyage nettoie les données d'adresse et les données ne concernant pas l'adresse (telles que
les données de nom personnelles).
Quand l'Assistant de nettoyage nettoie les données ne concernant pas l'adresse, il les analyse et les
standardise. Quand l'Assistant de nettoyage nettoie les données d'adresses, il les analyse, les valide et les
corrige.
Pour nettoyer les données, l'Assistant de nettoyage s'appuie sur des données de référence :
● Pour nettoyer les données d'adresses, l'Assistant de nettoyage utilise des données de référence également
nommées répertoires d'adresses. Le niveau de correction varie selon le pays et les répertoires que possède
votre organisation.
● Pour nettoyer les données de personne, fonction et téléphone, l'Assistant de nettoyage utilise le package
de nettoyage des données personnelles et professionnelles fourni par SAP.
Le nettoyage des données est essentiel pour le processus de correspondance. Des données correctes et
cohérentes permettent une correspondance efficace.
Dans le cadre du nettoyage, vous pouvez inclure des transformations de base pour effectuer des recherches et
remplacements ou un autre nettoyage de texte simple.
Informations associées
Présentation du processus de création d'une solution de nettoyage des données pour les données tierces.
1. Dans l'onglet Accueil de l'espace de travail de Data Insight, choisissez une source d'entrée, sélectionnez
Profil Type de contenu , puis dans la colonne Assistant, cliquez sur l'icône Assistant de nettoyage
( ).
2. Terminez l'Assistant de nettoyage en acceptant les recommandations proposées ou en apportant des
modifications pour répondre à vos besoins.
3. Visualisez les résultats de nettoyage et de correspondance de vos données. Vous pouvez voir le nombre
d'enregistrements valides, non valides, correspondants et non correspondants. Vous pouvez également
obtenir un aperçu des modifications de vos données et accéder aux options permettant de modifier les
résultats.
Guide de l'utilisateur
188 PUBLIC Data Insight
4. Quand les résultats de nettoyage et de correspondance vous semblent bons, cliquez sur Publier la solution
pour partager la solution de nettoyage des données avec le Workbench Data Services.
Informations associées
L'Assistant de nettoyage vous guide au cours des étapes de création d'une solution de nettoyage des données.
L'assistant présente une solution de nettoyage des données recommandée d'après les résultats de profilage du
type de contenu, l'analyse des données et les meilleures pratiques SAP. Vous pouvez accepter les
recommandations de l'assistant ou effectuer des ajustements pour mieux correspondre à vos besoins de
gestion.
1. Dans l'onglet Data Insight Accueil de l'espace de travail, sélectionnez une source d'entrée pour laquelle
générer une solution de nettoyage des données. Si les types de contenu de la source d'entrée n'ont pas
encore été profilés, faites-le en cliquant sur Profil Type de contenu .
Le profilage du type de contenu peut durer un certain temps selon la taille de la source d'entrée. Une coche
verte s'affiche dans la colonne Type de contenu quand le profilage du type de contenu est terminé. Le
profilage du type de contenu est actuellement disponible uniquement pour les données tierces.
Dans l'étape 1 de l'assistant, nommez la solution de nettoyage des données et fournissez-en une
description.
Le nom et la description saisis sont enregistrés avec la solution de nettoyage des données et sont visibles
dans le Workbench de Data Services lorsque la solution de nettoyage des données est publiée. Il est donc
important que le nom et la description soient significatifs pour l'utilisateur du Workbench de Data Services.
3. Dans le champ Nom, entrez un nom unique pour cette solution de nettoyage des données.
4. Dans le champ Description, entrez les informations sur cette solution de nettoyage des données qui vous
aideront, ainsi que les autres utilisateurs, à en identifier l'objectif et les caractéristiques.
Guide de l'utilisateur
Data Insight PUBLIC 189
5. Cliquez sur Suivant pour passer à la prochaine étape.
Informations associées
Au cours de l'étape 2 de l'Assistant de nettoyage, vous identifiez les données à utiliser dans cette solution de
nettoyage des données.
Vous pouvez voir toutes les colonnes identifiées par Data Insight pendant le profilage du type de contenu. Le
type des données est répertorié dans la colonne Type de contenu et les colonnes que l'Assistant de nettoyage
recommande d'utiliser dans la solution de nettoyage des données sont déjà sélectionnées pour vous. Vous
pouvez sélectionner et désélectionner les colonnes si nécessaire.
Sélectionnez les colonnes pertinentes pour le nettoyage et la correspondance. Les colonnes que vous
sélectionnez seront affichées dans l'Assistant de nettoyage. Par la suite, quand la solution de nettoyage des
données est publiée et utilisée dans un job du Workbench de Data Services, toutes les colonnes de la source de
données seront disponibles.
1. Cliquez sur les cases à cocher pour sélectionner ou désélectionner les catégories de données (Personne,
Adresse ou Autre) ou bien des colonnes individuelles. Sélectionnez uniquement les catégories ou colonnes
significatives pour votre processus de nettoyage et de correspondance.
Remarque
Les colonnes supplémentaires dont le type de contenu n'a pas pu être déterminé lors du profilage du
type de contenu pourront être sélectionnées pendant l'étape suivante de l'assistant. Vous pouvez
utiliser ces colonnes, une colonne d'ID par exemple, pendant la mise en correspondance.
L'Assistant de nettoyage vérifie que les colonnes appropriées sont sélectionnées pour former une personne
ou une adresse complète.
Statut Description
Ce groupe de colonnes contient des éléments inattendus. Examinez les colonnes sélection
nées pour vérifier qu'elles correspondent à vos attentes.
Guide de l'utilisateur
190 PUBLIC Data Insight
Statut Description
Ce groupe de colonnes n'est pas valide à des fins de nettoyage des données. Par exemple, si
une colonne de titre de civilité est la seule colonne de personnes sélectionnée, ce n'est pas
valide. Sélectionnez d'autres colonnes pour former une personne ou une adresse complète.
2. Si un lien s'affiche sous le tableau de la colonne, cliquez dessus pour clarifier les données de pays, de nom
ou de date.
Confirmation Description
Données de pays Si votre source d'entrée comprend une colonne Pays, sélectionnez-la durant l'étape 2 de
manquantes l'assistant.
Si votre source d'entrée ne comprend pas de colonne Pays, spécifiez si l'ensemble de la ta
ble contient des données du même pays (sélectionnez-le) ou de plusieurs pays. Si vous indi
quez que les adresses de vos enregistrements proviennent de plusieurs pays, l'Assistant de
nettoyage tentera d'identifier le pays de chaque enregistrement au cours du nettoyage.
Modifier l'ordre des noms Choisissez l'ordre des éléments de nom dans les colonnes de personne.
pour les colonnes de
Si vous ignorez cette étape, l'Assistant de nettoyage poursuit avec un paramétrage basé sur
personne ou
le type de contenu principal identifié pendant le profilage.
Nom ambigu pour les
colonnes de personne
Modifier le format des Spécifiez le format utilisé pour les dates dans l'ensemble des colonnes de date que vous in
colonnes de date cluez dans cette solution de nettoyage des données.
Si vous ignorez cette étape, l'Assistant de nettoyage poursuit avec un paramétrage basé sur
le type de contenu principal identifié pendant le profilage.
Informations associées
● Des colonnes appartenant à une personne par enregistrement. Si un enregistrement contient des
informations sur plusieurs personnes, vous devez sélectionner les colonnes qui représentent une seule de
ces personnes. Par exemple, un enregistrement peut contenir des colonnes de nom et de fonction pour un
Guide de l'utilisateur
Data Insight PUBLIC 191
client et un représentant commercial. Vous devez sélectionner les colonnes concernant le client ou le
représentant, mais pas les deux.
● Des colonnes appartenant à une adresse par enregistrement. Si un enregistrement contient des
informations sur plusieurs adresses, vous devez sélectionner les colonnes qui représentent une seule de
ces adresses. Par exemple, un enregistrement peut contenir une adresse de facturation et une adresse
d'expédition. Vous devez sélectionner les colonnes concernant l'une ou l'autre, mais pas les deux.
● Jusqu'à six colonnes de téléphone et de courrier électronique peuvent être nettoyées et utilisées pour la
correspondance. Jusqu'à six colonnes de date et de numéro de Sécurité Sociale (SSN) peuvent être
nettoyées, mais une seule peut être utilisée pour la mise en correspondance.
● Un nom de société.
● Toute autre colonne pertinente pour la solution de nettoyage des données. Par exemple, vous pouvez
utiliser une colonne Numéro d'identification à des fins de mise en correspondance.
Les colonnes de nom, fonction, société, adresse, téléphone, date, courrier électronique et numéro de sécurité
sociale que vous sélectionnez seront nettoyées si possible.
Les colonnes utilisées pour la correspondance dépendent du thème de correspondance et des règles que vous
sélectionnez lors de l'étape suivante de l'assistant. Par exemple, si vous sélectionnez des colonnes associées à
une personne au cours de l'étape 2 de l'assistant, mais que vous sélectionnez le thème de correspondance ID
uniquement lors de l'étape suivante, l'Assistant de nettoyage ne prendra pas en compte les colonnes de
personnes pour la recherche des enregistrements correspondants.
Les colonnes suivantes peuvent être disponibles à la sélection, selon le contenu de votre source d'entrée.
Nom de famille Nom de famille d'une personne, par exemple Smith ou Hamilton
Personne Nom complet d'une personne combiné en une seule colonne, par exemple Dr. Robert Hamilton III.
Cette colonne peut également comprendre la fonction d'une personne.
Titre de civilité Titre de civilité d'une personne, par exemple Mme, M. ou Dr.
Titre de maturité Titre de maturité d'une personne indiquant une descendance, par exemple Jr. ou III.
Titre honorifique Titre honorifique d'une personne indiquant une certification, un grade académique ou une affilia-
tion telle que CPA.
Personne ou société Certains enregistrements contiennent le nom d'une personne et d'autres le nom d'une organisa
tion. Par exemple, Personne ou Société peuvent être une colonne de nom de client, pour laquelle
le produit peut être vendu à une personne individuelle ou à une organisation.
Guide de l'utilisateur
192 PUBLIC Data Insight
Types de contenu associés aux adresses
Ligne d'adresse Tous les composants qui forment l'adresse postale ou bien le nom et numéro de rue, par exemple
1050 Main Street.
Nom de bâtiment Nom de bâtiment, qui peut être dans certains pays un composant formel de l'adresse. Par exem
ple, au Royaume-Uni, une adresse peut être White House, High Street, (White House étant le nom
de bâtiment).
Adresse secondaire Informations sur l'appartement ou la suite, par exemple Apt 315, qui fait partie de l'adresse 1050
Main St. Apt 315.
Numéro de la rue Le numéro associé au nom de la rue, par exemple 1050 dans l'adresse 1050 Main Street.
Nom de la rue Description de la rue, par exemple Main Street, qui fait partie de l'adresse 1050 Main Street.
Adresse unique L'adresse entière dans une seule colonne. Le type de contenu Adresse unique est valide unique
ment dans les scripts chinois et japonais. Par exemple,
Ville Composant de ville, banlieue ou district tel que district, quartier ou arrondissement dans une ville.
Ville Région Code pos Ville, région et code postal combinés en une seule colonne, par exemple Chicago IL 60640.
tal
Date Vous pouvez inclure jusqu'à six colonnes de date dans votre solution de nettoyage des données.
Email Vous pouvez inclure jusqu'à six colonnes de courrier électronique dans votre solution de nettoyage
des données.
Téléphone Vous pouvez inclure jusqu'à six colonnes de téléphone dans votre solution de nettoyage des don
nées.
SSN Vous pouvez inclure jusqu'à six numéros de Sécurité Sociale des Etats-Unis.
Lors de l'étape 3 de l'assistant de configuration, vous confirmez le thème et les règles de correspondance
recommandées pour vos données ou vous en sélectionnez d'autres. La recommandation que l'Assistant de
Guide de l'utilisateur
Data Insight PUBLIC 193
nettoyage vous propose est basée sur une analyse intelligente de vos données et des colonnes que vous avez
sélectionnées lors de l'étape précédente de l'assistant.
Vous pouvez également décider de ne pas effectuer de correspondance pour cette solution de nettoyage des
données
Si votre solution de nettoyage des données doit comprendre la correspondance, elle doit inclure un thème de
correspondance et au moins une règle de correspondance.
Individual Recherche des enregistrements correspondants d'après des données de noms de per
sonnes.
Corporate Recherche des enregistrements correspondants d'après des données de noms d'organi
sations.
Individual and Corporate Recherche des enregistrements correspondants d'après des données de noms de per
sonnes et d'organisations.
Family Recherche des enregistrements correspondants d'après des données de noms de fa
mille.
ID Only Recherche des enregistrements correspondants d'après une colonne d'ID ou de numé
ros de Sécurité Sociale que vous spécifiez.
Autre Recherche des enregistrements correspondants d'après des critères très spécifiques
(adresse uniquement, téléphone uniquement, courrier électronique uniquement ou une
autre colonne spécifique).
No Match Exclut la correspondance de cette solution de nettoyage des données. Cette solution de
nettoyage des données comprendra le nettoyage et les transformations de base si vous
en ajoutez lors de l'étape suivante de l'assistant.
Person and Address Compare les colonnes de nom de personne et d'adresse des enregistrements.
Person and Phone Compare les colonnes de nom de personne et de téléphone des enregistrements.
Person and Email Compare les colonnes de nom de personne et de courrier électronique des enregistre
ments.
Person and Date Compare les colonnes de nom de personne et de date des enregistrements.
Guide de l'utilisateur
194 PUBLIC Data Insight
Règle de correspondance Description
des individus
Person and ID Compare les colonnes de nom de personne et d'ID ou de numéro de Sécurité Sociale
des enregistrements.
Firm and Address Compare les colonnes de nom d'organisation et d'adresse des enregistrements.
Firm and Phone Compare les colonnes de nom d'organisation et de téléphone des enregistrements.
Firm and Email Compare les colonnes de nom d'organisation et de courrier électronique des enregistre
ments.
Firm and ID Compare les colonnes de nom d'organisation et d'ID ou de numéro de Sécurité Sociale
des enregistrements.
Person and Firm and Compare les colonnes de nom de personne, de nom d'organisation et d'adresse des en
Address registrements.
Person and Firm and Phone Compare les colonnes de nom de personne, de nom d'organisation et de téléphone des
enregistrements.
Person and Firm and Email Compare les colonnes de nom de personne, de nom d'organisation et de courrier élec
tronique des enregistrements.
Person and Firm and ID Compare les colonnes de nom de personne, de nom d'organisation et d'ID ou de numéro
de Sécurité Sociale des enregistrements.
Last Name and Address Compare les colonnes de nom de famille et d'adresse des enregistrements.
Last Name and Phone Compare les colonnes de nom de famille et de téléphone des enregistrements.
Last Name and Email Compare les colonnes de nom de famille et de courrier électronique des enregistre
ments.
Last Name and Date Compare les colonnes de nom de famille et de date des enregistrements.
Last Name and ID Compare les colonnes de nom de famille et d'ID ou de numéro de Sécurité Sociale des
enregistrements.
Règle de correspondance
ID only Description
Guide de l'utilisateur
Data Insight PUBLIC 195
Autres règle de correspon Description
dance
Other Column Compare les enregistrements en utilisant toute colonne que vous spécifiez.
3. Si la solution de nettoyage des données comprend plusieurs colonnes de téléphone et/ou courrier
électronique, cliquez sur le lien Modifier les colonnes de numéro de téléphone à utiliser ou Modifier les
colonnes d'adresses de messagerie à utiliser, sélectionnez les colonnes voulues, puis l'option Effectuer une
correspondance entre les colonnes pour comparer toutes les colonnes de téléphone (ou d'adresse de
messagerie) entre elles.
Par exemple, sans correspondance entre les colonnes, Phone1 du premier enregistrement est comparé à
Phone1 du deuxième enregistrement et Phone2 du premier enregistrement est comparé à Phone2 du
deuxième enregistrement Si la correspondance entre les colonnes est sélectionnée, Phone1 du premier
enregistrement est comparé à Phone1 et Phone2 du deuxième enregistrement, etc.
Vous pouvez utiliser jusqu'à six colonnes de téléphone et de courrier électronique pour la correspondance.
4. Si la solution de nettoyage des données comprend plusieurs colonnes d'ID ou de numéro de Sécurité
Sociale, cliquez sur le lien Modifier la colonne à utiliser, puis sélectionnez la colonne voulue.
Remarque
Les colonnes dont les types de contenu n'ont pas pu être déterminés pendant le profilage du type de
contenu sont sélectionnables pour la mise en correspondance.
A l'étape 4 de l'Assistant de nettoyage ou dans les Résultats du nettoyage, vous pouvez configurer des
modifications de texte (transformations) à appliquer aux colonnes de données spécifiées. Les transformations
que vous configurez dans l'assistant peuvent aider à préparer les données afin d'obtenir des résultats de
nettoyage et de correspondance plus précis.
Une seule transformation est appliquée à une seule colonne. Vous pouvez configurer plusieurs transformations
à appliquer à la même colonne ou à des colonnes différentes.
1. Pour accéder à la configuration des transformations dans l'assistant, continuez dans l'assistant jusqu'à
l'étape 4. Pour accéder à la configuration des transformations pour une solution de nettoyage des données
ayant déjà été créée, ouvrez cette dernière, cliquez sur Afficher les résultats du nettoyage, sur Afficher les
données, puis sur Transformations de base.
Guide de l'utilisateur
196 PUBLIC Data Insight
2. Sélectionnez le type de transformation à configurer dans la liste déroulante.
Transformation Description
Rechercher et remplacer Remplace le texte spécifié par le nouveau texte que vous indiquez.
Supprimer les espaces Supprime les espaces avant et/ou après le texte.
Remplacer les cellules Insère le texte spécifié à la place des champs vides ou nuls.
vides
Supprimer les caractères Supprime les caractères non imprimables suivants, également nommés caractères de con
non imprimables trôle :
○ Caractère d'appel
○ Espace arrière
○ Tabulation horizontale
○ Saut de ligne
○ Saut de page
○ Retour chariot
○ Echappement
○ Suppression
3. Dans la fenêtre Ajouter une transformation, configurez la transformation selon la description ci-dessous.
Les prochaines étapes dépendent du choix de la transformation.
Transformation Etapes
Rechercher et remplacer Dans la zone Remplacer, saisissez le texte à supprimer de la colonne sélectionnée. Dans la
zone par, saisissez le texte qui doit remplacer le texte supprimé. Cliquez sur Ajouter.
Utilisez les boutons flèche vers le haut et vers le bas pour réorganiser les valeurs à recher
cher et remplacer.
Supprimer les espaces Choisissez Espaces de début pour supprimer les espaces avant le texte dans la colonne sé
lectionnée.
Choisissez Espaces de fin pour supprimer les espaces après le texte dans la colonne sélec
tionnée.
Remplacer les valeurs Dans la zone par, saisissez le texte qui doit remplacer les champs vides dans la colonne sé
nulles par <valeur par lectionnée.
défaut>
Supprimer les guillemets Choisissez Guillemets doubles pour supprimer les guillemets doubles (") qui se trouvent
n'importe où dans la colonne sélectionnée.
Choisissez Guillemets simples pour supprimer les guillemets simples (') qui se trouvent
n'importe où dans la colonne sélectionnée.
Supprimer les caractères Choisissez Supprimer les caractères non imprimables pour supprimer les caractères de
non imprimables contrôle de la colonne sélectionnée.
4. Dans la liste déroulante Sélectionner la colonne à transformer, sélectionnez la colonne sur laquelle
appliquer la transformation.
Guide de l'utilisateur
Data Insight PUBLIC 197
5. Cliquez sur OK pour enregistrer vos paramètres et fermer la fenêtre.
Vous pouvez cliquer sur la croix (X) pour supprimer une transformation.
Remarque
Les transformations sont toujours appliquées dans cet ordre pour chaque champ : remplacer les
cellules vides, supprimer les caractères non imprimables, supprimer les espaces, supprimer les
guillemets et rechercher-remplacer.
6. Si vous avez terminé la configuration de l'Assistant de nettoyage, cliquez sur Terminer. Si vous travaillez
dans la fenêtre Résultats du nettoyage, cliquez sur Appliquer pour appliquer maintenant les
transformations aux données.
Remarque
Si vous cliquez sur Appliquer dans Résultats du nettoyage, sachez que selon la taille de la table de
données, le nouveau nettoyage et la nouvelle correspondance peuvent durer un certain temps. Une
fenêtre de message s'ouvre pour donner la possibilité d'exécuter ce processus en arrière-plan. Cliquez
sur Exécution en arrière-plan pour continuer le nouveau traitement et revenir à la liste Solutions de
nettoyage des données où vous pouvez accéder à d'autres solutions de nettoyage des données
pendant l'exécution du processus.
Si vous venez de terminer l'assistant ou de cliquer sur Exécution en arrière-plan après application des
modifications dans Résultats du nettoyage, vous revenez à la liste Solutions de nettoyage des données, où
vous pouvez voir la solution de nettoyage des données en cours de traitement. La taille de la table de
données utilisée dans cette solution de nettoyage des données détermine le temps nécessaire au
traitement de cette dernière. Cliquez sur le symbole Actualiser ( ) pour voir les mises à jour de statut.
En cliquant sur l'onglet Assistant de nettoyage dans Data Insight, la liste Solutions de nettoyage des données
s'affiche. La liste Solutions de nettoyage des données affiche les solutions de nettoyage des données ayant été
configurées.
Dans la liste Solutions de nettoyage des données, vous pouvez effectuer plusieurs actions :
Les solutions de nettoyage des données sont listées par nom et affichent également le statut actuel de chaque
solution.
Guide de l'utilisateur
198 PUBLIC Data Insight
Détails Description
Nom Nom attribué à cette solution de nettoyage des données lors de sa configuration dans l'Assistant de
nettoyage.
Statut La colonne de statut affiche ce qui se produit actuellement au niveau de la solution de nettoyage des
données.
Pour restreindre le nombre de solutions de nettoyage des données affichées dans cette liste, cliquez sur
l'en-tête de la colonne Statut, sélectionnez le statut à afficher et cliquez sur Appliquer.
Statut Description
Si vous venez de terminer l'Assistant de nettoyage, un certain temps peut être nécessaire pour que vo
tre solution soit utilisable (statut "Prêt"). Vous pouvez actualiser l'écran ( ) pour voir la mise à jour
d'un statut (si disponible).
L'état de traitement affiché sous « Création en cours » indique quel processus est actuellement exé
cuté.
● En cours d'exécution
● Nettoyage d'adresses
● Nettoyage de données ne concernant pas l'adresse
● Exportation des données
● Mise en correspondance des enregistrements
● Publication
● Annulation
Verrouillé La solution est actuellement ouverte. Si une solution n'est pas ouverte, mais qu'elle est verrouillée, cela
signifie qu'un problème s'est produit lors de la dernière ouverture de la solution.
Erreur Cette solution de nettoyage des données présente un problème impossible à résoudre. Pour voir l'er
reur, sélectionnez Plus Afficher les détails et consultez les erreurs répertoriées sous
Informations supplémentaires.
L'état de traitement affiché sous « Occupé » indique quel processus est actuellement exécuté. Voir les
statuts de traitement répertoriés avec le statut Création en cours ci-dessus.
Archivé Les données intermédiaires associées à cette solution ont été automatiquement purgées en fonction
du délai défini par l'administrateur dans la Central Management Console de la plateforme SAP Business
Intelligence. L'archivage des données intermédiaires aide à conserver de l'espace disque.
Les données intermédiaires associées aux solutions de nettoyage des données importées sont aussi ar
chivées. Vous devez les restaurer avant d'utiliser les solutions de nettoyage des données importées.
Vous pouvez restaurer les solutions archivées pour pouvoir les utiliser à nouveau.
Guide de l'utilisateur
Data Insight PUBLIC 199
Statut Description
Vous pouvez ouvrir une solution de nettoyage des données pour l'afficher ou la modifier. Pour ouvrir une
solution de nettoyage des données, sélectionnez-la dans la liste, puis cliquez sur Ouvrir. Sinon, cliquez deux
fois sur la solution.
Vous pouvez supprimer une solution de nettoyage des données si vous êtes sûr de ne plus en avoir besoin.
Sachez que d'autres utilisateurs, y compris ceux du Workbench de Data Services, peuvent compter sur le fait
que vous apportez des modifications à la solution de nettoyage des données, puis la republiez.
N'oubliez pas
Toutes les solutions de nettoyage des données ayant été publiées dans le Workbench de Data Services
seront toujours disponibles dans le Workbench de Data Services, même si vous avez supprimé la solution
dans l'Assistant de nettoyage. Quand une solution a été supprimée, vous ne pouvez plus y accéder dans
l'Assistant de nettoyage.
Pour supprimer une solution de nettoyage des données, sélectionnez-la dans la liste, puis cliquez sur
Supprimer.
C'est une bonne idée d'actualiser ou de mettre à jour la liste des solutions de nettoyage des données afin de
voir les derniers statuts et états de traitement de toutes les solutions. Par exemple, si vous attendez qu'un
processus se termine afin de pouvoir ouvrir une solution, actualisez la liste pour voir si le statut de la solution
est "Prêt".
Pour actualiser la liste des solutions de nettoyage des données, cliquez sur le symbole Actualiser ( ).
Guide de l'utilisateur
200 PUBLIC Data Insight
Affichage des détails
Vous pouvez afficher les dates et autres détails importants associés à la solution de nettoyage des données.
Sélectionnez Plus Afficher les détails ou passez le curseur de la souris sur le nom d'une solution de
nettoyage des données, les informations suivantes sont affichées :
Les administrateurs d'Information Steward peuvent déverrouiller des solutions de nettoyage des données pour
les rendre à nouveau utilisables.
Les solutions de nettoyage des données peuvent avoir le statut Verrouillé pour deux raisons : la solution est
ouverte (en cours d'utilisation) ou un problème est survenu lors de sa dernière ouverture.
Avant d'envisager de déverrouiller une solution de nettoyage des données, déterminez la raison qui a provoqué
son verrouillage.
Il peut être utile d'afficher la Date du dernier accès (sélectionnez Plus Afficher les détails ). Si la date de
dernier accès est récente, un autre utilisateur peut être en train d'utiliser cette solution. Demandez à vos
collaborateurs s'ils utilisent la solution.
Pour déverrouiller une solution de nettoyage des données, sélectionnez-la dans la liste, puis cliquez sur Plus
Déverrouiller ou contactez votre administrateur.
Les données intermédiaires des solutions de nettoyage des données auxquelles personne n'a accédé depuis un
nombre de jours défini sont automatiquement purgées pour conserver de l'espace disque. Lorsque les
données intermédiaires sont purgées, la solution elle-même est archivée. Vous pouvez restaurer les solutions
de nettoyage des données archivées pour pouvoir les utiliser à nouveau.
Les solutions de nettoyage des données importées doivent aussi être restaurées pour pouvoir les utiliser à
nouveau.
Si vous avez modifié un type de contenu ou un autre aspect de la source d'entrée depuis la création de la
solution de nettoyage des données, elle ne peut pas être restaurée.
Pour restaurer une solution de nettoyage des données archivée, sélectionnez-la dans la liste, puis cliquez sur
Plus Restaurer .
Guide de l'utilisateur
Data Insight PUBLIC 201
Pour en savoir plus sur la période de conservation des données intermédiaires de l'Assistant de nettoyage, voir
« Traitement de l'Assistant de nettoyage » dans le Guide de l'administrateur.
Dans certains cas, vous pouvez arrêter un processus en cours d'exécution d'une solution. Avant cela, cliquez
sur le symbole Actualiser pour mettre à jour la liste des solutions afin de vérifier que le processus n'est pas déjà
terminé.
Pour annuler un processus en cours d'une solution, sélectionnez la solution dans la liste, puis cliquez sur
Plus Annuler le traitement .
Vous pouvez partager des solutions de nettoyage des données en les exportant à partir d'une instance de SAP
Information Steward, puis en les important dans une autre instance. Pour importer ou exporter une solution de
nettoyage des données, vous importez ou exportez l'ensemble du projet Data Insight.
Pour en savoir plus, voir Exportation et importation de projets et d'objets [page 429].
Pour ouvrir une solution de nettoyage des données, sélectionnez-la dans la liste Solutions de nettoyage des
données, puis cliquez sur Ouvrir. Quand vous ouvrez une solution de nettoyage des données, l'écran
Présentation affiche une présentation des résultats de nettoyage et de correspondance de vos données. Vous
pouvez également accéder à des informations plus détaillées, à un aperçu de vos données nettoyées et
correspondantes et aux options modifiables.
Nettoyage
Le volet Nettoyage affiche une représentation graphique et des informations statistiques sur le nettoyage
d'adresse associé à cette solution de nettoyage des données.
Guide de l'utilisateur
202 PUBLIC Data Insight
Eléments du volet Nettoyage Description
Afficher les résultats du Cliquez sur Afficher les résultats du nettoyage pour accéder aux éléments suivants :
nettoyage
● Des diagrammes détaillés sur le nettoyage des types de données suivants de votre
table : adresse, personne, fonction, société, téléphone courrier électronique, date et
numéro de Sécurité Sociale.
● Une vue de vos données avant et après le nettoyage.
● Des options de mise en forme que vous pouvez modifier.
La partie Actuel du diagramme représente vos données avant tout nettoyage. Les adres
ses incorrectes comprennent les enregistrements présentant des problèmes pouvant
être corrigés ou pas. Les adresses correctes sont déjà correctes dans vos données et ne
nécessitent aucune correction.
La partie Après nettoyage du diagramme affiche les résultats du nettoyage si vous exécu
tez la solution de nettoyage des données telle qu'elle est actuellement configurée. Les
adresses incorrectes sont celles qui comportaient des problèmes graves n'ayant pas pu
être corrigés. Les adresses correctes sont celles qui étaient déjà correctes ou qui ont été
corrigées lors du processus de nettoyage.
Résumé Le tableau Résumé affiche le nombre d'adresses traitées, le nombre de celles qui sont
correctes après le nettoyage et le nombre de celles qui n'ont pas pu être corrigées du
rant le nettoyage.
Correspondance
Le volet Correspondance affiche une représentation graphique et des informations statistiques sur la mise en
correspondance associée à cette solution de nettoyage des données.
Afficher les résultats de la Cliquez sur Afficher les résultats de la correspondance pour accéder aux éléments sui
correspondance vants :
Guide de l'utilisateur
Data Insight PUBLIC 203
Informations associées
Dans l'écran Présentation, pour voir les résultats du nettoyage de manière plus détaillée, cliquez sur le bouton
Afficher les résultats du nettoyage.
Dans l'écran Résultats du nettoyage, vous pouvez afficher les résultats du nettoyage au format graphique et les
données nettoyées elles-mêmes.
Option Description
Afficher les Affiche une représentation graphique des résultats du nettoyage. Les diagrammes donnent une
diagrammes image globale des besoins en nettoyage des données. Vous pouvez voir d'un coup d'œil si les don
nées étaient en bon état avant le nettoyage ou nécessitaient plusieurs corrections.
Selon le type des données examinées, les diagrammes permettent de visualiser les détails des ré
sultats du nettoyage. Par exemple, vous pouvez voir exactement quel problème sur les données a
rendu une adresse non valide.
Afficher les données Affiche les données avant et après le nettoyage au format feuille de calcul.
Dans la vue des données, vous pouvez également accéder aux options de nettoyage modifiables.
Quand vous modifiez ces options, les données sont actualisées à l'écran pour afficher un aperçu
des nouveaux résultats.
Terminologie
Les définitions des termes qui apparaîtront dans les Résultats du nettoyage sont fournies ci-dessous.
Terme Définition
Nettoyé Les données des personnes, fonctions, sociétés, téléphones, courriers électroniques, dates et nu
méros de Sécurité Sociale sont répertoriées comme nettoyées dans les cas suivants :
Adresse corrigée L'adresse comporte des problèmes que le logiciel peut corriger.
Non valide Les données comportent des erreurs que le logiciel ne peut pas corriger.
Guide de l'utilisateur
204 PUBLIC Data Insight
Terme Définition
Suspectes Les données des personnes, fonctions, sociétés, téléphones, courriers électroniques, dates et nu
méros de Sécurité Sociale sont répertoriées comme suspectes dans les cas suivants :
● Les données sont potentiellement non valides, par exemple un champ de nom de personne
qui contient des données semblant être un nom d'entreprise.
● Les données sont incomplètes, par exemple un numéro de téléphone ne comportant pas as
sez de chiffres.
● Les données comprennent des données étrangères, comme un champ de numéro de Sécu
rité Sociale qui inclut du texte en plus du numéro.
● Les données sont peu fiables, par exemple un champ de prénom renseigné avec le mot Soleil.
Ce peut être un nom, mais le logiciel ne peut pas déterminer avec fiabilité que c'est le cas.
Adresse valide L'adresse est correcte lors de la saisie et ne nécessite aucune correction.
Les diagrammes des résultats du nettoyage affichés dans l' Assistant de nettoyage permettent de mieux
comprendre sous quelle forme les données profiteront du nettoyage. Cliquez sur les diagrammes pour
découvrir toutes les informations proposées.
Dans l'écran Présentation, pour afficher les diagrammes du nettoyage, cliquez sur Afficher les résultats du
nettoyage, puis sur Afficher les diagrammes. Les diagrammes Address Cleanse sont affichés par défaut. Pour
afficher d'autres diagrammes, sélectionnez une catégorie de données différente dans la liste déroulante
Résultats du nettoyage pour. Les choix disponibles dépendent des colonnes sélectionnées pour être incluses
dans cette solution de nettoyage des données.
La zone du diagramme est divisée en trois volets. De gauche à droite, chaque volet propose des détails de plus
en plus complets. Il est possible de cliquer sur une section de diagramme pour afficher davantage
d'informations sur une catégorie donnée. En cliquant sur une section du diagramme dans le premier volet,
celle-ci est analysée plus minutieusement dans le deuxième volet. De même, en cliquant sur une section du
diagramme dans le deuxième volet, celle-ci est analysée plus minutieusement dans le troisième volet (si ce
niveau de détails est disponible).
Vous pouvez également utiliser les filtres qui figurent au-dessus de la zone du diagramme pour restreindre des
éléments affichés. Par exemple, sélectionnez Adresse Adresses corrigées Rue pour afficher les
éléments corrigés des numéros et noms de rue. Les filtres que vous définissez déterminent les données
affichées dans la vue.
Les informations reportées dans les diagrammes figurent également dans le tableau Résumé sous le
diagramme.
Vous pouvez faire glisser les diviseurs entre les volets pour élargir ou rétrécir un diagramme.
Pour obtenir davantage de détails sur des résultats de nettoyage particuliers, cliquez sur Afficher les données.
Guide de l'utilisateur
Data Insight PUBLIC 205
4.13.6.2 Affichage des données nettoyées
Affichez vos données avant et après l'exécution de l’Assistant de nettoyage pour afficher les améliorations qui
peuvent être apportées à vos données dans le Workbench de SAP Data Services.
Pour afficher vos données avant et après le nettoyage, exécutez les étapes suivantes dans l'écran Présentation
de l’Assistant de nettoyage :
Les modifications « Après » dont un aperçu s'affiche dans l'Assistant de nettoyage sont temporaires et ne
servent que pour l'aperçu. Aucune modification des données n'a lieu tant que le job n'a pas été traité dans
le Workbench de Data Services.
La vue de données Résultats du nettoyage vous permet d'effectuer les opérations suivantes :
○ Voir les données avant et après le nettoyage, ce qui révèle la manière dont le nettoyage affecte les
données.
○ Personnaliser la vue.
○ Rechercher les données.
○ Voir une analyse détaillée d'un enregistrement avant et après.
○ Définir les options de mise en forme pour personnaliser le nettoyage.
○ Configurer les transformations pour les modifications de base du texte.
○ Exporter les enregistrements nettoyés.
3. Cliquez sur Présentation pour revenir à l'écran Présentation.
Informations associées
Personnalisez votre vue des résultats de nettoyage des données en affichant uniquement certaines colonnes et
en définissant les critères de tri.
● Cliquez sur Afficher les colonnes. Sélectionnez une colonne à afficher. Désélectionnez les colonnes à
masquer.
● Cliquez sur Critères de tri : Sélectionnez une ou plusieurs colonnes de tri. Effectuez un tri dans l'ordre
croissant (de A à Z) ou décroissant (de Z à A). Un petit indicateur de tri est affiché dans l'en-tête de cellule
des colonnes utilisées pour le tri.
● Faites glisser les bordures de colonne pour redimensionner les colonnes.
Guide de l'utilisateur
206 PUBLIC Data Insight
● Cliquez sur le petit X dans le coin supérieur droit d'un en-tête de colonne pour masquer celle-ci. Ou cliquez
sur le petit X uniquement pour la partie Avant ou Après.
● Pour restreindre les éléments affichés, utilisez les filtres qui figurent au-dessus de la zone du diagramme.
Par exemple, sélectionnez Adresse Adresses corrigées Rue pour afficher les enregistrements qui
nécessitent des corrections de numéro et nom de rue.
● Utilisez les boutons de navigation dans les pages ( ) pour afficher une autre
page de données, si plusieurs sont disponibles.
Informations associées
Recherchez les résultats de textes ou de chaînes de texte et filtrez des colonnes spécifiques à rechercher.
Utilisez le champ Rechercher pour rechercher une chaîne de texte particulière dans vos données. Saisissez un
ou plusieurs termes de recherche. Affinez votre recherche en sélectionnant une colonne dans la liste
déroulante et appuyez sur Entrée . Vous pouvez également cliquer sur l'icône Loupe pour rechercher les
données. L'Assistant de nettoyage met en évidence les résultats de la recherche dans la vue des données.
Remarque
Si la vue des données est déjà filtrée, la recherche a lieu uniquement au sein des résultats filtrés. Les filtres
situés au-dessus de la vue de données affichent également le nombre d'enregistrements incluant le terme
de recherche.
Pour supprimer un terme de recherche et les résultats de recherche qui lui sont associés, cliquez sur le petit X
qui s'affiche dans la zone Rechercher.
Le Visualiseur des détails d'enregistrement affiche toutes les informations disponibles pour l'enregistrement
sélectionné :
● Chaque colonne disponible, avant et après le nettoyage, y compris celles affectées par l'Assistant de
nettoyage pendant le nettoyage.
● Affectation d'adresses ou de données ne concernant pas l’adresse et codes de statut qui informent sur les
éléments modifiés ou les raisons pour lesquelles l'enregistrement n'a pas pu être mis à jour.
Cliquez sur Afficher les colonnes et sélectionnez les colonnes supplémentaires qui contiennent des codes qui
spécifient des détails précis sur les enregistrements.
Guide de l'utilisateur
Data Insight PUBLIC 207
Pour obtenir des informations complètes sur les colonnes supplémentaires et les informations qu'elles
contiennent, voir Codes d’information et de statut dans d’autres colonnes de données [page 239].
La solution de nettoyage des données présentée par l'Assistant de nettoyage comprend les options de
nettoyage des données recommandées. Le cas échéant, vous pouvez modifier ces options pour répondre à vos
besoins.
Les options disponibles pour la colonne sélectionnée sont affichées dans le volet Modifier les options de
nettoyage.
Quand vous modifiez une option, les données affichées sont instantanément mises à jour et mises en
surbrillance pour refléter l'option sélectionnée.
Options générales
L'option Casse s'applique à toutes les colonnes incluses dans votre solution de nettoyage des données.
Casse Description
Abc Xyz Applique des règles de mise en majuscules des premières lettres.
Quand le groupe de colonnes Personne, Fonction ou Société est sélectionné, vous pouvez activer l'option
Signes diacritiques.
María Hernández Conserve les accents qui figurent dans les colonnes Personne, Fonction et Société.
Maria Hernandez Supprime tous les accents des colonnes Personne, Fonction et Société.
Guide de l'utilisateur
208 PUBLIC Data Insight
Options d'adresses
Si une colonne d'adresse est sélectionnée, vous pouvez activer les options suivantes.
Remarque
Dans certains pays, il n'est pas acceptable d'abréger ou de développer chacun de ces composants
d'adresse. Dans ce cas, votre modification de format n'a pas d'effet sur les données.
100 N Main St Ste 300 Abrège tous les éléments pouvant être abrégés dans le numéro et nom de rue. Aucune
ponctuation n'est insérée.
100 N. Main St. Ste. 300 Abrège tous les éléments pouvant être abrégés dans le numéro et nom de rue. Une ponc
tuation est insérée pour chaque mot abrégé.
100 North Main Street Suite Utilise la forme complète de tous les mots du numéro et nom de rue.
300
PO Box 100 Abrège tous les éléments pouvant être abrégés dans l'adresse de boîte postale. Aucune
ponctuation n'est insérée.
P.O. Box 100 Abrège tous les éléments pouvant être abrégés dans l'adresse de boîte postale. Une ponc
tuation est insérée pour chaque mot abrégé.
Post Office Box 100 Utilise la forme complète de tous les mots de l'adresse de boîte postale.
Dans certains pays, la version complète n'est pas officiellement acceptée. Donc, même si
cette option est sélectionnée, certaines adresses postales peuvent être abrégées.
CA Abrège la région
Dans certains pays, la version abrégée n'est pas officiellement acceptée. Donc, même si
cette option est sélectionnée, certains noms de région peuvent être développés.
Options de téléphone
Quand une colonne de téléphone est sélectionnée, vous pouvez définir le format du numéro de téléphone. Les
numéros de téléphone des pays utilisant le plan de numérotation nord-américain sont mis en forme selon votre
sélection. Les numéros de téléphone des autres pays ne sont pas concernés par cette option.
(213) 608-8126 Met entre parenthèses le code de zone et met un trait d'union entre les deux dernières sec
tions.
Guide de l'utilisateur
Data Insight PUBLIC 209
Format du téléphone Description
213.608.8126 Sépare les trois sections du numéro de téléphone par des points.
Options de date
Quand une colonne de date est sélectionnée, vous pouvez définir le format de la date.
9/26/2012 Organise la date dans l'ordre mois, jour et année avec des barres obliques comme sépara
teurs et sans ajout de zéros.
09/26/2012 Organise la date dans l'ordre mois, jour et année avec des barres obliques comme sépara
teurs et avec ajout de zéros.
26/9/2012 Organise la date dans l'ordre jour, mois et année avec des barres obliques comme sépara
teurs et sans ajout de zéros.
26/09/2012 Organise la date dans l'ordre jour, mois et année avec des barres obliques comme sépara
teurs et avec ajout de zéros.
9.26.2012 Organise la date dans l'ordre mois, jour et année avec des points comme séparateurs et
sans ajout de zéros.
09.26.2012 Organise la date dans l'ordre mois, jour et année avec des points comme séparateurs et
avec ajout de zéros.
26.9.2012 Organise la date dans l'ordre jour, mois et année avec des points comme séparateurs et
sans ajout de zéros.
26.09.2012 Organise la date dans l'ordre jour, mois et année avec des points comme séparateurs et
avec ajout de zéros.
9-26-2012 Organise la date dans l'ordre mois, jour et année avec des tirets comme séparateurs et sans
ajout de zéros.
09-26-2012 Organise la date dans l'ordre mois, jour et année avec des tirets comme séparateurs et avec
ajout de zéros.
26-9-2012 Organise la date dans l'ordre jour, mois et année avec des tirets comme séparateurs et sans
ajout de zéros.
26-09-2012 Organise la date dans l'ordre jour, mois et année avec des tirets comme séparateurs et avec
ajout de zéros.
2012 年 9 月 26 日 Organise la date dans l'ordre année, mois et jour sans ajout de zéros. Les caractères chi
nois/japonais sont utilisés comme séparateurs.
2012 年 09 月 26 日 Organise la date dans l'ordre année, mois et jour avec ajout de zéros. Les caractères chi
nois/japonais sont utilisés comme séparateurs.
Guide de l'utilisateur
210 PUBLIC Data Insight
que vous configurez dans l'assistant peuvent aider à préparer les données afin d'obtenir des résultats de
nettoyage et de correspondance plus précis.
Une seule transformation est appliquée à une seule colonne. Vous pouvez configurer plusieurs transformations
à appliquer à la même colonne ou à des colonnes différentes.
1. Pour accéder à la configuration des transformations dans l'assistant, continuez dans l'assistant jusqu'à
l'étape 4. Pour accéder à la configuration des transformations pour une solution de nettoyage des données
ayant déjà été créée, ouvrez cette dernière, cliquez sur Afficher les résultats du nettoyage, sur Afficher les
données, puis sur Transformations de base.
2. Sélectionnez le type de transformation à configurer dans la liste déroulante.
Transformation Description
Rechercher et remplacer Remplace le texte spécifié par le nouveau texte que vous indiquez.
Supprimer les espaces Supprime les espaces avant et/ou après le texte.
Remplacer les cellules Insère le texte spécifié à la place des champs vides ou nuls.
vides
Supprimer les caractères Supprime les caractères non imprimables suivants, également nommés caractères de con
non imprimables trôle :
○ Caractère d'appel
○ Espace arrière
○ Tabulation horizontale
○ Saut de ligne
○ Saut de page
○ Retour chariot
○ Echappement
○ Suppression
3. Dans la fenêtre Ajouter une transformation, configurez la transformation selon la description ci-dessous.
Les prochaines étapes dépendent du choix de la transformation.
Transformation Etapes
Rechercher et remplacer Dans la zone Remplacer, saisissez le texte à supprimer de la colonne sélectionnée. Dans la
zone par, saisissez le texte qui doit remplacer le texte supprimé. Cliquez sur Ajouter.
Utilisez les boutons flèche vers le haut et vers le bas pour réorganiser les valeurs à recher
cher et remplacer.
Supprimer les espaces Choisissez Espaces de début pour supprimer les espaces avant le texte dans la colonne sé
lectionnée.
Choisissez Espaces de fin pour supprimer les espaces après le texte dans la colonne sélec
tionnée.
Guide de l'utilisateur
Data Insight PUBLIC 211
Transformation Etapes
Remplacer les valeurs Dans la zone par, saisissez le texte qui doit remplacer les champs vides dans la colonne sé
nulles par <valeur par lectionnée.
défaut>
Supprimer les guillemets Choisissez Guillemets doubles pour supprimer les guillemets doubles (") qui se trouvent
n'importe où dans la colonne sélectionnée.
Choisissez Guillemets simples pour supprimer les guillemets simples (') qui se trouvent
n'importe où dans la colonne sélectionnée.
Supprimer les caractères Choisissez Supprimer les caractères non imprimables pour supprimer les caractères de
non imprimables contrôle de la colonne sélectionnée.
4. Dans la liste déroulante Sélectionner la colonne à transformer, sélectionnez la colonne sur laquelle
appliquer la transformation.
5. Cliquez sur OK pour enregistrer vos paramètres et fermer la fenêtre.
Vous pouvez cliquer sur la croix (X) pour supprimer une transformation.
Remarque
Les transformations sont toujours appliquées dans cet ordre pour chaque champ : remplacer les
cellules vides, supprimer les caractères non imprimables, supprimer les espaces, supprimer les
guillemets et rechercher-remplacer.
6. Si vous avez terminé la configuration de l'Assistant de nettoyage, cliquez sur Terminer. Si vous travaillez
dans la fenêtre Résultats du nettoyage, cliquez sur Appliquer pour appliquer maintenant les
transformations aux données.
Remarque
Si vous cliquez sur Appliquer dans Résultats du nettoyage, sachez que selon la taille de la table de
données, le nouveau nettoyage et la nouvelle correspondance peuvent durer un certain temps. Une
fenêtre de message s'ouvre pour donner la possibilité d'exécuter ce processus en arrière-plan. Cliquez
sur Exécution en arrière-plan pour continuer le nouveau traitement et revenir à la liste Solutions de
nettoyage des données où vous pouvez accéder à d'autres solutions de nettoyage des données
pendant l'exécution du processus.
Si vous venez de terminer l'assistant ou de cliquer sur Exécution en arrière-plan après application des
modifications dans Résultats du nettoyage, vous revenez à la liste Solutions de nettoyage des données, où
vous pouvez voir la solution de nettoyage des données en cours de traitement. La taille de la table de
données utilisée dans cette solution de nettoyage des données détermine le temps nécessaire au
traitement de cette dernière. Cliquez sur le symbole Actualiser ( ) pour voir les mises à jour de statut.
Exportez des données vers un fichier CSV (Comma Separated Values, séparés par une virgule) pour le partager
avec des collègues qui peuvent, par exemple, décider de publier la solution de nettoyage des données à utiliser
sur vos données réelles.
Guide de l'utilisateur
212 PUBLIC Data Insight
Remarque
Lorsque vous exportez des données à partir de la vue de données Résultats du nettoyage, utilisez le tableur
pour ouvrir le fichier et afficher les données. Le fichier exporté affiche uniquement les données nettoyées, il
n'inclut pas les données d'origine, avant le nettoyage.
Exporter au format CSV Enregistre tous les enregistrements dans un fichier CSV,
compressé dans un fichier ZIP.
Exporter les données filtrées vers le fichier CSV Enregistre les enregistrements répondant à vos critères de
filtre dans un fichier CSV, compressé dans un fichier ZIP.
Les enregistrements filtrés peuvent inclure plusieurs pa
ges de données.
Exporter les données de la vue en cours vers le fichier CSV Enregistre les enregistrements de la vue de la page ac
tuelle dans un fichier CSV, compressé dans un fichier ZIP.
3. Facultatif. Cliquez sur Exécution en arrière-plan pour revenir à la liste des Solutions de nettoyage des
données où vous pouvez accéder à d'autres solutions de nettoyage des données pendant l'exécution du
processus.
Dès qu'un traitement est terminé, le statut de la solution de nettoyage des données est à nouveau « Prêt ».
Vous pouvez ensuite ouvrir la solution.
Si vous n'avez pas cliqué sur Exécution en arrière-plan, l'exportation est traitée pendant que la barre d'état
affiche la progression.
4. Dans la fenêtre de message, cliquez sur le bouton Enregistrer.
5. Spécifiez le fichier et l'emplacement du fichier .zip contenant le fichier .csv.
L'écran Résultats de la correspondance affiche les résultats du traitement de mise en correspondance d'après
le thème et les règles de correspondance sélectionnés dans l'Assistant de nettoyage.
Pour afficher des résultats de correspondance plus détaillés, cliquez sur le bouton Afficher les résultats de la
correspondance dans la vue Synthèse. Les résultats de correspondance s'affichent dans un graphique, dans
lequel les enregistrements avec correspondances, les enregistrements sans correspondance et les
correspondances partielles sont indiqués.
Guide de l'utilisateur
Data Insight PUBLIC 213
Options d'affichage des résultats de correspondance
Option Description
Afficher les Affiche une représentation graphique des résultats de la correspondance. Vous pouvez voir le nom
diagrammes bre d'enregistrements avec correspondances, le nombre d'enregistrements sans correspondance
le niveau de confiance des correspondances et les catégories de non-correspondances.
Afficher les données Affiche les enregistrements avec correspondances, sans correspondance et les correspondances
partielles de vos données.
Dans la vue des données, vous pouvez également accéder aux options de correspondance modifia-
bles.
Terminologie
● Les correspondances à fiabilité élevée sont exactement semblables ou ont une probabilité de
similitude élevée.
● Les correspondances à fiabilité moyenne sont suffisamment similaires pour être considérées
comme correspondantes, mais vous pouvez les vérifier parce que quelque chose est contesta
ble au sujet de la correspondance. Cliquez sur la barre Moyen du diagramme, puis sur Afficher
les données pour voir les enregistrements à fiabilité de correspondance moyenne.
● Les correspondances à fiabilité faible sont des groupes de deux ou trois enregistrements dans
lesquels il existe une correspondance indirecte. Vous pouvez vérifier les enregistrements avec
correspondances pour vérifier que les résultats sont conformes aux prévisions. Cliquez sur la
barre Faible du diagramme, puis sur Afficher les données pour voir les enregistrements à fiabi-
lité de correspondance faible.
Correspondance indi Une paire d'enregistrements du même groupe de correspondance qui ne correspondent pas. Une
recte correspondance indirecte se produit quand des enregistrements correspondent par association.
Exemple :
Correspondance Une paire ou un groupe d'enregistrements qui semblent être des doublons potentiels.
Groupe de correspon Une collection d'enregistrements comprenant un enregistrement principal et un ou plusieurs sub
dance ordonnés correspondant les uns aux autres.
Dans la vue de données Résultats de la correspondance, les groupes de correspondance sont listés
par ID de groupe (numéro d'identification). L'ID de groupe n'est pas significatif en lui-même, c'est
simplement un moyen d'identifier le groupe de correspondance.
Guide de l'utilisateur
214 PUBLIC Data Insight
Terme Définition
Correspondance par Enregistrements qui ne correspondent pas, mais sont proches des critères de correspondance. Il
tielle existe deux catégories de correspondances partielles :
Non-correspondance Enregistrements qui ne correspondent pas à d'autres. Les enregistrements sans correspondance
comprennent les sous-catégories correspondance partielle et unique.
Exigence Niveau selon lequel les enregistrements doivent correspondre afin d'être considérés comme cor
respondances. Exigence de la correspondance faible signifie un faible pourcentage de similitude.
Exigence de la correspondance élevée signifie un fort pourcentage de similitude.
Unique Enregistrements qui ne correspondent pas voire qui correspondent partiellement à d'autres. Les
enregistrements uniques représentent une sous-catégorie des enregistrements sans correspon
dance.
Les diagrammes des résultats de la correspondance Assistant de nettoyage aident à mieux comprendre
combien d'enregistrements correspondants contiennent les données et à quel niveau les données
bénéficieront du traitement de correspondance. Cliquez sur les diagrammes pour découvrir toutes les
informations proposées.
Dans l'écran Présentation, pour afficher les diagrammes de correspondance, cliquez sur Afficher les résultats
de la correspondance.
Cliquez sur la barre Enregistrements correspondants du diagramme pour afficher les niveaux de fiabilité des
enregistrements correspondants.
Guide de l'utilisateur
Data Insight PUBLIC 215
Cliquez sur Enregistrements non correspondants pour voir de quelle manière les enregistrements se
décomposent dans les deux catégories de non-correspondance (correspondance partielle et enregistrements
uniques).
Vous pouvez également utiliser les filtres qui figurent au-dessus de la zone du diagramme pour restreindre des
éléments affichés. Par exemple, sélectionnez Enregistrements non correspondants Correspondances
partielles pour afficher ces dernières. Les filtres que vous définissez déterminent les données affichées dans
la vue.
Les informations reportées dans les diagrammes figurent également dans le tableau Résumé sous le
diagramme.
Vous pouvez faire glisser les diviseurs entre les volets pour élargir ou rétrécir un diagramme.
Dans l'écran Assistant de nettoyage Présentation, pour voir les résultats du traitement de correspondance,
cliquez sur le bouton Afficher les résultats de la correspondance, puis sur Afficher les données.
Les résultats de la correspondance que vous voyez dans l'Assistant de nettoyage servent à titre d'aperçu
uniquement. Aucune modification des données n'a lieu tant que le job n'a pas été traité dans le Workbench de
Data Services .
La vue de données Résultats de la correspondance affiche les enregistrements correspondants regroupés par
ID de groupe.
Les correspondances partielles associées au groupe de correspondance sélectionné sont affichées, en italique
et sous une ligne de pointillés dans chaque groupe de correspondance. Les correspondances partielles ne font
pas partie du groupe de correspondance, mais elles le pourraient si les options de correspondance étaient
définies différemment.
Tous les groupes de correspondance comportant un indicateur rouge dans leur colonne ID de groupe peuvent
mériter une attention particulière : il est possible que quelque chose soit à corriger dans ce groupe de
correspondance. L'infobulle au-dessus de l'indicateur rouge apporte davantage d'instructions.
Dans la partie inférieure de la fenêtre, vous pouvez voir les enregistrements non correspondants uniques dans
l'onglet Enregistrements non correspondants.
Guide de l'utilisateur
216 PUBLIC Data Insight
Personnalisation de la vue.
● Cliquez sur Afficher les colonnes. Sélectionnez les colonnes à afficher. Désélectionnez les colonnes à
masquer.
● Dans la section Enregistrements non correspondants, cliquez sur Critères de tri pour choisir une ou
plusieurs colonnes sur lesquelles effectuer le tri, dans l'ordre croissant (de A à Z) ou décroissant (de Z à A).
Un petit indicateur de tri est affiché dans l'en-tête de cellule des colonnes utilisées pour le tri.
● Faites glisser les bordures de colonne pour redimensionner les colonnes.
● Cliquez sur le petit X dans le coin supérieur droit d'un en-tête de colonne pour masquer celle-ci.
● Utilisez les filtres qui figurent au-dessus de la zone du diagramme pour restreindre la portée des éléments
affichés.
● Utilisez les boutons de navigation dans les pages ( ) pour afficher une autre
page de données, si plusieurs sont disponibles.
Utilisez le champ Rechercher pour rechercher une chaîne de texte particulière dans vos données. Saisissez
le(s) terme(s) de recherche, choisissez une colonne dans la liste déroulante si vous souhaitez affiner la
recherche, puis appuyez sur la touche Entrée ou cliquez sur l'icône de loupe pour rechercher les données. Les
résultats de recherche apparaissent en surbrillance dans la vue de données.
Remarque
Si la vue des données des enregistrements de correspondance est déjà filtrée, la recherche a lieu
uniquement au sein des résultats filtrés. Les filtres situés au-dessus de la vue de données affichent
également le nombre d'enregistrements incluant le terme de recherche.
La recherche au sein des Résultats de la correspondance inclut les enregistrements de correspondance et les
enregistrements de non correspondance mais pas les correspondances partielles.
Pour supprimer un terme de recherche et les résultats de recherche qui lui sont associés, cliquez sur le petit X
qui s'affiche dans la zone Rechercher.
Vous pouvez exporter vos données dans un fichier CSV (Comma Separated Values, séparés par une virgule)
pour pouvoir le partager avec des collègues susceptibles d'avoir besoin de voir les résultats de correspondance
avant que vous finalisiez la solution de nettoyage des données et que vous la publiiez pour l'utiliser sur vos
données réelles. Les fichiers CSV peuvent être ouverts avec un tableur comme Microsoft Excel.
Lorsque vous exportez des données à partir de la vue de données Résultats de la correspondance, le fichier
exporté affiche les enregistrements de correspondance regroupés par numéro de groupe. Les
correspondances partielles et les enregistrements uniques ne figurent pas dans le fichier exporté.
Guide de l'utilisateur
Data Insight PUBLIC 217
1. Cliquez sur Exporter les données.
2. Choisissez parmi les options d'exportation suivantes, puis cliquez sur OK.
Exporter au format CSV Enregistre tous les enregistrements de correspondance dans un fichier CSV, compressé
dans un fichier ZIP.
Exporter les données Enregistre les enregistrements de correspondance répondant à vos critères de filtre dans
filtrées vers le fichier CSV un fichier CSV, compressé dans un fichier ZIP. Les enregistrements filtrés peuvent inclure
plusieurs pages de données.
Exporter les données de la Enregistre les enregistrements de correspondance de la vue de la page actuelle dans un
vue en cours vers le fichier fichier CSV, compressé dans un fichier ZIP.
CSV
3. Cliquez sur Exécution en arrière-plan pour revenir à la liste des Solutions de nettoyage des données où vous
pouvez accéder à d'autres solutions de nettoyage des données pendant l'exécution du processus. Dès
qu'un traitement est terminé, le statut de la solution de nettoyage des données est à nouveau Prêt et vous
pouvez ouvrir la solution.
Si vous n'avez pas cliqué sur Exécution en arrière-plan, l'exportation est traitée pendant que la barre d'état
affiche la progression.
Une fenêtre de message s'affiche pour vous informer de la fin de l'exportation.
4. Dans la fenêtre de message, cliquez sur le bouton Enregistrer.
5. Spécifiez le fichier et l'emplacement du fichier .zip contenant le fichier .csv.
Notez que le fichier .csv est toujours nommé comme suit :
DCA_<[nom solution]>_MATCH-<[horodatage date]>_<[horodatage heure]>.csv
Informations associées
Le Visualiseur de comparaison d'enregistrements affiche toutes les informations disponibles pour les
enregistrements sélectionnés :
Guide de l'utilisateur
218 PUBLIC Data Insight
● Chaque colonne de données pertinente, avec les différences entre les deux enregistrements marquées en
rouge.
● Les colonnes spécifiques à la correspondance qui en apprennent plus sur le processus de correspondance.
Les colonnes de correspondance répertoriées ci-dessous affichent les données utilisées pour la
correspondance.
La version Correspondance d'une colonne peut ne pas correspondre exactement à son homologue nommé
colonne de non-correspondance (par exemple, Nom de famille correspondant par rapport à Nom de famille).
Les colonnes de correspondance sont simplifiées à des fins de correspondance : mots étrangers, ponctuation,
espaces et signes diacritiques sont supprimés pour simplifier le processus de comparaison. Par exemple, le
nom de famille "de Rosier" est stocké dans la colonne Nom de famille correspondante sous la forme "ROSIER".
Certaines colonnes proposent également des alternatives. Les alternatives comptent pour les différentes
orthographes, les variantes et les formes standard.
Colonnes de correspondance :
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 219
Colonnes de date, de courrier électronique, de téléphone, de société et de numéro de sécurité sociale [page
261]
Si les résultats de la correspondance ne répondent pas à vos attentes, vous pouvez modifier les options de
correspondance dans la vue de données Résultats de la correspondance.
Les scénarios suivants peuvent vous inviter à modifier les options de correspondance :
Conseil
Lorsque vous appliquez les options de correspondance mises à jour, la correspondance est effectuée à
nouveau. Sachez que selon la quantité de données, le nouveau traitement des correspondances peut durer
un certain temps.
Guide de l'utilisateur
220 PUBLIC Data Insight
Options de correspondance des personnes Description
John Schmidt = J. Schmidt Un nom avec un prénom abrégé par une majuscule peut correspondre
au même nom avec un prénom orthographié entièrement.
John Schmidt = John-Paul Schmidt Un nom avec un prénom unique peut correspondre au même nom
avec un prénom composé.
John Schmidt = W. John Schmidt Une attention particulière est portée pour permettre une correspon
dance quand le prénom d'un enregistrement correspond au deuxième
prénom d'un autre enregistrement.
John Schmidt = Johnathan Schmidt Les variantes de nom sont prises en compte lors de la mise en corres
pondance des prénoms.
John Schmidt = John S. Un nom avec un nom de famille abrégé par une majuscule peut corres
pondre au même nom avec un nom de famille orthographié entière
ment.
John Schmidt = John Schmidt Bauer Un nom avec un nom de famille unique peut correspondre au même
nom avec un nom de famille composé.
John Schmidt = John Schmidt Jr. Un nom avec un suffixe peut correspondre au même nom sans suffixe.
Royal Medical Center = RMC Un nom de société complet peut correspondre à ses initiales.
Linda's Restaurant = Linda's Une version abrégée d'un nom de société peut correspondre à un nom
de société plus long si les mots du nom abrégé figurent dans le nom
complet.
International Group = Intl. Grp. Les mots abrégés d'un nom de société peuvent correspondre au mots
orthographiés entièrement.
First Bank #72 = First Bank #52 Les noms de société peuvent correspondre même si les numéros sont
différents.
High Tech Pty. Ltd. = High Tech Les mots non significatifs ne sont pas pris en compte lors de la com
paraison des noms de société.
100 Main St = 100 Main Une adresse avec un type de rue peut correspondre à la même
adresse sans type de rue.
100 Main St = 100 N Main St Une adresse avec direction peut correspondre à la même adresse
sans direction.
100 Main St = 100 Main St Suite 200 Une adresse avec des données secondaires peut correspondre à la
même adresse sans données secondaires.
100 Main St = 100 Main Ave Une adresse avec un type de rue peut correspondre à la même
adresse avec un type de rue différent.
100 S Main St = 100 N Main St Une adresse avec direction peut correspondre à la même adresse
avec une direction différente.
6. Cliquez sur Appliquer pour exécuter à nouveau le traitement des correspondances sur ces données à l'aide
des options de correspondance mises à jour.
Guide de l'utilisateur
Data Insight PUBLIC 221
Une fenêtre de message vous donne la possibilité d'exécuter ce processus en arrière-plan. Cliquez sur
Exécution en arrière-plan pour revenir à la liste des Solutions de nettoyage des données où vous pouvez accéder
à d'autres solutions de nettoyage des données pendant l'exécution du processus. Dès qu'un traitement de
correspondance est terminé, le statut de la solution de nettoyage des données est à nouveau Prêt et vous
pouvez ouvrir la solution pour afficher un aperçu de vos modifications de correspondance.
Si vous ne cliquez pas sur Exécution en arrière-plan, la fenêtre Aperçu des modifications de correspondance
s'ouvre dès qu'un traitement de correspondance est terminé.
Analysez les résultats dans la fenêtre Aperçu des modifications de correspondance. Observez dans quelle
mesure votre modification a affecté le nombre de groupes de correspondance, le nombre de nouvelles non-
correspondances et le nombre total d'enregistrements concernés. Après avoir vérifié ce résumé, cliquez sur
Aperçu pour voir ces modifications appliquées aux données ou cliquez sur Annuler pour annuler les
modifications.
Vous revenez à l'écran Résultats de la correspondance. Si vous avez cliqué sur Aperçu, vous pouvez voir les
groupes de correspondance mis à jour. Pour conserver cette modification, cliquez sur Appliquer. Pour annuler
cette modification, cliquez sur Annuler.
Si le thème et/ou les règles de correspondance que vous avez sélectionnés dans l'assistant ne répondent pas à
vos attentes, vous pouvez les modifier dans la vue de données Résultats de la correspondance.
Conseil
Lorsque vous appliquez le thème ou les règles de correspondance mises à jour, la correspondance est
effectuée à nouveau. Sachez que selon la quantité de données, le nouveau traitement des correspondances
peut durer un certain temps.
Remarque
Vous pouvez activer la correspondance, même si vous avez sélectionné Aucune correspondance dans
l'assistant. Voir les étapes ci-dessous.
Guide de l'utilisateur
222 PUBLIC Data Insight
6. Le cas échéant, cliquez sur l'icône crayon ou sur le lien Modifier les colonnes [...] à utiliser pour spécifier les
colonnes à utiliser pour la correspondance.
7. Cliquez sur Appliquer pour exécuter à nouveau le traitement des correspondances sur ces données à l'aide
du thème et/ou des règles de correspondance mises à jour.
Une fenêtre de message vous donne la possibilité d'exécuter ce processus en arrière-plan. Cliquez sur
Exécution en arrière-plan pour revenir à la liste des Solutions de nettoyage des données où vous pouvez accéder
à d'autres solutions de nettoyage des données pendant l'exécution du processus. Dès qu'un traitement de
correspondance est terminé, le statut de la solution de nettoyage des données est à nouveau Prêt et vous
pouvez ouvrir la solution pour afficher un aperçu de vos modifications de correspondance.
Si vous ne cliquez pas sur Exécution en arrière-plan, la fenêtre Aperçu des modifications de correspondance
s'ouvre dès qu'un traitement de correspondance est terminé.
Analysez les résultats dans la fenêtre Aperçu des modifications de correspondance. Observez dans quelle
mesure votre modification a affecté le nombre de groupes de correspondance, le nombre de nouvelles non-
correspondances et le nombre total d'enregistrements concernés. Après avoir vérifié ce résumé, cliquez sur
Aperçu pour voir ces modifications appliquées aux données ou cliquez sur Annuler pour annuler les
modifications.
Vous revenez à l'écran Résultats de la correspondance. Si vous avez cliqué sur Aperçu, vous pouvez voir les
groupes de correspondance mis à jour. Pour conserver cette modification, cliquez sur Appliquer. Pour annuler
cette modification, cliquez sur Annuler.
L'Assistant de nettoyage effectue une mise en correspondance en fonction du thème et des règles de
correspondance sélectionnés dans l' Assistant de nettoyage. Dans certains cas, l'Assistant de nettoyage utilise
plusieurs règles de correspondance qui font partie de la catégorie de règle sélectionnée dans l'assistant. Par
exemple, si vous sélectionnez la règle de correspondance Person and Address dans l'assistant, l'Assistant de
nettoyage utilise plusieurs règles de correspondance Person and Address afin de rechercher les
enregistrements correspondants, chacune étant conçue pour un type d'adresse spécifique.
La colonne Règle de correspondance, que vous pouvez voir dans la vue de données Résultats de la
correspondance et dans le Visualiseur de comparaison d'enregistrements affiche la règle de correspondance
spécifique à l'origine du fait qu'une paire d'enregistrements a été considérée comme enregistrements
correspondants.
Vous pouvez sélectionner plusieurs règles de correspondance dans l'Assistant de nettoyage. Une
correspondance est déterminée quand les enregistrements répondent aux critères de l'une des règles de
correspondance. Quand une correspondance est trouvée, aucune autre comparaison n'est effectuée.
Par exemple, l'Assistant de nettoyage effectue un traitement des correspondances à l'aide des règles de
correspondance Person and ID et Person and Phone. Si une paire d'enregistrements correspond d'après la
règle de correspondance Person and ID, la comparaison d'après la règle Person and Phone n'est pas nécessaire
et n'est pas effectuée.
Guide de l'utilisateur
Data Insight PUBLIC 223
L'Assistant de nettoyage applique les règles de correspondance dans l'ordre suivant :
Guide de l'utilisateur
224 PUBLIC Data Insight
Règle de correspondance Description Colonnes comparées
Person and General Delivery Address Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes et les adresses de livraison générale
● Nom de famille
ou de poste restante.
● Titre de maturité
● Ville
● Code postal
● Pays
Guide de l'utilisateur
Data Insight PUBLIC 225
Règle de correspondance Description Colonnes comparées
Guide de l'utilisateur
226 PUBLIC Data Insight
Règles de correspondance des noms de famille et adresses
Family and Postal Address 1 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Numéro de boîte postale
les adresses postales.
● Code postal
● Pays
Family and Postal Address 2 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Numéro de boîte postale
les adresses postales dans les scripts
● Code postal
chinois et japonais.
● Pays
Family and Rural Address 1 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Numéro de route rurale
les adresses rurales dans lesquels les
● Numéro de boîte postale de la
deux comportent un numéro de boîte
route rurale
postale.
● Ville
● Code postal
● Pays
Family and Rural Address 2 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Numéro de route rurale
les adresses rurales dans lesquels un
● Ville
numéro de boîte postale manque pour
● Code postal
l'un des deux.
● Pays
Family and General Delivery Address Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Ville
les adresses de livraison générale ou de
● Code postal
poste restante.
● Pays
Family and Building Address Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les adresses qui ont été validées pour le
● Numéro de la rue
nom de bâtiment lors du processus de
● Adresse secondaire
nettoyage.
● Nom de bâtiment
● Ville
● Région
● Code postal
● Pays
Family and Street Address 1 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les numéros et noms de rue dans les
● Numéro de la rue
pays qui n'ont pas leur propre règle de
● Adresse secondaire
correspondance nationale pour les nu
méros et noms de rue. ● Ville
● Région
● Code postal
● Pays
Guide de l'utilisateur
Data Insight PUBLIC 227
Règle de correspondance Description Colonnes comparées
Family and Street Address 2 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les numéros et noms de rue dans les
● Numéro de la rue
scripts chinois et japonais.
● Adresse secondaire
● Nom de bâtiment
● Ville
● Région
● Code postal
● Pays
Family and Street Address 3 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les numéros et noms de rue aux Etats-
● Numéro de la rue
Unis.
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Family and Street Address 4 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les numéros et noms de rue au Canada
● Nom de la rue 2
et en Grande-Bretagne.
● Numéro de la rue
● Adresse secondaire
● District
● Ville
● Région
● Code postal
● Pays
Family and Street Address 5 Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Nom de la rue
les numéros et noms de rue qui, lors du
● Numéro de la rue
processus de nettoyage, ont été validés
● Adresse secondaire
uniquement pour la région ou le pays
(ou bien sans niveau d'affectation). ● Ville
● Région
● Code postal
● Pays
Family and Dual Address Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Ligne d'adresse
les adresses dans lesquels un des élé
● Adresse double
ments comporte une adresse à la fois
● Ville
dans la colonne Address et dans la co
lonne Dual Address. ● Région
● Code postal
● Pays
Guide de l'utilisateur
228 PUBLIC Data Insight
Règles de correspondance des sociétés et adresses
Firm and Postal Address 1 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Numéro de boîte postale
et les adresses postales.
● Code postal
● Pays
Firm and Postal Address 2 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Numéro de boîte postale
et les adresses postales dans les scripts
● Code postal
chinois et japonais.
● Pays
Firm and Rural Address 1 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Numéro de route rurale
et les adresses rurales dans lesquels les
● Numéro de boîte postale de la
deux comportent un numéro de boîte
route rurale
postale.
● Ville
● Code postal
● Pays
Firm and Rural Address 2 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Numéro de route rurale
et les adresses rurales dans lesquels un
● Ville
numéro de boîte postale manque pour
● Code postal
l'un des deux.
● Pays
Firm and General Delivery Address Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Ville
et les adresses de livraison générale ou
● Code postal
de poste restante.
● Pays
Firm and Building Address Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de bâtiment
et les adresses qui ont été validées pour
● Nom de la rue
le nom de bâtiment lors du processus
● Numéro de la rue
de nettoyage.
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Firm and Street Address 1 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de la rue
et les numéros et noms de rue dans les
● Numéro de la rue
pays qui n'ont pas leur propre règle de
● Adresse secondaire
correspondance nationale pour les nu
méros et noms de rue. ● Ville
● Région
● Code postal
● Pays
Guide de l'utilisateur
Data Insight PUBLIC 229
Règle de correspondance Description Colonnes comparées
Firm and Street Address 2 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de la rue
et les numéros et noms de rue dans les
● Numéro de la rue
scripts chinois et japonais.
● Adresse secondaire
● Nom de bâtiment
● Ville
● Région
● Code postal
● Pays
Firm and Street Address 3 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de la rue
et les numéros et noms de rue aux
● Numéro de la rue
Etats-Unis.
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Firm and Street Address 4 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de la rue
et les numéros et noms de rue au Ca
● Nom de la rue 2
nada et en Grande-Bretagne.
● Adresse secondaire
● District
● Ville
● Région
● Code postal
● Pays
Firm and Street Address 5 Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Nom de la rue
et les numéros et noms de rue qui, lors
● Numéro de la rue
du processus de nettoyage, ont été vali
● Adresse secondaire
dés uniquement pour la région ou le
pays (ou bien sans niveau d'affecta- ● Ville
tion). ● Région
● Code postal
● Pays
Firm and Dual Address Identifie les enregistrements corres ● Nom d'organisation
pondants d'après les noms de société ● Ligne d'adresse
et les adresses dans lesquels l'un des
● Adresse double
éléments comporte une adresse à la
● Ville
fois dans la colonne Address et dans la
colonne Dual Address. ● Région
● Code postal
● Pays
Guide de l'utilisateur
230 PUBLIC Data Insight
Règles de correspondance des personnes, sociétés et adresses
Person and Firm and Postal Address 1 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
postales.
● Titre de maturité
● Nom d'organisation
● Numéro de boîte postale
● Code postal
● Pays
Person and Firm and Postal Address 2 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Nom de famille
nes, les noms de société et les adresses
● Titre de maturité
postales dans les scripts chinois et ja
● Nom d'organisation
ponais.
● Numéro de boîte postale
● Code postal
● Pays
Person and Firm and Rural Address 1 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
rurales dans lesquels les deux compor
● Titre de maturité
tent un numéro de boîte postale.
● Nom d'organisation
● Numéro de route rurale
● Numéro de boîte postale de la
route rurale
● Ville
● Code postal
● Pays
Person and Firm and Rural Address 2 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
rurales dans lesquels un numéro de
● Titre de maturité
boîte postale manque pour l'un des
deux ou les deux. ● Nom d'organisation
● Numéro de route rurale
● Ville
● Code postal
● Pays
Guide de l'utilisateur
Data Insight PUBLIC 231
Règle de correspondance Description Colonnes comparées
Person and Firm and General Delivery Identifie les enregistrements corres ● Prénom
Address pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
de livraison générale ou de poste res
● Titre de maturité
tante.
● Nom d'organisation
● Ville
● Code postal
● Pays
Person and Firm and Building Address Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
qui ont été validées pour le nom de bâti
● Titre de maturité
ment lors du processus de nettoyage.
● Nom d'organisation
● Nom de bâtiment
● Nom de la rue
● Numéro de la rue
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Person and Firm and Street Address 1 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les numéros
● Nom de famille
et noms de rue dans les pays qui n'ont
● Titre de maturité
pas leur propre règle de correspon
dance nationale pour les numéros et ● Nom d'organisation
noms de rue. ● Nom de la rue
● Numéro de la rue
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Guide de l'utilisateur
232 PUBLIC Data Insight
Règle de correspondance Description Colonnes comparées
Person and Firm and Street Address 2 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les numéros
● Nom de famille
et noms de rue dans les scripts chinois
● Titre de maturité
et japonais.
● Nom d'organisation
● Nom de la rue
● Numéro de la rue
● Adresse secondaire
● Nom de bâtiment
● Ville
● Région
● Code postal
● Pays
Person and Firm and Street Address 3 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les numéros
● Nom de famille
et noms de rue aux Etats-Unis.
● Titre de maturité
● Nom d'organisation
● Nom de la rue
● Numéro de la rue
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Person and Firm and Street Address 4 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les numéros
● Nom de famille
et noms de rue au Canada et en
● Titre de maturité
Grande-Bretagne.
● Nom d'organisation
● Nom de la rue
● Nom de la rue 2
● Adresse secondaire
● District
● Ville
● Région
● Code postal
● Pays
Guide de l'utilisateur
Data Insight PUBLIC 233
Règle de correspondance Description Colonnes comparées
Person and Firm and Street Address 5 Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les numéros
● Nom de famille
et noms de rue qui, lors du processus
● Titre de maturité
de nettoyage, ont été validés unique
ment pour la région ou le pays (ou bien ● Nom d'organisation
sans niveau d'affectation). ● Nom de la rue
● Numéro de la rue
● Adresse secondaire
● Ville
● Région
● Code postal
● Pays
Person and Firm and Dual Address Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms de société et les adresses
● Nom de famille
dans lesquels un des éléments com
● Titre de maturité
porte une adresse à la fois dans la co
lonne Address et dans la colonne Dual ● Nom d'organisation
Address. ● Ligne d'adresse
● Adresse double
● Ville
● Région
● Code postal
● Pays
Guide de l'utilisateur
234 PUBLIC Data Insight
Règle de correspondance Description Colonnes comparées
Person and Firm and Phone Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms d'organisation et les nu
● Nom de famille
méros de téléphone.
● Titre de maturité
● Nom d'organisation
● Jusqu'à 6 colonnes de téléphone
Person and Firm and Email Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms d'organisation et les
● Nom de famille
adresses de courrier électronique.
● Titre de maturité
● Nom d'organisation
● Jusqu'à 6 colonnes d'adresses de
messagerie
Person and Firm and Phone Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms d'organisation et les nu
● Nom de famille
méros de téléphone.
● Titre de maturité
● Nom d'organisation
● Jusqu'à 6 colonnes de téléphone
Person and Firm and Email Identifie les enregistrements corres ● Prénom
pondants d'après les noms de person ● Deuxième prénom
nes, les noms d'organisation et les
● Nom de famille
adresses de courrier électronique.
● Titre de maturité
● Nom d'organisation
● Jusqu'à 6 colonnes d'adresses de
messagerie
Guide de l'utilisateur
Data Insight PUBLIC 235
Règles de correspondance des noms de famille et des données ne
concernant pas l'adresse
Last Name and Phone Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Jusqu'à 6 colonnes de téléphone
les numéros de téléphone.
Last Name and Email Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Jusqu'à 6 colonnes d'adresses de
les adresses de messagerie. messagerie
Last Name and Date Identifie les enregistrements corres ● Nom de famille
pondants d'après les noms de famille et ● Date
les dates.
Guide de l'utilisateur
236 PUBLIC Data Insight
Règle de correspondance Description Colonnes comparées
Guide de l'utilisateur
Data Insight PUBLIC 237
Règle de correspondance Description Colonnes comparées
Email Identifie les enregistrements corres Jusqu'à six colonnes de courrier élec
pondants uniquement d'après l'adresse tronique
de courrier électronique.
Guide de l'utilisateur
238 PUBLIC Data Insight
4.13.8 Codes d’information et de statut dans d’autres
colonnes de données
L’Assistant de nettoyage présente les données dans des colonnes supplémentaires en fonction du contenu de
vos données et des types de standardisation et des améliorations apportées.
L'Assistant de nettoyage analyse les types de contenu que vous choisissez d'inclure dans votre solution de
nettoyage des données à l'étape 2 de l'Assistant de nettoyage. Il détermine ensuite à quoi sont mappées vos
données et analyse temporairement les données dans des colonnes discrètes. Les informations contenues
dans cette colonne indiquent la manière dont SAP Data Services peut mettre à jour vos données si vous avez
traité les données dans le Workbench. Les colonnes contiennent également des codes d’information et de
statut permettant d'expliquer la raison pour laquelle les informations peuvent être améliorées ou corrigées.
En outre, l’Assistant de nettoyage standardise et corrige les données en fonction de vos paramètres de format,
le cas échéant.
Remarque
Rappelez-vous que les modifications des données dont vous voyez l'aperçu dans l'Assistant de nettoyage
sont temporaires et destinées uniquement à une planification.
Information Steward affiche la plupart des autres colonnes de données dans Résultats du nettoyage et
Résultats de correspondance. Pour afficher les informations dans le groupe correspondant, cliquez sur Afficher
les données.
La liste suivante contient quelques points à prendre en compte pour l'affichage des résultats :
● Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
● Résultats de la correspondance : Pour afficher les colonnes les plus pertinentes pour la correspondance,
ouvrez le Visualiseur de comparaison d'enregistrements.
● Si certaines colonnes ne s’affichent pas dans la vue en cours, cliquez sur Afficher les colonnes et
sélectionnez la ou les colonnes à afficher.
La table suivante indique une courte description des autres colonnes et groupes de colonnes qui peuvent
apparaître dans les résultats.
Données d'adresse Une colonne pour chaque élément d’adresse analysée, stan
dardisée et corrigée par l’Assistant de nettoyage.
Guide de l'utilisateur
Data Insight PUBLIC 239
Catégorie de colonne Contenu
Affectation de données ne concernant pas l'adresse Colonnes contenant des codes associés à des données ne
concernant pas l'adresse (nom, société, date, téléphone,
etc.). Les codes relèvent de l'une des catégories suivantes :
● Codes d'information
● Codes de statut
● Données de la personne
● Date, courrier électronique, téléphone, société et nu
méro de sécurité sociale
Les colonnes de données d'adresses contiennent des informations sur les données analysées, standardisées et
corrigées que l’Assistant de nettoyage a trouvées dans vos données.
Utilisez les informations des colonnes de données d'adresses pour afficher les modifications qui ont pu être
apportées pour améliorer la qualité de vos données.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Guide de l'utilisateur
240 PUBLIC Data Insight
Colonnes contenant des données d'adresse
Nom de colonne Contenu
Code pays Abréviation de pays à deux caractères ISO, par exemple US.
Code pays à trois caractères Abréviation de pays à trois caractères ISO, par exemple USA.
Dual Address Deuxième adresse pour les adresses contenant deux adres
ses dans la ligne d'adresse.
Exemple
Adresse d'entrée : 1000 Main street, Suite 51/PO Box
2342
Exemple
Adresse d'entrée : 1000 Main Street, Suite 51
Exemple
Adresse d'entrée : 1000 Main Street, Suite 51
Guide de l'utilisateur
Data Insight PUBLIC 241
Nom de colonne Contenu
Code postal Code postal complet. Pour les pays dont le code postal com
porte deux parties, cette colonne contient les deux parties.
Code postal 1 Code postal complet pour les pays dont le code postal ne
comporte qu'une partie. Première partie du code postal pour
les pays dont le code postal comporte deux parties.
Code postal 2 Vide pour les pays dont le code postal ne comporte qu'une
partie. Deuxième partie du code postal complet pour les
pays dont le code postal comporte deux parties.
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
Guide de l'utilisateur
242 PUBLIC Data Insight
Codes de statut de l'adresse [page 247]
La colonne Informations d'affectation d'adresse contient un code à un caractère qui spécifie la validité de
l'adresse.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
La colonne Type d'affectation d'adresse contient un code à un ou deux caractères qui indique le type d'adresse
de l'enregistrement.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Guide de l'utilisateur
Data Insight PUBLIC 243
Contenu de la colonne Type d'affectation d'adresse
Valeur Description
BN Nom de bâtiment
F société
G livraison générale
H Gratte-ciel
HB Bateau habitable
L Lot
M militaire
R Rural
P postale
PI Point de référence
PR Poste restante
S Rue
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
La colonne Niveau d'affectation d'adresse contient un code à un ou deux caractères qui représente le niveau
auquel l'adresse de l’enregistrement a fait correspondre les données dans les répertoires d'adresses.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Guide de l'utilisateur
244 PUBLIC Data Insight
Valeurs de la colonne Niveau d'affectation d'adresse
Valeur Description
C Pays
L1 Ville
L2 District
L3 District 2
L4 District 3
PN Nom de la rue
PR Numéro de la rue
R Région
S Adresse secondaire
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
L’Assistant de nettoyage affecte les codes d'information aux adresses qui ne correspondent pas entièrement
aux données de référence.
Si l'adresse ne correspond pas entièrement aux données de référence lors du processus de nettoyage, la
colonne Code d'information de l'adresse affiche un code à quatre caractères qui décrit la raison de la non-
correspondance de l'adresse. Si l'adresse correspond entièrement aux données de référence, le champ est
vide.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Instructions relatives à la table : Pour rechercher un code spécifique, saisissez le code dans la zone de
recherche Code d'information de l'adresse. Pour rechercher des codes pour une catégorie donnée, ajoutez le
terme de recherche dans la zone Rechercher de la table.
Guide de l'utilisateur
Data Insight PUBLIC 245
Codes d'information de l'adresse
Code d'information de l'adresse Description
Guide de l'utilisateur
246 PUBLIC Data Insight
Code d'information de l'adresse Description
5000 L'adresse était valide, mais les autorités postales ont classé
cette adresse comme non livrable.
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
La colonne Code de statut de l'adresse affiche un code à six caractères qui explique quelles parties de l'adresse
ont été modifiées pendant le traitement.
Conseil
Résultats du nettoyage : Pour afficher les colonnes les plus pertinentes pour le nettoyage, ouvrez le
Visualiseur des détails d'enregistrement.
Chaque caractère dans le code de statut indique le statut sur les différentes parties de l'adresse. Chacune des
tables suivantes représente une position du caractère dans le code de statut. Pour rechercher un code de
Guide de l'utilisateur
Data Insight PUBLIC 247
statut, saisissez le caractère dans la zone de recherche de la colonne Valeur dans la table pour la position
concernée.
Le premier caractère du code de statut est « S ». Il n'est pas inclus dans les tables suivantes.
Le second caractère est associé aux corrections de la ville, de la région, du code postal ou du pays.
Second caractère
Valeur Description
1 Pays corrigé
4 Région corrigée
8 Ville corrigée
Troisième caractère
Valeur Description
1 Direction corrigée.
Guide de l'utilisateur
248 PUBLIC Data Insight
Valeur Description
Quatrième caractère
Valeur Description
8 Société corrigée.
Guide de l'utilisateur
Data Insight PUBLIC 249
Valeur Description
Le cinquième caractère est associé aux modifications des composants qui ne sont pas considérés comme
basiques pour l'adresse.
Cinquième caractère
Valeur Description
Guide de l'utilisateur
250 PUBLIC Data Insight
Valeur Description
Le sixième caractère fournit des informations supplémentaires sur un enregistrement non lié à une
modification de l'adresse. Certains enregistrements ne comportent pas de sixième caractère dans leur
code de statut.
Sixième caractère
Valeur Description
Rubrique parent : Codes d’information et de statut dans d’autres colonnes de données [page 239]
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 251
4.13.9 Colonnes relatives aux codes d’information des
données ne concernant pas l'adresse et de statut
L’Assistant de nettoyage édite des codes d’information et de statut pour les données nettoyées qui ne font pas
partie de l'adresse, mieux connues comme données ne concernant pas l'adresse.
Les codes d'information dans la colonne Code d'information des données ne concernant pas l'adresse
concernent les types suivants de données ne concernant pas l'adresse :
● Enregistrement « R »
● Personne
● Fonction
● Société
● Date
● Numéro de sécurité sociale (NSS)
● E-mail
● Téléphone
Remarque
Exemple
Les codes commençant par le symbole Dièse (#) sont des champs qui contiennent plusieurs données dans
un enregistrement. Par exemple, il peut y avoir plusieurs dates, e-mail ou numéros de téléphone.
Exemple
Lorsqu’un code s'applique à la deuxième date dans un enregistrement, le code de date D#01 apparaît
comme D201.
Les codes de statut dans la colonne Code de statut des données ne concernant pas l'adresse concernent les
types suivants de données ne concernant pas l'adresse :
● Personne
● Société
Guide de l'utilisateur
252 PUBLIC Data Insight
● Date
● Numéro de sécurité sociale (NSS)
● Téléphone
Remarque
Le symbole Dièse (#) dans le code de statut indique le champ dans un enregistrement auquel le code de
statut s'applique.
Exemple
Lorsqu'un code de statut s'applique au titre de civilité affecté pour la deuxième personne dans un
enregistrement, le code de statut est PERSON2_PRENAME_ADD.
Colonne Code d'information des données ne concernant pas l'adresse [page 253]
La colonne Code d'information des données ne concernant pas l'adresse contient un ou plusieurs codes
décrivant des informations spécifiques sur les données.
Colonne Code de statut des données ne concernant pas l'adresse [page 258]
La colonne Code de statut des données ne concernant pas l'adresse contient un ou plusieurs codes de
statut de données ne concernant pas l'adresse.
La colonne Code d'information des données ne concernant pas l'adresse contient un ou plusieurs codes
décrivant des informations spécifiques sur les données.
Lorsque la colonne contient plusieurs codes d'information, l’Assistant de nettoyage sépare chaque code par
une virgule.
Guide de l'utilisateur
Data Insight PUBLIC 253
Descriptions des codes d'enregistrement ne concernant pas l'adresse
Code Description
R001 Des données non reconnues ont été trouvées dans toutes les
colonnes et ont été placées dans les colonnes supplémentai
res.
R002 Des données non reconnues ont été trouvées dans certaines
colonnes et ont été placées dans les colonnes supplémentai
res.
R003 Des données non reconnues ont été trouvées dans certaines
colonnes et ont été placées dans les colonnes supplémentai
res.
Guide de l'utilisateur
254 PUBLIC Data Insight
Code Description
R425 Code pays non valide pour la colonne Code pays du groupe
Adresse. Par conséquent, il se peut que les données de la
personne, fonction et société ne soient pas nettoyées et ana
lysées selon les règles linguistiques ou culturelles prévues.
I111 Nom non valide. Insérez toutes les données de cette colonne
dans une colonne supplémentaire.
I311 Nom non valide. Insérez toutes les données de cette colonne
dans une colonne supplémentaire.
P101 Nom peu fiable. La colonne contient des données qui ne res
semblent pas à celles d'un nom de personne.
P102 Nom peu fiable. La colonne contient des données qui ne res
semblent pas à celles d'un nom de personne.
P103 Nom peu fiable. La colonne contient des données qui ne res
semblent pas à celles d'un nom de personne.
Remarque
Le symbole dièse (#) indique la date dans l'enregistre
ment qui est affectée lorsqu'il existe plusieurs e-mails
dans un enregistrement.
Guide de l'utilisateur
Data Insight PUBLIC 255
Code Description
Remarque
Le symbole dièse (#) indique la date dans l'enregistre
ment qui est affectée lorsqu'il existe plusieurs e-mails
dans un enregistrement.
Remarque
Le symbole dièse (#) indique la date dans l'enregistre
ment qui est affectée lorsqu'il existe plusieurs e-mails
dans un enregistrement.
Remarque
Le symbole dièse (#) indique la date dans l'enregistre
ment qui est affectée lorsqu'il existe plusieurs e-mails
dans un enregistrement.
I151 Fonction non valide. Insérez toutes les données de cette co
lonne dans une colonne supplémentaire.
Remarque
Le symbole dièse (#) indique l’e-mail dans l'enregistre
ment qui est affecté lorsqu'il existe plusieurs e-mails
dans un enregistrement.
Remarque
Le symbole dièse (#) indique l’e-mail dans l'enregistre
ment qui est affecté lorsqu'il existe plusieurs e-mails
dans un enregistrement (1-6).
Guide de l'utilisateur
256 PUBLIC Data Insight
Code Description
Remarque
Le symbole dièse (#) indique le numéro de téléphone
dans l'enregistrement qui est affecté lorsqu'il existe plu
sieurs numéros de téléphone dans un enregistrement
(1-6).
Remarque
Le symbole dièse (#) indique le numéro de téléphone
dans l'enregistrement qui est affecté lorsqu'il existe plu
sieurs numéros de téléphone dans un enregistrement
(1-6).
Remarque
Le symbole dièse (#) indique le numéro de téléphone
dans l'enregistrement qui est affecté lorsqu'il existe plu
sieurs numéros de téléphone dans un enregistrement
(1-6).
Remarque
Le symbole dièse (#) indique le numéro de téléphone
dans l'enregistrement qui est affecté lorsqu'il existe plu
sieurs numéros de téléphone dans un enregistrement
(1-6).
Remarque
Le symbole dièse (#) indique le numéro de téléphone
dans l'enregistrement qui est affecté lorsqu'il existe plu
sieurs numéros de téléphone dans un enregistrement
(1-6).
Guide de l'utilisateur
Data Insight PUBLIC 257
Code Description
Remarque
Le symbole dièse (#) indique le numéro de sécurité so
ciale dans l'enregistrement qui est affecté lorsqu'il existe
plusieurs numéros de sécurité sociale dans un enregis
trement.
Remarque
Le symbole dièse (#) indique le numéro de sécurité so
ciale dans l'enregistrement qui est affecté lorsqu'il existe
plusieurs numéros de sécurité sociale dans un enregis
trement.
Rubrique parent : Colonnes relatives aux codes d’information des données ne concernant pas l'adresse et de
statut [page 252]
Informations associées
Colonne Code de statut des données ne concernant pas l'adresse [page 258]
Colonnes de données personnelles [page 259]
Colonnes de date, de courrier électronique, de téléphone, de société et de numéro de sécurité sociale [page
261]
L'Assistant de nettoyage sépare plusieurs codes d’un enregistrement par une virgule.
Remarque
Les codes commençant par le symbole Dièse (#) sont des champs qui contiennent plusieurs données de
ce type dans un enregistrement. Par exemple, il peut y avoir plusieurs personnes, dates, e-mail ou numéros
de téléphone.
Guide de l'utilisateur
258 PUBLIC Data Insight
Descriptions des codes de statut des données ne concernant pas l'adresse
Code de statut Description
Rubrique parent : Colonnes relatives aux codes d’information des données ne concernant pas l'adresse et de
statut [page 252]
Informations associées
Colonne Code d'information des données ne concernant pas l'adresse [page 253]
Colonnes de données personnelles [page 259]
Colonnes de date, de courrier électronique, de téléphone, de société et de numéro de sécurité sociale [page
261]
L'Assistant de nettoyage analyse, standardise et corrige les données liées aux personnes en fonction des
paramètres que vous avez définis.
Pour obtenir des informations complètes sur les processus que la transformation Data Cleanse exécute sur les
données liées aux personnes, consultez les informations dans SAP Data ServicesGuide de Designer à l'adresse
https://help.sap.com/viewer/ec06fadc50b64b6184f835e4f0e1f52f/4.2.11/en-US/
5790fe1e6d6d1014b3fc9283b0e91070.html.
Guide de l'utilisateur
Data Insight PUBLIC 259
Les colonnes suivantes affichent des données liées aux personnes analysées, standardisées, corrigées et/ou
affectées.
Prénom Prénom.
Remarque
Dans la plupart des cultures, quand une personne a un
nom de famille composé, les deux noms sont placés
dans la colonne Nom de famille. Dans certaines cultures,
quand deux noms de famille sont disponibles, l'un est
placé dans la colonne Nom de famille et le deuxième est
placé dans la colonne Nom de famille 2.
Sexe Sexe du nom tel qu'il est classé dans le package de net
toyage des données.
Rubrique parent : Colonnes relatives aux codes d’information des données ne concernant pas l'adresse et de
statut [page 252]
Informations associées
Colonne Code d'information des données ne concernant pas l'adresse [page 253]
Colonne Code de statut des données ne concernant pas l'adresse [page 258]
Colonnes de date, de courrier électronique, de téléphone, de société et de numéro de sécurité sociale [page
261]
Guide de l'utilisateur
260 PUBLIC Data Insight
4.13.9.4 Colonnes de date, de courrier électronique, de
téléphone, de société et de numéro de sécurité
sociale
L’Assistant de nettoyage traite des données autres que les données de nom et d'adresse, et édite des résultats
standardisés et corrigés lorsque cela est possible.
Le tableau suivant contient les noms de colonne et les descriptions de contenu pour les données qui ne sont
pas comprises dans les autres catégories de données.
Données supplémentaires Contient toutes les données non reconnues comme données
tierces et ne pouvant donc pas être analysées dans une co
lonne plus spécifique.
L’Assistant de nettoyage édite un identificateur unique pour chaque enregistrement. Cet identificateur unique
ne fait pas partie de vos données d'entrée.
Colonne Description
Rubrique parent : Colonnes relatives aux codes d’information des données ne concernant pas l'adresse et de
statut [page 252]
Guide de l'utilisateur
Data Insight PUBLIC 261
Informations associées
Colonne Code d'information des données ne concernant pas l'adresse [page 253]
Colonne Code de statut des données ne concernant pas l'adresse [page 258]
Colonnes de données personnelles [page 259]
L’Assistant de nettoyage édite les résultats du processus de correspondance dans plusieurs colonnes de
correspondance.
La table suivante contient les colonnes de correspondance que l’Assistant de nettoyage renseigne le cas
échéant, et les descriptions des données dans chaque colonne.
Tous les enregistrements correspondants partiels Contient une liste des numéros de séquence pour chaque
enregistrement avec lequel cet enregistrement est en cor
respondance directe et pour les enregistrements respectant
les exigences de correspondances partielles moins strictes.
L'utilisation de cette colonne est interne à l'Assistant de net
toyage.
Toutes les règles de correspondance Contient une liste des règles de correspondance (indexées)
pour chaque enregistrement avec lequel cet enregistrement
est en correspondance directe. Utilisez conjointement avec
la colonne Tous les enregistrements concordants. L'utilisa
tion de cette colonne est interne à l'Assistant de nettoyage.
Toutes les règles de correspondance partielle Contient une liste des règles de correspondance (indexées)
pour chaque enregistrement en correspondance directe et
pour les enregistrements respectant les exigences de cor
respondances partielles moins strictes. Utilisez conjointe
ment avec la colonne Tous les enregistrements concordants.
L'utilisation de cette colonne est interne à l'Assistant de net
toyage.
Tous les scores de correspondance Contient une liste des scores de correspondance pour cha
que enregistrement avec lequel cet enregistrement est en
correspondance directe. Utilisez conjointement avec les co
lonnes Tous les enregistrements concordants et Toutes les
règles de correspondance. L'utilisation de cette colonne est
interne à l'Assistant de nettoyage.
Numéro de groupe approximatif Identifie les enregistrements qui correspondent aux critères
de correspondance approximative.
Guide de l'utilisateur
262 PUBLIC Data Insight
Colonne Description
Guide de l'utilisateur
Data Insight PUBLIC 263
Colonne Description
Nombre de paires de correspondance Indique avec combien d'enregistrement correspond cet en
registrement. Un enregistrement unique a une valeur de 0.
Un enregistrement en correspondance avec tous les autres
enregistrements d'un groupe de correspondance a une va
leur inférieure d'une unité par rapport au nombre total du
groupe de correspondance.
Nombre de paires de correspondance partielle Indique avec combien d'enregistrement correspond cet en
registrement et les enregistrements respectant les exigen
ces de correspondances partielles moins strictes. Un enre
gistrement unique a une valeur de 0. Un enregistrement en
correspondance avec tous les autres enregistrements d'un
groupe de correspondance a une valeur inférieure d'une
unité par rapport au nombre total du groupe de correspon
dance.
Ordre des groupes L'enregistrement principal reçoit une valeur de 1. Les enre
gistrements subordonnés reçoivent une valeur allant de 2 au
nombre d'enregistrements dans le groupe de correspon
dance.
Guide de l'utilisateur
264 PUBLIC Data Insight
4.13.11 Résumé de la solution de nettoyage des données
Vous pouvez afficher un résumé de votre solution de nettoyage des données, qui comprend des détails sur la
source d'entrée et les options de traitement utilisées pour la solution de nettoyage des données sélectionnée.
Pour afficher le résumé, ouvrez la solution de nettoyage des données et cliquez sur Afficher le résumé dans
l'écran Présentation.
Cliquez sur chacun des onglets pour voir les informations suivantes concernant la solution de nettoyage des
données :
● Source d'entrée
● Colonnes et/ou groupes de colonnes sélectionnés pour le nettoyage et la correspondance.
● Thème et règles de correspondance
● Options de correspondance sélectionnées
● Options de nettoyage sélectionnées
● Options de transformations de base sélectionnées
Après avoir créé une solution de nettoyage des données et vérifié ses résultats, vous pouvez la publier.
La publication d'une solution de nettoyage des données la rend disponible pour une utilisation dans le
Workbench de Data Services, où un utilisateur de Data Services peut exécuter un job basé sur votre solution de
nettoyage des données.
1. Dans la liste Solutions de nettoyage des données, sélectionnez la solution à publier et cliquez sur Ouvrir.
2. Dans l'écran Présentation, cliquez sur Publier la solution.
Un message vous indique si la publication a réussi.
La solution de nettoyage des données est maintenant disponible dans le Central Management Server (CMS) de
la plateforme SAP BusinessObjects Business Intelligence. Le nom de la solution publiée est celui que vous avez
donné à la solution quand vous l'avez configurée dans l'assistant. Le nom et la description que vous avez saisis
dans l'assistant sont partagés avec le Workbench de Data Services
Un utilisateur autorisé du Workbench de Data Services peut alors accéder à la solution de nettoyage des
données dans le Workbench de Data Services et exécuter le job.
Dans l'écran Présentation, cliquez sur Fermer la solution pour fermer la solution de nettoyage des données en
cours. Les solutions de nettoyage des données sont fermées automatiquement lorsque vous en ouvrez une
autre.
Guide de l'utilisateur
Data Insight PUBLIC 265
4.14 Scorecards
Les scorecards fournissent une vue générale de la qualité des données d'un domaine de données clés basée
sur des objectifs métier de qualité des données.
Chaque projet peut avoir plusieurs scorecards basés sur les différents domaines de données clés.
Remarque
Membres du groupe d'utilisateurs Gestionnaire de scorecards Data Insight ou utilisateurs disposant des
autorisations pour créer ou modifier des scorecards. Les membres du groupe d'utilisateurs Data Insight
peuvent afficher les résultats des scorecards.
Un scorecard vous permet d'évaluer la qualité des données en fonction des scores pour différentes dimensions
de qualité de données que vous configurez dans un domaine de données clés. Les scorecards fournissent
également une vue d'analyse commerciale permettant de déterminer le coût des données erronées.
L'onglet Scorecard de Data Insight vous permet de déterminer visuellement la qualité de vos données en
examinant les couleurs de la colonne Score. Les couleurs vert, jaune et rouge vous donnent une indication
visuelle rapide de la qualité de vos données.
Vert Le score est supérieur à la valeur du seuil maximal La qualité des données est souhaitable.
Jaune Le score est compris entre les valeurs du seuil maximal et du La qualité des données est acceptable.
seuil minimal.
Rouge Le score est inférieur à la valeur du seuil minimal. La qualité des données n'est pas accep
table.
Avant de pouvoir créer un scorecard, définissez des règles et liez-les aux colonnes spécifiques dans vos
données. Lorsque vous créez un scorecard, utilisez des moyennes simples ou pondérées pour calculer les
scores de scorecard. De plus, appliquez des moyennes simples ou pondérées au niveau de la règle, dimension
de qualité et du domaine de données global.
Chaque scorecard a un lien direct que vous pouvez partager avec d'autres utilisateurs D'autres utilisateurs
peuvent ouvrir les liens pour afficher le scorecard. Le scorecard s'ouvre dans une application Web telle que SAP
Enterprise Portal, Barre de lancement BI ou types de page Web.
Définissez Information Steward pour qu’il envoie des notifications par e-mail lorsque les scores changent.
Joignez un fichier PDF du scorecard afin que les utilisateurs fonctionnels accèdent à un scorecard sans avoir à
se connecter à Information Steward.
Envoi de notifications par e-mail pour les domaines de données clés [page 270]
Notifiez automatiquement les utilisateurs professionnels lorsque le score d’un domaine de données
clés satisfait un paramètre de sensibilité spécifique.
Guide de l'utilisateur
266 PUBLIC Data Insight
Un scorecard propose des informations précieuses sur plusieurs aspects de la qualité de vos données.
Vous pouvez choisir une vue en fonction des informations dont vous avez besoin ou basculer entre
différentes vues si besoin.
Informations associées
Les domaines de données clés jouent un rôle essentiel dans la création et la modification des scorecards.
Les domaines de données clés sont composés d'une combinaison de dimensions de qualité, de règles et de
liaisons de règles. Lorsque vous créez un scorecard, vous créez un domaine de données clés. Chaque élément
du domaine de données clés contribue à l'ensemble du score de scorecard.
Informations associées
Envoi de notifications par e-mail pour les domaines de données clés [page 270]
Vues de scorecard [page 272]
Liens de scorecard [page 285]
Calcul des scorecards [page 286]
Valeurs par défaut de la dimension de qualité [page 143]
Modification des valeurs de la dimension de qualité [page 144]
Guide de l'utilisateur
Data Insight PUBLIC 267
4.14.1.1 Création d'un domaine de données clés
Lorsque vous créez un scorecard, vous devez créer des domaines de données clés et une dimension de qualité.
Avant de pouvoir travailler avec des données d'un scorecard, développez les domaines de données clés sur
lesquels le scorecard doit être basé. Après avoir créé un domaine de données clés, celui-ci s'affiche dans le
volet Domaines de données clés lorsque vous créez un scorecard.
1. Ouvrez l'onglet Configuration du scorecard et cliquez sur Ajouter dans le volet Domaines de données clés.
La description que vous saisissez apparaît dans le scorecard que vous joignez à une notification par e-mail.
3. Déplacez les indicateurs pour Seuil vers les seuils minimum et maximum souhaités.
Le seuil minimum définit le score à partir duquel les résultats inacceptables s'affichent en rouge. Le seuil
maximum définit le score à partir duquel les résultats acceptables s'affichent en vert. Les valeurs en jaune
indiquent un score situé entre le seuil minimum et maximum.
Conseil
Pour éliminer les scores en jaune, définissez les seuils minimum et maximum.
Exemple
Pour 3 dimensions de qualité, Information Steward ré
partit les poids de la manière suivante : 33.34, 33.33,
and 33.33.
Guide de l'utilisateur
268 PUBLIC Data Insight
Option de pondération Description
Les règles qui s'affichent dans la liste sont des règles liées à une colonne dans un ou plusieurs projets.
12. Ajustez les poids pour les règles le cas échéant et cliquez sur Enregistrer.
Les paramètres de poids fonctionnent de la même façon que pour les dimensions.
13. Cliquez sur Ajouter dans le volet Liaisons de règles.
14. Dans la boîte de dialogue Associer les liaisons de règles, sélectionnez les liaisons de règles à utiliser dans le
score et cliquez sur Enregistrer.
Information Steward crée le domaine de données clés. Pour mettre à jour les scores, cliquez sur Actualiser.
15. Pour afficher le scorecard, cliquez sur la flèche déroulante Espace de travail dans le coin supérieur droit et
sélectionnez Scorecard.
16. Sélectionnez l’icône de la vue Résumé, puis Maintenant dans la liste déroulante Afficher le score à partir de.
Le nouveau domaine de données clés s'affiche dans le volet Domaine de données clés.
Lorsqu'un objet dans un domaine de données clés est obsolète ou n'est plus applicable, supprimez l'objet du
domaine de données clés.
1. Ouvrez l'onglet Paramétrer le scorecard dans Data Insight et sélectionnez l'objet à supprimer.
2. Cliquez sur Supprimer.
Le logiciel supprime l'objet et met à jour le score.
Si plusieurs objets sont contenus dans un domaine et que la pondération est définie sur Fixe, réajustez les
pondérations pour que la pondération combinée soit égale à 100 %.
Exemple
Dans une dimension de qualité avec une pondération définie sur Fixe, les dimensions Précision, Intégralité
et Conformité présentent une pondération respective de 30 %, 60 % et 10 %. Vous supprimez ensuite la
conformité de la dimension. Ajustez la précision, l’intégralité ou les deux pour utiliser les 10 %
supplémentaires qui ont été affectés à la conformité.
Guide de l'utilisateur
Data Insight PUBLIC 269
4.14.2 Envoi de notifications par e-mail pour les domaines de
données clés
Notifiez automatiquement les utilisateurs professionnels lorsque le score d’un domaine de données clés
satisfait un paramètre de sensibilité spécifique.
Envoyez plusieurs notifications par e-mail par domaine de données clés selon l’intérêt de l'utilisateur
professionnel.
Exemple
SAP Information Steward envoie des e-mails au format texte brut. L’e-mail contient les informations suivantes :
En outre, choisissez de joindre le scorecard. Information Steward joint le scorecard au format PDF. Les
utilisateurs peuvent ensuite ouvrir et afficher le scorecard sur les appareils de prise en charge sans avoir à se
connecter au système.
Informations associées
Guide de l'utilisateur
270 PUBLIC Data Insight
4.14.2.1 Configuration des notifications par e-mail pour les
domaines de données clés
Configurez le logiciel pour l’envoi d’un e-mail pour notifier les utilisateurs professionnels lorsqu'un score est
modifié ou qu'il satisfait un paramètre de sensibilité spécifique.
Assurez-vous que l’adresse électronique de tous les utilisateurs concernés est configurée dans la CMC (Central
Management Console). Assurez vous également de configurer le Job Server SAP Information Steward pour les
notifications par e-mail.
1. Ouvrez l'onglet Paramétrer le scorecard et choisissez d’ajouter ou de modifier un domaine de données clés.
2. Dans la boîte de dialogue Définition des domaines de données clés, cliquez sur Gérer les notifications par e-
mail.
La boîte de dialogue Gérer les notifications par e-mail s'ouvre. La partie gauche contient une liste des
notifications existantes sous Notifications par e-mail pour les domaines de données clés. La partie droite
contient les détails relatifs aux notifications.
3. Cliquez sur Nouveau et saisissez un nom pour la notification dans Nom.
4. Saisissez les adresses électroniques, les noms d'utilisateur et/ou les groupes d'utilisateurs dans la zone de
texte À.... Ou bien cliquez sur À... pour ouvrir la boîte de dialogue Modifier les destinataires.
5. Dans la boîte de dialogue Modifier les destinataires, renseignez l’adresse électronique, le nom d’utilisateur
ou le groupe d'utilisateurs concerné dans le champ Cliquez pour ajouter un destinataire…. Ou bien
sélectionnez-les dans la liste déroulante.
Le cas échéant, incluez plusieurs adresses électroniques, noms d'utilisateur et/ou groupes d'utilisateurs.
Information Steward affiche une astérisque en regard des adresses e-mail, utilisateurs ou groupes
invalides.
6. Dans Objet, saisissez un objet compréhensible pour le destinataire.
Si vous n'ajoutez pas d'objet, le logiciel nomme la notification de la façon suivante : <nom de domaine de
données clés> : <nom de la notification par e-mail>.
7. Sélectionnez une option dans la liste déroulante Sensibilité.
Remarque
Vous pouvez sélectionner une seule option de Sensibilité par notification par e-mail.. Pour créer des
notifications pour plusieurs sensibilités, configurez une notification distincte pour chaque sensibilité.
Remarque
Pour obtenir des descriptions des options de sensibilité, reportez-vous à la rubrique Ajout d'une
notification par e-mail relative aux tâches d’exécution de règle [page 158].
8. Sélectionnez l’option Joindre le rapport de qualité du scorecard pour joindre un fichier PDF du scorecard à l
'e-mail.
Lorsque les destinataires de l'e-mail ouvrent le fichier PDF joint, ils peuvent afficher le scorecard sans avoir
à se connecter à Information Steward.
9. Saisissez une valeur dans la boîte de dialogue Seuil de modification du score.
Ne spécifiez aucune valeur pour qu’Information Steward utilise une valeur de zéro. Avec la valeur de zéro,
le logiciel envoie une notification pour toute modification apportée au score, quel que soit le type de
modification.
Guide de l'utilisateur
Data Insight PUBLIC 271
10. Pour modifier une notification par e-mail, effectuez les étapes suivantes :
a. Cliquez sur la notification à modifier sous Notifications par e-mail pour les domaines de données clés
sur la gauche.
b. Apportez les modifications concernées à droite sous la colonne Détails de la notification.
11. Cliquez sur OK pour fermer la boîte de dialogue Gérer les notifications par e-mail.
Informations associées
Un scorecard propose des informations précieuses sur plusieurs aspects de la qualité de vos données. Vous
pouvez choisir une vue en fonction des informations dont vous avez besoin ou basculer entre différentes vues
si besoin.
Les autorisations requises pour afficher des scorecards sont des Data Insight de membres de groupe
d'utilisateurs ou utilisateurs ou groupes disposant d'autorisation d'affichage
Remarque
Les composants de données clés ayant un poids équivalent à zéro et tout composant inférieur
n'apparaissent pas dans des vues scorecard et ne sont pas inclus au calcul du scorecard.
Cliquez sur le numéro de coût pour visualiser plus de détails sur ce coût.
Remarque
Vérifiez que vous avez configuré les coûts des données ayant échoué pour accéder aux
données d'analyse des coûts.
Guide de l'utilisateur
272 PUBLIC Data Insight
Vue Description
Les scores changent lorsque vous cliquez sur les différents composants des volets des do
maines de données clés, de dimension de qualité et des règles de validation. Le graphique
des tendances change également pour représenter les détails relatifs aux objets sélection
nés.
Analyse de la valeur commer Ouvre l'outil Analyse de la valeur commerciale avec lequel vous pouvez analyser la façon
ciale
dont les changements dans la qualité de vos données affectent vos coûts.
Remarque
Vérifiez que vous avez configuré les coûts des données ayant échoué pour accéder aux
données d'analyse des coûts.
Affichage des coûts estimés et informations de tendance sous forme de vue tabulaire ou de
vue graphique.
Vue graphique :
Vue tabulaire :
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 273
Affichage des scorecards [page 274]
Graphique des tendances [page 162]
Analyse de la valeur commerciale [page 288]
Sélectionnez une vue Récapitulative ou Détail de Data Quality lorsque vous affichez les résultats du scorecard,
et ouvrez aussi un outil Analyse de la valeur commerciale.
1. Dans Accueil de l'espace de travail, cliquez sur la liste déroulante Espace de travail dans le coin supérieur
droit de la fenêtre, puis sur Scorecard.
La vue Récapitulative ou la vue Détail de Data Quality s'ouvre, en fonction de la dernière fenêtre visualisée.
2. Sélectionnez une option dans la liste déroulante Afficher le score à partir de.
Cette option est disponible que vous choisissiez la vue Résumé ou la vue Détail de Data Quality.
Dernière exécution Affiche les scores obtenus lors de la dernière exécution de l'utilitaire de calcul de score
card. Cet utilitaire de calcul de scorecard est planifié dans la CMC (Central Management
Console). Les scores calculés par l'utilitaire sont stockés dans le référentiel.
Maintenant Affiche les scores calculés à la demande. Par exemple, si vous avez modifié la pondéra
tion des dimensions de qualité, cette option permet d'afficher le score actualisé immé
diatement. Ces scores reflètent les modifications apportées à la configuration du score
card et aux scores de liaison de règle depuis la dernière exécution de l'utilitaire de calcul
de scorecard.
De même, si vous avez créé un scorecard qui n'a pas encore été exécuté par l'utilitaire,
vous pouvez générer ou afficher des scores avec cette option. Les scores ne sont pas
stockés dans le référentiel lorsque vous sélectionnez cette option.
Option Description
Score (croissant) Les domaines de données clés sont triés du score de qua
lité le plus faible au plus élevé.
Score (décroissant) Les domaines de données clés sont triés du score de qua
lité le plus élevé au plus faible.
Guide de l'utilisateur
274 PUBLIC Data Insight
Option Description
Personnalisé Les domaines de données clés sont triés dans l'ordre dé
fini lorsque vous sélectionnez Modifier l'ordre de tri
personnalisé.
Remarque
Si un tri personnalisé est déjà défini et que vous cli
quez de nouveau sur Personnalisé, l'information con
tenue dans le scorecard s'affiche en fonction de l'or
dre de tri personnalisé déjà défini.
Modifier l'ordre de tri personnalisé Ouvre la boîte de dialogue Modifier l'ordre d'affichage
personnalisé grâce à laquelle vous pouvez définir un nou
vel ordre de tri personnalisé qui remplace le précédent.
4. Cliquez régulièrement sur l'icône Actualiser pour vous assurer que les données affichées sont bien les plus
récentes en fonction des choix effectués.
Remarque
Si vous affectez un poids de zéro à un élément, ce dernier, ainsi que ses enfants, n'apparaîtra pas ou ne
sera pas utilisé dans les calculs dans la vue du scorecards.
5. Partagez vos scorecards en sélectionnant une option dans la liste déroulante Partager. L'option génère une
URL qui permet aux autres utilisateurs ayant une autorisation pour le projet d'afficher le scorecard. Avec
une URL, vous pouvez intégrer un scorecard, par exemple dans le SAP Enterprise Portal, la zone de
lancement BI ou une page Web.
Option Description
Tout Génère et affiche un lien vers tous les scorecards pour les
quels vous avez des droits.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 275
Calcul des scorecards [page 286]
Analyse de la valeur commerciale [page 288]
Affichage d'exemples de données ayant échoué à partir d’un scorecard [page 279]
Liens de scorecard [page 285]
Analyse de la valeur commerciale [page 288]
Le graphique des tendances vous permet d'effectuer un suivi des tendances de qualité des données au fil du
temps.
À des fins de simulation, créez un scorecard et planifiez son exécution périodiquement. Utilisez un exemple de
source de données que vous pouvez modifier d'une exécution à l'autre pour voir l'évolution du graphique des
tendances.
Suivez les étapes ci-dessous pour en savoir plus sur les fonctionnalités du graphique des tendances :
1. Dans la page Accueil de l'espace de travail, cliquez sur la liste déroulante Espace de travail dans le coin
supérieur droit de la fenêtre, puis sur Scorecard.
La vue Récapitulative ou la vue Détail de Data Quality s'ouvre, en fonction de la dernière fenêtre ouverte.
2. Sélectionnez l'icône Détail de Data Quality.
Les dimensions liées s'affichent dans le volet Dimensions Data Quality et la liste de règles liées dans le volet
Règles de validation.
4. Examinez le graphique des tendances dans le volet du coin inférieur gauche.
Le graphique des tendances affiche les statistiques pour le domaine de données de source de données
sélectionné.
5. Sélectionnez une dimension dans le volet Dimensions Data Quality.
Le graphique des tendances est modifié pour afficher les statistiques pour la dimension sélectionnée.
6. Contrôlez l'intervalle d'exécution à inclure dans le graphique des tendances en cliquant sur un numéro
dans l'option Dernière exécution, en haut du graphique.
Faire glisser l’indicateur de plage vous permet de vous axer sur le sous-ensemble de scores dans les scores
minimum et maximum calculés.
8. Sélectionnez un point de données sur la ligne de tendance dans le graphique.
Guide de l'utilisateur
276 PUBLIC Data Insight
○ Lignes ayant échoué
○ Lignes correctes
Informations associées
Le graphique des tendances affiche le nombre maximum de lignes ayant échoué lorsqu'une règle est liée à
plusieurs colonnes dans une seule source de données.
Comment le logiciel calcule-t-il le nombre total de lignes ayant échoué lorsqu'une ligne présente deux colonnes
faisant échouer la règle ? Le fait que le logiciel pourrait compter une ligne comme deux lignes dans le nombre
total de lignes ayant échoué, constitue le problème potentiel Nous contournons ce problème, en exigeant de la
part du logiciel l'utilisation du nombre maximal de lignes ayant échoué entre les colonnes.
Exemple
Par exemple, vous affichez un graphique des tendances pour le scorecard Sales_North. Le domaine de
données clés dans le scorecard comprend une règle liée aux colonnes, dans deux tables :
● North_Region_Sales
● Sales_Rep
La règle est liée à deux colonnes dans la table Sales_Rep et à une colonne dans la table
North_Region_Sales. Le logiciel recherche le nombre total de lignes ayant échoué pour chaque table
comme suit :
Nom de la table Nombre total de lignes ayant échoué Nombre total d'enregistrements
North_Region_Sales 10 500
Guide de l'utilisateur
Data Insight PUBLIC 277
Lignes ayant échoué : 24 14 + 10 = 24
500 - 10 = 490
86 + 490 = 576
Remarque
Le logiciel n'inclut pas les lignes ayant échoué de la colonne 2 dans la table Sales_Rep pour éviter de
compter une ligne ayant échoué, plusieurs fois.
Par exemple, une ligne peut présenter des données ayant échoué dans la colonne 1 et la colonne 2. Si le
logiciel a inclus les totaux des deux colonnes de la table Sales_Rep , il comptabilise la ligne ayant
échoué dans la colonne 1 et la colonne 2, comme deux lignes.
Informations associées
L’examination des données ayant échoué vous aide à déterminer la raison pour laquelle certaines données
n’ont pas atteint le seuil du scorecard.
Dans la vue Détail du scorecard, vous pouvez choisir de visualiser un modèle de données ayant échoué. Par
défaut, le logiciel affiche un modèle de 100 lignes de données ayant échoué, lesquelles sont enregistrées
temporairement dans le référentiel Information Steward. Les administrateurs peuvent adapter le nombre de
modèles de lignes dans la Central Management Console (CMC) afin que vous puissiez afficher plus ou moins
de données.
Avant de pouvoir afficher plus de données ayant échoué, ou exporter des données ayant échoué, votre
administrateur configure le type de connexion des données ayant échoué et vous accorde les autorisations
pour les connexions spécifiques :
● Votre administrateur configure le type de connexion pour l’accès aux données ayant échoué : Connexion
aux données ayant échoué ou connexion à la source.
● Votre administrateur crée de nouvelles connexions du même type de connexion, ou modifie des
connexions existantes du même type de connexion.
Guide de l'utilisateur
278 PUBLIC Data Insight
● Votre administrateur vous accorde une autorisation spécifique pour les connexions nouvelles ou
existantes, afin que vous puissiez afficher davantage de données ayant échoué et les exporter.
Lorsque vous avez les mêmes autorisations configurées, vous pouvez choisir d’afficher davantage de données
ayant échoué à partir du scorecard. Le logiciel affiche jusqu'à 500 lignes de données ayant échoué. Vous
pouvez ensuite décider d’exporter toutes les données ayant échoué, afin de pouvoir utiliser d’autres outils pour
l’analyse des informations.
Modifiez et personnalisez votre vue de données ayant échoué, en utilisant les diverses options de filtres de
colonnes dans la table des données ayant échoué du scorecard.
Critères de filtre Créez des expressions de filtre à l'aide des fonctions « And » et « Or ».
Par exemple, vous pouvez créer une expression indiquant à l'application de n'afficher que
les exemples de données ayant échoué provenant de la colonne Titre qui contiennent une
salutation en particulier. Vous pouvez définir plusieurs expressions pour les mêmes exem
ples de données.
Afficher les colonnes Déterminez les colonnes à afficher ou à masquer dans l'exemple de table de données ayant
échoué.
Exporter les données Exportez les données ayant échoué dans un fichier ouvrable avec Excel.
Afficher plus de données Affichez davantage de données ayant échoué (jusqu'à 500 lignes) et exportez toutes ces
ayant échoué données dans Excel.
Vous pouvez aussi contrôler l’ordre dans lequel les colonnes sont répertoriées. Vous pouvez choisir d’afficher
les colonnes par ordre alphabétique ou dans l’ordre des bases de données. Pour apprendre à configurer l’ordre
des colonnes, voir Contrôle de l’ordre des colonnes de tables [page 40].
Affichez les données dont les liaisons de règles ont échoué dans un scorecard.
Vous pouvez afficher un modèle pouvant contenir jusqu’à 100 enregistrements de données ayant échoué. Pour
afficher plus de données ayant échoué, vous devez avoir des autorisations spéciales définies par votre
administrateur.
1. Dans la page Accueil de l'espace de travail, cliquez sur la liste déroulante Espace de travail dans le coin
supérieur droit de la fenêtre, puis sélectionnez Scorecard.
La fenêtre Scorecard s'ouvre. La vue Analyse de la valeur commerciale, Détail de Data Quality ou la vue
Récapitulative s'ouvre en fonction de la dernière fenêtre visualisée.
Guide de l'utilisateur
Data Insight PUBLIC 279
4. Cliquez sur Afficher les données ayant échoué au-dessus de la table Liaisons de règles.
Informations associées
Affichage des données ayant échoué à partir des scorecards [page 278]
Exporter des données ayant échoué depuis plusieurs liaisons de règles [page 280]
Exportez les données ayant échoué d’un scorecard vers un fichier Zip compressé ou un classeur Excel.
Un scorecard peut avoir des données ayant échoué provenant de plusieurs liaisons de règles et plusieurs
colonnes. Plutôt que d'exporter les données ayant échoué pour chaque liaison d'une règle dans un scorecard,
vous pouvez exporter les données ayant échoué de certaines ou de l'ensemble des liaisons de règles et
colonnes ayant échoué.
Remarque
Votre capacité à accéder aux données ayant échoué et à les exporter dépendent des options spécifiques
que votre administrateur sélectionne dans la Central Management Console. Pour en savoir plus, voir
Connexion aux données ayant échoué et autorisations [page 165].
Le logiciel génère une liste des liaisons de règles et colonnes ayant échoué qui contribuent au scorecard ayant
échoué à la dimension de données sélectionnée. Vous pouvez choisir des liaisons de règles spécifiques ou des
colonnes spécifiques à exporter. Avant l'exportation, vous pouvez examiner le résumé d'exportation qui fait
état du nombre de liaisons de règles exportées et ignorées. Il répertorie les messages de réussite ainsi que les
messages d'avertissement et d'erreur applicable à l'exportation.
Choisissez d’exporter les fichiers CSV dans un dossier Zip, ou dans un classeur Excel, comme des classeurs
individuels. La table suivante décrit la manière dont le logiciel exporte vos données et nomme les fichiers en
fonction de votre choix.
Exporter en format Zip Toutes les données ayant échoué de la Nom du fichier CSV :
colonne sont exportées dans des fi- ISExportData_<timestamp>_<
chiers CSV individuels. Le logiciel com Column_Name>_<Rule_Name>.c
pile les fichiers CSV dans un dossier sv (ISDonnéesExportées_horoda
ZIP. teur_NomColonne_NomRègle.csv)
Guide de l'utilisateur
280 PUBLIC Data Insight
Option d'exportation Description Nom du fichier
Exporter vers Excel Toutes les données ayant échoué de la Nom du classeur Excel :
colonne sont exportées dans des fi- <nom_scorecard>_<id_unique
chiers CSV individuels. Le logiciel ex _généré>.xlsx
porte les fichiers CSV vers Excel, ce qui
crée une feuille de calcul pour chaque Remarque
fichier CSV dans un Classeur.
Le format de fichier Excel par dé
faut est XLSX. Modifiez le format
de fichier Excel par défaut dans la
boîte de dialogue Préférences.
Remarque
Le logiciel limite le nom des clas
seurs et le nom des feuilles à 31 ca
ractères. Par conséquent, les noms
de fichiers peuvent être tronqués.
Informations associées
Exportation de données ayant échoué depuis plusieurs liaisons de règles dans un scorecard [page 281]
Calcul des scorecards [page 286]
Modification du format de fichier Excel par défaut [page 20]
Exportez les données ayant échoué en sélectionnant les liaisons de règles et les colonnes d’une scorecard,
dans un dossier Zip ou un classeur Excel.
Votre capacité à accéder aux données ayant échoué et à les exporter dépendent des options spécifiques que
votre administrateur sélectionne dans la Central Management Console. Pour en savoir plus, voir Connexion aux
données ayant échoué et autorisations [page 165].
Après avoir exécuté un scorecard, ouvrez l'onglet Scorecard, sélectionnez la Vue détaillée et suivez cette
procédure pour exporter les données ayant échoué depuis plusieurs liaisons de règles et colonnes :
1. Sélectionnez le domaine de données applicables depuis la liste Domaine de données clés dans le volet
supérieur à gauche de l'onglet Scorecard.
Guide de l'utilisateur
Data Insight PUBLIC 281
2. Cliquez sur l'icône Exporter les données ayant échoué du scorecard dans la barre d'outils.
La fenêtre Exporter les liaisons de règles s'ouvre, affichant une liste de liaisons de règles ayant échoué.
Développez chaque liaison de règle pour visualiser les colonnes contenant des données ayant échoué.
3. Sélectionnez les liaisons de règles et les colonnes pour exporter, puis cliquez sur Exporter :
○ Cochez la case en regard de la liaison de règle pour exporter toutes les colonnes de la liaison de règle.
○ Développez chaque liaison de règle et sélectionnez les colonnes spécifiques à exporter.
4. Sélectionnez Exporter en format Zip ou Exporter vers Excel dans la fenêtre Exporter les options puis cliquez
sur OK.
Exporter en format Zip : le logiciel exporte chaque règle dans un fichier CSV et tous les fichiers CSV sont
compressés dans un fichier Zip.
Exporter vers Excel : le logiciel exporte chaque règle dans un fichier CSV, puis le fichier Excel crée une feuille
pour chaque fichier CSV et les place dans un classeur.
Remarque
Le format de fichier Excel par défaut est XLS. Modifiez le format de fichier Excel par défaut dans la boîte
de dialogue Préférences.
La barre de progression s’ouvre avec un message indiquant que le processus peut prendre quelques
minutes. Le temps de traitement dépend du nombre d'enregistrements dans les liaisons de règles et les
colonnes choisies. Après avoir terminé l'exportation, le logiciel ouvre le Résumé d'exportation.
5. Révisez le Résumé d'exportation puis cliquez sur Continuer.
Contenu Description
Total des liaisons de règles exportées : <n> Nombre de liaisons de règles dont l'exportation a réussi.
Total des liaisons de règles ignorées : <n> Nombre de liaisons de règles qui n’ont pas été exportées.
6. Sélectionnez un emplacement pour le fichier Zip ou le classeur Excel. Cliquez sur Enregistrer.
7. (Facultatif) Cliquez sur Télécharger le fichier journal. Sélectionnez un emplacement puis saisissez un nom
de fichier pour le fichier de journal. Cliquez sur Enregistrer.
8. Cliquez sur Fermer.
Informations associées
Exporter des données ayant échoué depuis plusieurs liaisons de règles [page 280]
Modification du format de fichier Excel par défaut [page 20]
Guide de l'utilisateur
282 PUBLIC Data Insight
4.14.3.5 Affichage des valeurs Sigma
Six Sigma est une combinaison de principes de base et de méthodes statistiques à utiliser pour améliorer vos
processus et augmenter l'efficacité.
Pour afficher les scores six sigma dans le scorecard, accédez à Gérer Préférences et sélectionnez
l'option Afficher les valeurs Sigma.
Remarque
Les valeurs Sigma sont disponibles seulement lorsque vous définissez l'option Afficher le score à partir de :
sur Maintenant.
Une colonne affichant le total de la valeur Sigma apparaît dans l'onglet Paramétrer le scorecard dans les
sections suivantes de la vue de scorecard Détails de Data Quality :
Remarque
Si tous les enregistrements échouent, <-6 s'affiche dans la colonne Score Sigma.
Si tous les enregistrements ont réussi, >6 s'affiche dans la colonne Score Sigma.
La formule utilisée pour dériver les défauts par millions d'opportunités (DPMO) est la suivante :
([Defects]/[Opportunities])* 1,000,000
NORMSINV(1-([DPMO]/1,000,000))+1.5
Remarque
Lorsque vous visualisez les informations de scorecard, il se peut que la qualité des données ne dépasse pas le
seuil bas d'une colonne. Utilisez l'analyse de lignage pour identifier les sources des données et l'analyse
d'impact pour identifier les banques et les rapports de données pouvant être affectés par les données. Vous
Guide de l'utilisateur
Data Insight PUBLIC 283
pouvez également utiliser l'analyse d'impact pour identifier les objets affectés lors de la modification ou de la
suppression d'autres objets connectés.
1. Dans la vue Détail du scorecard, cliquez sur Afficher l'impact et choisissez l'une des options suivantes :
Option Description
Afficher l'impact Affiche les objets dépendant des données de la colonne de table.
Afficher la relation associée Affiche les relations définies (s'il y a lieu) pour la colonne de table.
2. Pour fermer la vue, cliquez sur la croix (X) dans le coin supérieur droit.
Pour apporter des modifications à ces vues, accédez à l'onglet Gestion des métadonnées.
Informations associées
Affichez les informations associées à et de lignage à partir de Data Insight et Metadata Management.
SAP Information Steward ne peut pas afficher les données associées à et de lignage pour les tables importées
à partir de la connexion Data Insight car Information Steward ne dispose pas des métadonnées nécessaires
stockées pour cette connexion.
Pour voir les données associées à et de lignage pour les tables à partir de Data Insight et de Metadata
Management, créez une source d’intégrateur de métadonnées dans la CMC pour la base de données pour
laquelle la connexion Data Insight a été créée, puis exécutez-la pour collecter les métadonnées. Vous pouvez
alors utiliser l’intégrateur pour afficher les informations associées à et de lignage à partir de Data Insight et
Metadata Management. Pour des informations sur la création d’un intégrateur de métadonnées, voir le Guide
d'administration de Information Steward.
Une fois que vous avez une connexion Data Insight et une source d’intégrateur disponible pour la même base
de données, suivez ces étapes pour voir les informations sur Data Insight :
1. Dans Data Insight, sélectionnez la table pour laquelle vous voulez voir les informations :
2. Dans la barre d’outils, sélectionnez Afficher la relation identique. Le logiciel affiche l’intégrateur Metadata
Management correspondant, si configuré.
3. Cliquez sur le Nom de l’intégrateur.
4. Cliquez sur l’onglet Associé à. Le logiciel affiche le diagramme de relations pour la table.
Guide de l'utilisateur
284 PUBLIC Data Insight
5. Cliquez sur l'onglet Lignage. Le logiciel affiche le diagramme de lignage pour la table.
Chaque scorecard comporte un lien URL unique permettant aux autres utilisateurs de le visualiser facilement.
Ce lien peut être intégré au SAP BusinessObjects Enterprise Portal, à la zone de lancement BI ou à une page
Web. Vous pouvez également le copier-coller dans un courrier électronique, un document ou tout autre
emplacement accessible aux autres utilisateurs.
Vous pouvez obtenir le lien d'un score de l'une des façons suivantes :
● Affichez le lien vers un scorecard en accédant à la fenêtre du scorecard, puis cliquez sur Partager.
○ Pour générer un lien pour tous les scorecards sur lesquels vous avez des droits, sélectionnez Tous.
○ Pour générer un lien pour un sous-ensemble spécifique de scorecards, sélectionnez Scorecards
spécifiques. Sélectionnez les scorecards à inclure dans le lien, puis cliquez sur Générer une URL.
Vous pouvez cliquer sur le lien pour voir le mode d'affichage du scorecard pour les autres utilisateurs. Pour
afficher le scorecard partagé, l'utilisateur doit être autorisé à accéder au projet dont il est issu. Les
destinataires du lien de scorecard peuvent uniquement afficher le scorecard et n'ont en aucun cas accès
aux autres écrans et fonctionnalités de Information Steward.
● Créez un lien manuellement vers un scorecard sans accéder à la fenêtre de scorecard.
Les liens de scorecard utilisent la syntaxe suivante :
Par exemple, le scorecard d'un projet « Finance » hébergé par un serveur « IS_Server » peut se présenter
comme suit :
http://IS_Server:8080/BOE/Scorecard?name=Finance&rdir=y
Lorsque vous accédez à un scorecard via un lien, notez les différences suivantes du scorecard sur l'application
Web Information Steward :
● Par défaut, le scorecard s'affiche en Vue récapitulative. Pour passer en vue Détail de Data Quality, cliquez
sur Afficher les détails.
● Pour effectuer un tri à l'affichage des données ayant échoué dans le scorecard, cliquez sur Critères de tri,
puis définissez la séquence de tri pour chaque colonne dans la fenêtre contextuelle.
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 285
4.14.5 Calcul des scorecards
La formule utilisée pour calculer le scorecard est assez simple : (score de l'objet x % de pondération) + (score
de l'objet x % de pondération) = score combiné. L'objet peut être une liaison de règle, une règle ou encore une
dimension de qualité. Le nombre de scores d'objet dépend du nombre d'objets à ajouter au domaine de
données clés. Le calcul de score d'un processus de scorecard commence par les scores de la liaison de règle,
qui sont utilisés pour calculer le score de la règle. Le score de la règle est à son tour utilisé pour calculer le score
de la dimension de qualité, qui lui est utilisé pour calculer le score du domaine de données clés. La pondération
de chaque section doit être cumulée de façon à obtenir un pourcentage de 100 %.
Remarque
Si vous affectez un poids de zéro à un élément, ce dernier (ainsi que ses enfants) n'apparaitra pas ou ne
sera pas utilisé dans les calculs dans la vue du scorecards.
Les scores de scorecard sont calculés et stockés dans le référentiel à l'aide de l'utilitaire de calcul de scorecard,
dont l'exécution est planifiée via la CMC (Central Management Console). Par défaut, l'utilitaire de calcul de
scorecard est exécuté tous les jours, mais vous pouvez modifier la fréquence dans la CMC. Veuillez noter que
les scores de liaison de règle sont obtenus via une tâche d'exécution de règle, qui calcule les scores de
l'ensemble des règles liées aux tables, fichiers plats et/ou vues.
Exemple
Supposons que vous ayez créé un domaine de données clés appelé Client dans l'onglet Configuration du
scorecard. Ce domaine comporte les trois dimensions de qualité suivantes : Précision, Intégralité et
Conformité. Dans le domaine Conformité, deux règles sont appliquées : le code postal doit être valide et le
format du numéro de téléphone doit être standard. La règle du numéro de téléphone comporte deux
liaisons : une table de client individuel est liée à une colonne de numéro de téléphone et une table de client
professionnel est liée à une colonne d'informations sur le contact. Le diagramme illustre les composants du
scorecard. Le score, qui commence par le score de la liaison de règle, est pondéré et utilisé pour calculer le
score de la règle, lui-même utilisé pour calculer le score de la dimension de qualité, à son tour utilisé pour
calculer le score du domaine de données clés.
Guide de l'utilisateur
286 PUBLIC Data Insight
Rubrique parent : Scorecards [page 266]
Informations associées
Guide de l'utilisateur
Data Insight PUBLIC 287
4.15 Analyse de la valeur commerciale
Utilisez les outils d'analyse de la valeur commerciale pour estimer combien les données inexactes peuvent
coûter à votre organisation.
SAP Information Steward estime les coûts relatifs à l'analyse de la valeur commerciale. L’estimation est
effectuée en fonction du nombre réel d'enregistrements ayant échoué dans le système et de votre estimation
du coût par enregistrement ayant échoué. Vous pouvez accéder à ces estimations au niveau des domaines de
données clés, de la dimension de qualité et de la règle de validation.
Exemple
Par exemple, en raison d’informations client inexactes dans votre système ERP, votre société est
confrontée à des retards de commande et des pertes d'envois. Une analyse de la valeur commerciale vous
indique la perte d’argent sur une base annuelle. L'impact financier est suffisamment important pour
convaincre votre direction de dépenser plus d'argent au nettoyage des données client de votre système
ERP.
Le processus général d'analyse de la valeur commerciale est le suivant : Exécutez les étapes suivantes pour
chaque règle applicable dans le projet :
1. Estimez une valeur monétaire pour l'impact financier annuel moyen par échec de cette règle.
2. Choisissez parmi divers types de coûts indépendants des ressources et dépendants des ressources ou
créez-en un.
3. Liez la règle à une ou plusieurs sources et calculez les scores.
4. Dans le scorecard d'un projet, affichez les résultats d'analyse de la valeur commerciale.
5. Au besoin, ajustez les résultats ou utilisez l'outil d'analyse par simulation pour déterminer la manière dont
les modifications se répercutent sur le résultat.
Informations associées
Guide de l'utilisateur
288 PUBLIC Data Insight
4.15.1 Configuration des coûts par échec d'enregistrement
Information Steward estime les coûts pour les données ayant échoué à l'aide de la feuille de calcul de la valeur
commerciale et des informations que vous fournissez.
Configurez les coûts associés pour chaque règle. Le logiciel calcule les valeurs estimées qui représentent
l'impact financier total de cette règle par échec. Utilisez l'outil d'analyse par simulation de la valeur
commerciale pour manipuler ces valeurs pour simuler différents scénarios.
Pensez en termes d'impact financier annuel moyen par échec de cette règle. Par exemple, un enregistrement
erroné dans le système peut être employé plusieurs fois sur une année s'il n'est pas corrigé. Par conséquent, le
coût ne correspond pas à une seule occurrence, mais au cumul des impacts des utilisations de cet
enregistrement sur un an.
Saisissez les coûts estimés pour chaque type de coût dans la feuille de calcul de la valeur commerciale.
Frais généraux fixes Frais généraux fixes distribués par échec. Par exemple, les
coûts de stockage en raison de retours de colis.
Chiffre d'affaires Perte de chiffre d'affaires direct. Par exemple, la perte de cli
ents ou de nouvelles ventes.
Autre Autres coûts encourus qui ne sont pas liés aux autres caté
gories.
Guide de l'utilisateur
Data Insight PUBLIC 289
Types de coûts dépendants des ressources
Main d'œuvre Coûts nécessitant le travail de l'homme pour corriger les er
reurs. Par exemple, le paiement des heures supplémentaires
des employés qui réapprovisionnent les retours de colis.
Informations associées
Saisissez les estimations de coûts pour les différents types de dépenses dans la Feuille de calcul de la valeur
commerciale pour qu’Information Steward puisse calculer l'impact financier annuel moyen pour la règle
sélectionnée.
Le logiciel affiche la feuille de calcul de la valeur commerciale. La feuille de calcul est divisée en deux
sections : Coûts indépendants des ressources et Coûts dépendants des ressources.
3. Cliquez sur Ajouter un coût pour ajouter une ligne à la section Coûts indépendants des ressources.
Cliquez sur Ajouter un coût pour ajouter une nouvelle ligne pour chaque coût dont vous souhaitez faire
l’estimation.
4. Sélectionnez un type de coût dans la liste déroulante de la colonne Coût.
5. Saisissez une description pour le coût qui décrit au mieux son sens pour votre organisation dans la colonne
Description.
Étant donné que vous pouvez avoir plusieurs types de coût identiques, une description précise est
importante. Description est un champ obligatoire.
6. Saisissez un montant dans la colonne Sous-total qui représente le coût par année.
Lorsque vous avez terminé la section Coûts indépendants des ressources, le logiciel calcule
automatiquement le sous-total des coûts.
Guide de l'utilisateur
290 PUBLIC Data Insight
Saisissez maintenant les coûts estimés dans la section Coûts dépendants des ressources.
7. Cliquez sur Ajouter un coût pour ajouter une ligne à la section Coûts dépendants des ressources.
8. Sélectionnez un type de coût dans la liste déroulante de la colonne Coût.
9. Saisissez une description pour le coût qui décrit au mieux son sens pour votre organisation dans la colonne
Description.
Étant donné que vous pouvez avoir plusieurs types de coût identiques, une description précise est
importante. Description est un champ obligatoire.
10. Saisissez une estimation du nombre de personnes pour le type de coût.
11. Saisissez une estimation du montant en dollars pour le taux de main-d’œuvre.
12. Saisissez une estimation du nombre d'heures par personne.
Le logiciel calcule automatiquement un sous-total et le total de tous les coûts indépendants des
ressources et dépendants des ressources.
13. Cliquez sur Enregistrer.
Veillez à renseigner tous les champs obligatoires. Le logiciel affiche une erreur lorsque vous cliquez sur
Enregistrer et que vous n'avez pas renseigné tous les champs obligatoires.
14. Cliquez sur Enregistrer, puis sur Fermer pour fermer la fenêtre Éditeur de règle.
Le logiciel met à jour l'analyse de la valeur commerciale dans les scorecards des projets qui utilisent cette règle.
Informations associées
Utilisez l’Analyse de la valeur commerciale pour analyser la façon dont les changements dans la qualité de vos
données affectent vos coûts. Affichez les données dans un format graphique ou tabulaire.
La vue Résumé ou la vue Détail de Data Quality s'ouvre, en fonction de la dernière fenêtre visualisée.
2. Si la vue du scorecard en cours est Résumé, sélectionnez un domaine de données clés, puis cliquez sur
Analyse de la valeur commerciale.
3. Si la vue du scorecard en cours est Détails de Data Quality, sélectionnez un domaine de données clés et
cliquez sur Analyse de la valeur commerciale ou bien sélectionnez un domaine de données clés après
l’ouverture de la boîte de dialogue Analyse de la valeur commerciale.
Dans la boîte de dialogue Analyse de la valeur commerciale, le coût estimé total en cours s'affiche dans le
coin supérieur droit de la fenêtre. L'estimation est basée sur les définitions en cours pour chaque règle.
Guide de l'utilisateur
Data Insight PUBLIC 291
4. Modifiez le domaine de données clés en le sélectionnant dans la liste déroulante.
5. Cliquez sur Analyse par simulation pour modifier les paramètres et afficher les résultats. Vous pouvez, par
exemple, déterminer comment la diminution du nombre d'enregistrements ayant échoué ou le coût par
échec peut faire économiser de l'argent à votre organisation.
6. Ignorez vos modifications par simulation en sélectionnant Réinitialiser dans le menu Paramètres.
7. Enregistrez le coût estimé dans une feuille de calcul.
a. Cliquez sur l’icône Paramètres dans le coin supérieur droit de la fenêtre.
b. Sélectionnez Enregistrer au format Excel.
Informations associées
L'estimation actuelle contient les coûts estimés, le coût par échec et d’autres détails affichés dans une vue
graphique ou tabulaire.
La vue graphique s’ouvre initialement par défaut. Cliquez sur les icônes à onglets pour modifier la vue. Le
tableau suivant décrit le contenu de chaque vue.
Guide de l'utilisateur
292 PUBLIC Data Insight
Affichage des descriptions pour l’estimation actuelle
Vue Description
Diagrammes Vue graphique du diagramme à barres Coût estimé. Le diagramme à barres affiche les dimensions de qua
à barres et de
lité. Affichez les règles en cochant la case Afficher les règles pour ce projet.
tendances
Placez le curseur sur une barre du diagramme à barres pour afficher les détails relatifs à chaque règle :
Nombre total d'enregistrements, enregistrements ayant échoué, coût par échec et total.
● Placez le curseur sur une valeur pour afficher la fenêtre Détails sur le coût par échec affichant les mon
tants par type de coût configurés pour cette règle.
● Cliquez sur la valeur pour ouvrir la fenêtre Détail de coût affichant les détails définis dans l'éditeur de
règles. Vous pouvez aussi afficher cette fenêtre Détails sur le coût en cliquant sur l'icône Paramètres
dans le coin supérieur droit, puis en sélectionnant Afficher les détails des coûts estimés actuels.
Le diagramme Tendance des coûts représente l'historique de l'impact financier à l'aide du coût actuel par
échec par règle. Chaque ligne présente l'impact pour une dimension de qualité. Lorsque vous placez le cur
seur de la souris sur une ligne, des info-bulles affichent l'impact du coût par date.
Tabulaire Cette vue tabulaire répertorie les règles en les regroupant par dimension de qualité. La vue tabulaire inclut
les informations suivantes :
● Placez le curseur sur une valeur pour afficher la fenêtre contextuelle Détails sur le coût par échec affi-
chant les montants par type de coût configurés pour cette règle.
● Cliquez sur la valeur pour ouvrir la fenêtre Détail de coût affichant les détails définis dans l'éditeur de
règles. Vous pouvez aussi afficher cette fenêtre Détails sur le coût en cliquant sur l'icône Paramètres
dans le coin supérieur droit, puis en sélectionnant Afficher les détails des coûts estimés actuels.
Exemple
Ajustez également le Coût par échec sans avoir à mettre à jour les valeurs dans l'éditeur de règles. Augmentez
ou réduisez le montant du coût par échec. Le logiciel reflète immédiatement les modifications dans les totaux
et les différences.
Guide de l'utilisateur
Data Insight PUBLIC 293
Cliquez sur les icônes à onglets pour modifier la vue :
Vue Description
Diagramme à Une vue graphique qui affiche les dimensions de qualité définies pour ce projet. Si vous cochez la case
barres du
Afficher les règles, les règles définies pour ce projet s’affichent sous forme graphique.
coût estimé
Manipulez les valeurs de coût pour une règle donnée en sélectionnant Modifier. La boîte de dialogue
Modifier l'analyse par simulation s'affiche pour effectuer les ajustements. Le logiciel met à jour instantané
ment les montants totaux et les différences.
Tabulaire Cette vue tabulaire répertorie les règles en les regroupant par dimension de qualité. La vue tabulaire inclut
les informations suivantes :
Le langage de script SAP Information Steward prend en charge les expressions avec vérification conditionnelle,
variables, manipulation de données et appels de fonctions. Utilisez-le pour créer des expressions de condition
et de définition complexes pour les règles et les vues.
Lorsque vous créez des expressions de définition de règle, vous avez accès au langage de script complet. Celui-
ci inclut des modèles, des mots clés et des paramètres. Créez des expressions de définition de règle dans la
boîte de dialogue Editeur de règles avancé de la fenêtre Editeur de règles.
Un sous-ensemble du langage de script est disponible dans les éditeurs avancés associés aux vues lorsque
vous créez des mappages de colonnes, des conditions de jointure, des expressions de condition de filtre et des
tâches de profilage de colonnes.
Informations associées
Guide de l'utilisateur
294 PUBLIC Data Insight
4.16.1 Catégories de création d'expressions
Les éditeurs d'expressions avancés contiennent des catégories permettant de créer des expressions
disponibles sous la forme d'icônes dans la barre de menus en haut de chaque boîte de dialogue de l'éditeur
avancé. Lorsque vous cliquez sur une icône de menu, toutes les fonctions de la catégorie s'affichent dans une
liste déroulante. Lorsque vous sélectionnez une option, une boîte de dialogue permettant de créer une
expression s'ouvre. Notez que vous devez toujours entrer manuellement d'autres éléments de l'expression,
puis, même si vous avez utilisé le logiciel pour générer l'expression, validez cette dernière en cliquant sur le
bouton Valider. Les expressions Information Steward demandent des connaissances en langage de script SAP.
Cette table contient une liste de chaque catégorie de fonction, des fonctions associées et précise si une
catégorie s'applique aux types d'objets spécifiques.
● Moyenne
Agrégat (disponible unique ● Nombre
ment pour les vues de l'onglet
● Compter les éléments uniques
Schéma de sortie)
● Max
● Min
● Somme
● Convertir en caractères
● Convertir en date
Conversion
● Convertir en décimale
● Valeur julienne en date
Guide de l'utilisateur
Data Insight PUBLIC 295
Catégorie Fonctions
Règles :
● Absolue
Math ● Modulo
● Arrondi
● Racine carrée
● Tronquer
● And
Opérateur ● Equals
● Greater than
● Greater than or equal
● In
● Is not null
● Is null
● Less than
● Less than or equal
● Not
● Not equal
● Not in
● OR
Guide de l'utilisateur
296 PUBLIC Data Insight
Catégorie Fonctions
● Remplissage à gauche
● Remplissage à gauche logique
Chaîne
● Supprimer à gauche de la chaîne
● Modèle de correspondance
● Correspondance d'expression régulière
● Remplacer la sous-chaîne
● Remplissage à droite