Vous êtes sur la page 1sur 0
GUIDE D'ACCÈS AUX DONNÉES
GUIDE D'ACCÈS AUX DONNÉES

GUIDE D'ACCÈS AUX DONNÉES

GUIDE D'ACCÈS AUX DONNÉES
GUIDE D'ACCÈS AUX DONNÉES
GUIDE D'ACCÈS AUX DONNÉES

GUIDE D'ACCÈS AUX DONNÉES

Copyright © 2007 ACL Services Ltd.

Tous droits réservés.

Aucune partie de cette documentation ne peut être reproduite, stockée dans un système de récupération ou transmise sous quelque forme ou par quelque moyen que ce soit (photocopie, format électronique, moyen mécanique, enregistrement ou autre), sans l’autorisation écrite de l’éditeur, sauf par des critiques qui pourront en citer de courts extraits.

ACL 9

Novembre 2007

ACL Services Ltd. 1550 Alberni Street Vancouver, BC Canada V6G 1A5

Téléphone : +1-604-669-4225 Adresse électronique : info@acl.com Site Web : www.acl.com

Imprimé au Canada

ACL, le logo ACL, le logo ACL accompagné du texte, « ACL Data you can trust. Results you can see. » et Audit Command Language sont des marques ou des marques déposées d'ACL Services Ltd.

Microsoft, Windows et Windows Server sont des marques ou des marques déposées de Microsoft Corporation. z/OS est une marque déposée d'IBM Corporation. SAP, R/2 et R/3 sont des marques commerciales ou des marques déposées de SAP AG. Crystal Reports est une marque ou une marque déposée de Business Objects SA. Toutes les autres marques commerciales appartiennent à leurs propriétaires respectifs.

200801151120

TABLE DES MATIÈRES

Chapitre 1 : Introduction

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

1

Recherche, transfert et accès

 

2

Chapitre 2 : Recherche des données

 

3

Connaître vos données

 

5

Formuler une requête de données

6

Choisir un emplacement pour le traitement des données

12

Chapitre 3 : Accès aux données

 

17

Créer une table

18

Importer et copier

19

Accès direct

21

Chapitre 4 : Sources de données

 

.

.

.

.

.

.

.

.

.

.

25

ACCPAC

26

AIX, données

27

Fichiers COBOL copybook

28

DB2

34

Compatibilité avec dBase

38

Délimité

40

HTML

47

Longueur variable IBM

49

IMS

51

Linux, données

53

Microsoft Access

54

Microsoft Excel

55

Microsoft Word

58

Données à plusieurs types d’enregistrements

59

Bases de données conformes à la norme ODBC

65

Oracle

74

Fichiers OS/400 FDF

76

PDF

80

Fichiers PL/1 copybook

81

Image d’impression

84

RTF (Rich Text Format)

87

SAP

88

SMF

90

UNIX, données

96

VSAM

98

XML

100

CHAPITRE 1

INTRODUCTION 1

Les trois étapes de l’accès aux données

Ce guide vous aidera à accéder à différents types de données à l’aide du logiciel ACL. Les analystes de données doivent avoir accès à diverses sources de données, à la fois au sein et à l’extérieur de leur organisation, et doivent également avoir conscience des problèmes techniques qui les accompagnent. Ce guide aborde ces deux questions.

Une grande partie du matériel utilisé pour cette publication provient des connaissances collectives de l’équipe de service d'assistance d’ACL. Les compétences de cette équipe proviennent de leur propre formation et du contact quotidien avec ceux qui utilisent ACL sur leur lieu de travail. Ce contact leur permet également de savoir quelles questions sont posées à propos de l’accès aux données.

Ce guide a pour objectif de répondre aux questions les plus fréquentes et de servir de référence afin de relever quelques-uns des défis les plus problématiques de l’accès aux données.

Dans ce chapitre… Trouver les données Obtenir les données Lire les données

Pour trouver la définition de

termes inhabituels, sélectionnez Aide » Index et cherchez « terminologie » dans l'aide d' ACL.

Chapitre 1 : Introduction

Recherche, transfert et accès

Avant d’envisager d’accéder aux données, vous devez trouver celles que vous souhaitez analyser. Ensuite, vous devez les transférer de leur source vers un ordinateur qui utilise ACL. Considérez l’accès aux données comme un processus en trois étapes :

Recherche des données

Tout d’abord, trouvez la source et le fournisseur des données, puis obtenez le plus d’informations possible sur la nature de ces données. Vous devez connaître les caractéristiques des données afin de formuler votre requête de manière précise à leur fournisseur. Ce processus est un élément essentiel du projet d’analyse des données. Déterminez si l'accès à ces données est limité.

Choix d’un emplacement pour le traitement des données

Vous devez ensuite décider de l’emplacement pour le traitement des données. Dans certains cas, vous devrez déplacer les données sur un lecteur à partir duquel vous pourrez les lire. Vous pouvez avoir directement accès à certaines sources de données basées sur un serveur et les traiter à partir du serveur avec ACL Édition Serveur.

Le Chapitre 2 : “Recherche des données” détermine le contenu des requêtes de données et leur formulation, ainsi que la manière de décider de l’emplacement du traitement de vos données.

Accès aux données

Une fois les données sur un lecteur accessible, vous pouvez commencer le processus d’accès aux données. ACL lit différents types de fichiers de différentes façons et avec différents degrés d’automatisation. Les données issues de technologies récentes requièrent moins de traitement manuel que celles issues de systèmes hérités.

Le Chapitre 3 : “Accès aux données” donne une vue d’ensemble des différentes méthodes de lecture de données d’ACL et le Chapitre 4 :

“Sources de données” dresse une liste des sources de données par catégorie et présente les options d’accès aux données pour chacune d’entre elles.

CHAPITRE 2

RECHERCHE DES DONNÉES 2

Trouver les données requises et en prendre connaissance

Les données proviennent souvent de l’extérieur dans des formats aussi variés que des fichiers plats et des bases de données relationnelles, sur des plates-formes allant des PC aux ordinateurs centraux. Des disques durs, des bandes ou des CD peuvent être utilisés comme support de stockage. Les moyens de transmission peuvent inclure un protocole de transfert de fichiers, un courrier électronique ou un mappage de lecteur. Les fichiers de données ne contiennent pas toujours des informations relatives au format de l’enregistrement.

Vous êtes souvent amené à obtenir des données auprès d’agents externes ou auprès d’autres services de votre organisation. Les grandes organisations emploient des administrateurs de bases de données qui gèrent les données, examinent et acceptent les requêtes d’accès et s’assurent qu’elles sont conformes aux procédures de sécurité des données.

Par conséquent, lorsque vous formulez une requête de données, de nombreux facteurs doivent être pris en considération. Parfois, les analystes de données trouvent que les contraintes organisationnelles et une communication interne inefficace limitent leur accès

Dans ce chapitre…

Travailler avec l'équipe informatique

Préparer des requêtes de données

Connaître la structure du fichier

Préciser le jeu de caractères original

Vérifier l’intégrité des données

Transférer de PC à PC

Obtenir des données d’ordinateur central/de serveur

Opter pour un système

Chapitre 2 : Recherche des données

aux données. Plus vous êtes informé sur les données et la manière d’y accéder, plus vos requêtes seront précises et fondées.

Connaître vos données

Les problèmes que pose l’accès aux données proviennent souvent :

Connaître vos données

D’un manque de connaissance des données disponibles

D’une communication inefficace concernant les besoins en données

Apprendre à collaborer avec l'équipe informatique

Vous dépendez énormément du personnel du département informatique dans vos recherches de données, donc facilitez-vous la tâche (et la leur) en apprenant le langage de la technologie. Lorsque vous entendez un terme qui vous est inconnu, demandez ce qu’il signifie. Apprenez le plus de vocabulaire possible afin de formuler des requêtes claires et vous assurer ainsi d’obtenir ce dont vous avez besoin.

Connaître la nature des données et les fondements de la gestion des données peut vous aider à formuler votre requête brièvement. En connaissant le langage des systèmes d’information, vous contribuez à installer une bonne communication entre les analystes de données et les fournisseurs de données et vous encouragez des conditions de travail positives.

Identifiez les données disponibles.

? Pour un aperçu des concepts de données, sélectionnez Aide » Index et cherchez « sources de données ».

Trouvez quelles données sont disponibles et où elles sont stockées. Demandez à examiner ces données pour voir quels champs vous seraient utiles et quelles informations ils contiennent. Vous vous apercevrez que certaines données comprennent des champs vides ou que vous n’avez besoin que d’une partie des données. Dans ce cas, il est possible d’extraire les données dont vous avez besoin dans un fichier plus petit.

En travaillant avec l'équipe informatique, vous en saurez plus sur les systèmes et sur les tables et les champs qu’ils contiennent. Conservez des notes relatives aux discussions que vous avez eues avec les fournisseurs de données afin de constituer un plan des données principales. Plus vous aurez des connaissances, moins vous serez dépendant de l'équipe informatique.

Chapitre 2 : Recherche des données

Formuler une requête de données

Avant de faire une requête, déterminez qui contrôle les données que vous cherchez. En règle générale, c’est le service informatique qui est chargé du traitement et de la distribution des données.

Cependant, le traitement des données peut être décentralisé. Des services tels que les ressources humaines ou les achats possèdent souvent leur propre système indépendant. Ces systèmes locaux peuvent contenir de nombreuses données utiles.

Votre requête doit être aussi complète que possible. Déterminez les champs et les enregistrements qui vous sont nécessaires, ainsi que le type de fichier, le format de date, la méthode de transmission et les supports de stockage. Trouvez le format le mieux adapté à ACL et précisez-le. Renseignez-vous sur la longueur des enregistrements, le comptage des enregistrements et le total de contrôle car ces informations sont nécessaires pour les tests d’intégrité des données.

Obtenir un format d’enregistrement

À moins que vos fichiers ne contiennent des informations inhérentes relatives au format des enregistrements, vous devez également demander un format d'enregistrement. Les formats d’enregistrements vous aident à créer la table dans ACL. Ils fournissent des caractéristiques supplémentaires telles que la longueur d’enregistrement, le type de données et la description du champ. Hormis les tables DB2, tous les fichiers de données de l’ordinateur central doivent être accompagnés d’un fichier de format d’enregistrement.

Exemple de format d’un enregistrement

Formuler une requête de données

Nom de

Position

Longueur

Type

Format

Description

champ

de

début

NoProd

1

7

Caractère

Numéro du produit

DescProd

8

20

Caractère

Description

PrxUnit

28

6

Numérique

9,999.99

Prix unitaire standard

DtePrx

34

10

Date

JJ/MM/AAAA

Date du prix

Tenir compte de la structure du fichier

Les structures de fichiers les plus adaptées à vos besoins sont celles qu’ACL définit comme nécessitant peu ou pas d’aide de votre part. Cependant, ces structures ne sont pas toujours celles que les fournisseurs de données ont le plus de facilité à fournir. Il vous faudra parfois faire des compromis.

Lorsque vous le pouvez, utilisez les données sous leur forme originale. ACL reconnaît de nombreuses structures de fichiers et s’en sert comme base pour créer des tables avec une intervention manuelle minime.

ODBC

Travailler avec une structure conforme à la norme ODBC vous demande peu d’effort. ACL reconnaît et crée une table à partir de données conformes à la norme ODBC. Dans ODBC, vous pouvez également choisir des tables spécifiques et installer un filtre pour obtenir uniquement les enregistrements dont vous avez besoin. Mais, pour des raisons de sécurité et de performance, l'équipe informatique hésite parfois à donner un accès ODBC. Ce qui pose problème est que vous pouvez parfois contourner les dispositifs de sécurité intégrés du logiciel qui lisent la base de donnée. De plus, l’accès non contrôlé à des tables de données d’un système peut ralentir les opérations quotidiennes, surtout si la requête est faite en période de pointe. Les requêtes d’un grand nombre de données sollicitent énormément les ressources du système. Cependant, si vous suivez la procédure normale, vous pouvez aider à réduire ces problèmes et obtenir l’accès nécessaire.

Trouvez une structure qui

convient aussi bien à l'équipe

informatique qu'à vous.

Chapitre 2 : Recherche des données

dBASE

Si possible, demandez les données en sortie dBASE de longueur fixe. Les fichiers de longueur fixe contiennent des enregistrements de longueur égale dans lesquels le même champ apparaît au même emplacement sur chaque enregistrement. ACL reconnaît les fichiers dBASE et crée facilement des tables à partir de ces fichiers.

Fichiers plats

L'équipe informatique est souvent capable d’extraire des données vers un fichier plat qui contient uniquement les données et un caractère CR/LF à la fin de chaque enregistrement. Dans les fichiers plats, les informations sont stockées dans des enregistrements et des champs simples et non dans des structures de bases de données complexes. Lorsqu’ACL rencontre un fichier plat, il comprend automatiquement que le caractère CR/LF marque la fin d’un enregistrement. Pour créer une table, vous pouvez utiliser l'Assistant de définition de données pour définir les champs manuellement ou à l'aide d'un format d'enregistrement.

Fichiers de définition externe

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « fichier plat ».

Une autre option utilise des fichiers textes. Ces fichiers de définition externe contiennent le format d’enregistrement de fichiers de données spécifiques. Pour les fichiers OS/400, le format porte le nom de Field Definition Format (FDF, format de définition de champ). Pour PL/1 et COBOL, le format est connu sous le nom de copybook. Dans les deux cas, ACL crée les tables automatiquement.

Fichiers image d’impression

Parfois, la seule manière d’obtenir des données d’un système hérité est de créer des fichiers de rapport électroniques, connus sous le nom de fichiers image d’impression. ACL peut lire les fichiers de rapport électroniques. Il est recommandé d'utiliser l'Assistant de définition de données pour définir un fichier image d'impression. L'Assistant crée une instruction IMPORT que vous pouvez réutiliser pour d'autres fichiers image d'impression ayant le même format.

Préciser le jeu de caractères original

Formuler une requête de données

Demandez les données dans leur jeu de caractères original lorsque vous les téléchargez à partir d’un ordinateur central. ACL lit les données dans leur jeu de caractères original, qu’il s’agisse du format EBCDIC ou ASCII.

Lorsque vous convertissez des données, vous pouvez en omettre certaines ou les modifier par inadvertance. Par ailleurs, étant donné que les jeux de caractères ASCII et EBCDIC ne sont pas équivalents, le processus de conversion peut modifier les données sources. Certains types de données, tels que les données numériques compactées, ne peuvent pas être convertis directement d’EBCDIC en ASCII. Évitez donc, si possible, les conversions inutiles.

Formuler des requêtes spécifiques

Les fournisseurs de données sont en charge d’une multitude de tables de données et de champs et ne peuvent donc pas répondre efficacement à des requêtes imprécises. Utilisez un formulaire tel que le “Formulaire type de requête de données” page 10 pour vous assurer que vous fournissez toutes les informations nécessaires.

Chapitre 2 : Recherche des données

Formulaire type de requête de données

Vos coordonnées

Date de la requête

20.05.06

À l’attention de

Joe Technicien, siège de Metaphor Corporation

Adresse électronique

joe_tech@metaphorcorp.com

De

Georges Auditeur, Filiale occidentale, Metaphor Corporation

Adresse électronique

geo_aud@metacorpwb.com

Description des données

Nom du fichier ou de l’ensemble des données

Détail des transactions A/R

Noms des champs ou des tables

Informer l'équipe informatique

Période

1er semestre 2006

Plate-forme et application

PC, Oracle Financials

Structure du fichier

dBASE

Détails sur le transfert des données

Date de livraison requise

22.05.06

Supports de stockage

CD

Méthode de transfert

Coursier

Adresse électronique ou FTP du destinataire

Suite 207, 123 rue X, ville Y

Exigences supplémentaires

Formuler une requête de données

Longueur de l’enregistrement

SO

Comptage des enregistrements

Veuillez l’envoyer par courrier électronique

Totaux de contrôle pour les champs numériques

Veuillez l’envoyer par courrier électronique

Format d’enregistrement qui contient les noms de champs, les positions de début de champ, les longueurs de champs, les types de données, les formats de champs numériques et de dates, ainsi que les descriptions de champs

SO

Test d’intégrité

Peu importe le temps que vous passez sur un projet, il est impossible d’obtenir de bons résultats avec de mauvaises données. Par conséquent, à chaque fois que vous recevez des données, testez leur intégrité.

Vous pouvez alors vous rendre compte que vous avez besoin de plus de données ou que vous avez reçu des fichiers pour la mauvaise période fiscale ou des fichiers incomplets. Soyez flexible pour faire face à des évènements inattendus, rectifiez l’approche analytique et faites d’autres requêtes de données si nécessaire.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « tests ».

Chapitre 2 : Recherche des données

Choisir un emplacement pour le traitement des données

Une fois que vous avez défini les données nécessaires, vous devez réfléchir à la façon dont vous allez les déplacer vers un lecteur accessible ou accéder à leur emplacement actuel. Si les données proviennent d’un miniordinateur ou d’un ordinateur central, vous devrez peut-être les transférer vers un ordinateur personnel (PC). Si les données proviennent d’une plate-forme Windows, vous devrez certainement les transférer d’un PC à un autre.

Vous pouvez accéder aux données du serveur en mettant ACL et ACL Édition Serveur en réseau de façon à fonctionner dans une configuration client/serveur, ou en exécutant ACL Édition Serveur en mode autonome.

Cette section fournit une vue d’ensemble du traitement dans un environnement client/serveur et du traitement sur PC afin de vous aider à choisir la meilleure solution.

Transférer les données sur votre PC

La plupart des fabricants de mini-ordinateurs et d’ordinateurs centraux fournissent un moyen de transfert des données vers un PC. Si vous utilisez un PC pour accéder à l’ordinateur central via un logiciel d’émulation de terminal, vous pouvez télécharger ou transférer des fichiers de données par l’intermédiaire de ce lien.

Les méthodes standard de transfert de données sont :

Le protocole de transfert de fichiers (FTP)

Les utilitaires de transfert de données avec logiciels d’émulation de terminal

Le mappage de lecteur

La configuration client/serveur

Les supports sous forme de disques

Assurez-vous que vous disposez de l’espace approprié sur votre lecteur de disque dur ou sur votre disque réseau pour stocker les données que vous allez obtenir. Les données requièrent parfois un espace important.

Préparation des fichiers pour le transfert

Choisir un emplacement pour le traitement des données

Dans de nombreux systèmes, vous pouvez exporter ou extraire des données pour les transférer. Souvent, il est possible d’exporter des données à partir de leur application source, dans un format adapté à l’exportation, vers des programmes Windows. Les options de sortie peuvent être, entre autres, dBASE, délimité, et Microsoft Excel.

Lorsque les applications proposent une option appropriée, vous pouvez extraire les champs désirés afin de réduire le temps de traitement. Vous pouvez également combiner les champs d’un fichier à enregistrements multiples pour créer un fichier à enregistrement simple.

Durée de transfert

Le temps nécessaire pour transférer des données varie selon la méthode utilisée. La vitesse de transfert est comprise entre 6 Ko et 10 000 Ko par minute pour une émulation PC3270 et jusqu’à 10 Mo par seconde pour une connexion LAN.

Une configuration client/serveur transfère les données à une vitesse comparable à FTP. Des tests de performance locaux indiquent qu’un utilitaire de transfert d’émulation de terminal peut prendre jusqu’à trente fois plus de temps qu’une configuration client/serveur ou FTP.

Protocole de transfert de fichiers (FTP)

Le protocole FTP permet de copier simplement des fichiers sur votre ordinateur à partir d’autres serveurs. Il utilise les protocoles TCP/IP d’Internet et permet de transférer des fichiers qui sont trop volumineux pour être envoyés par courrier électronique. Vous pouvez utiliser FTP avec une interface de ligne de commande ou l’un des nombreux programmes commerciaux qui disposent d’une interface graphique.

Chapitre 2 : Recherche des données

Logiciel d’émulation de terminal

Le logiciel d’émulation de terminal affiche le système d’exploitation central de la source de données sur votre PC, dans une fenêtre séparée. L’ordinateur personnel fonctionne alors comme un terminal connecté à l’ordinateur central.

Les logiciels tels que Personal Communications, PC3270, PC Support/400 et RUMBA fournissent une émulation de terminal pour les PC, ainsi qu’un composant de transfert de fichiers pour télécharger des fichiers.

Sélectionnez le logiciel adéquat.

Précautions à prendre lors du téléchargement Avec le logiciel d’émulation, vous pouvez choisir de transférer les données au format ASCII ou EBCDIC. La plupart des ordinateurs centraux stockent les données au format EBCDIC, alors que la plupart des PC les stockent au format ASCII. ACL peut procéder au traitement des données sur PC dans les deux formats. Dans la mesure du possible, traitez toujours les données dans leur format d’origine. Toute forme de manipulation des données, même leur conversion, entraîne un risque d’erreur. Il faut par conséquent toujours vérifier les paramètres de votre logiciel pour vous assurer que vous téléchargez les données dans leur format d’origine (si possible).

Éviter les problèmes de longueur des enregistrements De nombreux logiciels d’émulation de terminal font appel à un utilitaire dénommé IND$FILE pour transférer des données. Lorsqu’il transfère des données IBM de longueur variable, IND$FILE supprime les informations relatives à la longueur des blocs et des enregistrements, incorporées dans ces données. Sans ces informations, les enregistrements de longueur variable sont difficiles à traiter.

Par contre, l’utilitaire FTP conserve les informations relatives à la longueur des blocs et des enregistrements. Par conséquent, si vous avez le choix, préférez FTP pour transférer des données contenant des enregistrements de longueur variable.

De plus, faites en sorte de conserver les longueurs des enregistrements dans les fichiers de longueur variable IBM.

? Consultez la section “Longueur variable IBM” page 43.

Mappage de lecteur

Choisir un emplacement pour le traitement des données

L'équipe informatique peut mapper un lecteur entre un ordinateur central et un PC, mais doit pour cela utiliser un logiciel externe tel que Samba. Le mappage de lecteur d’un PC vers un autre permet aux membres d’un groupe de travail de partager des fichiers. Toutefois, tout traitement passe par un réseau, ce qui limite le rythme auquel les données peuvent être transférées.

De PC à PC

Pour traiter des données à partir d’un PC, vous pouvez :

Transférer des fichiers de données vers l’ordinateur sur lequel ACL est installé. Copiez des fichiers sur n’importe quel type de disque (disquettes, CD, disques compressés).

Installer ACL sur l’ordinateur contenant les fichiers de données.

Installer un dossier ou un lecteur partagé. Consultez l’Aide dans l’Explorateur Windows pour plus d’informations sur les dossiers partagés.

Traitement des données sur le serveur

Le meilleur environnement pour le traitement des données est souvent l’ordinateur sur lequel se trouvent les données. Le logiciel ACL Édition Serveur peut lire et traiter les données sur Windows et les plates-formes z/OS.

ACL se connecte à ACL Édition Serveur via un réseau pour opérer dans une architecture client/serveur. Vous pouvez traiter les données basées sur un serveur sur le bureau ou sur le serveur.

Lecture directe des données

Avec une connexion client/serveur, vous pouvez lire les bases de données et les fichiers plats directement à partir d’un serveur. Cette possibilité de lecture directe réduit les risques d’erreurs, étant donné que vous ne traitez ni ne téléchargez les fichiers.

ACL offre une sécurité des données sous la forme d’options de cryptage et de compression, que vous pouvez sélectionner lorsque vous créez un profil de serveur.

Consultez également la section

“Mappage de lecteur” page 15.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « accéder aux données avec ACL Édition Serveur ».

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « client/serveur ».

Chapitre 2 : Recherche des données

Composants du système

TPour configurer un environnement client/serveur dans ACL, il vous faut :

Un ou plusieurs clients exécutant ACL avec l’option client/serveur.

Un ou plusieurs serveurs exécutant ACL Édition Serveur.

Une connexion réseau TCP/IP pour relier les clients aux serveurs. La connexion peut être directe, dans un LAN (réseau local), ou par accès par ligne commutée dans un WAN (réseau grande distance).

CHAPITRE 3

ACCÈS AUX DONNÉES 3

Comprendre comment ACL accède aux données

ACL lit les données issues de systèmes aussi variés que ceux des ordinateurs centraux hérités et les bases de données relationnelles modernes. Étant une application en lecture seule, ACL ne modifie jamais les données sources.

En raison de la diversité des sources de données et des technologies d'accès aux données, la manière d’accéder aux données varie d’une source à une autre. ACL lit certaines sources de données directement. Pour d’autres, ACL importe et copie d’abord la source de données dans un lecteur accessible. Plusieurs méthodes permettent d’accéder à certaines sources de données.

La plupart des sources de données modernes contiennent des informations relatives au format de l’enregistrement, telles que la longueur d’enregistrement, le nom des champs, la longueur des champs et le type de données de chaque champ. Lorsque ces informations sont présentes dans la source de données ou dans un fichier de définition externe associé, ACL les obtient automatiquement. Dans le cas contraire, vous devez vous référer à un document tel qu’un format d’enregistrement ou un dictionnaire de données et fournir manuellement les informations à ACL.

Dans ce chapitre… Le processus d’accès aux données La fonction d’un format de table Comment ACL lit les données

Chapitre 3 : Accès aux données

Créer une table

Lorsque vous accédez à une source de données, ACL présente les données sous forme d’une table. Par conséquent, il est possible de décrire le processus d’accès aux données comme le processus de création d’une table.

Formats de table

Elle ACL contient des informations relatives à la structure et au contenu des données sources. Ces informations concernent entre autres l’emplacement, le chemin, la longueur d’enregistrement, les noms de champs, les longueurs de champs, les positions de champs et le type de données. ACL stocke des informations relatives au contenu des données et à la façon dont celles-ci sont affichées dans un format de table.

Pour connaître le format d’une table, sélectionnez Modifier » Format de table.

Méthodes d’accès

Pour accéder aux données, ACL importe les données sous forme de fichier plat et les copie dans un lecteur local ou les lit directement dans leur format d’origine.

? Consultez également la section “Obtenir un format d’enregistrement” page 6.

Importer et copier

Avec cette méthode, ACL crée une copie des données sources dans un ACL fichier plat et de longueur fixe à extension fil.

Lorsque la source de données ou la technologie d’accès aux données fournit des informations sur le format d’enregistrement, ACL crée automatiquement une table.

Importer et copier, format automatique

Les sources de données de cette catégorie sont, entre autres, les fichiers SAP, Microsoft Access, Microsoft Excel, les données XML, ainsi que toutes les sources de données conformes à la norme ODBC, telles qu’un serveur SQL, Oracle ou DB2.

Pour accéder aux données avec cette méthode :

Importer et copier

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « sources de données ».

? Pour plus d’informations sur ODBC, consultez la section “ODBC” page 66.

Trouvez la source de données lorsqu’ACL vous le demande.

ACL copie les données dans un fichier de données ACL plat.

ACL crée automatiquement une table. qui lit les données dans le fichier copié.

Les données importées par l'une de ces sources peuvent être actualisées à tout moment.

Excel, Access, XML, SAP, et sources de données conformes à la norme ODBC Source de
Excel, Access, XML, SAP, et sources de données conformes à la
norme ODBC
Source de
Importer
données
conformes à la norme ODBC Source de Importer données 00110100 01010 00010 001101 110011 Copie des
conformes à la norme ODBC Source de Importer données 00110100 01010 00010 001101 110011 Copie des

00110100 01010 00010 001101 110011

de Importer données 00110100 01010 00010 001101 110011 Copie des données sources sous forme de fichier

Copie des données sources sous forme de fichier plat (.FIL)

Format de

table

Copie des données sources sous forme de fichier plat (.FIL) Format de table Vues Guide d'accès

Vues

Chapitre 3 : Accès aux données

Importer et copier, format manuel

Les sources de données de cette catégorie sont, entre autres, des fichiers délimités, des fichiers PDF et des fichiers image d’impression. Pour les fichiers délimités, vous devez, en règle générale, indiquer seulement le nom et le type de données, ainsi que le format (si nécessaire) de chaque champ. Pour les fichiers PDF et les fichiers image d’impression, vous indiquez quelles parties du fichier doivent être lues en tant que champs et le type de données de chaque champ.

Pour accéder aux données avec cette méthode :

Trouvez la source de données lorsqu’ACL vous le demande.

Entrez les informations relatives au format de l’enregistrement ou confirmez-les lorsqu’ACL les fournit.

ACL copie les données dans un fichier de données ACL plat.

ACL crée une table basée sur votre définition. qui lit les données dans le fichier copié.

Les données importées par l'une de ces sources peuvent être actualisées à tout moment.

Fichiers délimités, fichiers PDF, fichiers image d’impression avec différents types Format manuel Source de
Fichiers délimités, fichiers PDF, fichiers
image d’impression avec différents types
Format manuel
Source de
données
Importation des
00110100 01010 00010 001101 110011
Copie des données
sources sous forme
Format de
de
table
001101 110011 Copie des données sources sous forme Format de de table Vues 20 Guide d'accès

Vues

Accès direct

Accès direct

ACL peut accéder à certaines sources de données directement, sans devoir importer ou copier les données. ACL crée une table avec différents degrés d’automatisation, suivant la quantité d’informations relatives au format disponibles dans la source.

Accès direct, format automatique

Sur le PC, ACL peut accéder à des fichiers de données dBASE avec une extension dbf . Avec ACL Édition Serveur, vous pouvez accéder à des bases de données dynamiques en temps réel :

ACL Édition Serveur pour Windows peut accéder aux données Oracle, DB/2 et SQL Server.

ACL Édition Serveur pour le système d'exploitation z/OS peut accéder aux données DB2, IMS et VSAM.

ACL lit les données sources et obtient les informations relatives au format d’enregistrement automatiquement, à partir du fichier ou de la technologie qui permet d’accéder à la base de données.

Pour accéder aux données avec cette méthode :

Trouvez la source de données lorsqu’ACL vous le demande.

ACL crée automatiquement une table. La table lit la source de données directement.

dBASE, DB2, Oracle, VSAM Import du 00110100 01010 00010 001101 110011 Source de Format de
dBASE, DB2, Oracle, VSAM
Import du
00110100 01010 00010 001101 110011
Source de
Format de
Vues
données
table

Chapitre 3 : Accès aux données

Accès direct, format manuel

ACL peut lire toutes les données plates et séquentielles directement, y compris les données héritées de systèmes centraux plus anciens, les fichiers textes, les journaux de téléphone et d’Internet, etc. Cependant, étant donné que la source ne contient aucune information sur le format d’enregistrement, vous devez fournir ces informations avant qu’ACL ne soit en mesure de créer une table.

Pour accéder aux données avec cette méthode :

Procurez-vous une copie des informations relatives au format de l’enregistrement.

Trouvez la source de données sur l’écran approprié.

Entrez les informations relatives au format de l’enregistrement lorsqu’ACL le demande.

ACL crée une table basée sur votre définition. La table lit la source de données directement.

Fichiers image d'impression définis manuellement, IMS ou tout fichier de données

Format de l’enregistrement ou dictionnaire de

Format manuel 00110100 01010 00010 001101 110011 Source de Format de Vues données table
Format manuel
00110100 01010 00010 001101 110011
Source de
Format de
Vues
données
table

Accès direct, définition externe

Accès direct

Sur certaines plates-formes, les informations sur le format d’enregistrement sont disponibles dans un fichier de référence, distinct du fichier plat qui contient les données. ACL peut lire COBOL copybooks, PL/1 copybooks, et les fichiers de définition OS/400 FDF.

Pour accéder aux données avec cette méthode :

Trouvez le fichier de définition lorsqu’ACL le demande.

ACL transforme la définition en table.

Reliez la table à la source lorsqu’ACL le demande.

La table lit la source de données directement.

COBOL, PL/1, OS/400

Fichier de définition externe : COBOL copybook, PL/1

Import du 00110100 01010 00010 001101 110011 Source de Format de Vues données table
Import du
00110100 01010 00010 001101 110011
Source de
Format de
Vues
données
table

Chapitre 3 : Accès aux données

CHAPITRE 4

SOURCES DE DONNÉES 4

Procédures d’accès aux sources de données courantes

ACL crée une table avec différents degrés d’automatisation, suivant la quantité d’informations sur le format d’enregistrement contenues dans les données sources. Une source de données provenant d’un environnement de traitement plus ancien nécessite en règle générale une intervention manuelle plus importante qu’une source de données créée selon une technologie plus nouvelle.

Plusieurs méthodes permettent d’accéder à certains types de données. Ce chapitre décrit les ensembles de données et les types de fichiers les plus courants et indique comment y accéder.

Dans ce chapitre…

Les types de données sont listés par ordre alphabétique

Chapitre 4 : Sources de données

ACCPAC

ACCPAC est une application pour PC qui stocke les données dans des fichiers de transaction, eux-mêmes associés à des fichiers principaux. Lors de l’acquisition de données ACCPAC, demandez les fichiers de transaction et les fichiers principaux au fournisseur de données. Les données de transaction sont stockées dans des champs compactés de longueur fixe propriétaires.

Méthode d’accès

Importez les données ACCPAC conformément à l’une des méthodes suivantes :

Formats de table prédéfinis

Le dossier des fichiers de données exemples installé avec le logiciel ACL comprend un projet dénommé Formats.acl. Ce projet contient des formats de table pour les fichiers standard ACCPAC. Après avoir ouvert ce projet, sélectionnez un format de table, puis ouvrez le fichier ACCPAC correspondant lorsque vous y êtes invité.

Accès direct, format manuel

Si Formats.acl ne propose pas la liste des fichiers dont vous avez besoin, utilisez l’Assistant de définition de données. Le bon fonctionnement de cette méthode dépend du degré de conformité des fichiers à la structure ACCPAC standard.

Lien ODBC

Vous pouvez utiliser le logiciel tiers ODBC Link pour vous connecter à des données ACCPAC.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « création de tables avec l’assistant ». Consultez également la section « Accès direct, format manuel » page 22.

? Pour plus d’informations sur Lien ODBC, consultez le site Web ACCPAC.

AIX, données

AIX, données

Le système d’exploitation AIX est une version d’UNIX produite par IBM. AIX s’exécute sur différentes plates-formes matérielles, y compris des serveurs et des stations de travail.

Méthode d’accès

Vous pouvez accéder aux fichiers d’un ordinateur qui dispose d’un réseau et qui exécute AIX de la même manière que vous accédez aux fichiers d’un PC, à la condition que vous disposiez des droits d’accès adéquats.

Vous pouvez également accéder aux données AIX et les traiter sur le serveur sur lequel elles se trouvent en utilisant ACL Édition Serveur pour AIX. Les fichiers plats ainsi que les fichiers image d’impression situés sur le serveur peuvent être directement traités sur le serveur lui-même à l’aide de la fonctionnalité de script en mode autonome.

Pour accéder aux bases de données DB2 à l’aide du logiciel ACL Édition Serveur, consultez « DB2 » page 34.

Pour accéder aux bases de données Oracle à l’aide du logiciel ACL Édition Serveur, consultez « Oracle » page 74.

? Pour connaître d’autres moyens d’accéder aux fichiers sur un serveur AIX, consultez « UNIX, données » page 96.

Chapitre 4 : Sources de données

Fichiers COBOL copybook

Le format d’enregistrement des ensembles de données créé sur cette plate-forme est souvent stocké dans un fichier de référence, distinct du fichier plat contenant les données. ACL appelle ces fichiers de référence des fichiers de définition externes. Lorsqu’ACL convertit les données dans le fichier copybook en un format de table, il retient les noms de champs des données sources et identifie les types de ces dernières.

Demandez à l’administrateur système de fournir les données dans leur format EBCDIC d’origine pour éviter les risques d’erreur que peut engendrer une conversion. Demandez le fichier copybook au format ASCII afin que vous puissiez le lire dans un éditeur de texte, si nécessaire.

Méthode d’accès

Accédez aux données COBOL conformément à l’une des méthodes suivantes :

Définition externe

Accédez au fichier de définition externe à l’aide de l’Assistant de définition de données.

Sur l’écran Sélectionner la source des données de l’assistant, sélectionnez Définition externe. Sur l’écran suivant, sélectionnez COBOL. Recherchez ensuite le fichier. ACL crée un format de table à l’aide de la définition externe, puis vous invite à l’enregistrer. Recherchez le fichier de données si vous y êtes invité. ACL crée la table.

Format manuel

S’il est impossible d’obtenir un fichier copybook, procurez-vous une copie imprimée ou électronique des informations relatives au format, puis créez le format de table manuellement.

Références

Chaque ligne d’uncopybookreprésente la définition d’un champ. Toutes les définitions des champs COBOL comportent un niveau, un nom de champ et une instruction PIC qui indique le type de données. Le dictionnaire de données contient souvent des données plus détaillées.

La définition du champ

CODE_POSTAL PIC 9(5)

Fichiers COBOL copybook

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « OFFSET( ) ».

décrit un champ numérique appelé CODE_POSTAL à cinq chiffres. Le chiffre 9 indique que les données sont de type numérique et le 5 indique que le champ comporte cinq chiffres.

ACL retient les noms des champs COBOL, détermine les types de fichiers et interprète les fonctions telles que OCCURS, REDEFINES, ainsi que les champs logiques de niveau 88.

Servez-vous du copybook comme guide si vous devez modifier le format de table ACL. Par exemple, ACL définit uniquement la première occurrence d’une instruction OCCURS. Si vous souhaitez ajouter d’autres occurrences au format de table ACL, vous devez le faire manuellement. Pour le traitement de plusieurs occurrences d’un élément de données, vous pouvez utiliser la fonction OFFSET( ).

Interprétation du copybook

Les mots clés de copybook suivants peuvent vous aider à interpréter le copybook.

Chapitre 4 : Sources de données

Instructions PIC L’instruction PIC identifie le type de données. Le tableau ci-dessous répertorie et décrit les types de données COBOL les plus fréquents et donne leur équivalent ACL s’il existe.

Type de

Description

Type de données ACL équivalent

données

COBOL

X Caractères alphanumériques

EBCDIC

A Caractères alphabétiques uniquement

EBCDIC

9

Caractère numérique

BINARY (Binaire) ou PACKED (Compacté), suivant le type de Comp. Cf. Comp-3 et Comp-1. Numérique par défaut.

Comp-3

Valeur numérique

BINARY (Binaire) ou PACKED (Compacté), si l’instruction PIC ne contient pas de S.

Comp-1

Valeur numérique

BINARY (Binaire)

S Caractère numérique signé

9(5)

Nombre de caractères répétés

Les parenthèses indiquent la largeur PIC. Le 9 indique un champ numérique qui comporte 9 chiffres. 9(5) a la même signification que 99999.

9

Caractère numérique

BINARY (Binaire) ou PACKED (Compacté), suivant le type de Comp. Cf. Comp-3 et Comp-1. Numérique par défaut.

Comp-3

Valeur numérique

BINARY (Binaire) ou PACKED (Compacté), si l’instruction PIC ne contient pas de S.

Fichiers COBOL copybook

Type de

Description

Type de données ACL équivalent

données

COBOL

Comp-1

Valeur numérique

BINARY (Binaire)

V Le « V » indique une décimale virtuelle, c’est-à-dire une décimale implicite à l’emplacement du champ. La décimale n’est pas stockée dans le fichier, ce qui permet d’économiser l’espace.

Niveaux et groupes Les COBOL copybooks comportent des niveaux, des chiffres de 01 à 49 qui précèdent les noms des champs. Ces niveaux indiquent au compilateur COBOL comment associer ou regrouper les champs dans l’enregistrement. Le niveau 01 indique le nom de l’enregistrement.

Un champ de niveau 2 n’est pas plus important qu’un champ de niveau 3, mais un champ de niveau inférieur est subordonné à un champ de niveau plus élevé. Par exemple, les deux champs de niveau 10, NUMÉRO_AGENCE et TYPE_COMPTE, appartiennent au groupe de niveau 05, NUMÉRO_COMPTE. Plus le numéro est grand, plus le niveau est bas.

05 NUMÉRO_COMPTE.

10

NUMÉRO_AGENCE

PIC

9(3).

10

TYPE_COMPTE

PIC

9(1).

10

NUMÉRO_CLIENT

PIC

9(6).

NUMÉRO_COMPTE n’a pas de PIC car NUMÉRO_COMPTE représente un groupe et non un champ. En règle générale, les programmeurs indentent les niveaux inférieurs pour plus de clarté, mais ce n’est pas indispensable. La longueur du champ numérique NUMÉRO_COMPTE est 10, soit la somme des champs subordonnés, (3) + (1) + (6).

Chapitre 4 : Sources de données

Converti à ACL, le groupe NUMÉRO_COMPTE prend la forme suivante :

NUMÉRO_COMPTE

NUMERIC

5

10

0

NUMÉRO_AGENCE

NUMERIC

5

3

0

TYPE_COMPTE

NUMERIC

8

1

0

NUMÉRO_CLIENT

NUMERIC

9

6

0

Champs logiques de niveau 88 Le niveau 88 indique un champ logique équivalent à un champ calculé ACL. Par exemple, le premier niveau 88 ci-dessous attribue le numéro 347 à la filiale de Granville. Le second niveau attribue le numéro 870 à la filiale du centre ville.

01

NUMÉRO_AGENCE

NUMERIC PIC 9(3).

88

GRANVILLE

VALUE 347.

88

CENTRE_VILLE

VALUE 870.

Dans ACL, les mêmes champs de niveau 88 deviennent les champs calculés ACL suivants :

GRANVILLE

COMPUTED

T

if NUMÉRO_AGENCE = 347

F

CENTRE_VILLE

COMPUTED

T

if NUMÉRO_AGENCE = 870

F

Avec un champ calculé de ce type, vous pouvez préciser des

conditions telles que "IF

GRANVILLE DO X".

Redefines

REDEFINES est l’équivalent COBOL de la définition de champs ACL qui se chevauchent. ACL crée des champs qui se chevauchent mais vous devez appliquer manuellement le filtre nécessaire.

Occurs

OCCURS indique le nombre d’apparitions du champ. Seule la première occurrence du champ apparaît dans ACL. Si le champ apparaît un certain nombre de fois dans chaque enregistrement, installez manuellement les occurrences restantes ou utilisez la fonction OFFSET( ).

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « filtres de données ».

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « fichiers compartimentés », « LOOP » ou « OFFSET( ) ».

Fichiers COBOL copybook

Par exemple :

05 CHANGEMENT_DATE PIC 9(6) OCCURS 5 TIMES.

représente 5 dates différentes, de 6 octets chacune. L’équivalent ACL est :

05

CHANGEMENT_DATE1

PIC 9(6).

05

CHANGEMENT_DATE2

PIC 9(6).

05

CHANGEMENT_DATE3

PIC 9(6).

05

CHANGEMENT_DATE4

PIC 9(6).

05

CHANGEMENT_DATE5

PIC 9(6).

Si le nombre d’OCCURS est basé sur un champ et non sur un enregistrement, comme dans un fichier compartimenté, utilisez la commande LOOP( ) et la fonction OFFSET( ) dans un script ACL.

Pour obtenir un script standard

afin de supprimer ou traiter les segments des fichiers compartimentés, contactez le Service d’assistance ACL (support@acl.com).

Chapitre 4 : Sources de données

DB2

Un système DB2 est composé d’un catalogue et de bases de données. Le catalogue assure le suivi de toutes les données dans le système et des droits d’accès à ces données.

Les bases de données DB2 sont des groupes de tables en relation. Les lignes d’une table n’ont aucun ordre particulier et les données sont donc indépendantes des applications qui y ont accès. Sans demande de votre part, DB2 détermine l’ordre dans lequel les données sont fournies.

DB2 permet de visualiser les données afin d’augmenter la sécurité et l’indépendance des données. Une vue est une structure logique et non physique. Une vue représente les données qui sont définies dans le catalogue DB2 et peuvent être composées d’un sous-ensemble de colonnes provenant d’une ou plusieurs tables. Il n’est pas nécessaire de savoir si les données proviennent d’une ou plusieurs tables. Vous pouvez également utiliser les vues pour limiter l’accès aux données sensibles, sans pour autant limiter l’accès aux autres données stockées dans la même table.

Vous pouvez accéder aux bases de données DB2 via ODBC ou via un produit ACL Édition Serveur doté d’une interface DB2.

Méthode d’accès

? Avec ACL Édition Serveur, vous n’avez pas besoin de télécharger les données source. Vous pouvez à la place établir un lien avec la source grâce au serveur.

Accédez aux données DB2 conformément à l’une des méthodes suivantes.

ACL Édition Serveur

Pour accéder à DB2 à l’aide d’ACL Édition Serveur, vous devez :

Activer l’option client/serveur dans ACL, puis créer un profil de serveur. À partir de la liste déroulante Type de serveur, sélectionnez le serveur auquel vous souhaitez vous connecter.

Créer un profil de base de données.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « profil de serveur ».

DB2

Démarrez l’Assistant et sur l’écran Sélectionnez la plate-forme comme source de données, sélectionnez Serveur ACL. À partir de la liste déroulante, sélectionnez le serveur auquel vous souhaitez vous connecter. Les trois prochaines étapes diffèrent en fonction du type de serveur sur lequel les données sont stockées.

Serveur du système d’exploitation z/OS

1 Sur l’écran Sélectionnez la source des données du serveur ACL, sélectionnez l’option DB2.

2 Sur l’écran Sélectionnez le sous-système DB2, sélectionnez le sous-système souhaité.

3 Sur l’écran Choisir des tables DB2, sélectionnez les tables souhaitées dans la liste Tables disponibles. Si vous sélectionnez plus d’une table, vous devez les associer à l’aide de la boîte de dialogue Identifier la relation.

Autres serveurs

1 Sur l’écran Sélectionnez la source de données du serveur ACL, sélectionnez l’option Base de données, puis un profil de base de données dans la liste déroulante.

2 Sur l’écran Sélectionnez le schéma DB2, sélectionnez le schéma souhaité.

3 Sur l’écran Choisir les tables de base de données , sélectionnez les tables souhaitées dans la liste Tables disponibles. Si vous sélectionnez plus d’une table, vous devez les associer à l’aide de la boîte de dialogue Identifier la relation.

Toutes les plates-formes

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « profil de base de données ».

4 Si vous avez sélectionné plusieurs tables, vous pouvez modifier les conditions de la jonction sur l’écran Instruction de condition. Pour modifier une condition, sélectionnez l’option Modifier l’instruction de condition.

5 Sélectionnez les champs ou les colonnes souhaités à partir de l’écran Sélectionnez les colonnes DB2.

6 Pour obtenir un sous-ensemble d’éléments ou un ordre particulier, entrez les instructions WHERE et ORDER à l’aide de la syntaxe SQL sur l’écran Instructions Where et Order.

Chapitre 4 : Sources de données

7 Lorsque tous les champs ont été définis, l’assistant vous demande de nommer et d’enregistrer la table.

ODBC

Pour modifier la requête après avoir fermé la table, cliquez sur cette dernière avec le bouton droit de la souris dans la Vue globale. Sélectionnez Propriétés puis cliquez sur l’onglet Modifier la requête.

Dans un script, vous pouvez utiliser les variables DB2WHERE, DB2ORDER et DB2CONDITION pour modifier les instructions WHERE, ORDER et CONDITION. Les valeurs que vous affectez à ces variables de remplacement restent valides jusqu’à la suppression des variables. Vous pouvez également utiliser les variables DBWHERE, DBCONDITION et DBORDER.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « définition de fichiers de données du serveur ».

Utilisez ODBC pour importer les bases de données DB2. Consultez la section « Bases de données conformes à la norme ODBC » page 65.

Références

DB2

Voici quelques conseils pour le traitement des données DB2.

Traitement des sous-ensembles

Pour traiter plusieurs fois le même sous-ensemble d’un fichier DB2, il faut extraire les enregistrements et les champs nécessaires dans un fichier plat. ACL peut traiter avec plus d’efficacité des fichiers plus petits. Cela s’applique particulièrement lorsque vos données doivent être dans un ordre spécifique ou lorsqu’ACL doit retourner plusieurs fois au début du fichier pour exécuter les commandes.

Classement des données

Si vos données doivent être dans un ordre spécifique, utilisez une instruction ORDER pour les récupérer dans l’ordre souhaité. Il est possible que le transfert de données à partir de la base de données en soit ralenti, mais il est généralement préférable de trier les fichiers de données volumineux sur un disque local.

Chapitre 4 : Sources de données

Compatibilité avec dBase

dBASE est devenu un format standard pour le stockage des données. La plupart des bases de données et des feuilles de calcul sont capables d’importer ou d’exporter des données dans ce format. Les fichiers dBASE ont une extension .dbf.

ACL reconnaît les fichiers dBASE et crée facilement des tables à partir des informations qu’ils contiennent sur le format d’enregistrement. Les tables qui en résultent comportent un champ nommé Record_deleted. Vous pouvez supprimer ce champ du format de table.

Méthode d’accès

Importez le fichier via l’Assistant de définition de données. Dès que vous avez sélectionné le fichier qui contient les données, l’assistant reconnaît le format dBASE du fichier et crée une table pour vous.

Références

? Pour en savoir plus, consultez la section « Accès direct, format automatique » page 21.

De nombreuses applications peuvent exporter des données dans un format dBASE. Cependant, le processus de conversion peut ne pas prendre en charge toutes les fonctions de l’application source. De plus, des erreurs de conversion peuvent se produire, ce qui peut vous empêcher de lire le fichier avec ACL.

Préparation des fichiers pour la conversion

Avant d’exporter les données d’une application au format dBASE, vous devez prendre en compte les éléments suivants :

Le format dBASE prend en charge les noms des colonnes à 10 caractères maximum. Avant d’exporter des données

dans un fichier compatible avec dBASE, vérifiez que les

dix

premiers caractères de chaque nom de champ sont

uniques afin de vérifier que la totalité des champs peut être exportée.

Les

noms des champs doivent apparaître dans la

première ligne et les données dans la seconde ligne.

Compatibilité avec dBase

Si le premier enregistrement d’un champ contient des caractères, le processus de conversion traitera les enregistrements suivants de ce champ comme des données caractères.

La conversion traitera les champs contenant seulement des chiffres comme des données numériques.

Les champs comportant des chiffres (numéros de factures, numéros de code d’une filiale, etc.) sont généralement traités comme des données caractères. Pour exporter des champs contenant uniquement des chiffres comme caractères, vous devez les modifier avant de les exporter ou enregistrer le fichier au format dBASE.

Pour importer un champ contenant des chiffres en tant que champ caractère

1 Dans la feuille de calcul, cliquez sur la cellule de la deuxième ligne, c’est-à-dire la première ligne de données du champ.

2 Dans la barre des formules, entrez un guillemet simple (’) devant la valeur, puis appuyez sur ENTRÉE.

Le guillemet indique que le champ est un champ caractère.

3 Enregistrez le fichier au format de type DBF 4.

Endommagement des fichiers dBASE

Il peut arriver qu’ACL ne puisse pas lire un fichier dBASE car l’application qui l’a créé n’a pas respecté exactement les spécifications propres à dBASE.

Vous pouvez généralement les ouvrir en utilisant la ligne de commande. Par exemple, pour ouvrir le fichier C:\Sortie\Données.dbf, utilisez la syntaxe suivante :

OPEN C:\Sortie\Données.dbf

Si cette méthode ne vous permet pas d’ouvrir le fichier, ceci signifie que le fichier dBASE est corrompu.

Chapitre 4 : Sources de données

Délimité

Dans les fichiers délimités, différents caractères peuvent être utilisés pour séparer ou délimiter un champ : les virgules, points-virgules, tabulations, barres (|) ou espaces. Différents caractères peuvent aussi être utilisés pour représenter les identificateurs de texte, bien que les guillemets soient les plus courants. Les identificateurs de texte identifient les caractères et différencient la ponctuation qui sert de texte de la ponctuation qui sert de séparateur de champ. Par exemple, dans un fichier délimité par des virgules, les guillemets qui encadrent

« Nom, Prénom »

indiquent que la virgule représente ici du

texte plutôt qu’un séparateur de champ. Chaque enregistrement du fichier se termine par un retour chariot et un saut de ligne.

Les fichiers délimités ne contiennent en général aucun espace en fin de mot. Par conséquent, les longueurs de champs diffèrent souvent d’un fichier de données sources à l’autre, en fonction du contenu des champs. Par exemple, si un champ contient une valeur de trois octets et une valeur de onze octets, la longueur du champ va varier de 3 octets dans un enregistrement à 11 octets dans l’autre enregistrement. Un champ peut contenir des valeurs de nombreuses longueurs différentes.

Lorsqu’ACL importe un fichier délimité, la longueur d’un champ est basée sur la plus longue valeur détectée dans ce champ ou sur le nom du champ si ce dernier est plus long que cette valeur. Par conséquent, si vous importez le même fichier mis à jour tous les mois, la longueur des champs correspondants dans les tables ACL obtenues peut varier d’un mois à l’autre. Les différences de longueur des champs signifient que vous ne pouvez pas lier une table à de nouvelles données sources délimitées à moins d’utiliser des fonctions pour créer un format de table de champs calculés. Consultez la section « Création d’un format de table réutilisable » page 43.

Toutefois, vous pouvez modifier la largeur d’un champ sur l’écran de l’Assistant Propriétés du fichier délimité afin de normaliser les largeurs de champs pour les opérations d’ACL telles que les jonctions et les extractions. Vous pouvez également augmenter la largeur de champ pour éviter la troncature des champs larges qui ne pourront peut-être pas s’afficher tant que la vue n’a pas été actualisée pour intégrer les nouvelles données. Vous pouvez

Délimité

également définir une largeur d’un octet pour les champs ne contenant aucune donnée afin de réduire l’espace que ces champs occupent à l’écran.

Après avoir créé une table, vous pouvez la mettre à jour pour inclure les modifications effectuées dans le fichier source. Pour ce faire, cliquer sur le bouton Rafraîchir à partir du fichier source sur la barre des tâches ou sous l’onglet Options de format de table de la fenêtre Format de table. Vous pouvez également cliquer avec le bouton droit sur la table dans Vue globale et sélectionner Rafraîchir depuis la source. Dans un script, utilisez la commande REFRESH. Pour rafraîchir à partir d’une source délimitée dans ACL Version 8.2 ou une version antérieure, accédez aux données via ODBC. Pour plus d’informations, consultez la section « Utilisation d’ODBC » page 46.

En rafraîchissant, vous mettez la table à jour au lieu de créer une nouvelle table. Par conséquent, vous devez vous assurer que la longueur de champ est adéquate pour éviter que les données soient tronquées si les valeurs de champ mises à jour sont plus longues que les valeurs d’origine.

Si la première ligne de votre fichier délimité contient des noms de champs, vous pouvez indiquer qu’ACL doit utiliser ces noms de champs. Sinon, ACL donne des noms de champs génériques, tels que Field_1 et Field_2, que vous pouvez remplacer par des noms plus explicites.

Méthode d’accès

Vous pouvez en général utiliser l’Assistant de définition de données pour convertir des fichiers délimités. Cependant, si ACL ne reconnaît pas qu’un fichier est délimité, vous pouvez utiliser la fenêtre Format de table pour convertir le fichier manuellement.

Si vous avez besoin de spécifier la valeur d’un séparateur de champ ou d’un indicateur de texte mais que le caractère ne figure pas sur votre clavier, tapez X suivi de la valeur hexadécimale. Par exemple, X09 représente une tabulation. Pour préciser qu’il n’y a aucun indicateur de texte, utilisez X00, l’équivalent hexadécimal de la valeur « null ». Si vos données délimitées se trouvent dans un fichier texte ASCII, vous pouvez utiliser une table ASCII pour trouver les valeurs hexadécimales.

Chapitre 4 : Sources de données

Importer et copier

Dans la plupart des cas, l’Assistant de définition de données identifie correctement le séparateur de champ et l’indicateur de texte. Cependant, vous pouvez définir un séparateur ou un indicateur différent, si nécessaire. Sur l’écran Propriétés du fichier délimité, sélectionnez l’option Autre puis indiquez le caractère ou la chaîne de caractères de votre choix.

Vous pouvez utiliser l’option Commencer à la ligne pour indiquer que les données commencent à la ligne cinq, par exemple, si les quatre premières lignes de données contiennent des informations d’en-tête inutiles.

Accès direct, format manuel

En cas de problèmes lors de l’importation d’un fichier à l’aide de l’assistant, vous pouvez utiliser la fenêtre Format de table pour créer manuellement une table à la place :

1 Dans l’assistant, sélectionnez l’option Autre format de fichier sur l’écran Format de fichier. Sélectionnez ensuite Passer à la fin pour ouvrir la fenêtre Format de table.

Vous pouvez également sélectionner l’option Définir manuellement les fichiers plats sous l’onglet Table dans Outils » Options. Ensuite, lorsque vous sélectionnez un fichier, ACL ignore certaines étapes de l’assistant et ouvre automatiquement la fenêtre Format de table.

2 Cliquez sur l’onglet Options de format de table.

3 Si la première ligne de données comporte des noms de champs, réglez la Longueur à ignorer pour ignorer le premier enregistrement.

4 Cliquez sur le bouton Convertir fichier délimité à gauche de l’onglet Options de format de table.

Références

Vous pouvez utiliser la commande IMPORT pour travailler avec des fichiers délimités dans un script.

Si vous analysez différents fichiers de structure identique, vous pouvez utiliser des fonctions pour analyser les champs puis lier la table obtenue aux nouvelles données sources.

Utilisation de l’instruction IMPORT

Dans un script, vous pouvez utiliser la commande IMPORT pour capturer les modifications des données sources ou pour importer de nouveaux fichiers délimités. La syntaxe IMPORT peut être assez longue donc au lieu de l’écrire, importez un fichier à l’aide de l’Assistant de définition de données. À partir de la trace des commandes, vous pouvez ensuite copier l’instruction et la modifier selon vos besoins.

Exemple

IMPORT DELIMITED TO Employés_vente_au_détail "Employés_vente_au_détail.fil" FROM "Employés_vente_au_détail.csv" SERVER 1 0 SEPARATOR "," QUALIFIER ’"’ CONSECUTIVE STARTLINE 0 KEEPTITLE FIELD "Prénom" C AT 1 DEC 0 WID 20 PIC "" AS "" FIELD "Nom" C AT 21 DEC 0 WID 20 PIC "" AS "" FIELD "Numéro_employé" C AT 41 DEC 0 WID 16 PIC "" AS "" FIELD "Numéro_employé" C AT 57 DEC 0 WID 6 PIC "" AS "" FIELD "Date_embauche" D AT 63 DEC 0 WID 10 PIC "JJ/MM/AAAA" AS "" FIELD "Salaire" N AT 73 DEC 0 WID 10 PIC "" AS "" FIELD "Prime_2004" N AT 83 DEC 2 WID 11 PIC "" AS ""

Délimité

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « IMPORT ».

Lorsque vous exécutez à nouveau la commande IMPORT, ACL crée une nouvelle table. Lorsque vous actualisez la table, ACL met à jour la table d’origine en intégrant les nouvelles données.

Pour importer un fichier de données sources différent qui contient le même nombre de champs, dans le même ordre et avec le même type de données, modifiez les éléments en italique. Dans cet

exemple, Employés_vente_au_détail correspond au nom de la table, Employés_vente_au_détail.fil au fichier de données enregistré, et Employés_vente_au_détail.csv

au fichier de données sources.

Création d’un format de table réutilisable

Vous pouvez créer un format de table réutilisable en utilisant des champs calculés pour analyser les données contenues dans le fichier délimité. Cependant, pour permettre la liaison à une nouvelle source de données, les fichiers doivent contenir le même nombre de champs, dans le même ordre, et avec le même type de données.

Chapitre 4 : Sources de données

Pour accélérer le traitement des fichiers volumineux, analysez seulement les champs dont vous avez besoin.

1 Dans l’assistant, sélectionnez l’option Autre format de fichier sur l’écran Format de fichier. Cliquez sur Suivant.

2 Sur l’écran Propriétés du fichier, entrez la longueur de l’enregistrement le plus long dans la zone Longueur d’enregistrement du fichier. Si vous ne connaissez pas la longueur d’enregistrement, contactez votre administrateur de base de données. Il est important que vous spécifiiez la longueur exacte.

3 Sélectionnez Passer à la fin pour ouvrir la fenêtre Format de table.

4 Sous l’onglet Modifier champs/expressions, définissez un champ nommé Enreg_complet. Dans la zone d’affichage, sélectionnez une longueur d’enregistrement qui est égale à la longueur du plus long enregistrement du fichier ou

cliquez dans la zone d’affichage puis tapez la valeur de la

longueur d’enregistrement dans la zone Long

zone Nom, tapez Enreg_complet. Le champ unique,

Enreg_complet, englobe toutes les valeurs de l’enregistrement.

Vous pouvez maintenant utiliser la fonction SPLIT( ) avec plusieurs autres fonctions pour créer des champs calculés qui analysent Enreg_complet en champs individuels de type caractère, numérique ou date. La fonction à utiliser avec SPLIT( ) dépend du type de champ que vous analysez :

Caractère utilisent la fonction SUBSTRING( ) :

SUBSTRING(SPLIT("chaîne_de_caractères"; "séparateur"; segment <;"qualificatif_texte">); début; longueur_champ)

début désigne le premier octet du champ. Étant donné que SPLIT( ) renvoie le champ entier à la position indiquée par segment, la position de début est toujours 1, quelle que soit la position du champ dans la table.

Dans la

Placez les paramètres chaîne_de_caractères,

séparateur et qualificatif_texte entre

guillemets, sauf si la chaîne de caractères correspond à un champ.

Délimité

Les expressions de champ Numérique utilisent la fonction VALUE( ) :

VALUE(SPLIT(chaîne_de_caractères; "séparateur"; segment <;"qualificatif_texte">); décimales)

décimales correspond au nombre de décimales de votre choix.

Les expressions de champ Date utilisent la fonction CTOD( ) :

CTOD(SPLIT(chaîne_de_caractères; "séparateur"; segment <;"qualificatif_texte">); "format_date")

format_date désigne le format de date utilisé dans les données source. Insérez le format de date entre guillemets doubles.

Dans tous les cas, SPLIT( ) spécifie, par numéro de gauche à droite, le segment ou champ que vous voulez isoler.

paramètre de SPLIT( ) spécifie

un caractère d’indicateur de texte. Pour analyser tous les segments qui contiennent un indicateur de texte, ou tous les segments suivants, vous devez spécifier le caractère d’indicateur de texte.

Pour spécifier un séparateur de champ à onglet, utilisez la fonction CHR( ) avec la fonction SPLIT( ) pour convertir la valeur héxadécimale, 09, en caractère ASCII :

SPLIT(chaîne_de_caractères; CHR(09); segment <;"qualificatif_texte">)

Cliquez sur le bouton Ajouter une nouvelle expression et dans la zone Nom, entrez un nom pour le champ à analyser.

Le qualificatif_texte

Ce champ Enreg_complet utilise le caractère (,) comme séparateur de champ, le caractère (") comme indicateur de texte, et contient les valeurs :

01/31/2004,"Ordinateurs ABC, SA",99.95

Pour analyser un champ de type caractère :

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « SPLIT( ) »,

« SUBSTRING( ) », « VALUE( ) » et

« CTOD( ) ».

SUBSTRING(SPLIT(Enreg_complet; ’,’; 2; ’"’); 1; 30)

L’expression renvoie Ordinateurs la longueur de champ à 30.

ABC,

SA. et définit

Pour spécifier des guillemets

doubles comme identificateur de texte,

placez-les entre guillemets simples.

Chapitre 4 : Sources de données

Pour analyser un champ de type numérique :

VALUE(SPLIT(Enreg_complet; ","; 3; ’"’); 2)

L’expression renvoie 99.95.

Pour analyser un champ de type date :

CTOD(SPLIT(Enreg_complet; ","; 1); "mm/dd/yy")

L’expression renvoie 01/31/2004 ou 01/31/04, selon le format d’affichage de vos dates.

5 Une fois que vous avez saisi l’expression pour le premier champ, cliquez sur la coche verte pour enregistrer la saisie, puis répétez le processus pour tous les champs restant.

Après avoir créé une table contenant les champs de votre choix, vous pouvez lier la table à de nouvelles données sources :

1 Cliquez avec le bouton droit sur la table contenant les champs analysés dans Vue globale, puis copiez et collez pour créer un double de la table.

2 Cliquez avec le bouton droit sur la table dupliquée et sélectionnez Lier aux nouvelles données source pour lier la table à un autre fichier délimité.

Utilisation d’ODBC

Vous pouvez rafraîchir depuis la source pour obtenir des données mises à jour ou modifier l’instruction IMPORT pour réutiliser un format de table lorsque vous importez des données délimitées via ODBC.

Consultez la section « Bases de données conformes à la norme ODBC » page 65.

Pour un pilote de sources de données, utilisez Microsoft Text Driver fourni avec Microsoft Jet. Ce pilote de texte Microsoft fonctionne avec tous les types de fichiers délimités, même ceux délimités par des virgules, des tabulations ou de manière personnalisée.

? Pour plus d’informations sur les pilotes ODBC, consultez la section « ODBC » page 76.

HTML

HTML

HTML (HyperText Markup Language) définit la structure et le format de documents Web. Les balises HTML incluses dans le texte indiquent les éléments structuraux.

Dans votre navigateur, un document s’affiche comme sur l’image de gauche, mais les données importées comportent uniquement des balises HTML et ressemblent à l’image de droite.

Navigateur Balise HTML
Navigateur
Balise HTML

Lorsqu’un document est importé dans ACL, il est possible que le texte perde sa structure originale. La structure de votre document dépend des balises HTML utilisées lors de la création du document.

Méthode d’accès

Importez les fichiers HTML conformément à l’une des méthodes suivantes :

Importer comme fichier image d’impression

Utilisez l’Assistant de définition de données pour importer les fichiers avec une extension htm ou html. Sur l’écran Format de fichier, sélectionnez l’option Fichier image d’impression (rapport).

Même si le HTML est un fichier texte ASCII, ACL ne peut pas interpréter les balises HTML. ACL ne peut pas non plus importer les données situées entre ces balises, sauf celles entre les balises <PRE>, qui affichent le contenu « tel quel », c’est-à-dire sans formatage.

Traitez les données entre les balises <PRE> de la même manière que n’importe quel autre enregistrement de détail.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « détail des enregistrements ».

Chapitre 4 : Sources de données

Sauvegarder en tant que fichier texte

Cette deuxième possibilité (dans le navigateur) permet d’enregistrer un fichier HTML sous forme de fichier texte pour supprimer les balises HTML. Ensuite, vous pouvez importer le fichier via l’Assistant de définition de données.

Imprimer vers un fichier texte

Vous pouvez également utiliser l’ Assistant Ajout d’imprimante de Windows pour ajouter un pilote Générique/document texte. Pour obtenir de l’aide concernant la manière d’ajouter une imprimante, contactez votre administrateur système.

Pour imprimer en fichier texte

1 Dans la boîte de dialogue Imprimer de l’application source, sélectionnez Générique/document texte dans la liste déroulante Nom puis activez la case à cocher Imprimer dans un fichier.

2 Cliquez sur OK et enregistrez le fichier lorsque vous y êtes invité.

Vous pouvez ouvrir le fichier dans un éditeur de texte pour visualiser le format d’enregistrement. Ensuite, importez le fichier sous forme de fichier image d’impression via l’Assistant de définition de données.

Longueur variable IBM

Longueur variable IBM

Par souci d’économie d’espace, de nombreux ordinateurs centraux IBM utilisent des enregistrements de longueur variable pour stocker plusieurs types d’enregistrements de longueur différente dans un seul fichier. Le fichier contient un champ qui répertorie la longueur de chaque enregistrement.

Chaque enregistrement de longueur variable IBM commence par un champ de quatre octets, qui se compose d’un champ d’en-tête de deux octets qui stocke la longueur de l’enregistrement au format binaire et d’un autre champ à deux octets dont vous n’avez pas besoin pour ACL. ACL calcule automatiquement la longueur de l’enregistrement à partir du champ d’en-tête de deux octets, appelé « Mot de description d’enregistrement » (Record Descriptor Word ou RDW).

Les fichiers de longueur variable IBM comportent également un champ de description du bloc qu’on appelle le mot de description du bloc (Block Description Word ou BDW) et qui fait quatre octets. Ce champ est situé au début du fichier puis à des intervalles réguliers. Si la taille du bloc est de 48 000 octets, par exemple, un autre Block Descriptor Word apparaît après 48 000 octets. Vous ne pourrez jamais voir ce champ, car il est caché dans ACL. Toutefois, ACL doit disposer de ce champ pour savoir que le fichier est un fichier de longueur variable IBM.

L’exemple de fichier de longueur variable IBM suivant comporte deux enregistrements de respectivement 5800 et 5100 octets :

Fichier de longueur variable IBM

Nom

Société

Poste

Christine Haas

Equitable Corporation

Vice-présidente

Michael Thompson

University National

Directeur

Michael Thompson University National Directeur Longueur de l’enregistrement : 5100 octets Longueur de

Longueur de l’enregistrement : 5100 octets

Longueur de l’enregistrement : 5800 octets

Chapitre 4 : Sources de données

Bien que le BDW de quatre octets ne soit jamais visible, la structure cachée du fichier échantillon est la suivante :

BDW

 

RDW

Enregistrement 1, longueur 5800

RDW

Enregistrement 2, longueur 5100

RDW

 

BDW

 

RDW

 

Méthode d’accès

Importez les données de longueur variable IBM en utilisant soit l’Assistant de définition de données, soit la fenêtre Format de table.

ACL évite automatiquement les quatre premiers octets du fichier.

Lorsque vous créez une table manuellement, ignorez les quatre premiers octets de chaque enregistrement, car ils ne contiennent que des informations relatives à la longueur de l’enregistrement. Commencez la définition des données à partir de la position 5.

L’assistant tente d’identifier tous les champs. S’il tente de définir le champ de longueur de l’enregistrement, sélectionnez l’option Ignorer ce champ sur l’écran Modifier les propriétés des champs.

Par ailleurs, le traitement d’un fichier de longueur variable IBM est identique en tout point au traitement d’un fichier de longueur fixe.

Références

Parfois, le logiciel de téléchargement supprime à la fois le RDW qui contient la longueur de l’enregistrement et le BDW de quatre octets. Dans ce cas, vous devez obtenir à nouveau les données ou utiliser une expression ACL pour calculer la longueur de l’enregistrement.

Si vous perdez uniquement le BDW de quatre octets, vous pouvez définir les deux premiers octets de l’enregistrement comme un champ binaire nommé Record_length. Si vous fermez puis ouvrez à nouveau le fichier, les champs seront organisés correctement.

Demandez le fichier au format

EBCDIC pour réduire les risques d’erreur

lors de la conversion. Pour plus d’informations sur les formats de téléchargement, consultez la section

« Précautions à prendre lors du téléchargement » page 14.

? Consultez également la section

« Éviter les problèmes de longueur des enregistrements » page 14.

IMS

IMS

Le système de gestion des transactions IMS d’IBM stocke les données dans un format hiérarchique. Chaque niveau et segment de données dépendent du niveau supérieur. Pour accéder à des données d’un niveau hiérarchique inférieur, suivez le chemin hiérarchique de la racine au segment recherché. La description de la base de données (DBD) détermine l’ordre d’accès.

Méthode d’accès

Accédez aux données IMS conformément à l’une des méthodes suivantes :

ACL Édition Serveur pour le système d’exploitation z/OS

Pour accéder aux données IMS à l’aide d’ACL Édition Serveur, vous devez :

Vous assurez que l’interface IMS dans ACL Édition Serveur pour le système d’exploitation z/OS est activée.

Activer l’option client/serveur dans ACL, puis créer un profil de serveur.

Dans la boîte de dialogue Profiler, sélectionnez l’option Activer IMS, puis dans la liste déroulante Type de serveur, sélectionnez le serveur auquel vous souhaitez vous connecter.

Démarrez ensuite l’assistant et effectuez les étapes suivantes :

1 Sur l’écran de l’Assistant Sélectionner la plate-forme comme source de données, sélectionnez le serveur qui possède les données afin d’établir une connexion. Ensuite, sélectionnez l’option IMS sur l’écran Sélectionner la source des données du serveur ACL et poursuivez l’opération dans l’écran Sélectionnez le segment IMS.

2 L’écran Sélectionner le segment IMS contient une liste des segments et une liste des définitions de base de données. Si aucun segment n’apparaît dans la liste, sélectionnez la DBD adéquate pour créer une liste des segments. Sélectionnez les segments désirés dans la liste Segments.

Il se peut que cette tâche doive

être effectuée par un administrateur

système.

? Pour en savoir plus, sélectionnez Aide » Index et cherchez « profil de serveur ».

Chapitre 4 : Sources de données

3 Effectuez les étapes de l’assistant jusqu’à l’écran Type de fichier. Si ce n’est pas déjà fait, sélectionnez Fichier de données (type mono-enregistrement), puis déterminez les champs en utilisant les écrans Identifier les champs et Modifier les propriétés des champs dans l’assistant. Lorsque tous les champs ont été définis, l’assistant vous demande de nommer et d’enregistrer la table.

ODBC

Vous pouvez également accéder aux données IMS via ODBC. Consultez la section « Bases de données conformes à la norme ODBC » page 65.

Linux, données

Linux, données

Le système d’exploitation Linux ressemble beaucoup à UNIX. Linux s’exécute sur différentes plates-formes matérielles, y compris des PC, des stations de travail et des ordinateurs centraux.

Méthode d’accès

Vous pouvez accéder aux fichiers d’un ordinateur qui dispose d’un réseau et qui exécute Linux de la même manière que vous accédez aux fichiers d’un PC, à la condition que vous disposiez des droits d’accès adéquats.

Vous pouvez également accéder aux données Linux et les traiter sur le serveur sur lequel elles se trouvent en utilisant ACL Édition Serveur pour Linux. Les fichiers plats ainsi que les fichiers image d’impression situés sur le serveur peuvent être directement traités sur le serveur lui-même à l’aide de la fonctionnalité de script en mode autonome.

Pour connaître d’autres moyens d’accéder aux fichiers sur un serveur Linux, consultez « UNIX, données » page 96.

Pour accéder aux bases de données DB2 à l’aide du logiciel ACL Édition Serveur, consultez « DB2 » page 34.

Pour accéder aux bases de données Oracle à l’aide du logiciel ACL Édition Serveur, consultez « Oracle » page 74.

Chapitre 4 : Sources de données

Microsoft Access

Importez les tables d’une base de données relationnelle Microsoft Access conformément à l’une des méthodes suivantes :

Importer et copier

Lorsque vous ouvrez un fichier de base de données Access à l’aide de l’assistant, ACL utilise l’interface de programmation de l’application de Microsoft, ActiveX Data Objects (ADO), pour créer un fichier plat ACL. À partir de ce fichier plat, ACL crée automatiquement un format de table basé sur le format du fichier Access. L’Assistant de définition des données vous guide tout au long de la procédure.

ODBC

Lorsque vous utilisez ODBC, ACL importe la base de données sous forme d’un nouveau fichier plat ACL. Consultez la section « Bases de données conformes à la norme ODBC » page 65.

Autres méthodes

Vous pouvez également enregistrer les données au format dBASE, texte ou image d’impression dans l’application source. Accédez ensuite aux données en suivant la méthode qui s’applique à ce type de fichier. De tous ces formats, ACL lit dBASE plus facilement.

? Pour plus d’informations, consultez la section « Compatibilité avec dBase » page 38.

Microsoft Excel

Microsoft Excel

ACL lit les données dans toutes les versions d’Excel à partir d’Excel 3.0. Il n’est pas nécessaire que Microsoft Excel soit installé sur votre PC pour que vous puissiez importer des fichiers Excel dans ACL.

Contrairement aux applications de bases de données proprement dites, dans lesquelles un champ individuel contient un type de données unique, les colonnes individuelles dans Excel peuvent contenir différents types de données. Par exemple, dans une même colonne, une cellule peut contenir une date, une deuxième un nombre et une troisième une chaîne de texte, voire une image. De telles incohérences peuvent poser des problèmes lorsque vous transférez les données via ODBC ou Microsoft ADO, la technologie utilisée par ACL pour lire les fichiers Excel.

Si vous ne mettez pas en forme les colonnes avant de saisir des données dans une feuille de calcul Excel, une colonne contenant un mélange de caractères alphabétiques et numériques peut être impossible à importer dans ACL. Lorsque vous n’appliquez pas de mise en forme spécifique avant de saisir des données, le type de données est déterminé par le contenu de la première cellule de données de la colonne. Par exemple, si la première cellule contient des nombres, la colonne est considérée comme une colonne numérique. Par conséquent, si d’autres cellules de la même colonne contiennent des données non numériques, ces cellules affichent des zéros dans ACL. De même, si la première cellule d’une colonne non mise en forme contient du texte, les autres cellules contenant des nombres seront vides dans ACL.

Pour éviter de perdre des données, assurez-vous que chaque colonne du fichier Excel contient uniquement des nombres ou du texte. Sinon vous devez enregistrer le fichier Excel dans un format qui peut conserver le contenu hétérogène du fichier lorsque vous l’importez dans ACL.

Pour plus d’informations, consultez les sections « Enregistrez le fichier Excel en tant que fichier délimité » page 57 et « Enregistrez le fichier Excel en tant que fichier dBASE » page 57.

Chapitre 4 : Sources de données

Méthode d’accès

Importez les données Excel conformément à l’une des méthodes suivantes :

Importer et copier

Lorsque vous ouvrez un fichier Excel à l’aide de l’assistant, ACL utilise l’interface de programmation de l’application de Microsoft, ActiveX Data Objects (ADO), pour accéder aux données Excel. Cette interface prend en charge les versions 97 et 2000 d’Excel.

Dès que vous avez sélectionné la feuille de calcul ou la plage nommée qui contient les données, l’assistant vous demande d’enregistrer les données dans un fichier plat ACL. Ensuite, il vous guide jusqu’à l’écran Terminer où vous pourrez visualiser les champs qui ont été définis.

Dans un classeur correctement mis en forme :

La première ligne contient uniquement les noms de champs.

Les données n’apparaissent qu’à partir de la deuxième ligne.

La zone des données ne comporte aucune colonne ni ligne vide.

Pour importer des fichiers à partir de versions d’Excel antérieures à 97, utilisez ODBC ou enregistrez le fichier dans un autre format.

ODBC

Lorsque vous utilisez ODBC, ACL importe la feuille de calcul ou plage nommée sous forme de fichier plat. Consultez la section « Bases de données conformes à la norme ODBC » page 65.

Autres méthodes

Vous pouvez également enregistrer les données au format dBASE, texte ou image d’impression dans l’application source. Accédez ensuite aux données en suivant la méthode qui s’applique à ce type de fichier. De tous ces formats, ACL lit dBASE plus facilement.

? Pour plus d’informations, consultez la section « Compatibilité avec dBase » page 38.

Références

Microsoft Excel

Pour éviter la perte de données dans les colonnes qui n’ont pas été mises en forme avant la saisie de données et qui contiennent des caractères à la fois alphabétiques et numériques :

Enregistrez le fichier Excel en tant que fichier délimité

Enregistrez le fichier Excel au format délimité, puis importez le fichier délimité dans ACL. Si l’assistant détecte des données numériques dans un champ de type caractère ou des caractères dans un champ numérique, il signale ces incohérences en renvoyant un message d’erreur. Cependant, il importe quand même le contenu de toutes les cellules, même si les colonnes contenant des données alphanumériques n’ont pas été mises en forme avant la saisie des données.

Enregistrez le fichier Excel en tant que fichier dBASE

Enregistrez la feuille de calcul Excel au format DBF4 (dBASE IV) avant d’accéder au fichier dans ACL. Le format DBF4 limite les noms de champs à 10 caractères et si, une fois tronqués, certains champs ont le même nom, ACL affiche uniquement l’un d’entre eux. Pour conserver l’intégralité des données, assurez-vous que les dix premiers caractères de chaque nom de champ sont uniques.

Si la première cellule de données d’une colonne non mise en forme contient seulement des nombres, Excel enregistre la colonne en tant que données numériques et les valeurs de cellules non numériques s’affichent sous forme de zéros dans ACL. Pour éviter ce problème, sélectionnez la première cellule de données de la feuille de calcul dans Excel, et insérez une apostrophe (’) avant le contenu existant de la cellule. Enregistrez ensuite la feuille de calcul au format DBF4. Maintenant, si vous accédez au fichier dBASE avec ACL, le type de données devient ASCII et tous les nombres s’affichent correctement.

Chapitre 4 : Sources de données

Microsoft Word

Les documents Microsoft Word sont enregistrés dans un format propriétaire avec une extension .doc.

Méthode d’accès

Il est impossible d’importer un document Word directement dans ACL. Le document doit être enregistré ou imprimé sous forme de fichier texte, puis importé via l’Assistant de définition de données.

Pour une description de ces deux procédures, consultez les sections Sauvegarder en tant que fichier texte et Imprimer vers un fichier texte dans « RTF (Rich Text Format) » page 87.

Données à plusieurs types d’enregistrements

Données à plusieurs types d’enregistrements

Les fichiers de type multi-enregistrement contiennent plus d’un type d’enregistrement et peuvent se composer d’enregistrements de longueur variable ou fixe.

Vous identifiez d’abord les types d’enregistrements individuels, puis définissez les champs dans ACL. Vous avez ensuite plusieurs options pour analyser les données.

Un enregistrement à la fois en créant un filtre dans une vue. Par exemple, si votre fichier contient des enregistrements de type A et B, utilisez un filtre pour afficher uniquement les enregistrements d’un type ou d’un autre.

Plus d’un fichier à la fois, en utilisant un groupe dans un script ou des champs conditionnels ou conditionnels fixes. Cette approche est plus complexe mais plus flexible.

Méthode d’accès

Lorsque les fichiers de type multi-enregistrement contiennent un champ de longueur d’enregistrement, vous pouvez utiliser l’assistant pour créer une table ACL. Lorsque les fichiers de type multi-enregistrement ne contiennent pas de longueurs d’enregistrement, vous devez utiliser la fenêtre Format de table pour définir les champs manuellement.

Fichiers image d’impression

Les fichiers de rapport électroniques, également connus sous le nom de fichiers image d’impression, sont des fichiers de type multi-enregistrement qui comprennent des enregistrements complémentaires, de détail et d’en-tête. Consultez la section « Image d’impression » page 84.

Fichiers CR/LF

Dans les fichiers CR/LF, un retour chariot (CR) et un saut de ligne (LF), ou parfois seulement un des deux, indiquent la fin d’une ligne. ACL identifie automatiquement un fichier CR/LF et le traite de la même façon qu’un fichier de longueur fixe.

Chapitre 4 : Sources de données

Fichiers de longueur variable IBM

Consultez la section « Longueur variable IBM » page 49.

Fichiers contenant la longueur d’enregistrement

Certains types de fichiers stockent la longueur de chaque enregistrement dans un champ de l’enregistrement ou stockent une valeur permettant ensuite d’établir la longueur de l’enregistrement.

ACL traite automatiquement les fichiers multi-enregistrements dont la longueur est stockée dans le fichier. Toutefois, sur l’écran Modifier propriétés des champs de l’assistant, vous devez définir le champ qui contient la longueur de l’enregistrement sous forme de données numériques avec 0 décimale. Nommez ce champ Record_length. Ce nom informe ACL que ce champ contient la longueur de l’enregistrement. Si vous fermez puis ouvrez à nouveau le fichier, les champs seront organisés correctement.

Fichiers sans longueur d’enregistrement

Certains fichiers ne font pas apparaître la longueur d’enregistrement dans l’enregistrement. Cependant, si vous êtes capable de calculer la longueur d’enregistrement, ACL peut traiter le fichier.

Pour déterminer la longueur d’un enregistrement

1 Ouvrez le fichier dans l’Assistant de définition de données. Sur l’écran Propriétés du fichier, sélectionnez l’option Passer à la fin, cliquez sur Suivant, puis sur l’écran suivant, cliquez sur Terminer. Enregistrez le fichier lorsque vous y êtes invité. ACL affiche les données dans la fenêtre Format de table.

2 Sur l’onglet Options de format de table, sélectionnez Longueur d’enregistrement fixe dans la liste déroulante Type de fichier.

3 Dans la zone d’affichage de l’onglet Modifier champs/expressions, sélectionnez un champ à définir, de préférence un champ de type d’enregistrement si le fichier en comporte un. Définissez le champ, puis cliquez sur la coche verte.

Données à plusieurs types d’enregistrements

4 Cliquez sur le bouton Ajouter une nouvelle expression pour définir un champ calculé conditionnel qui indique la longueur de chaque type d’enregistrement. Entrez Record_length dans la zone de texte Nom et donnez une valeur par défaut égale à la longueur du plus grand enregistrement.

5 Cliquez sur le bouton Insérer une condition. Dans la zone Condition, spécifiez une condition qui identifie un des types d’enregistrements.

6 Après avoir attribué des conditions et des valeurs à chaque type d’enregistrement, cliquez sur la coche verte pour valider la définition du champ, puis fermez la fenêtre Format de table.

7 Fermez puis ouvrez à nouveau la table. À présent, ACL reconnaît le nom de champ Record_length et lit automatiquement son contenu comme étant la longueur d’enregistrement.

8 Dans le menu, sélectionnez Modifier » Format de table pour définir les autres champs de données. ACL traite les données comme un fichier de longueur fixe.

Fichiers segmentés

Les fichiers segmentés, également connus sous le nom de fichiers compartimentés, sont un type de fichier de longueur d’enregistrement variable dans lequel un ensemble de champs d’en-tête est suivi par un ou plusieurs ensembles de champs de données.

Les fichiers segmentés stockent de manière efficace les données car chaque enregistrement n’est pas plus long que nécessaire et ne contient aucun champ vide ou répété. Les fichiers COBOL contiennent souvent des champs ou des tables qui peuvent apparaître un nombre variable de fois, en fonction de la valeur du champ d’en-tête telle qu’elle est définie par une instruction OCCURS.

Chapitre 4 : Sources de données

Ci-dessous un exemple d’un fichier segmenté.

 

Champs d’en-tête

Segment

Segment

Segment

Segment

Segments

Num_Emp

Nom_Emp

Année

Ventes

Année

Ventes

Année

Ventes

Année

Ventes

3

101

Andersen

2002

58500

2001

60400

2000

63000

 

1

102

Guterriez

2002

60700

 

2

105

Schmidt

2002

62500

2001

58300

 

4

107

Lapierre

2002

63300

2001

59500

2000

67500

1999

63500

1

108

Ko

2002

56000

 

Les champs d’en-tête peuvent contenir un champ indiquant le nombre de segments qui suivent, comme dans l’exemple. Lorsque cette information n’existe pas, vous pouvez être en mesure de calculer le nombre de segments dans un script à l’aide d’autres informations, telles que la longueur des segments.

Définition des fichiers segmentés Ouvrez le fichier dans l’Assistant de définition de données. Sur l’écran Propriétés du fichier, sélectionnez l’option Passer à la fin, cliquez sur Suivant, puis sur l’écran suivant, cliquez sur Terminer. Enregistrez le fichier lorsque vous y êtes invité. ACL affiche les données dans la fenêtre Format de table.

Dans l’onglet Options de format de table de la fenêtre Format de table, sélectionnez Longueur d’enregistrement fixe dans la liste déroulante Type de fichier. Ensuite, spécifiez une longueur d’enregistrement (au moins aussi longue que l’enregistrement le plus long, segments inclus).

Données à plusieurs types d’enregistrements

Définissez les champs d’en-tête et le premier segment. Vous pouvez ensuite utiliser un script pour traiter le fichier ou pour extraire les champs dans un fichier plat. Pour définir les champs, vous devrez peut-être vous reporter à un format d’enregistrement qui vous permet d’obtenir le type d’informations suivant :

Nom du champ

Type de

Longueur

données

Segments

   

Num_Emp

   

Nom_Emp

   

Année

   

Ventes

   

Traitement du fichier segmenté Une fois que les champs communs à tous les enregistrements sont définis, vous pouvez traiter le fichier à l’aide d’un script. L’exemple suivant montre un script qui utilise la commande LOOP et la fonction OFFSET( ) pour traiter ce fichier segment par segment.

GROUP

 

Compteur = 1 Décalage_octets = 0 Longueur_compartiment = 20 LOOP WHILE Compteur <= Champ_compte_segment V_champ1 = OFFSET(ChampSegment1; Décalage_octets) V_champ2 = OFFSET(ChampSegment2; Décalage_octets) TOTAL FIELDS V_champ1 V_champ2 STRATIFY ON V_champ1 V_champ2 MIN 0 MAX 10000 INTERVAL 10 TO SCREEN Décalage_octets = Décalage_octets + Longueur_compartiment Compteur = Compteur + 1

END

END

Chapitre 4 : Sources de données

Extraction du fichier segmenté dans un fichier plat Extraire les champs d’un fichier segmenté dans un fichier ACL plat peut vous être utile pour un traitement ultérieur. Dans un fichier plat, chaque segment de données, tel que les ventes d’une année, apparaît sous forme d’un enregistrement séparé, comme le montre l’exemple suivant.

Num_Emp

Nom_Emp

Année

Ventes

101

Andersen

2002

58500

101

Andersen

2001

60400

101

Andersen

2000

63000

102

Guterriez

2002

60700

105

Schmidt

2002

62500

105

Schmidt

2001

58300

107

Lapierre

2002

63300

107

Lapierre

2001

59500

107

Lapierre

2000

67500

107

Lapierre

1999

63500

108

Ko

2002

56000

Il existe plusieurs manières d’obtenir ce résultat dans un script. L’exemple suivant montre un script qui utilise la commande LOOP et la fonction OFFSET( ) pour extraire les segments dans un nouveau fichier plat de données.

GROUP

Compteur = 1 Décalage_octets = 0 Longueur_compartiment = 20 LOOP WHILE Compteur <= Champ_compte_segment V_champ1 = OFFSET(ChampSegment1; Décalage_octets) V_champ2 = OFFSET(ChampSegment2; Décalage_octets) EXTRACT FIELDS Champ1 Champ2 Champ3 V_champ1 V_champ2 TO "Nouveau_fichier" Décalage_octets = Décalage_octets + Longueur_compartiment Compteur = Compteur + 1

END

END

Bases de données conformes à la norme ODBC

Bases de données conformes à la norme ODBC

ODBC (Open DataBase Connectivity) est une interface Microsoft que vous pouvez utiliser pour accéder à des données stockées sur n’importe quelle application de bases de données. Les sources de données conformes à la norme ODBC sont, entre autres, Access, Excel, Oracle, DB2, FoxPro, Peoplesoft, dBASE, Informix, IMS, Sybase, SQL, SQL Server, ADABAS, SAS et SPSS.

Les développeurs peuvent créer des applications compatibles avec ODBC, aussi connues sous le nom d’applications conformes aux normes ODBC ou d’applications clients ODBC. Ils peuvent également créer des pilotes ODBC, des DLL (Dynamic Link Libraries ou bibliothèques de liens dynamiques) pour des systèmes de gestion de bases de données ou des sources de données spécifiques.

Méthode d’accès

Pour accéder à une source de données conforme aux normes ODBC dans ACL, il faut disposer d’un pilote ODBC spécifique à ACL et d’un pilote ODBC spécifique à la source de données. Les pilotes, développés par les fabricants de la source de données et des fabricants tiers à partir d’ODBC servent de traducteurs entre ACL et la source de données.

Les règles et les méthodes d’accès ne changent pas, quelle que soit la source de données. ACL utilise le pilote ACL-ODBC pour demander les données à l’administrateur ODBC. L’administrateur utilise le pilote ODBC des sources de données pour lire les données à partir de la source de données. Ces données sont traduites dans un format ODBC standard et renvoyées à ACL qui les copie dans un fichier de données ACL.

ACL

ACL   Administrateur ODBC     Source de
 

Administrateur ODBC

   
ACL   Administrateur ODBC     Source de

Source de

     

données

 
       
 
       
   
 
   
   
   
 
   

Pilote ACL ODBC (DLL)

   

Pilote de source de données ODBC (DLL)

Chapitre 4 : Sources de données

Pour importer des données conformes aux normes ODBC

1 Sélectionnez l’option ODBC de l’une des manières suivantes :

Sur l’écran Sélectionner la source des données de l’Assistant de définition de données, sélectionnez ODBC.

À partir du menu, sélectionnez Données » Données externes » ODBC.