Académique Documents
Professionnel Documents
Culture Documents
2013 DWH23
2013 DWH23
Diapositive 1 rn1
i016851; 09/01/2013
2012 - 2013
Plan
Partie 1
1- Introduction P1 2- Architecture, Maintenace des Data Warehouses (DWH) 3- Conception logique des data warehouses 4- Implantation et Administration des DWH 5- ETL : Alimentation des data warehouses 6- Optimisation des des data warehouses P2 P3 P4
7- TALEN + Oracle Warehouse Builder; Quelques ETL du march 8- Modlisation et gnration des Reporting avec BO 9- SQL Avancs P5 P6
M. F. Boufars & R. NEFOUSSI, UP13
2012 - 2013
1. Introduction
La majeure partie des applications Bases de Donnes reposent aujourd'hui sur trois couches. La couche la plus externe est celle de qui permet de prsenter les donnes aux utilisateurs. Elle est appele "Graphical User Interfaces GUI". La couche application intermdiaire inclut le programme de l'application elle mme et ne stocke pas les donnes. La couche la plus interne gre le stockage des donnes. Elle est appele la couche Base de Donnes.
1. Introduction
Les applications interrogent les donnes avec par exemple le langage SQL "Select" et les mettent jour par l'intermdiaire des oprations "Insert, Update et Delete" qui constituent des transactions. Celles-ci doivent avoir certaines proprits telle que l'atomicit, la consistance Ce type d'application est appel "On-Line
2012 - 2013
2012 - 2013
1. Introduction
Couche Prsentation Graphical User Interfaces GUI GUI
1. Introduction
Donnes volumineuses & Besoins nouveaux Systmes dInformation Dcisionnel ; Systmes dAide la Dcision : Rapports, Etats, Tableaux de Bord, Graphiques, Synthses, Groupement, Agrgat, Rsum (Repoting Tools, Management Information System, Executive Information System, Decision Support System DSS).
Couche Application
OLTP application
Insert, Delete, Update
OLTP application
2012 - 2013
2012 - 2013
1. Introduction
Contrairement aux applications OLTP, qui consultent et mettent jour les donnes des BD oprationnelles, les DSS lisent les donnes seulement pour avoir de nouvelles informations partir des donnes sources. Le bnfice de cette approche est que seulement les BD oprationnelles ont tre cres et maintenues. Un ensemble de mta-donnes est utiliss pour les 2 systmes. Les DSS ne ncessitent que des travaux supplmentaires mineurs.
1. Introduction
Cependant, il y a plusieurs dsavantages quand le DSS et les application OLTP se partagent les mmes BD.
Le DSS ne peut utiliser que les donnes actuellement stockes dans les BD ; et donc les analyses historiques sont souvent impossibles cause des oprations de mises jour qui changent les donnes historiques. Lutilisation des BD en mode multi-utilisateurs, ce qui implique des oprations de verrouillage des donnes (Locking operations) et donc des problmes de performances ; car les requtes analytiques demandent laccs de trs grands nombre de tuples.
2012 - 2013
2012 - 2013
1. Introduction
La solution est de sparer la BD oriente Transaction de la BD oriente Aide la Dcision ; do la naissance du concept Data Warehouse = Entrept de Donnes.
1. Introduction
Data Warehouse : Daprs le dictionnaire
Un entrept de donnes est une structure informatique dans laquelle est centralis un volume important de donnes consolides partir des diffrentes sources de renseignements d'une entreprise (notamment les bases de donnes internes) et qui est conue de manire que les personnes intresses aient accs rapidement l'information stratgique dont elles ont besoin. Si, dans le pass, l'entrept de donnes servait davantage l'archivage, aujourd'hui il est devenu une pice matresse de l'informatique dcisionnelle (ou informatique d'aide la dcision). Il reprsente l'un des lments essentiels d'un ensemble matriel et logiciel dynamique de recherche d'informations. Dans un entrept de donnes, les donnes sont : slectionnes et prpares (pour rpondre aux questions vitales de l'entreprise), intgres ( partir des diffrentes sources de renseignements) et dates (elles gardent la trace de leur origine).
2012 - 2013
10
2012 - 2013
11
1. Introduction
Datamining : Data Warehouse : Dfinition de Bill Immon (1996) Collection de donnes orientes pour un sujet, intgres, non volatiles et historises, organises pour le support du processus daide la dcision Il sagit base de donnes dans laquelle sont dposes aprs nettoyage et homognisation les informations en provenance des diffrents systmes de production de lentreprise Datamart: Est un sous-ensemble de lentrept de donnes, dfini lintention dun dpartement prcis de lentreprise.
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 12
1. Introduction
Selon SAS-INSTITUTE, il s'agit du processus de slection, exploration, modification et modlisation de grandes bases de donnes afin de dcouvrir des relations entre les donnes jusqu'alors inconnues. En outre, bien qu'utilisant des techniques et une dmarche statistique, le Data Mining et ses outils sont appels tre utiliss par des non-statisticiens praticiens spcialistes du problme modliser. Les applications du Data Mining sont multiples, elles concernent: la grande distribution, la vente par correspondance, les oprateurs de tlcommunications, les banques et assurances, etc. Le domaine majeur o le Data Mining a prouv son efficacit est la gestion de la relation client (CRM ou Customer Relationship Management). En effet, le Data Mining permet par une meilleure connaissance de la clientle d'accrotre les ventes.
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 13
1. Introduction
Couche Prsentation Graphical User Interfaces GUI GUI
1. Introduction
Le DW intgre des donnes partir de sources multiples et htrognes afin de rpondre aux requtes du systme daide la dcision. Ce type dapplication est appel On-Line Analytical Processing OLAP . OLAP permet la transformation des donnes en information stratgiques.
Couche Application
OLTP application
Insert, Delete, Update
OLTP application
OLAP application
Read, Select
BD1
BD2
2012 - 2013
14
2012 - 2013
15
1. Introduction
OLAP est un terme pour dcrire l'approche dimensionnelle de l'aide la dcision. Tout comme le modle relationnel, OLAP a t propos par
le Dr Edgar Codd(1923-2003) IL est dfini initialement (1993) par douze rgles qui reprsentent l'talon de mesure servant comparer les systmes OLAP. 6 critres ont t ajouts en 1995, et ont t reclasss en 18 fonctionnalits
2012 - 2013
16
2012 - 2013
17
2012 - 2013
18
2012 - 2013
19
2012 - 2013
20
2012 - 2013
21
1. Introduction : FASMI
En constatant que les rgles de Cood taient trop compliques, des auteurs indpendants ont proposs une dfinition OLAP simple FASMI
F : Fast A : Analysis S : Shared M : Multidimensional I : Information
1. Introduction : FASMI
Fast
Le systme doit tre conu pour rpondre aux requtes de l'utilisateur en moins de cinq secondes
Les analyses trs simples moins d'une seconde Les plus compliques, environ 20 secondes. Les temps de rponses doivent tre bon mme avec beaucoup de donnes Si le systme est trop lent, les utilisateurs estiment que lapplication est plante Ncessite des architectures de stockage ddies et des algorithmes de prtraitement.
2012 - 2013
22
2012 - 2013
23
1. Introduction : FASMI
Analysis
1. Introduction : FASMI
Shared
Le systme peut prendre en compte n'importe quel domaine ou analyse statistique, et fournir un rsultat exploitable par l'utilisateur final, sans avoir utiliser un langage de programmation L'utilisateur doit au moins pouvoir dfinir de nouveaux calculs ad-hoc et obtenir des tats sous la forme souhaite, sans programmation. L'analyse peut concerner des sries temporelles, allocations de cot, conversions de devises, recherche d'objectifs, gestion d'exceptions, etc.
Le systme doit en particulier grer les accs multiples en criture en toute scurit.
2012 - 2013
24
2012 - 2013
25
1. Introduction : FASMI
Multidimensional
1. Introduction : FASMI
Information
C'est la condition essentielle des applications OLAP. Les systmes OLAP peuvent fournir une vue "conceptuelle" multidimensionnelle des donnes, incluant le support des hirarchies simples ou multiples.
Linformation comprend l'ensemble des donnes et des informations drives, quel que soit leur volume et leur stockage.
2012 - 2013
26
2012 - 2013
27
1. Introduction
Un systme de DW peut tre formellement dfini comme un triplet <BD cible, mta-donnes, un ensemble doprations>. Lensembles des oprations peut tre prsents en 4 catgories. Extraction (Extraction): Ces oprations permettent de filtrer les donnes partir de donnes sources (BD, fichiers, sites web) dans des BD temporaires. Transformation (Transformation): Ces oprations permettent de transformer les donnes extraites dans un format uniforme. Les conflits entre les modles, les schmas et les donnes sont rsolus durant cette phase. Chargement (Load) : Ces oprations permettent de charger les donnes transformes dans la BD cible. La BD cible est souvent implante avec un SGBD relationnel-objet. Agrgat et Groupement (Agregating and Grouping) : La BD cible doit permettre de stocker les donnes oprationnelles et les donnes issues de calculs.
1. Introduction
Les donnes des entreprises sont gnralement : - Surabondantes - Eparpilles - Peu structures pour lanalyse - Focalises pour amliorer le quotidien Prise de dcision difficile Apparition doutils et de techniques visant prparer les donnes pour lanalyse :
Le Data warehousing
Il sagit dune technique visant extraire des donnes de diffrentes sources afin de les intgrer selon des formats plus adapts lanalyse et la prise de dcision
28 2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 29
Les mta-donnes telles que la description des structures des donnes et les contraintes sont trs utiles pour contrler la validit des donnes.
M. F. Boufars & R. NEFOUSSI, UP13
2012 - 2013
OLAP Server
Oracle Express
UNIX (,Aix,Oracle,..)
Data Warehouse
Transformer les donnes de Production sous forme dinformations Le S.I doit avoir la lourde tche dassurer aux dcideurs les donnes ncessaire pour une prise de dcision
Data Marts
Applications En Production
2012 - 2013
OLAP
Outils Front-End
30 2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 31
Difficult et la complexit de lenvironnement Concurrence de plus en plus agressive Importance de la rapidit de la prise de dcision Rglementation
2012 - 2013
32
2012 - 2013
33
Extraction Transformation Alimentation et indexation Contrle qualit Diffusion Mise jour Requtes Rinjection des donnes Surveillance et scurisation Sauvegarde et restauration
2012 - 2013
34
2012 - 2013
35
Choix dun modle de conception (Schma) Utilisation, par exemple, d Oracle Designer ou Oracle Warehouse Builder
2012 - 2013
36
2012 - 2013
37
2012 - 2013
40
2012 - 2013
41
2012 - 2013
42
2012 - 2013
43
Partie 2
Lidentifiant unique
Pour distinguer les enregistrements dans les tables
2012 - 2013
44
- des attributs vers des colonnes - des identifiants uniques vers des cls primaires
2012 - 2013
46
2012 - 2013
47
Entreprise, Usine,etc..
Type de contrat
48 2012 - 2013
2012 - 2013
DB2
Fichiers Plats
2012 - 2013
50
2012 - 2013
51
Nous allons avoir 12 fichiers clients : - un fichier par type de contrat (socit, particulier et agences) * 4 pays
DB2
M. F. Boufars & R. NEFOUSSI, UP13 M. F. Boufars & R. NEFOUSSI, UP13
Unix
2012 - 2013
52
2012 - 2013
53
PREPARATION de lETL
ETAPE de lETL
M. F. Boufars & R. NEFOUSSI, UP13 55
2012 - 2013
Grer lenvironnement du DWH existant Prparation du croissance et de lvolution du DWH Exemple doutils pour la maintenance dun DWH
2012 - 2013
56
2012 - 2013
57
2012 - 2013
58
2012 - 2013
59
2012 - 2013
60
2012 - 2013
62
2012 - 2013
63
2012 - 2013
64
2012 - 2013
65
6.4 RT: pour lextraction et le chargement dun jeu dessai cohrent Access Definition :
Dfinit les liens fonctionnel entre les # tables permettant ainsi de dfinir un ensemble fonctionnel cohrent
RELATIONAL TOOLS
Cration des requtes dextraction des donnes dfinit dans un Access Definition Cration des requtes de chargements partir dun fichier dextraction ETC.
2012 - 2013
66
2012 - 2013
67
6.5 Utilisation des Packages dOracle, pour loptimisation des requtes SQL
6.6 TKPROF
Mettre la base ou la session en mode Trace :
Base : mettre SQL_TRACE=TRUE dans init.ora Session : alter session set SQL_TRACE TRUE
Utilisation de TKPROF :
TKPROF fichier_entree.trc fichier_sortie [ [Explain=username/password] [sys=no] [insert=filename] [print=entier]
2012 - 2013
68
2012 - 2013
69
6.7 TKPROF
Rsultat de TKPROF : Count : Nombre de fois que la commande SQL a t excute cpu : Temps total CPU en centime de seconde elapsed : temps total coul pour chaque tape phys : Nombre de block physique lus sur disque Cr : Nombre de fois quune ancienne version du buffer a t utilise (lecture consistante) Cur : Nombre de fois que la version courante du buffer a t utilise. La quntit cr+cur donne le nombre de blocks ramens en mmoie. Rows : nombre de lignes trouves par lOrdre SQL)
Utlestat : permet ldition dun tat de lactivit de la base en sappuyant sur les donnes statistique collectes par Utlbstat.sql
2012 - 2013
70
2012 - 2013
71
6.10 Statpack
- Excution du script spcreate.sql
Compte-rendu de Statpack
- Cinq premiers vnement Wait - Liste complte des vnements Wait - Informations sur les instructions SQL - E/S des TBS et des fichiers - Statistiques sur lactivit de linstance
2012 - 2013
72
2012 - 2013
73
7. Maintenance des DW
Problme : Lorsque les relations de base sont modifies, comment rpercuter la mise jour sur les vues ?
7. Maintenance des DW
Quand et comment assurer les mises jour (la maintenance) dun data warehouse ? Quelles anomalies peuvent tre causes par la maintenance ? A quel niveau pourrait-on automatiser cette maintenance ?
Comment mesurer et assurer la performance et quels critres choisir ? La maintenance ou l'auto-maintenance pourra t-elle elle seule garantir la performance ?
2012 - 2013
74
2012 - 2013
75
2012 - 2013
76
2012 - 2013
77
2012 - 2013
78
2012 - 2013
79
Maintenance de donnes
2012 - 2013
80
2012 - 2013
81
Maintenance structurelle
Maintenance structurelle
Sources R1 ( W, X, Z ) R2 ( X, Y )
Sources R1 ( W, X, Z ) R2 ( Y )
Arrive DW
Arrive
2012 - 2013
82
2012 - 2013
83
Sources R1 ( W, X, Z ) R2 ( X, Y, Z )
Sources R1 ( W, X, Z ) R2 ( X, Y, Z )
2012 - 2013
84
2012 - 2013
85
Reconfiguration du DW
Reconfiguration du DW
Dpart
Arrive
2012 - 2013
86
2012 - 2013
87
Evolution du DW
Evolution du DW
DW = {V1, V2, V3, V4, V5, V6 } Dpart
V1, V3, V5 sont des vues matrialises (stockes dans le DW) V2, V4, V6 sont des vues non matrialises (calcules la suite d une requte de consultation)
Arrive
V2, V3, V4 sont des vues matrialises (stockes dans le DW) V1, V5, V6 sont des vues non matrialises (calcules la suite d une requte de consultation)
2012 - 2013
88
2012 - 2013
89
7 (ETL)
Extraire, Transformer et Charger les donnes dun DWH
Partie 3
Extraction (E) :
Utilisation Utilisation Utilisation Utilisation du spooler de dblink de PL/SQL : Gestion des curseurs de lutilitaire dexport (EXP)
Transformation (T) :
Utilisation de la commande Update Utilisation de PL/SQL (Exemple:transformation des dates)
Chargement (L) :
Utilisation de lutilitaire dimport (IMP) Utilisation de lutilitaire de chargement (SQLLOADER) Utilisation de dblink, pour le chargement dune table Create table as select col1, col from table
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 90
7.1 Extraction
Utilisation du spooler :
Utilisation du spooler
Utilisation define col Utilisation de ; comme sparateur de colonne
Utilisation de dblink :
Cration dun dblink Utilisation du dblink pour lextraction dune table
2012 - 2013
92
2012 - 2013
93
2012 - 2013
94
2012 - 2013
95
7.1 Extraction:PL/SQL
set serveroutput on size 100000 set feedback off set termout off spool extract_fournisseur.txt DECLARE CURSOR C1 IS SELECT * FROM FOURNISSEUR; enreg_c1 c1%rowtype; BEGIN DBMS_OUTPUT.put_line(' NUM_PROF NOM SPECIALITE DATE_ENTREE SALAIRE_ACTUEL); OPEN C1; LOOP FETCH C1 into enreg_c1; exit when c1%notfound; DBMS_OUTPUT.put_line(enreg_c1.num_four || ; || enreg_c1.nom || ; || enreg_c1.specialite || ; || enreg_c1.date_entree || ; || enreg_c1.salaire_actuel); end loop; close C1; exception when others then null; end; / Exit spool off M. F. Boufars & R. NEFOUSSI, 2012 - 2013 UP13
Cration de dblink : Create database link remote_db connect to user1 identified by mdp1 using dbdistante;
2012 - 2013
96
97
7.1 Utilitaire dexport (EXP) pour lextraction des donnes Syntaxe exp system/manager tables=(schema1.tab1,schema1.tab2) file=file.dmp log=exp_tab.log . 1. Variables de EXP : - full - tables - log - file - full - indexes - grants - parfile - query -
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 98
Exemples de requte dexport (EXP) en ligne exp scott/tiger tables=emp query=\"where job=\'SALESMAN\' and sal\<1600\" exp scott/tiger file=scott.dmp owner=scott grants=Y rows=Y compress=y exp system/manager tables=(scott.emp,blake.dept) grants=Y indexes=Y
2012 - 2013
99
Exemples de requte dexport (EXP) avec parfile exp tiger/scott parfile=params.dat Le fichier params.dat contient les informations suivantes : FILE=blake.dmp TABLES=(dept,manager) ROWS=Y COMPRESS=Y
2012 - 2013
100
7.2 Transformormation
Transformation (T) :
Utilisation de la commande DECODE Utilisation de PL/SQL (Exemple:transformation des dates)
2012 - 2013
7.2 Transformation:PL/SQL
DECLARE CURSOR C1 IS SELECT * FROM FOURNISSEUR; enreg_c1 c1%rowtype; BEGIN OPEN C1; LOOP FETCH C1 into enreg_c1; exit when c1%notfound; Insert into dw_fournisseur values (enreg_c1.num_prof,enreg_c1.nom,to_char(data_entree,ddmmyyyy end loop; close C1; exception when others then null; end; / Exit spool off
M. F. Boufars & R. NEFOUSSI, UP13
2012 - 2013
104
2012 - 2013
105
7.3 Chargement:sqlldr
Syntaxe : sqlldr ... Valid Keywords: userid -- Oracle username/password control -- Control file name log -- Log file name bad -- Bad file name data -- Data file name skip -- Number of logical records to skip (Default 0) errors -- Number of errors to allow (Default 50) direct -- Use direct path (Default FALSE) parfile -- Parameter file: name of file that contains parameter specifications parallel -- Perform parallel load (Default FALSE) readsize -- Size (in bytes) of the read buffer file -- File ..
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 108
7.3 Chargement:sqlldr
Exemple 1 : utilisation de la commande sqlldr en ligne SQLLDR CONTROL=foo.ctl, LOG=bar.log, BAD=baz.bad, DATA=etc.dat USERID=scott/tiger, ERRORS=999, LOAD=2000, DISCARD=toss.dis, DISCARDMAX=5 Exemple 2 : utilisation de la commande sqlldr avec parfile SQLLDR PARFILE=example.par Le fichier example.par peut avoir les informations suivantes : userid=scott/tiger control=example.ctl errors=9999 log=example.log Le fichier contrle example.ctl peut contenir les informations suivantes :
2012 - 2013
109
7.3 Chargement:sqlldr
Exemple N1 de Contrle file : etl1.ctl
7.3 Chargement:sqlldr
Le fichier etl1.ctl contient les informations suivantes : LOAD DATA INFILE * INTO TABLE departement FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' (No_dept, nom_dept, departement) BEGINDATA ,INDUSTRIE, ILE de FRANCE" ,COMPTABILITE,"IDF" ,"ART", ,"IDF" ,FINANCE ,"IDF"
M. F. Boufars & R. NEFOUSSI, UP13
LOAD DATA INFILE 'ulcase2.dat' INTO TABLE EMPLOYE (No_emp POSITION(01:04) INTEGER EXTERNAL, nom POSITION(06:15) CHAR, job POSITION(17:25) CHAR, salaire POSITION(32:39) DECIMAL EXTERNAL, comm POSITION(41:48) DECIMAL EXTERNAL, No_dept POSITION(50:51) INTEGER EXTERNAL)
2012 - 2013
110
2012 - 2013
111
7.3 Chargement:sqlldr
7.3 Chargement:sqlldr
The following shows a portion of the log file: Control File: etl2.ctl Data File: etl2.dat Bad File: etl2.bad Discard File: none specified Number to load: ALL Number to skip: 0 Errors allowed: 50 Bind array: 64 rows, maximum of 65536 bytes Continuation: none specified Path used: Conventional Table EMP, loaded from every logical record. Insert option in effect for this table: INSERT Column Name Position Len Term Encl Datatype ------------------------------ ---------- ----- ---- ---- --------------------No_emp 1:4 4 CHARACTER Nom 6:15 10 CHARACTER JOB 17:25 9 CHARACTER SaLaire 32:39 8 CHARACTER COMM 41:48 8 CHARACTER No_dept 50:51 2 CHARACTER Table EMPLOYE: 7 Rows successfully loaded. 0 Rows not loaded due to data errors. 0 Rows not loaded because all WHEN clauses were failed. 0 Rows not loaded because all fields were null. Space allocated for bind array: 65520 bytes(1092 rows) Space allocated for memory besides bind array: 0 bytes Total logical records skipped: 0 Total logical records read: 7 Total logical records rejected: 0 Total logical records discarded: 0 Run began on Sun Nov 08 11:09:31 1998 Run ended on Sun Nov 08 11:09:32 1998 Elapsed time was: 00:00:00.63 CPU time was: 00:00:00.16
load data append into table compte_marne fields terminated by ';' ( cpt_branch , cpt_racine , cpt_groupe , cpt_noisy )
2012 - 2013
112
2012 - 2013
113
Cration de dblink :
Create database link remote_db connect to user1 identified by mdp1 using dbdistante;
2012 - 2013
114
2012 - 2013
115
Partie 4
2012 - 2013
117
3. Table composite RANGE-LIST partitionne par intervalle et sous partitionne par liste
CREATE TABLE () PARTITION BY LIST () ( PARTITION VALUES () , PARTITION VALUES () , );
2012 - 2013
118
2012 - 2013
119
2012 - 2013
120
2012 - 2013
UP13
121
8.2.1 Syntaxe
Syntaxe et rgle de cration dune MV Suppression des objets dune vue matrialise Cration du journal de la vue matrialise Cration dune vue matrialise Plan dexcution (accs la table) Plan dexcution (accs la MV)
CREATE MATERIALIZED VIEW MV_SYNTAXE PCTFREE 0 TABLESPACE TBS_TEST STOTAGE (INITIAL 5 M NEXT 5 M PCTINCREASE 0) PARALLEL 4 BUILD {IMMEDIATE , DEFERED} REFRESH {COMPLETE,FAST,FORCE,NEVER} ENABLE QUERY REWRITE AS /* Corps de la requte*/ SELECT .. From
2012 - 2013
122
2012 - 2013
123
8.2.3 Rgles
CREATE ANY VIEW CREATE TABLE CREATE ANY INDEX CREATE ANY MATERIALIZED VIEW CREATE ANY SNAPSHOT GLOBAL QUERY REWRITE
2012 - 2013
124
2012 - 2013
125
8.2.4 Syntaxe
CREATE MATERIALIZED VIEW MV_SYNTAXE PCTFREE 0 TABLESPACE TBS_TEST STOTAGE (INITIAL 5 M NEXT 5 M PCTINCREASE 0) PARALLEL 4 BUILD {IMMEDIATE , DEFERED} REFRESH {COMPLETE,FAST,FORCE,NEVER} ENABLE QUERY REWRITE AS /* Corps de la requte*/ SELECT .. From
Rem ========================================= Rem Suppression des objets relatifs la vue materialise. Rem ========================================= drop materialized view log on CONTRAT ; drop materialized view MV_CONTRAT_01;
2012 - 2013
126
2012 - 2013
127
8.2.7 Cration de la MV
rem================================= rem Cration de la vue matrialise. rem ================================
rem===================================== rem Creation du journal de la vue materialise. rem ==================================== create materialized view log on CONTRAT tablespace TBS_TEST storage (initial 50M next 50M maxextents unlimited pctincrease 0) nologging with primary key /
create materialized view MV_CONTRAT_01 tablespace TBS_TEST storage (initial 50M next 50M pctincrease 0 maxextents unlimited) nologging build immediate refresh fast using default rollback segment enable query rewrite as select no_par_ttu,count(*),sum(mt_frs_doss),sum(mt_net_valr),sum(mt_tva_net_valr ), sum(mt_enc_ms) from contrat group by no_par_ttu /
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 129
2012 - 2013
128
2012 - 2013
132
2012 - 2013
133
8.3.1 Limitations
Les tablespaces transporter ne doivent pas exister sous le mme nom dans la destination; il n'y a pas possibilit de changer le nom "en cours de route". Un tablespace fragment est transfr tel quel : pas de rorganisation.
2012 - 2013
134
2012 - 2013
135
8.3.3 Syntaxes
1. Export des mtadonnes sur la machine source (quelques minutes) exp userid=sys/change_on_install file=S_FR_GEN.DMP log=S_FR_GEN.LOG transport_tablespace=Y TABLESPACES=S_FR_GEN_DATA,S_FR_GEN_TG_CRCOH,S_FR_GEN_TG_STVD,S_FR_GEN_INDX 2. Copie des fichiers *.dbf des tablespaces par ftp de la machine source vers la machine destination 3. Import des mtadonnes sur la machine de destination imp parfile=impgen.par avec impgen.par : userid=sys/change_on_install file=S_FR_GEN.DMP log=S_FR_GEN.LOG transport_tablespace=Y datafiles=,'/opt/app21vg/appl/dwhev/dbdc/oracle/dbs/oradata3/FR_DWHE_V_GEN_AUDIT_1.dbf', '/opt/app21vg/appl/dwhev/dbdc/oracle/dbs/oradata3/FR_DWHE_V_GEN_DATA_1.dbf', '/opt/app21vg/appl/dwhev/dbdc/oracle/dbs/oradata3/FR_DWHE_V_GEN_INDX_1.dbf', '/opt/app21vg/appl/dwhev/dbdc/oracle/dbs/oradata3/FR_DWHE_V_GEN_TG_CRCOH_1.dbf', '/opt/app21vg/appl/dwhev/dbdc/oracle/dbs/oradata3/FR_DWHE_V_GEN_TG_STVD_1.dbf'
MERGE INTO NOM_TABLE1 USING (SELECT COL1, FROM NOM_TABLE2 WHERE ) ON (CONDITION) WHEN MATCHED THEN merge_update_clause WHEN NO MATCHED THEN merge_insert_clause;
2012 - 2013
136
2012 - 2013
137
8.4.2.1 Instruction Merge (Example) The following example creates a bonuses table in the sample schema oe with a default bonus of 100. It then inserts into the bonuses table all employees who made sales (based on the sales_rep_id column of the oe.orders table). Finally, the Human Resources manager decides that all employees should receive a bonus. Those who have not made sales get a bonus of 1% of their salary. Those who already made sales get an increase in their bonus equal to 1% of their salary. The MERGE statement implements these changes in one step:
2012 - 2013
138
140
2012 - 2013
141
8.4.2.1 Table externe Contenu du fichier externe vente1.dat 1,1,1,1,1,30,30012007 1,1,1,1,1,30,14042008 1,2,1,1,1,32,15072007 1,2,1,1,1,32,03102006 Cration dun repertoire sous System create directory dir_vente as '/opt/appl/bcri/dbdc/oracle/admin/rne/eid Attribution des droits GRANT READ ON directory dir_vente TO RNE GRANT WRITE ON directory dir_vente TO RNE
2012 - 2013 M. F. Boufars & R. NEFOUSSI, UP13 142
2012 - 2013
143
9 Exemple dETL
Vendor Ascential Software Business Objects DataMirror April 1, Evolutionary Technologies (ETI) Group 1 Hummingbird IBM DB2 Informatica iWay Software Microsoft Oracle Pervasive SAS Sunopsis TALEND
DataStage Data Integrator Transformation Server ETI Solution June Data Flow Fall Genio September Warehouse Manager PowerCenter DataMigrator Data Transformation Services (DTS) Oracle Warehouse Builder (OWB) Data Integrator Enterprise ETL Server Sunopsis TALEND
July 1, 2004 April 6, 2004 2003 1, 2004 2004 3, 2004 August 1, 2003 August 25, 2004 July 3, 2004 August 7, 2000 May 1, 2004 July 1, 2004 August 11, 2004
September, 2007
2012 - 2013
145
ETL : TALEND
2012 - 2013
146
2012 - 2013
147
ppm install DBI.ppd ppm install Class-Trigger.ppd ppm install Email-Simple.ppd ppm install Email-LocalDelivery.ppd ppm install Email-Filter.ppd ppm install MIME-Lite.ppd ppm install Net-LDAP-Express.ppm ppm install Spreadsheet-ParseExcel.ppd
: Exploitation des fichiers Excel (csv) ppm install Spreadsheet-WriteExcel.ppd : Gnration dun fichier Excel partir de la Base ppm install Text-ASCIITable.ppd ppm install Text-CSV_XS.ppd : Gestion des fichiers Excel Csv
2012 - 2013
148
2012 - 2013
149
Rfrentiel (Repository) Espace de modlisation (WorkSpace) Proprits (Properties), Excution (Run Job) et Logs
Aperu Schma (Outline) Aperu du code (Code Viewer)
2012 - 2013
150
2012 - 2013
151
2012 - 2013
152
2012 - 2013
153
2012 - 2013
154
2012 - 2013
155
2012 - 2013
156
2012 - 2013
157
2012 - 2013
158
2012 - 2013
159
2012 - 2013
160
2012 - 2013
161
2012 - 2013
162
2012 - 2013
163
2012 - 2013
164
2012 - 2013
165
Mapping de flux de donnes dans un Job Excution dun Job Construction dune requte avec SQLBUILDER Type de connexion connexion de type Row Connexion de type iterate Connexion de type trigger Connexion de type Link Dfinition dun contexte et des variables dun job Ordonnancement des traitements par scheduler de TALEND Excution dune commande systme (Sqlloader, cmd; ..)
2012 - 2013
166
2012 - 2013
167
2012 - 2013
168
2012 - 2013
169
2012 - 2013
170
2012 - 2013
171
2012 - 2013
172
2012 - 2013
173
2012 - 2013
174
2012 - 2013
175
2012 - 2013
176
2012 - 2013
177
2012 - 2013
178
2012 - 2013
179
ETL DORACLE
2012 - 2013
180
2012 - 2013
181
Installation : OWB
1. Download du produit partir du site dOracle
Cest un outil intelligent fournissant une solution intgre de conception et de dploiement des DW, des data marts et des applications intelligentes de Buisness
2012 - 2013
184
2012 - 2013
185
de conception
2012 - 2013
186
2012 - 2013
187
2012 - 2013
188
2012 - 2013
189
1ere partie de lETL (E)xtraction : avec OWB (Cration dun fichier plat)
Mapping
2012 - 2013
190
2012 - 2013
191
2012 - 2013
192
2012 - 2013
193
2012 - 2013
194
2012 - 2013
195
Excution dune requte : sous OWB Cliquer sur la table partir du centre de conception (ensuite cliquer sur visualiseur des donnes)
2012 - 2013
196
2012 - 2013
197
2012 - 2013
198
2012 - 2013
199
Architecture de lOWB
2 composantes : -Environnement de conception (meta-data repository + outils de reprsentation et ddition ) -Environnement dexcution ( Warehouse Builder Deployment Manager ou bien Oracle Entreprise Manager)
2012 - 2013
200
2012 - 2013
201
Fonctionnalits du OWB
- Importer les dfinitions des sources de donnes - Conception et cration des schmas des bases de donnes (DW) - Dfinition des mouvements et des transformations des donnes des sources - Attribuer les dpendances entre les diffrents processus de lETL - Manipuler et grer les dfinitions des sources
Fonctionnalits du OWB
- Mise jour et gestion des schmas des bases de donnes (DW) - Conception et cration de lenvironnement dexcution (requtes et outils dextraction) - Conception et cration dun environnement OLAP
2012 - 2013
202
2012 - 2013
203
Composantes du OWB
- Warehouse Builder Client Application - Warehouse Builder Runtime Platform Service - Warehouse Builder design repository - Warehouse Builder runtime repository - Audit Reporting Browser - Metadata Reporting Browser - Advanced Queues - External tables - Connectors - Cubes - Dimensions - Files - Locations - Mappings - Materialized views
M. F. Boufars & R. NEFOUSSI, UP13
Objets du OWB
2012 - 2013
204
2012 - 2013
205
Objets du OWB
- Process flows - Sequences - Tables - Transformations - Views
2012 - 2013
206
2012 - 2013
207
Partie 5
Console du supervisor
Dfinition Univers
2012 - 2013
211
2012 - 2013
212
2012 - 2013
213
2012 - 2013
214
2012 - 2013
215
Visualisation de lUNIVERS
2012 - 2013
216
2012 - 2013
217
Parametrage de lUnivers
Parametrage de lUnivers
2012 - 2013
218
2012 - 2013
219
Parametrage de lUnivers
Parametrage de lUnivers
2012 - 2013
220
2012 - 2013
221
Parametrage de lUnivers
Parametrage de lUnivers
2012 - 2013
222
2012 - 2013
223
2012 - 2013
224
2012 - 2013
225
2012 - 2013
226
Gnral
Affichage (Display)
Drill
Nouveau Document
Macros
Les rapports
Exemple de rapport
Partie 9
SQL Avancs
2012 - 2013
240