Vous êtes sur la page 1sur 17

BD Multidimensionale

Sistemele informaţionale operaţionale (tranzacţionale) sunt organizate


pe domenii de activitate (marketing, gestiunea resurselor umane,
financiar-contabilitate, gestiunea vânzărilor, etc.) şi au ca nucleu baze
de date orientate pe gestiunea curentă a organizaţiei (sunt numite şi
baze de date operaţionale - BDO).

Scopul principal al BDO este stocarea datelor despre tranzacţiile unui


anumit domeniu de gestiune. Baza de date garantează persistenţa
datelor şi este concepută pentru a păstra urma tranzacţiilor
(evenimentelor) survenite într-o organizaţie (BD au caracter istoric)

OLTP (On-Line Transaction Processing) reprezintă conceptul care


descrie prelucrarea tranzacţiilor legate de bazele de date
operaţionale.
BD Multidimensionale
Modelul de organizare a datelor este destinat să
minimizeze redundanţele pentru a menţine fiabilitatea
şi coerenţa sistemului informaţional
Interogările sunt în majoritatea cazurilor previzibile; ele materializează
cerinţele informaţionale standard specificate de utilizatorii finali pe
domenii de activitate
Volumul datelor care trebuie accesat pentru a prelucra o tranzacţie este
în general limitat. Cel mai adesea, numărul de intrări/ieşiri asociat
fiecărei tranzacţii este un număr finit, previzibil. Pentru a efectua
prelucrările necesare unei bune execuţii, o tranzacţie face apel la un
număr limitat şi finit de structuri. Este destul de rar cazul în care o
interogare tranzacţională să necesite asamblarea sau agregarea
informaţiilor ce provin de la un număr mare de tabele de date.
BD Multidimensionale
Un ansamblu de date, constituite prin extragere sau transformare de
date din bazele de date (fişiere) interne sau externe, variind în timp,
organizate multidimensional şi explorate folosind interogări
convenţionale sau tehnici specifice de analiză simplă (OLAP) sau de
analiză avansată (Data Mining)
BD Multidimensionale: Particularităţi:
Organizare pe teme ale managementului executiv. Datele sunt structurate având la bază
teme ale conducerii şi nu procese funcţionale cum era în cazul bazelor de date
operaţionale.
Memoria organizaţiei. BDM este văzută ca o memorie a întreprinderii. Volumul datelor
este imens şi în armonie cu sistemele operaţionale.
Integrare date. Integrarea datelor interne şi externe organizaţiei.
Date temporale (în literatura de specialitate mai sunt numite şi istorice). Într-o BDM
datele temporale permit efectuarea de extrapolări bazate pe evenimente trecute.
Redundanţă. Datele sunt stocate în BDM cu eventuale redundanţe (nu se poate încă
vorbi de un formalism riguros pentru normalizarea datelor din BDM).
Date nevolatile. Datele din BDM nu se actualizează. O anume interogare efectuată la
anumite intervale de timp determină obţinerea aceluiaşi rezultat.
Date detaliate. Sunt deduse (prin extragere şi transformare) din bazele de date
operaţionale. Într-o BDM se pot stoca date detaliate replică a datelor curente
(operaţionale) sau a datelor pe mai mulţi ani.
Date agregate. Ele trebuie să fie astfel stocate încât să permită navigarea utilizatorilor
de la sinteză la detaliu şi invers.
OLAP. On Line Analytical Processing desemnează o categorie de aplicaţii şi tehnologii
ce permit colectarea, stocarea, tratarea şi restituirea de date multidimensionale în scopuri
de analiză.
Data Mining. Termen folosit pentru a desemna procese de explorare a datelor utilizând
tehnici izvorâte din inteligenţa artificială şi statistică în scopuri de analiză a datelor.
BD Multidimensionale
Cea mai mare parte a problemelor care se încearcă a se rezolva cu
tehnologia relaţională sunt în realitate de natură multidimensională.
Modelul relaţional descrie tabelele în două dimensiuni: linie, coloană,
în timp ce modelul multidimensional nu are limite în ceea ce priveşte
stocarea dimensională (spaţială) a datelor

Un SGBDR nu este adaptat unor astfel de cerinţe în care intervin


agregări de date, sintetizări, consolidări şi proiecţii multidimensionale.

De aceea au fost extinse facilităţile BDR prin adăugarea de


componente care să permită OLAP şi Data Mining.

Pentru ca un sistem informaţional să fie cu adevărat performant, acesta


trebuie să fie proiectat pe componentele sale dimensionale.
BD Multidimensionale: Principii
OLAP oferă utilizatorilor instrumente ce permit navigarea de la o
dimensiune la alta, precum şi modalităţi de relevare a informaţiilor cele
mai detaliate
Tehnologia OLAP se articulează în jurul următoarelor principii
fundamentale (Ted Codd, 1992)

•viziune conceptuală multidimensională asupra datelor;


•transparenţă prin arhitectura deschisă a sistemelor (ascunderea pentru
utilizator a eterogenităţii eventuale a datelor);
•accesibilitate prin ascunderea pentru utilizator a modalităţilor tehnice de
furnizare a datelor (utilizatorul trebuie să preia datele dintr-un univers
eterogen: SGBDR, fişiere, date externe organizaţiei, WEB, etc.);
•performanţe stabile şi independente de complexitatea dimensională a
contextelor analizei;
•arhitectura client-server, în care server-ul are un rol de omogenizare a
datelor, putându-se conecta la diferiţi clienţi ai produselor OLAP;
BD Multidimensionale: Principii

•prelucrarea generică a dimensiunilor, adică posibilitatea efectuării


aceleiaşi operaţii asupra tuturor dimensiunilor;
•gestionarea dinamică şi eficace a matricilor încrucişate, adică aptitudinea
de a nu aglomera memoria calculatorului cu celulele ce corespund
combinărilor dimensionale nule;
•multi-user, adică posibilitatea de acces simultan la acelaşi context de
analiză pentru mai mulţi utilizatori;
•operaţiuni nerestrictive, adică posibilitatea efectuării, fără restricţii
tehnice, de calcule asupra tuturor combinărilor de dimensiuni posibile şi de
niveluri ierarhice;
• posibilitatea manipulării intuitive a datelor;
• număr nelimitat de niveluri de agregare şi de dimensiuni, adică absenţa
(apriori) limitelor numărului de dimensiuni posibile şi a numărului de
niveluri ierarhice pe fiecare dimensiune în parte.
BD Multidimensionale
Modelarea dimensională pleacă de la principiul general conform căruia
obiectivul major al unui sistem informaţional este reprezentat de analiza
ventilării datelor cantitative (numite fapte) în interiorul datelor
calitative (numite dimensiuni).
Tehnicile multidimensionale operează cu noţiunile de fapte, dimensiuni,
ierarhie şi agregat.
Faptele reprezintă elementele analitice ale bazei de date;
Dimensiunile sunt categoriile descriptive după care se realizează
gruparea, sintetizarea şi consolidarea datelor;
Ierarhiile reprezintă nivelurile de detaliere pentru o dimensiune de
date;
Agregatele sunt elemente compozite ce conţin date aflate la stadii
diferite de sintetizare.

Analizarea datelor de-a lungul mai multor dimensiuni este mult mai
uşor de vizualizat decât de descris
BD Multidimensionale

TIMP

PRODUS

REGIUNE

Intersecţia celulelor celor trei dimensiuni conţine datele de


analizat, măsurile acestora, iar fiecare dimensiune poate avea unul
sau mai mulţi membri. De exemplu, dimensiunea spaţială Regiune
poate avea ca membri zonele geografice (nord, sud, est, vest),
dimensiunea Produs poate conţine membri ce reprezintă produsele
vândute de întreprindere, iar dimensiunea Timp poate avea membrii de
tipul unităţilor de timp (zile, săptămâni, decade, luni, trimestre,
semestre, ani, etc.).
BD Multidimensionale
În general, din punct de vedere conceptual, analiza se axează pe trei
dimensiuni principale: pe elementul supus analizei, pe componenta
spaţială şi pe componenta temporală. În realitate, MOLAP
(Multidimensional OLAP) poate organiza şi analiza datele după „n”
dimensiuni ale cubului. Termenul de cub este utilizat pentru a descrie
spaţiul n-dimensional ocupat de date. Datorită faptului că numărul de
dimensiuni este variabil, utilizarea conceptului de cub nu este
circumscrisă sensului său geometric. Un cub ce stochează datele în mai
multe dimensiuni, este cunoscut sub numele de hypercub

Într-un hypercub, datele sunt stocate pe zone multidimensionale, în


care fiecare celulă dintr-o zonă reprezintă intersecţia tuturor
dimensiunilor. Utilizând această abordare poate fi analizat simultan
orice număr de dimensiuni şi pot fi prezentate multiple vizualizări
multidimensionale ale datelor
BD Multidimensionale

Rezultatele cererilor de interogare corespund în fapt unei matrici în care


fiecare dimensiune este descrisă de o entitate, iar conţinutul este dedus din
asocierea entităţilor. Combinarea condiţiilor şi restricţiilor reprezintă
coordonatele ce determină valorile faptelor, după cum combinarea valorilor
numerice pot determina reprezentarea unui punct într-un spaţiu
multidimensional

Principalele operaţii într-o bază de date multidimensională sunt:


•navigarea verticală în datele bazei sau depozitului de date (drill down,
drill up) reprezintă operaţia prin care se face trecerea de la un anumit
nivel de prezentare al unui ansamblu de date, la un nivel mai detaliat
(drill down) sau mai agregat (drill up);
•rotaţia a bazei de date reprezintă schimbarea orientării dimensionale în
prezentarea datelor, prin permutări între linii şi coloane.
BD Multidimensionale: Exemplu normalizat
Societatea X distribuie produse clienţilor. Din punct de vedere al analizei, este
interesant de cunoscut cum are loc ventilarea veniturilor obţinute din vânzări de
produse, pe clienţi, pe judeţe, pe regiuni, pe ţări importatoare, etc

GAMĂ PRODUS FURNIZOR ŢARĂ


ID_Gamă ID_Furnizor
Model normalizat
Cod_Ţară
Denumire_gamă Nume_fz Denumire_ţară
Marjă_comercială Cod_fiscal ........
Adresă
Localitate
Telefon CLIENT

ID_Client
IMPLEMENTARE
PRODUS
Nume_cl
Cod_ţară într-un SGBD
COMANDĂ Adresă
ID_Produs Localitate
ID_Gamă Telefon
ID_Comandă
ID_Furnizor
ID_expeditor
Denumire_prod
Cod_ţară
ID_Client
Reducere_com
Relevanţă
decizională nulă
Caracteristici
Cost_standard
Preţ_fără_TVA

LINIE COMANDĂ

ID_Comandă
ID_Linie_comandă
ID_Produs
Cantitate
Denormalizarea bazei de date
Dată
BD Multidimensionale: Exemplu denormalizare
Modelul normalizat al BD trebuie să fie transformat printr-un proces de
denormalizare a modelului datelor, dublat de precalcularea unor
agregate care pot introduce redundanţe (până în prezent nu a fost
identificată încă nici o tehnică formală de denormalizare)
FURNIZOR
PRODUS
CLIENT
ID_Furnizor
ID_Produs
Nume_fz ID_Client
Gamă
Ţară Nume_cl
ID_Furnizor
Cod_fiscal Ţară
Venituri n-1
Adresă Adresă
Venituri n
Localitate Localitate
Provenienţă
Telefon Telefon
Denumire_prod
Caracteristici
Preţ_fără_TVA
Cost_standard
COMANDĂ

LINIE COMANDĂ ID_Comandă


ID_expeditor
ID_Comandă ID_Client
ID_Linie Preţ fără TVA
ID_Produs Preţ cu TVA
Preţ fără TVA Reducere_com
Preţ cu TVA
Cantitate
Dată
Ţară
BD Multidimensionale: Tipuri de modele
MODELUL ÎN STEA
În modelul stea, indicatorii de bază sunt grupaţi într-o tabelă principală,
numită tabelă de fapte. O astfel de tabelă regrupează toţi indicatorii ce
partajează acelaşi ansamblu de dimensiuni şi toţi indicatorii ce nu pot fi
deduşi din alţi indicatori. Tabela de fapte conţine elemente numerice
măsurabile ce există la intersecţia dimensiunilor. Faptele din tabela de
fapte reprezintă elementele de date ce pot fi agregate. La nivelul tabelei de
fapte nu este necesară descrierea datelor în mai mult de două dimensiuni.
În centrul reprezentării în stea se regăseşte tabela de fapte.
Identificatorul acestei tabele de fapte este o cheie multiplă compusă din
concatenarea cheilor fiecărei dimensiuni de analiză. Astfel, atributul
<<venituri>> stocat în tabela de fapte, va putea fi identificat prin dimensile:
timp, produs, client, furnizor.
În corelaţie cu tabela de fapte, figurează toate elementele ce caracterizează
dimensiunile analizei, regrupate în tabele de dimensiuni. În acest fel, tabela ce
corespunde dimensiunii „Produse” va conţine toate informaţiile de analizat care
descriu un produs (culoare, gamă, preţ, ambalaj, accesorii, etc.).
BD Multidimensionale: Tipuri de modele
MODELUL ÎN STEA
FURNIZOR
PRODUS
ID_Furnizor
ID_Produs Nume_fz
D Gamă Departament
Provenienţă D
I Ţară
Denumire_prod Localitate I
M Caracteristici ............. M
E Accesorii VÂNZĂRI
E
N Culoare
ID_Produs N
S Cost_standard
.............. ID_Furnizor S
I ID_Client I
U Data (zz/ll/aaaa) U
N PERIOADĂ Venituri CLIENT
Marjă_comercială
N
I Unităţi vândute ID_Client I
Data (zz/ll/aaaa)
Zi - săptămână ........... Nume_cl
Săptămână - lună Ţară
Săptămână – trimestru Localitate
Săptămână – an Vârstă
Lună Telefon
An ............
Măsuri
BD Multidimensionale Tipuri de modele
MODELUL FULG DE ZĂPADĂ

Modelarea intitulată sugestiv „fulg de zăpadă” (snowflake) derivă din


modelul în stea. „Fulgul de zăpadă” este de fapt o stea ale cărei raze
sunt ele însele descompuse într-o structură ierarhică. A modela
potrivit acestei tehnici presupune a conserva nucleul modelului în stea
(tabela de fapte) şi a descompune tabelele de dimensiuni în sub-
tabele. În fapt, modelul „fulg de zăpadă” normalizează tabelele
dimensionale ale modelului stea. Pentru tratarea dimensiunii
temporale se pot defini sub-entităţi de tip an, lună, semestru.
Normalizând dimensiunile, modelul poate elimina redundanţele
apărute odată cu denormalizarea bazei de date
BD Multidimensionale Tipuri de modele
MODELUL FULG DE ZĂPADĂ
CULOARE FURNIZOR TIP FZOR
PRODUS
ID_Culoare ID_Furnizor ID_Tip
Nume_culoare ID_Produs Nume
ID_Familie Nume_fz
ID_Responsabil_prod Ţară
ID_Culoare Localitate ORIGINE
Denumire_produs
VÂNZĂRI Telefon
Cost_standard ID_Tip_fzor
ID_Origine
ID_Produs ID_Origine
Naţionalitate
ID_Furnizor
RESP_PROD Dată (z/l/a)
ID_Client
ID_Responsabil_prod Venituri REGIUNE
Nume_prenume Marjă_comercială
Remarci Unităţi CLIENT ID_Regiune
Nume_regiune
ID_Client .
GAMĂ ACTIVITATE Nume_cl
ID_Regiune
SEGMENT
ID_Gamă ID_Activitate ID_Activitate
Nume_gamă ID_Gamă ID_Segment ID_Segment
Interval_preţuri Interval_preţuri ........... Nume_segment
.

ACTIVITATE
PERIOADĂ
AN SEZON LUNĂ ID_Activitate
Dată (z/l/a) Denumire_activitate
ID_An ID_Sezon Lună ID_zi (luni, marţi...) .
Coment Nume Nume_lună ID_săptămână
Comentarii ID_Lună

SĂPTĂMÂNĂ ZI SĂPTĂMÂNĂ

ID_Săptămână Cod_Zi_Săptămână
Săptămână Nume

Vous aimerez peut-être aussi