Banca de date este un sistem de organizare şi prelucrare (teleprelucrare) a informaţiei
constituit din trei elemente : • colecţie de date aflate în interdependenţă; • descrierea datelor şi a relaţiilor ce există între ele; • un sistem de programme pentru gestiunea datelor ce asigură independenţa programelor aplicative faţă de modul de structurare a datelor, o redundanţă minimă, controlată în memorarea acestora, precum şi un timp minim de răspuns la solicitările utilizatorilor în ansamblul lor. Noţiunea de baza de date se foloseşte pentru a denumi primele două elemente ale băncii de date. Baza de date are sens numai ca element al băncii de date nefiind element distinct. Componenta a treia, sistemul de programme cu sarcinile specificate, poartă numele de sistem de gestiune a bazelor de date (Database management system). Activitatea de organizare şi prelucrare a datelor a avut o evoluţie determinată de necesităţile mereu în creştere de a avea acces mai rapid la un volum foarte mare de date. În cadrul evoluţiei metodelor şi tehnicilor de organizare a datelor se disting următoarele etape: • Etapa I. Se caracterizează prin adaptarea tipurilor de organizare a datelor existente în sistemele de prelucrare şi stocare manuală la cerinţele impuse de utilizarea calculatoarelor electronice. Principalul tip de structurare a datelor din această etapă este fişierul. Sistemele de prelucrare automată au preluat această formă de structurare a datelor fără ai aduce mari îmbunătăţiri. Astfel se folosesc fişiere secvenţiale, secvenţial indexate sau cu acces direct moduri de organizare a datelor care au fost preluate de la prelucrarea manuală a datelor. De exmplu fişierele întâlnite în biblioteci pe fişe de carton ce permit identificarea cărţilor din bibliotecă. Principalul tip de fişier folosit în acestă etapă este fişierul secvenţial, determinat de utilizarea pe scară largă a benzii perforate, cartelelor perforate şi a benzilor magnetice drept suport extern pentru păstrarea datelor. De asemenea în acestă etapă nu există o distincţie între structura logică şi cea fizică a bazei de date. Structura datelor este proiectată pentru a deservi o singură aplicaţie, astfel aplicaţii asemănătoare foloseau alt set de date deşi toate acestea caracterizau acelaşi obiecte, evenimente, fapte, aspecte ale lumii reale. Rezultă o mare redundanţă a datelor ce se întâlneşte în această etapă. O altă caracteristică a acestei etape este dependenţa aplicaţiilor faţă de date, adică orice modificare în structura datelor implică modificări ale aplicţiei. • Etapa II. Este caracterizată de separarea între structura fizică a datelor (modul lor de reprezentare pe suporturile de stocare) de structura logică a datelor (modul în care acestea sunt reprezentate de aplicaţie). Acest lucru duce la idependenţa fizică a datelor ceea ce înseamn,a că se pot schimba dispozitivele de stocaj fără a afecta aplicaţiile. Datorită utilizării pe scara largă a discului magnetic în această etapă se utilizează pe scară largă fişierele secvenţial indexate şi cele cu acces direct. Apar şi primele facilităţi de protecţie a datelor. • Etapa III. Se caracterizează prin apariţia fişierelor integrate. Acestea înlătură o parte din inconvenientele date de organizarea datelor din primele două etape legate de redundanţa datelor, a timpului mare de prelucrare, a flexibilităţii reduse a sistemului la apariţia unei noi aplicaţii. Fişierele integrate folosesc mai multe fişiere logice ce descriu acelea,si date fizice. Astfel, se poate utiliza acelaşi set de date fizice în mai multe aplicaţii. • Etapa IV. Se caracterizează prin apariţia şi dezvoltarea bazelor de date. Acest lucru a fost posibil prin dezvoltarea fişierelor integrate ce ofereau posibilitatea exploatării în comun a aceloraşi seturi de date de către mai multe aplicaţii. S-a ajuns la necesitatea de a separa clar structura fizică a datelor de modul în care acestea sunt utilizate de mai multe aplicaţii, find necesară externalizarea descrierii structurii datelor de programul de aplicaţii. Tot în aceast,a etapă apare tehnici şi proceduri speciale pentru protecţia şi securitatea datelor. Un sistem de gestiune a bazelor de date este un ansamblu de programme care realizează descrierea, crearea, interogarea şi actualizarea unei baze de date, realizează legăturile dintre informaţiile păstrate în bazele de date folosind tabele auxiliare, menţine integritatea bazei de date şi asigură securitatea exploatării bazei de date. Principalele funcţii ale unui sistem de gestiune a bazelor de date sunt: • Funcţia de descriere. Din analiza sistemului informaţional pentru o aplicaţie dată sau pentru un grup de aplicaţii rezultă un model de structură a bazei de date care trebuie să ţină cont de posibilităţile sistemului de gestiune a bazelor de date. Folosind un limbaj de descriere a bazelor de date acesteia i se precizează structura prin definirea entităţilor, a caracteristicilor (atributelor) şi legăturilor între entităţi. Limbajul de decriere poate fi propriu sistemului de gestiune a bazei de date sau o extensie a unor limbaje de nivel înalt deja existente ( Delphi, Visual C++, Java). Subprogramele care tratează descrierea bazei de date generează tabele speciale prin care se asigură independenţa între structura fizică (modul în care informaţiile sunt păstrate pe suportul fizic) şi structura logică ( modul în care programatorul lucrează cu baza de date) Referinţele la entităţi sau atribute se face prin numele simbolice prin care au fost descrise şi nu depind de caracteristicile suportului fizic sau de sistemul de operare. • Funcţia de manipulare. La descrierea bazei de date nu se crează înregistrări în baza de date ci doar modul de organizare a informaţiei care să asigura independenţa faţă de suportul fizic. Crearea înregistrărilor se face prin intermediul unui limbaj de manipulare care dispune de anumite comenzi (macroinstrucţiuni). Noile înregistrări sunt validate (verificate) în conformitate cu restricţiile date la descrierea fiecărui atribut (câmp). Limbajul de manipulare permite de asemenea consultarea şi actualizarea bazei de date. Limbajul de manipulare poate fi propriu sistemului de gestiune a bazei de date sau poate fi o extensie a unui limbaj de programare de nivel înalt. • Funcţia de utilizare. Acestă funcţie este în general relizată în cadrul limbajului de manipulare, care permite scrierea unor algoritmi de prelucrare, tratare a datelor. Condiţiile de prelucrare a datelor din bazele de date depind de la o aplicaţie la alta.
În exploatarea bazelor de date lucrează persoane cu pregătire şi responsabilităţi diferite.
Principalele tipuri de utilizatori ai unei baze de date sunt: • Administratorul bazei de date. Persoana care stabileşte şi descrie modelul bazei de date după o ananliză amănunţită a sistemului informaţional c,aruia îi este destinată. Se descriu toate entităţile şi legăturile existente ţinând cont de aplicaţiile care vor utiliza baza de date şi dezvoltările ulterioare. Practic structura baza de date se poate schimba cu un cost foarte mare (excepţie modelul relaţional al bazei de date). Administratorul bazei de date trebuie să cunoască foarte bine atât problemele fiecărei aplicaţii cât şi posibilităţile sistemului de gestiune a bazei de date şi a sistemului de operare utilizat ( ca modalităţi de organizare a fişierelor reale, metode de acces optime pentru a avea performanţe ridicate în exploatare). El realizează descrierea bazei de date în ansamblul ei. • Administratorul aplicaţiei. Este persoana care cunoscând modelul global al bazei de date analizează cerinţele concrete ale unei aplicaţii ( cum ar fi programarea producţiei, urmărirea aprovizionării, gestiunea materialelor) şi stabileşte un submodel al bazei de date ce va fi utilizat. Submodelul cuprinde o parte a bazei de date globale care este văzută din punct de vedere al aplicaţiei. Această descriere a bazei de date va fi folosită de toţi programatorii de aplicaţii. • Programatorii de aplicaţii. Sunt persoanele ce scriu programele de exploatare a bazei de date, pentru o aplicaţie dată, pe baza descrierii stabilită de administratorul aplicaţiei şi a indicaţiilor primite de la acesta. Ei vor folosi limbajul de manipulare disponibil pentru sistemul de gestiune a bazei de date, şi eventual alte subprograme. • Utilizatorii bazei de date. Persoanele care în diferite împrejurări se servesc de informaţiile din baza de date prin staţiile client disponibile. Aceştia nu sunt informaticieni. Ei utilizează fie aplicaţiile realizate de programatorii de aplicaţie sau un limba care se aseamană cu limbajul natural. Structura unei baze de date cuprinde trei nivele: • nivelul modelului global; • nivelul aplicaţiei; • nivelul fizic. La nivelul modelului global o bază de dată are o structură logică formată din entităţi (înregistrări), fiecare entitate având un număr de caracteristici sau atribute (câmpuri) care îndeplinesc anumite condiţii şi repectă anumite restricţii ( sunt valori numerice sau şiruri de caractere de o anumit,a lungime, care au anumite limite impuse). Entităţile sunt legate între ele conform modelului real. La nivelul aplicaţiei structura bazei de date este văzută parţial şi prin intermediul programelor de aplicaţie. Aceleaşi entităţi din baza de date pot fi văzute diferit din aplicaţii diferite. La nivel fizic baza de date este formată dintr-un ansamblu de fişiere cu organizări diferite legate între ele prin referinţe sau tabele de referinţe şi din sisteme de corespondenţă între înregistrările fizice şi cele formale din descrierea bazei de date. Fişierele pot fi pe acelaşi disc sau pe discuri diferite, pe acelaşi calculator sau pe mai multe calculatoare, pe suporturi de natură diferită. Accesul la fişiere poate fi secvenţial, direct sau indexat pe baza unor chei.
Sistemul de gestiune a datelor trebuie să asigure prin intermediul funcţiei de manipulare
securitatea şi integritatea datelor. Integritatea datelor înseamnă protecţia datelor împotriva alterării lor datorită unor defecte de echipament sau de program. Trebuie să asigure protecţia datelor împotriva distrugerii sau modificării datelor datorate unor căderi de tensiune, pene ale echipamentelor de calcul sau ale sistemului de operare. Securitatea informaţiilor înseamnă protecţia datelor împotriva distrugerii, modificării interogării efectuate de persoane neautorizate. Nu există metode infilibile de asigurare, preţul protecţiei creşte funcţie de complexitatea metodei folosite. Metodele de protecţie trebuie să se refere atât la nivelul fizic căt şi la nivelul logic. Există un mare număr de sisteme de gestiune a bazelor de date ce diferă între ele prin modul de organizare al bazei de date, procedee de acces, limbajele de descriere şi manipulare utilizate. Performanţele unei aplicaţii ce foloseşte un anume sistem de gestiune a bazelor de date depinde nu numai de SGBD-ul folosit ci şi de performanţele sistemului de calcul pe care este implementat, de viteza de transmisie a datelor prin reţea sau prin Internet. Numărul de utilizatori al unui sistem de gestiune a bazelor de date depinde de vechimea acestuia, de performanţele dovedite, de costul licenţelor de utilizare. De asemenea se constată un conservatorism puternic constând în păstrarea sistemelor de gestiune mai vechi, care funcţionează relativ bine, deoarece implementarea unuia nou necesită o nouă analiză şi o nouă recreare a bazelor de date lucru care ar perturba activitatea. Unele din primele sisteme de gestiune a bazelor de date au fost IMS (Information Management System) IBM 1969, GIS ( Generalized Information System)- IBM, TOTAL Franţa 1976, SOPHOCLE- 1976, SOCRATE. Pentru PC-uri cele mai folosite SGBD-uri sunt sau au fost dBase, Paradox, Clipper, Fox, Access. La momentul actual cele mai folosite SGBD pentru baze de date mari şi mijlocii sunt ORACLE, DB2, INGRESS, iar pentru baze de date mici şi mijlocii sunt Postgress, MySQL, Access.
Bibliografie
1. P. Vasilescu, V. Dunca, Proiectarea sistemelor informatice, Editura Tehnică 1979;
2. I Văduva, I. Negescu, G. Dulgheru, Gh Popa, V. Florescu, N. Feleagă, Sisteme Electronice de calcul, Editura didactică şi pedagocică, Bucureşti 1982; 3. M. Drăgănescu Sistem şi civilizaţie industrială, Editura politică, 1976;