baze de date distribuite și baze de date distribuite - abstract, pagina 1

Volumele moderne de date stocate, cerințe obligatorii pentru disponibilitatea și viteza de procesare, dinamica sistemelor face ca este important pentru studiul factorilor care afectează calitatea bazei de date care stau la baza sistemelor informatice moderne.

Până la sfârșitul anilor 80 există noi condiții de muncă pentru DB: cantități mari de informații apar în multe locuri (de exemplu, de vânzare cu amănuntul, de imprimare și alte activități de producție). Sursa de cantități mari de date ar putea fi un centru, dar aceste date au nevoie de acces rapid la periferie (distribuția geografică a producției, care lucrează la același program). În plus, datele pot fi interogate și centru, și utilizatorii de la distanță în locații îndepărtate. Există o cantitate mare de date, care sunt utilizate în cererile urgente, de multe ori un caracter local (pentru bilete de avion și de cale ferată).

În multe industrii, de exemplu, integrate în nevoile industriei de imprimare de calculator este o bază de date distribuită, care leagă într-un întreg proces complex de gestionare a proceselor de diferite. Aici lucrarea nu este executată cu o singură aplicație, precum și cu sistemul de aplicare.

bază de date centralizată, în special construit pe abordarea clasica, nu a putut face față noilor cerințe.

Extinderea rapidă a rețelelor de date, o creștere bruscă în memoria externă a PC-ului în timpul ieftinirea sale în anii '80 a contribuit la adoptarea pe scară largă a bazelor de date distribuite.

Avantajele bazelor de date distribuite includ:

1) Structura de potrivire distribuită structura bazei de date a organizațiilor;

2) interacțiune flexibilă a bazelor de date locale;

3) noduri oportunități de centralizare;

4) acces imediat la informații, reducând costurile de transmisie (datorită compresiei datelor și concentrare);

5) caracteristicile ridicate ale sistemului (timp de răspuns scurt datorită procesului paralelizare, fiabilitate ridicată);

6) interacțiunea implementare modulară, extinderea hardware, utilizarea programării orientate pe obiecte;

7) capacitatea de a distribui fișiere în funcție de activitatea lor;

8) dezvoltarea bazelor de date locale independente printr-o interfață standard.

Cu toate acestea, baze de date distribuite au o structură mai complicată, care cauzează probleme suplimentare (neconcordanțe de date redundante alinierea temporală a actualizării proceselor și solicită utilizarea resurselor de telecomunicații, operațiune de contabilitate este în continuare conectat bazele de date locale, standardizare comune interfață) elemente de operare potrivite.

Probleme serioase apar atunci când integrarea bazelor de date distribuite peste omogene (omogene), cu aceeași bază de date locală, de multe ori modele de date relaționale.

Problema este mult mai complicată, în cazul în care baza de date locală a construit folosind diferite modele de date (non-uniform, baze de date eterogene distribuite).

Scopul acestei lucrări curs este de a studia baza de date distribuite și sisteme de baze de date distribuite. Pentru atingerea acestui obiectiv au fost implementate următoarele sarcini:

Conceptul de baze de date distribuite;

Proprietățile bazelor de date distribuite;

Conceptul de integritate a datelor;

Principiul bazelor de date distribuite pe exemplul SYSTEM R *

Dezvoltarea unei aplicatii in Delphi.

1 SISTEME DE INFORMARE DISTRIBUITE ȘI BAZE

Conceptul de baze de date distribuite

Sub distribuite (baze de date distribuite - DDB), de obicei, implică o bază de date, inclusiv fragmente din mai multe baze de date care se află pe diferite noduri ale unei rețele de calculatoare, și, eventual, gestionate de diferite SGBD. baze de date distribuite arata ca din punct de vedere al utilizatorilor și aplicații ca o bază de date locală normală. În acest sens, cuvântul „distribuit“ reflectă modul de organizare a bazei de date, dar nu și caracteristica sa externă. (Baza de date „Distribuție“ este invizibil din exterior).

Sarcina principală a managementului sistemelor de baze de date distribuite este de a oferi mijloace de a integra bazele de date locale, care sunt situate în unele dintre nodurile rețelei de calculatoare, astfel încât utilizatorul să lucreze în orice nod de rețea, are acces la toate aceste baze de date ca o bază de date unică, [1] .

În acest caz, ar trebui să fie furnizate:

ușurința de utilizare a sistemului;

operațiune fără fir în încălcarea conectivității la rețea sau de nevoi administrative;

grad ridicat de eficiență.

Există baze de date uniforme și distribuite neuniforma. În cazul omogen, fiecare bază de date locală gestionată de aceeași bază de date. Într-un sistem eterogen de baze de date locale pot referi chiar la diferite modele de date. Integrarea în rețea de baze de date eterogene - este relevant, dar problema foarte dificilă. Multe soluții sunt cunoscute la nivel teoretic, dar încă nu pot face față cu problema principală - lipsa de eficiență a sistemelor integrate. Rețineți că mai mult succes rezolvat, practic, sarcina intermediară - integrarea de sisteme orientate-SQL eterogene. Este clar că acest lucru contribuie în mare măsură la standardizarea limbajului SQL și respectarea generală a producătorilor DBMS principiilor sistemelor deschise [2].

1.2 Proprietățile bazelor de date distribuite

Definiția unei baze de date distribuite (DDB) a sugerat Deyta (C. J. Data). El a găsit 12 proprietăți sau calități ale ideale DDB [4]:

Autonomia locală (autonomia locală)

Independența de noduri (nu se bazează pe site-ul central)

Funcționarea continuă (funcționare continuă)

Transparența locație (independența locație)

fragmentarea transparentă (independența fragmentare)

replicare transparent (independenta de replicare)

Procesarea Query distribuite (distribuite de procesare interogare)

Distributed Transaction Processing (distribuit de procesare a tranzacțiilor)

Independența echipamentelor (independența hardware)

Independent de sisteme de operare (independența sistemului de operare al)

Rețeaua de transparență (independență de rețea)

Independența din baza de date (independența bazei de date)

Autonomia locală. Această calitate înseamnă că gestionarea datelor cu privire la fiecare dintre nodurile sistemului distribuit funcționează la nivel local. Fiind un fragment partajat spațiu de date, PB. în același timp funcții ca o bază de date locală cu drepturi depline; conducerea acesteia se realizează la nivel local și independent de alte noduri din sistem [4].

Independența din nodul central. Într-un sistem ideal, toate nodurile sunt egale și independente, și aranjate pe bază sunt furnizori de date egale într-un spațiu comun de date. Baza de date pe fiecare nod este autosuficientă - aceasta include dreptul de proprietate deplină a dicționarului de date și este pe deplin protejate împotriva accesului neautorizat.

Funcționarea continuă. Această calitate poate fi interpretată ca posibilitatea de acces la date continuu (o anumită „24 de ore pe zi, șapte zile pe săptămână“) în cadrul DDB, indiferent de locația lor și indiferent de operațiunile efectuate la site-uri locale. Această calitate poate fi exprimată prin sloganul „date sunt întotdeauna disponibile, iar operațiunile asupra acestora sunt efectuate în mod continuu“ [4].

locație de transparență. Această proprietate este o transparență completă a datelor de locație. Utilizatorii care accesează DDB, nimic nu trebuie să știe despre locația actuală, fizică a datelor în nodurile sistemului informatic. Toate operațiunile privind datele sunt efectuate fără a lua în considerare cunoștințele despre locul lor. cereri de transport către bazele de date implementate sistem integrat înseamnă.

fragmentarea transparentă. Această proprietate este tratată ca abilitatea de a distribui (de exemplu, la diferite site-uri) plasarea de date, constituie în mod logic o singură unitate. Există două tipuri de fragmentare: orizontale și verticale. Liniile orizontale înseamnă stocarea unui singur tabel pe diferite noduri (de fapt, stocarea unei linii de tabelă logică în mai multe tabele fizice identice pe diferite noduri). distribuție verticală înseamnă de coloane din tabel logica pe mai multe noduri.

Să considerăm un exemplu care ilustrează ambele tipuri de fragmentare. Există un angajat tabel (emp_id, emp_name, telefon), definit într-o bază de date pe un nod în Phoenix. Există aceeași masă, care este definită într-o bază de date pe un nod în Denver. Ambele tabele stoca informații despre angajați. În plus, baza de date de la nodul ales din Dallas emp_salary tabel (emp_id, salariu). Apoi, cererea „pentru a obține informații despre angajații“ poate fi formulată după cum urmează:

SELECT * FROM angajat @ ​​Phoenix, angajat al @ ORDER BY emp_id denver

În același timp, o cerere „pentru informații privind salariile angajaților“ va fi după cum urmează:

SELECT employee.emp_id, emp_name, salariu de la angajat @ ​​denver, angajat @ ​​Phoenix, emp_salary @ COMANDA PRIN emp_id dallas

transparență replicare. Duplicarea datelor - acesta este un proces asincron de mișcare modificări obiect în baza de date sursă în baza de date localizată pe celelalte noduri din sistem distribuit. În acest context, înseamnă transparență schimbări de portabilitate pentru replicare între bază de date înseamnă invizibil pentru utilizatorul sistemului distribuit. Această proprietate înseamnă că reproducerea este posibilă și se realizează prin interiorul sistemului.

Distribuit Solicitare de procesare. DDB Această proprietate este tratată ca abilitatea de a efectua operațiuni pe baza de date distribuite eșantion, stabilit în mod regulat SQL limbaj de interogare. Aceasta este, de la operație de prelevare de probe DDB pot fi formulate utilizând aceeași limbă înseamnă că o operațiune pe baza de date locală. De exemplu,

SELECT customer.name, customer.address, order.number, order.date de la client @ Londra, comanda @ Paris, unde customer.cust_number = order.cust_number

Distribuit Transaction Processing. DDB Această calitate poate fi interpretată ca fiind capacitatea de a efectua operațiuni de actualizare a unei baze de date distribuite (INSERT, UPDATE, DELETE), nu distruge integritatea și coerența datelor. Acest obiectiv este atins prin utilizarea unui comitere în două faze de protocol (comitere în două faze protocol), care a devenit standardul de facto pentru procesarea tranzacțiilor distribuite. Utilizarea sa asigură o modificare consecventă a datelor pe mai multe noduri în cadrul unei tranzacții distribuite.

independență hardware. Această proprietate înseamnă că, într-un sistem distribuit noduri pot acționa calculatoare toate modelele și producătorii - de la mainframe-uri la „desktop“.

Independența din sistemul de operare. Această calitate derivă din cea anterioară și înseamnă varietatea de sisteme de operare, unități de sistem de control distribuit.

Rețeaua de transparență. Accesul la orice baze de date printr-o rețea. Gama de protocoale de rețea acceptate DBMS specifice nu ar trebui să fie o limitare a sistemului cu baze de date distribuite. Această calitate este formulat cât mai larg posibil - orice posibile protocoale de rețea într-un sistem distribuit.

Independența din baza de date. Această calitate înseamnă că într-un sistem distribuit pot coexista pasnic baze de date de la diferiți furnizori, precum și posibilitatea de a căuta și să actualizeze operațiuni în bazele de date de diverse modele si dimensiuni.

Pe baza determinării Deyta, DDB poate fi privit ca o structură de rețea slab cuplate ale cărei noduri sunt baze de date locale. baze de date locale sunt autonome, independente și auto-determinate; accesul la baza de date furnizate, în general, de la diferiți furnizori. Comunicarea între noduri - curge date replicate. DDB topologie variază într-o gamă largă - posibile variante ale structurilor ierarhice ale „stea“, etc. In topologie DDB general definit de sistemul de informații geografice și date orientate fluxuri replicare [4].