Anatomia unei infrastructuri nor de stocare

Model, funcții și piese interne

sistem de stocare Cloud (sau de stocare a datelor ca serviciu) - este un concept abstract, care corespunde unui sistem de stocare a datelor, care pot fi gestionate la cerere printr-o interfață specială. Acest sistem de rezumate de interfață și locația, astfel încât să fie local sau la distanță (sau hibride) - nu contează. infrastructura de stocare Cloud forma noi arhitecturi care suportă diferite nivele de servicii asupra grupului potențial mare de clienți și unități distribuite geografic. Articolul analizeaza atributele arhitecturale-cheie de stocare nor - de la securitatea și integritatea datelor de securitate și optimizare.

M. Tim Dzhons. Inginer consultant, Emulex Corp.

În cazul în care aceste rate, care astăzi cantități de date cresc, nu este surprinzător faptul că popularitatea tot mai mare de sisteme cloud și de stocare. Cea mai rapidă creștere a volumului de date istorice care sunt ideale pentru stocarea în nor, în anumite condiții, inclusiv condițiile de rentabilitate, frecvența tratamentului, protecție și disponibilitate. Dar nu toate sistemele de stocare cloud sunt aceleași. Un furnizor poate concentra în primul rând pe costuri, în timp ce cealaltă se concentrează asupra accesibilității sau performanței. Nici unul dintre arhitectura nu este axat pe un singur lucru, și măsura în care o anumită arhitectură caracteristică definește utilizarea sa de piață țintă și model.

acronimele utilizate frecvent

  • API: Application Programming Interface Interfață de programare / aplicație
  • FTP: File Transfer Protocol / File Transfer Protocol
  • HTTP: Hypertext Transfer Protocol / Hypertext Transfer Protocol
  • HTTPS: HTTP peste Secure Sockets Layer / HTTP peste Secure Sockets Level
  • JFS: Journaling fișier Sistem de sistem / Journaling fișiere
  • NFS: sistem de fișiere de rețea / Network File System
  • NIC: placă de rețea / placa de retea
  • RAID: matrice redundantă de discuri independente / Redundant Array Discuri independente
  • REST: Representational State Transfer / Transfer de Stat Representational
  • SAN: Stocare în rețea / zonă de rețea zona de stocare
  • SCSI: Small Computer System Interface / Small Computer System Interface
  • SLA: Serviciul de acord privind nivelul / SLA
  • TCP: Transmission Control Protocol / Transmission Control Protocol
  • UDP: User Datagram Protocol / User Datagram Protocol
  • WAN: rețea de arie largă / rețea globală

Este dificil să vorbim despre arhitectura fără a lua în considerare parametrii de funcționare. Prin aceasta înțeleg diferitele caracteristici ale arhitecturii, inclusiv costurile, performanța, accesul de la distanță, etc. Prin urmare, vom defini mai întâi un set de criterii, care măsoară caracteristicile modelului de stocare nor și apoi uita-te la un moment de punere în aplicare interesantă.

În primul rând, să vorbim despre arhitectura de stocare nor, în general, pentru a determina contextul follow-up studiu caracteristicile unice ale acestei arhitecturi.

arhitectura generală

Arhitectura de stocare Cloud - este în primul rând o livrare a resurselor de stocare la cerere într-un mediu extrem de scalabil și multitenantnoy. Generalized arhitectura nor de stocare este o interfață externă care furnizează API pentru accesarea drive (vezi. Figura 1). În stocare tradițională este sistemele de date de protocol SCSI, dar în nor, noi protocoale. Printre acestea putem găsi protocoale externe servicii Web, rapoarte de fișiere și interfețe chiar mai tradiționale externe (Internet SCSI, iSCSI, etc ..). Pentru interfața externă este nivelul de middleware, pe care o numesc logica de stocare a datelor. Acest nivel implementează un număr de funcții, cum ar fi replicarea datelor și pentru a reduce cantitatea de date în algoritmi tradiționale de plasare a datelor (în funcție de localizarea geografică). În cele din urmă, interfața internă organizează stocarea de date fizice. Acest lucru poate fi un protocol intern care pune în aplicare o funcție specifică, sau un server tradițional discuri fizice.

Figura 1. Arhitectura de stocare Cloud

Figura 1 prezintă câteva caracteristici ale arhitecturii moderne de stocare cloud. Rețineți că caracteristicile nu sunt proprietatea exclusivă a unui anumit nivel, ci pur și simplu se referă la subiectele care sunt discutate în acest articol. Aceste caracteristici sunt definite în tabelul 1.

Tabelul 1. Caracteristici Arhitectura nor de stocare

controlabilitatea

Dezvoltarea abilităților de pe acest subiect

metoda de acces

Una dintre diferențele cele mai izbitoare între sistemele tradiționale de stocare cloud și sunt un mijloc de acces la aceasta (a se vedea. Figura 2). Cei mai mulți furnizori ofera diverse metode de acces, cu toate acestea, sunt frecvente API-ul Web-servicii. Multe dintre aceste principii sunt puse în aplicare în restul care presupune o schemă orientată-obiect dezvoltat peste HTTP (HTTP folosind ca un transport). REST API simplu apatridă și eficient. REST API pune în aplicare mulți furnizori de servicii de stocare cloud, inclusiv Amazon Simple Storage Service (Amazon S3), Windows Azure ™ și Mezeo Cloud Storage Platform.

O problemă API pentru servicii web constă în faptul că, pentru a beneficia de sistemul de stocare cloud-based, care au nevoie să se integreze cu aplicația. Prin urmare, sistemul de stocare cloud pentru a asigura integrarea directă utiliza, de asemenea, metode de acces comune. De exemplu, protocoale bazate pe fișiere, cum ar fi NFS / Common Internet File System (CIFS) sau FTP, sau protocoale bazate pe blocuri, cum ar fi iSCSI. Aceste metode oferă acces Nirvanix, Zetta, Cleversafe și alți furnizori de servicii de stocare cloud.

Protocoalele de mai sus sunt cele mai comune, dar potrivite pentru stocare nor, și altele. Una dintre cele mai interesante - Authoring Web-based distribuite și versiuni (WebDAV). WebDAV se bazează, de asemenea, pe HTTP și vă permite să utilizați Web ca resursă pentru citire și scriere. Numărul de furnizori care utilizează WebDAV, introduceți Zetta, Cleversafe și altele.

Figura 2. Metode de a avea acces la un sistem de stocare a datelor tulbure

Puteți găsi soluții care suportă mai multe protocoale de acces. De exemplu, IBM® Smart Business Storage Cloud vă permite să utilizați un protocoale bazate pe fișiere (NFS și CIFS) și protocoale bazate pe SAN în aceeași infrastructură, virtualizare de stocare.

productivitate

Există mai multe aspecte ale performanței, dar problema principală este un sistem de stocare nor - o mișcare de date între utilizator și furnizorul de la distanță a serviciilor bazate pe cloud. Problema constă în TCP, calul de bataie principal al internetului. TCP controlează fluxul de date, pe baza pachetelor de confirmare de la nodul de la distanță. Pierderea sau întârzierea pachetelor rezultate în aplicarea unor măsuri de limitare cluster-ele de pachete cu constrângerea suplimentară a performanței pentru a evita problemele de rețea la nivel mondial. TCP este ideal pentru deplasarea cantități mici de date prin intermediul internetului, dar nu și pentru livrarea unor cantități mari de date - în acest caz, timpul de comunicare (RTT) crește.

Amazon prin Aspera Software-ul a rezolvat această problemă prin ștergerea ecuația TCP. Pentru a accelera mișcarea în masă a datelor pentru a evita mari RTT și mari pierderi de pachete dezvoltat un nou protocol rapid și protocol securizat (FASP ™). Cheia este UDP, protocolul de transport auxiliar cu respect este TCP. UDP permite nodului de control al congestiei, transmiterea acestui aspect al FASP protocolului stratului de aplicație (vezi. Figura 3).

Figura 3. Protocolul de protocol rapid și sigur pe software Aspera

Lucrul cu NIC-uri standard (fără accelerație), aplicație FASP utilizează în mod eficient lățimea de bandă disponibilă și evită blocajele majore scheme tradiționale de transmisie a datelor în masă. A se vedea Resurse pentru link-uri către date statistice interesante privind performanța FASP în comparație cu rețelele globale tradiționale, transmisii intercontinentale și canale de comunicare prin satelit.

Multitenantnost

scalabilitate

Scalabilitate poate fi privit din mai multe puncte de vedere, dar suntem interesați în principal în alocarea de stocare în cloud la cerere. Capacitatea de a crește capacitatea de stocare (atât în ​​sus și în jos) înseamnă eficiență economică îmbunătățită pentru utilizator și complexitate crescută pentru furnizorul de servicii bazate pe cloud.

Figura 4. nor de stocare scalabilă

infrastructura de stocare în cloud și ar trebui să ofere scalare internă. Servere și sistem de stocare ar trebui să permită redimensionarea fără consecințe pentru utilizator. Așa cum sa discutat în secțiunea de manipulare. Arhitectura de stocare Cloud ar trebui să sprijine un calcul independent.

disponibilitate ridicată

Atunci când un furnizor de servicii cloud pentru a stoca date de utilizator, acesta ar trebui să poată să se întoarcă datele către utilizator la cerere. Având în mod fiabil și determinist o rețea simplă, eroare de utilizator și de alte circumstanțe, această condiție poate fi dificilă.

Figura 5. Cleversafe Abordarea la date de înaltă disponibilitate

Posibilitatea de a reduce date folosind Reed-Solomon cod de corecție a permite distribuite geografic dispozitive de stocare. În cazul în care numărul de acțiuni și valoarea admisibilă de m eșecuri p rezultate aeriene este p / (p -m). Astfel, în cazul prezentat în Figura 5. Sistemul de depozitare deasupra capului, când p = 4 și m = 1 este de 33%.

Dezavantajul AID - prelucrare intensivă, fără accelerare hardware. Replicarea - o altă metodă utilă, care este utilizat de către mulți furnizori de servicii cloud. Este simplu și eficient, deși ridicat deasupra capului (100%).

administrare

Important de capacitatea clientului de a monitoriza și controla modul în care sunt stocate datele lor, precum și costurile aferente. Mulți furnizori de cloud oferă instrumente de management care oferă utilizatorilor un control mai mare asupra cheltuielilor.

Amazon, pentru a oferi utilizatorilor cu un mijloc de a minimiza costul total de stocare a datelor, utilizează redundanță redusă de stocare (RRS). Datele sunt replicate în infrastructura Amazon S3, dar RRS le permite să reproducă cantitate minimă de timp, cu posibilitatea de recuperare în caz de pierdere de date. Este ideal pentru datele pe care le puteți recrea, sau atunci când copii ale datelor sunt amplasate în locuri diferite. Nirvanix prevede, de asemenea, replicarea bazată pe politici, care să permită un control mai detaliat asupra modului și în cazul în care datele sunt stocate.

eficacitate

Eficiența de stocare - o caracteristică importantă a infrastructurii de stocare cloud, având în vedere în special accentul pus asupra economiei în ansamblu. Următoarele secțiune se referă în mod specific cu cheltuieli, iar această caracteristică este mult mai legate de utilizarea eficientă a resurselor disponibile decât costul lor.

Pentru a face sistemul mai eficient de stocare, aveți nevoie pentru a stoca mai multe date. O soluție comună este de a reduce cantitatea de date brute, astfel încât acestea ocupă mai puțin spațiu fizic. Două modalități de a realiza acest lucru: de compresie - de comprimare a datelor prin codare-le folosind o varietate de reprezentări - și deduplicare - eliminarea tuturor datelor duplicat. Deși ambele metode sunt utile implică prelucrarea de compresie (codificare a datelor în și în afara infrastructurii) și deduplicare - calcul de semnături pentru a găsi duplicate.

Una dintre caracteristicile cele mai notabile de stocare cloud - capacitatea de a realiza economii. Această economisire privind depozitarea cumpărarea, furnizarea de energie, repararea și gestionarea de stocare. Dacă luăm în considerare stocarea tulbure în acest punct (inclusiv SLA și eficiență sporită a depozitării), poate fi avantajos în anumite modele de utilizare.

Un exemplu interesant este soluții de stocare cloud companie Backblaze (cm. Resurse). Ea a construit o soluție de stocare low-cost special pentru ofertele de cloud. Backblaze POD (stocare raft) capacitate de 67 TB de stocare într-un pachet 4U pentru mai puțin de 8000 $. Complexul este format din 4U sistem de locuințe bord 4 GB RAM, patru controlere de SATA, 45 unități HDD SATA 1.5 TB și două surse de alimentare. Placa de sistem funcționează Backblaze Linux® (JFS ca un sistem de fișiere) și adaptoare de rețea GbE ca o interfață externă folosind HTTPS și Apache Tomcat. Software-ul BackBlaze include deduplicare, criptare și protecție a datelor RAID6. Din descrierea lui BackBlaze POD propus (care, în detaliu arată cum să construiască propriul dvs.), vom vedea măsura în care societatea poate reduce costurile de stocare, ceea ce face o soluție viabilă și rentabilă de stocare cloud.

Modelul de stocare Cloud

Până în prezent, am vorbit în principal despre furnizorii de nor de servicii de stocare, dar există model bazat pe cloud, care permit utilizatorilor să mențină controlul asupra datelor lor. de stocare Cloud este dezvoltat în trei direcții, dintre care una permite fuziunea dintre celelalte două, în scopul de a obține eficiență și siguranță economică.

Cele mai multe din acest articol se concentrează asupra furnizorilor de soluții de stocare cloud publice care furnizează infrastructura pe o bază de închiriere (resurse pentru termen lung sau de stocare pe termen scurt și lățime de bandă de rețea). nor private folosesc același concept ca și publicul, dar în așa fel încât infrastructura poate fi încorporat în siguranță în rețea privată a utilizatorului. În cele din urmă sisteme de stocare în cloud hibrid poate combina ambele modele, definirea normelor care reglementează datele pe care doriți să le salvați în proprietate privată, și ceea ce poate fi protejat sub nor publice (vezi. Fig. 6).

Figura 6. Modelul de stocare Cloud

Figura 6 prezintă grafic modelul nor. Numărul de furnizori de stocare includ cloud publice Amazon și Nirvanix (oferind de stocare ca serviciu). Exemple de furnizori de sisteme de stocare private IBM, Parascale și Cleversafe (care oferă software și / sau echipament pentru nori interne). În cele din urmă, furnizorii de nor hibrid - un Nirvanix, Egnyte și altele.

concluzie

de stocare Cloud - este o direcție interesantă de dezvoltare a modelelor de stocare, care deschide noi posibilități pentru construcția, accesul și gestionarea sistemelor de stocare a datelor în întreprindere. Deși astăzi sistemul de stocare în cloud - predominant tehnologie de consum, a dezvoltat rapid în direcția întreprinderii. Modelele hibride cloud permit organizațiilor să mențină confidențialitatea datelor lor în cadrul centrului de date locale, care trece datele mai puțin sensibile în nor pentru economii de costuri și protecția geografică. A se vedea Resurse pentru link-uri către informații despre furnizorul de servicii și tehnologii unice de stocare cloud.