Sistemul cu memorie partajată și distribuite

Sistem cu o memorie RAM comun (partajat) formează o clasă de soare moderne - supercomputere multiprocesor. Accesul egal al tuturor procesoarelor programelor și a datelor prezintă oportunități de organizare a procesului de calcul paralel (calcul paralel). Nu există nici o pierdere reală a productivității interprocessor (între sarcini, procese, etc.), comunicare (fig. 1.5a).

Sistemul cu memorie partajată și distribuite

Fig. 1.5. Aeronave cu un total (a) și distribuite (b) o memorie

Sistemele cu formă sisteme de calcul de memorie distribuite (VC) - (. Figura 1.5b), grupuri de calculatoare cu schimb inter-mașină pentru rezolvarea problemelor de colaborare. VC combinate sistemele de gestionare a resurselor de calcul care abordează set specific de sarcini, date interdependente. Noi spunem că cei VK efectua de calcul distribuit. în timp ce ei înșiși numit distribuit VC VC.

Alte opus principiului întruchiparea MIMD - massprotsessornye sau arhitectura extrem de paralel, care reunește sute - mii - zeci de mii de procesoare.

În supercomputere moderne tendința combinarea a două principii: partajat (distribuite) și distribuit de memorie (locală) (LLR). Această structură este utilizată în cadrul proiectului MVK "Elbrus-3" și "Elbrus-3M" (fig. 1.6).

Sistemul cu memorie partajată și distribuite

Fig. 1.6. schema Sun cu module de memorie locale

Metode pentru conexiuni intermodule (interconectare)

Există două modalități opuse de interconectare: un autobuz comun (arhitectură bus) și cruce (matrice) cu comutarea circuitelor de module solare (procesoare, module de memorie, periferice).

Fig. 1.7 prezintă un sistem cu un autobuz comun. Bus este format din linii care transporta date și semnale de control.

Sistemul cu memorie partajată și distribuite

Fig. 1.7. Înarmat cu sistemul comun de autobuz

Înaltă performanță Sun pentru schimbul simultană a unui număr de perechi de abonați folosind cruce sau comutare matrice.

Matrix Switcher pot fi prezentate (dreptunghiulare) pneurilor de rețea. La un capăt al fiecărei surse de către consumatori de informații conectate (fig. 1.8). Punctele de intersecție - nodurile rețelei - sunt cheile de control. care conectați sau deconectați autobuzele corespunzătoare, stabilirea sau întreruperea comunicării între module. comunicare puse în aplicare „toată lumea cu toată lumea“. În același timp, se poate lega de multe (până la n / 2) din perechea de module.

Fig. 1.8A - legătura încrucișată între procesoarele la soare cu memorie distribuită în Fig. 1.8b - între m și n modulele procesor OP.

Sistemul cu memorie partajată și distribuite

Fig. 1.8. switch-uri Matrix: a) - Crucea de comutare procesoare, b) - comutare de procesoare și module de memorie

Sisteme informatice multi-microprocesor

În prezent, alegerea este făcută în favoarea aeronavei multiprocesor simetric de tip MIMD. oferind virtualizarea resurselor de calcul. Baza acestei AC este superskaler. concentrat în sine toate căile pentru a obține performanțe maxime atunci când efectuează singur program. procesoare și sisteme de vectori și vector-conducte au locul lor. Eficacitatea lor ca unități independente ar putea fi suficient de mare numai pentru sarcini și teste speciale. Prin urmare, a devenit clar destul de repede că plantele pot acționa ca terminale inteligente în rezolvarea problemei fundamentale la alte instrumente de calcul universal și de a efectua numai unele dintre aplicațiile sale. Astăzi a devenit clar că numai în primul eficace rolul de calcul dispozitive specializate pentru sarcini speciale. Ferm ocupat locul al doilea în unitatea de multi-aritmetică-logică (ALU) superskalerov, pentru că fără transportoare, nu ne putem imagina noi înșine efectuarea tuturor operațiunilor de aeronave.

Toate cele de mai sus confirmă perspectivele soluțiilor structurale pentru proiectarea complexului multiprocesor „Elbrus-3“ și dezvoltarea microprocesorului „Elbrus-3M“, „Elbrus-2K“. Astfel, structura „cuvânt de instrucțiuni lung“ (arhitectura VLIW. EPIC subiacent), se încadrează în categoria clasice.

Acum microprocesorul să se concentreze toate progresele in domeniul microelectronicii, este principalul component element de design amfibii Base. Prin urmare, conceptul de „multi-microprocesor Sun“ a venit să înlocuiască conceptul de „microprocesor VS“.

Analiza multimicroprocessor moderne BC vă permite să selectați acele soluții în curs de dezvoltare specifice, care, în condiții de miniaturizare și reducerea consumului de energie, dezvoltarea logică „economică“ de a furniza proprietățile necesare aplicării universale.

Astfel de soluții sunt după cum urmează.

cristale multiprocesor. Redare multiprocesor soare pe un singur cip în mare parte caracterizată prin mijloace de semnalizare specializată în tratamentul cu două și imagini tridimensionale, care sunt utilizate în difuzarea programelor de televiziune digitală, și, atunci când transmiterea imaginilor prin canalele de comunicare și altele de calcul. Astfel de agenți sunt utilizate în mod eficient ca neurocomputere.

De exemplu, pe un singur MVP cip (procesor video multimedia) TMS familie 320 C80 (firma Texas Instrument) sunt 4 procesor de semnal digital pe 32 de biți (DSP - Digital Signal Processor), cu un punct fix (ADSP-0 - ADSP-3). Caracteristica lor - și gradul ridicat de pipelining la cuvânt de control lungime de 64 de biți pentru executarea în paralel a mai multor operațiuni. Setul de instrucțiuni include instrucțiuni despre câmpuri de biți și structuri de date care transportă informații grafice. Această specializare a condus la conceptul - DSP-arhitectura.

Procesoarele funcționează independent. Ie BC - tip MIMD - (Multiple-Instruction, Multiple-date). Separat programate în asamblare sau Hll. Datele sunt schimbate prin intermediul unei memorii comune on-chip.

Fiecare din ADSP conține comenzi cache (2 Kbytes), și prin comutatorul de matrice Crossbar are acces la 32 din 50 KB de mare viteză memoria internă statică disponibilă. Memorie stratificat - împărțit în segmente. În cazul în care două sau mai multe procesoare într-un singur ciclu va încerca să apeleze la un singur segment, sistem de control al accesului hardware cu o schimbare ciclică a priorității (runda robin prioritizare) va face un singur procesor.

RISC -Processor opereaza patru ADSP folosind controlerul. Managerul și programatorul lucrează îndeaproape cu transporturile controler. În plus, procesorul de comandă efectuează independent calcule și asigură comunicarea cu dispozitivele externe. Conține un built-in virgula mobila unitate aritmetică și un set de vector de operații în virgulă mobilă sunt optimizate pentru procesarea imaginii, sunet și grafică tridimensională.

Tehnologia Transputer. Arhitectura de mai sus are o astfel de completitudine structurale, care permite atât să-l încorpora într-un anumit sistem, și de a organiza interacțiunea mai multor cristale. Acest lucru este realizat de comunicare dezvoltat și schimbul de date.

Posibilitatea de multi a atras atenția într-un stadiu incipient de dezvoltare a microprocesoarelor (mijlocul anilor 1980) și a condus la Transputer construcții - microprocesoare, echipate cu mijloace avansate de agregare. Astfel, pentru a crea „blocuri“, pe care a fost posibilă crearea unor structuri complexe. Această tendință nu este doar păstrat, ci este un mijloc necesar de a construi multimicroprocessor Sun.

În căutarea de versatilitate înseamnă de schimb, nu le impune în mod necesar să fie plasat pe un singur cip cu CPU. Astfel, firma Analog Devices ofera microprocesoare ADSP-21060/62 SHARC ( „rechin“) pentru procesarea semnalului digital, proiectat special pentru agregare.

Inseamna „rechin“ agregare:

linia 6 pentru conectarea „rechinii“ și procesorul o gazdă (de control, cu acces privilegiat la magistrala și memoria fiecărui procesor - într-un port special);

semnalizare registre în cadrul fiecărui procesor conectat direct (un picior) din fiecare dintre celelalte procesoare - pentru a controla starea lor;

Link - fiecare procesor are 6 ieșiri (link) pentru conectarea directă „procesor. - procesorul“

Procesoare comunica semnale de stare. De aceea, fiecare procesor știe cine este linia de „maestru“, adică conduce schimb, și prioritatea sa în coadă la coloana vertebrală. La finalizarea fiecărui schimb se face o schimbare ciclică a priorităților de procesoare care au nevoie de o autostradă. Procesor cu cea mai mare prioritate devine „maestru“. Schimbul poate fi întrerupt doar de către procesorul gazdă.

Microprocesorul este aprobat ca un element de bază de design-amfibii Base, și se înțelege cei mai importanți dezvoltatori.

În acest sens, atrage atenția asupra transformării intereselor „părintele supercomputere“ S.Kreya care a recunoscut rolul decisiv principiul MIMD în construcția de 6400 Sistemului de soare Cray Superserver (CS640), emise de societățile Cray Research, în colaborare cu SUN Microsystems (cooperare SUN cu firma acum, de asemenea caracteristică pentru cei mai importanți dezvoltatori din România).

Sistemul presupune o configurație scalabil de la 4 la 64 de procesoare SuperSPARC. O soluție de compromis bazat pe schema de separare clasică DO (total) la multiprocessing și memorie distribuită de procesare paralelă matrice atunci când. Pentru a lucra cu memorie distribuite parțial în RAM, soarele în orice configurație are patru anvelope. Pneul utilizează o tehnologie de rețea „de comutare de pachete.“ Ea ne permite să găsim calea schimbului de unități de informații, în conformitate cu angajarea sau descărcarea pneurilor.

În general, arhitectura pneului care trebuie luate în considerare, cu toate că există mai multe autobuze făcând intermediar între magistrala și folosind o matrice switcher.

Direcția „super-mini“ este conceput pentru a sprijini calculatorul personal

Supercomputer este unic, există puține replicabil, prețul său este ridicat.

Pe de altă parte, nimic nu poate opri „marșul triumfal“ al calculatoarelor personale. Domeniul de aplicare acestea devin cuprinzătoare. Acestea sunt utilizate și în cazul în care acestea pot face față provocărilor și în cazul în care nu există nu mai face față, în ciuda utilizării superskalerov moderne.

Apoi, este recomandabil să se pună următoarea problemă.

Introducem în calculatorul personal (PC), deoarece acesta este un sistem extern dispozitiv multimicroprocessor (multiprocesor), a căror utilizare în mod exclusiv și sarcină unică poate oferi o soluție de succes la problemele de complexitate crescută.

Într-adevăr, soluția la această problemă ar umple o nișă între super-computere și PC-uri. aduce un PC la nivelul unui mini-supercomputer. Aplicarea multiprocesor PC-ul într-un singur mod de program, alocarea de memorie greu, utilizați (vezi mai jos.) Tehnologia Progressive „un program - fluxuri de mai multe date“ se poate reduce în mod semnificativ regie de performanță pe sistemul de operare, ușor de „Încorporați“ le în sistemele moderne de operare calculator. Asamblarea un astfel de sistem ar trebui să se bazeze pe existente de proiectare microprocesor element de bază, cu utilizarea minimă a componentelor nou dezvoltate.

Aici, ideea de mai sus menționată este reprodusă pe sistemul de disponibilitate de monitorizare, care rezolvă problema principală, precum și existența unor terminale inteligente, care preia funcția de a asigura eficiența sistemului în ansamblu.

Schema generală a unui astfel de configurare este prezentat în Fig. 2.1. Parametrii specifici selectate.

Sistemul cu memorie partajată și distribuite

Fig. 2.1. schema Sun pentru PC

Este cunoscut (vezi mai jos.) Asta înseamnă că sincronizarea semafoarelor - universală. Cu toate acestea, utilizate în mod tradițional semafoarelor sistem de operare. Pentru a evita acest lucru, trebuie să fie puse în aplicare semafoarelor prin intermediul mecanismului de predicat. și anume folosind memoria predicate.

Apoi, în general, utilizarea semafoarelor trebuie introduse comandă de forma.

așteptat, având în vedere valoarea de atribuire predicatul 1 (în modul „buzz“);

Această comandă este trecut.

PE implementează ideea RISC -arhitektury și reprezintă o unitate completă funcțional, constând dintr-un microprocesor, un circuit de încadrare și RAM locală (LLR). Memoria procesorului local include o zonă pentru stocarea stive proces de calcul, inclusiv - de stive de subrutine imbricate și bucle. În alte zone ale memoriei sunt modificatori, descriptori matrice și variabile locale stocate. Aici sunt firmware-ul de punere în aplicare a sistemului de comandă la soare.

Synchronizer este proiectat pentru a oferi simultan start-up de programe sau module. Puteți utiliza switch-uri simple pentru PE schimb modulele de memorie.