Naudingi patarimai

Superkompiuterių tinklai

Pin
Send
Share
Send
Send


Paskirstytoji kompiuterija yra vienas iš būdų prisidėti prie įdomių projektų. Kai jūsų kompiuteris neveikia, pasidalykite savo galia su SETI projektu, kuris ieško nežemiškų civilizacijų. Tokiu atveju jūsų kompiuteris analizuos palydovo duomenis ir informaciją, gautą iš teleskopų.

Šis straipsnis padės prisijungti prie projektų (pvz., SETI), susijusių su paskirstyta kompiuterija. Straipsnyje taip pat supažindinama su BOINC - paskirstyta skaičiavimo programine įranga.

Jums reikia kompiuterio. Jei tokį jau turite, eikite į skyrių Šaltiniai ir nuorodos ir įdiekite BOINC programinę įrangą. Jei jūsų nedomina SETI projektas, žemiau rasite kitų projektų sąrašą.

Jei daug pinigų

Atskirai pažymime ypač brangią, bet produktyvią „Intel Xeon LGA1567“ lizdo procesorių liniją.
Aukščiausias šios serijos procesorius yra E7-8870 su dešimčia 2,4 GHz branduolių. Jo kaina yra 4616 USD. Tokiems procesoriams „HP“ ir „Supermicro“ išleidžiami! aštuonių procesorių! serverio važiuoklė. Aštuoni 10 branduolių „Xeon E7-8870“ 2,4 GHz procesoriai su „HyperThreading“ palaiko 8 * 10 * 2 = 160 gijų, kurie „Windows Task Manager“ rodomi kaip šimtas šešiasdešimt procesorių įkėlimo grafikų, matrica 10x16.

Kad aštuoni procesoriai tilptų į dėklą, jie dedami ne iš karto į pagrindinę plokštę, bet į atskiras lentas, kurios prilimpa prie pagrindinės plokštės. Nuotraukoje parodytos keturios pagrindinės plokštės su procesoriais, įmontuotomis pagrindinėje plokštėje (po dvi kiekvienoje). Tai supermicro sprendimas. HP sprendime kiekvienas procesorius turi savo plokštę. HP sprendimo kaina yra nuo dviejų iki trijų milijonų, atsižvelgiant į procesorių skaičių, atmintį ir dar daugiau. „Supermicro“ važiuoklė kainuoja 10 000 USD, tai yra patraukliau. Be to, „Supermicro“ į „PCI-Express x16“ prievadus gali sudėti keturias papildomo procesoriaus išplėtimo korteles (beje, „Infiniband“ adapteriui dar bus vietos surinkti iš šių grupių), bet tik dvi - „HP“. Taigi, norint sukurti superkompiuterį, patrauklesnė yra aštuonių procesorių platforma iš „Supermicro“. Ši nuotrauka iš parodos rodo visą superkompiuterį su keturiomis GPU plokštėmis.

Tačiau tai labai brangu.

Ryšių tinklai

Superkompiuterio efektyvumą daugelyje programų lemia darbas su atmintimi ir tinklu. Darbo su atmintimi profilį paprastai apibūdina skambučių lokalizavimas pagal erdvę ir laiką - pagal skambučių dydį ir jų adresų išsklaidymą, o darbo su tinklu profilį apibūdina mazgų, su kuriais keičiamasi žinutėmis, paskirstymas, keitimo greitis ir pranešimų dydžiai.

Superkompiuterio našumą atliekant užduotis, kuriose intensyviai keičiamasi duomenimis tarp mazgų (modeliavimo problemos, grafikų ir netaisyklingų tinklelių problemos, skaičiavimai, naudojant mažas matricas), daugiausia lemia tinklo našumas, todėl įprastų komercinių sprendimų (pvz., „Gigabit Ethernet“) naudojimas yra ypač neefektyvus. Tačiau tikras tinklas visada yra kompromisinis sprendimas, kurio plėtojime nustatomi prioritetai tarp kainos, efektyvumo, energijos suvartojimo ir kitų reikalavimų, kurie iš esmės yra prieštaringi: bandymai pagerinti vieną savybę gali pabloginti kitą.

Ryšių tinklą sudaro mazgai, iš kurių kiekvienas turi tinklo adapterį, sujungtą su vienu ar daugiau maršrutizatorių, kurie savo ruožtu yra sujungti greitaisiais ryšio kanalais (nuorodomis).

Fig. 1. Topologija 4D-torus (3x3x3x3)

Tinklo struktūrą, nustatančią, kaip tiksliai sujungiami sistemos mazgai, lemia tinklo topologija (dažniausiai grotelės, torus ar storas medis) ir struktūrinių parametrų rinkinys: matavimų skaičius, medžio lygis, toro šonų matmenys, jungiklių skaičius medžio lygyje, tinklo mazgų skaičius. maršrutizatorių uostai ir kt. 1 paveiksle parodytas keturių matmenų toriaus 3x3x3x3 topologijos pavyzdys.

Maršrutizatoriaus architektūra nustato blokų, atsakingų už duomenų perdavimą tarp tinklo mazgų, struktūrą ir funkcionalumą, taip pat būtinas kanalo, tinklo ir transporto sluoksnių protokolų savybes, įskaitant maršruto, arbitražo ir duomenų srauto valdymo algoritmus. Tinklo adapterio architektūra nustato blokų, atsakingų už procesoriaus, atminties ir tinklo sąveiką, struktūrą ir funkcionalumą, visų pirma šiame lygmenyje palaikomos MPI operacijos, RDMA (Remote Direct Memory Access - tiesioginė prieiga prie kito mazgo atminties, nedalyvaujant jo procesoriui). patvirtinimai apie gavimą kitu paketo mazgu, išskirtinių situacijų tvarkymas, paketų sujungimas.

Ryšių tinklo veikimui įvertinti dažniausiai naudojamos trys charakteristikos: pralaidumas (perduoto duomenų kiekis per laiko vienetą), ryšio vėlavimas (duomenų perdavimo per tinklą laikas), pranešimo tempas (paprastai siunčiant, priimant ir perduodant paketus tarp kelvedžio vidinių blokų, jie atskirai atsižvelgia į pristatymo greitį).

Siekiant išsamumo, šios charakteristikos yra matuojamos skirtingų tipų srautams, pavyzdžiui, kai vienas mazgas siunčia duomenis visiems kitiems, arba, atvirkščiai, visi mazgai siunčia duomenis į vieną, arba kai visi mazgai siunčia duomenis į atsitiktines vietas. Funkcionalumo reikalavimai keliami šiuolaikiniams tinklams:

  • efektyvus „Shmem“ bibliotekos įgyvendinimas, kaip galimybė palaikyti vienpusio ryšio modelį, ir „GASNet“, kuriuo grindžiamas daugelio PGAS kalbų diegimas,
  • efektyvus MPI įgyvendinimas (paprastai tam reikia veiksmingo žiedinių buferių ir gautų paketų patvirtinimų palaikymo),
  • efektyvus kolektyvinių operacijų palaikymas: transliavimas (tų pačių duomenų siuntimas vienu metu į daugelį mazgų), sumažinimas (dvejetainės operacijos taikymas, pavyzdžiui, papildymui iš skirtingų mazgų gautų verčių rinkinyje), masyvo elementų paskirstymas per mazgų rinkinį (sklaidą), elementų masyvo surinkimas, esantys skirtinguose mazguose (surinkti),
  • efektyvi tarpmezginių sinchronizacijos operacijų palaikymas (bent jau barjerinė sinchronizacija), efektyvi sąveika su daugybe mazgo procesų tinklo ir užtikrinant patikimą paketų pristatymą.

Taip pat svarbu veiksmingai palaikyti adapterio darbą su pagrindinio kompiuterio atmintimi tiesiogiai nedalyvaujant procesoriui.

Užsienio greitųjų ryšių tinklai

Visus ryšių tinklus galima suskirstyti į dvi klases: komercinius ir pasirinktinius, sukurtus kaip kompiuterinių sistemų dalis ir prieinamus tik kartu su jais. Tarp komercinių tinklų rinka yra padalyta tarp „InfiniBand“ ir „Ethernet“ - „Top500“ sąraše (2011 m. Birželio mėn.) 42% sistemų naudoja „InfiniBand“, o 45% naudoja „Gigabit Ethernet“. Tuo pačiu metu, jei „InfiniBand“ yra orientuota į didelio našumo sistemų, skirtų sudėtingoms skaičiavimo užduotims, turinčioms daug ryšių, segmentą, tada „Ethernet“ tradiciškai užima nišą, kurioje duomenų mainai tarp mazgų yra nekritiški. Superkompiuteriuose eterneto tinklas dėl mažų kainų ir prieinamumo dažnai naudojamas kaip pagalbinis paslaugų tinklas, siekiant sumažinti valdymo srautą ir užduočių srautą.

„Inifiniband“ tinklas iš pradžių buvo sutelktas į konfigūraciją su „Fat medžio“ topologija, tačiau naujausios jungiklių ir maršrutizatorių versijos (pirmiausia pagamintos „QLogic“) palaiko daugiamatę torių topologiją (naudojant „Torus-2QoS Routing Engine“), taip pat hibridinę topologiją iš 3D toriaus. ir riebalinis medis. „Sandia RedSky“ superkompiuteris, surinktas 2010 m. Pradžioje ir dabar užimantis 16 vietą „Top500“, yra vienas iš pirmųjų didelės apimties projektų, turinčių „InfiniBand“ tinklą ir topologinį 3D torą (6x6x8). Taip pat dabar daug dėmesio skiriama veiksmingam RDMA operacijų ir „Shmem“ bibliotekos (ypač „Qlogic Shmem“) palaikymui.

„InfiniBand“ populiarumą lemia palyginti mažos kainos, išplėtota programinės įrangos ekosistema ir veiksminga MPI parama. Tačiau „InfiniBand“ turi savo trūkumų: mažas pranešimų perdavimo greitis (40 milijonų pranešimų per sekundę naujausiuose „Mellanox“ sprendimuose), mažas trumpų paketų perdavimo efektyvumas, santykinai didelis vėlavimas (daugiau nei 1,5 μs perdavimui nuo mazgo iki mazgo ir papildomas 0,1–3). 0,5 μs vienam tranzito mazgui), silpna toroidinės topologijos atrama. Apskritai galima teigti, kad „InfiniBand“ yra produktas, skirtas masiniam vartotojui, o jo kūrimo metu buvo padarytas kompromisas tarp efektyvumo ir universalumo.

Taip pat galime atkreipti dėmesį į tinklą „Extoll“, kuris ruošiamas išleisti į rinką - Heidelbergo universiteto plėtrą, vadovaujamą profesoriaus Ulricho Brueningo. Pagrindinis šio tinklo plėtros akcentas yra kuo labiau sumažinti vėlavimą ir padidinti pristatymo greitį vienpusio ryšio srityje. Numatoma, kad „Extoll“ turės 3D toriaus topologiją ir naudos optinius ryšius, kurių pralaidumas bus 10 Gb / s per juostą (nuoseklusis duomenų perdavimo kanalas jungtyje) ir 12 juostų plotį per nuorodą. Dabar FPGA yra „Extoll“ tinklo prototipai: R1 - pagrįstas „Virtex4“, „R2 Ventoux“ - dviejų mazgų išdėstymas, paremtas „Virtex6“. Vienos krypties vienos juostos pralaidumas yra 600 MB / s (R1). Taip pat bus palaikomos dvi sąsajos („HyperTransport 3.0“ ir „PCI Express gen3“) su procesoriumi, kurios leis šį tinklą integruoti į „Intel“ ir AMD platformas. „Extoll“ palaiko kelis būdus, kaip organizuoti vienpusius įrašus, savo MMU (atminties valdymo bloką, virtualių adresų vertimo į fizinius adresus bloką) ir atomines operacijas.

Skirtingai nuo komercinių tinklų, pasirinktiniai tinklai užima daug mažesnę rinkos dalį, tačiau jie naudojami galingiausiuose „Cray“, IBM, SGI, „Fujitsu“, NEC ir „Bull“ superkompiuteriuose. Kurdami pasirinktinius tinklus, kūrėjai turi daugiau laisvės ir stengiasi naudoti progresyvesnius metodus dėl mažesnės svarbos galutinio produkto patrauklumo rinkai, pirmiausia spręsdami maksimalių našumo tam tikros klasės užduočių srityje problemą.

„K Computer“ superkompiuteris naudoja patentuotą „Tofu“ (TOrus FUsion) ryšių tinklą, tai yra keičiamąjį 3D torą, kurio mazgus sudaro 12 mazgų grupės (mazgų grupes jungia 12 tinklų su 3D toru, o kiekvienas šios grupės mazgas turi savo išvestį. 3D torių tinklas). Kiekvienos grupės mazgai yra sujungti trimačiu toru, kurio šonai yra 2x3x4 be pasikartojančių nuorodų, o tai prilygsta 2D torui su šoninėmis 3x4 (taigi gauname 5D torą su fiksuotais dviem matmenimis). Taigi „Tofu“ tinklo mazgas turi 10 jungčių, kurių kiekvienos vienos spartos srautas yra 40 Gb / s. Aparatinėje įrangoje palaikoma barjerų mazgų sinchronizacija ir mažinimas (sveikasis skaičius ir kintamasis taškas).

Pagrindiniai „Tianhe-1A“ superkompiuterio tobulinimo tikslai buvo pasiekti aukštą energijos vartojimo efektyvumą, sukurti savo procesorių ir tinklą, pranašesnį už „InfiniBand QDR“. Superkompiuterį sudaro 7168 skaičiavimo mazgai, sujungti savo sukurto Arch tinklo tinklu su storojo medžio topologija. Tinklas pastatytas iš 16 uostų maršrutizatorių, vienos krypties ryšio pralaidumas - 8 GB / s, vėlavimas - 1,57 μs. Palaikomos RDMA operacijos ir optimizuotos kolektyvinės operacijos.

Klasikiniai sistemų, naudojančių toroidinę topologiją skaičiavimo mazgams sujungti, sistemos yra „IBM Blue Gene“ serijos sistemos, kurių pirmosiose dviejose kartose - „Blue Gene / L“ (2004) ir „Blue Gene / P“ (2007) - buvo naudojama 3D toro topologija. „Blue Gene / P“ tinkle yra santykinai silpni ryšiai su vienpusiu pralaidumu - 0,425 GB / s, o tai yra eilės laipsnis mažesnis nei jo šiuolaikinio „InfiniBand QDR“ saito pralaidumas, tačiau aparatinės įrangos palaikymas barjerų sinchronizavimui ir kolektyvinėms operacijoms (atskiruose medžiuose panašiuose tinkluose) suteikia gerą mastelį. realios programos. Be to, visos sąsajos ir maršruto parinkimo elementai yra integruoti į BPC mikroprocesorių („Blue Gene / P Chip“), o tai žymiai sumažina pranešimų perdavimo vėlavimą. Naujos kartos ryšių tinklas „Blue Gene / Q“ turi 5D torių topologiją ir, skirtingai nei jo pirmtakai, neturi atskirų tinklų barjerų sinchronizavimui ir kolektyvinėms operacijoms. „Blue Gene / Q“ mikroschema pirmą kartą tapo kelių branduolių - kelių gijų - po keturis aparatūros siūlus kiekvienoje gysle su 16 gyslų, tai leidžia susilpninti tinklo reikalavimus ir užtikrinti vėlavimo toleranciją. Nuorodos pralaidumas padidintas iki 2 GB / s, tačiau vis dar išlieka mažas, palyginti su „Cray Gemini“ ar „Extoll“. Mažą šių sistemų pralaidumą išlygina didelis toro matmuo (didelis nuorodų skaičius) ir dėl to mažas tinklo skersmuo (žymiai mažesnis nei tinklų, turinčių 3D toruso topologiją su tuo pačiu mazgų skaičiumi). Turimi šaltiniai praneša apie dviejų „Blue Gene / Q“ transpetaflopų superkompiuterių sukūrimą: „Sequoia“, kurio našumas yra 20 PFLOPS, ir „Mira - 10 PFLOPS“. Galime daryti išvadą, kad „Blue Gene / Q“ yra sutelktas į užduotis, kurios vykdys dešimtis ir šimtus tūkstančių skaičiavimo mazgų, kurių tinklo srautas yra „visiems visiems“ tipo.

Kitas požiūris į ryšių tinklų su toroidine topologija kūrimą yra „Cray“, kuris ir toliau naudoja 3D torinės topologiją, kartu didindamas pralaidumą ir kaimyninius mazgus jungiančių nuorodų skaičių. Dabartinė „Cray“ toroidinio tinklo karta yra „Cray Gemini“ tinklas. Vienas „Gemini“ maršrutizatorius atitinka du ankstesnės „SeaStar2 +“ kartos maršrutizatorius, tai yra, iš tikrųjų yra du tinklo mazgai, todėl „Gemini“ vietoj 6 nuorodų 10 naudojama prisijungti prie kaimyninių mazgų (2 tarnauja sujungiant du adapterius vienas su kitu).

Superkompiuterio tinklo komponentai (tinklo adapteriai, jungikliai, maršrutizatoriai), skirtingai nei procesoriai, dažnai yra brangesni, o prieiga prie jų yra labiau ribota. Pavyzdžiui, dabar „InfiniBand“ tinklo, kuris yra pagrindinis komercinis superkompiuterių tinklas, jungiklius gamina tik dvi įmonės, abi jas kontroliuoja JAV. Tai reiškia, kad nesant savų pokyčių greitųjų tinklų srityje, šiuolaikinių superkompiuterių kūrimą bet kurioje šalyje, išskyrus JAV, Kiniją ar Japoniją, galima lengvai kontroliuoti.

Vietiniai tinklai

Ryšių tinklų, skirtų naudoti superkompiuteriuose, plėtrą vykdo keletas šalies organizacijų: RFNC VNIIEF (apie šiuos pokyčius informacijos labai mažai informacijos yra atviruose šaltiniuose), Rusijos mokslų akademijos programinės įrangos sistemų institutas ir RSK SKIF, IPM RAS ir tyrimų institutas Kvant (MVS-Express tinklas). “).

3D-tor ryšio ryšių tinklas Rusijos ir Italijos superkompiuteriui SKIF-Aurora yra visiškai sukurtas naudojant „Altera Stratix IV FPGA“, kuris paaiškina gana mažą pralaidumą vienai saitai - 1,25 GB / s (FPGA ištekliai yra labai riboti).

„MVS-Express“ tinkle „PCI Express 2.0“ yra naudojamas skaičiavimo mazgams integruoti, o mazgai yra sujungiami per 24 uostų jungiklius. Tinkle yra topologija, artima riebalų medžiui. Tinklo adapteris, esantis skaičiavimo mazge, turi vieną uostą, kurio plotis yra 4 juostos, todėl vienos krypties maksimalus vienos jungties pralaidumas yra 20 Gbit / s, neatsižvelgiant į kodavimo pridėtinę vertę. „PCI Express“ naudojimo „MVS-Express“ pranašumas yra veiksmingas bendrosios atminties palaikymas su vienpusio ryšio galimybėmis. Todėl tinklas yra patogus įdiegti „Shmem“ biblioteką ir PGAS kalbas (UPC, CAF).

Palaikant Rusijos Federacijos pramonės ir prekybos ministeriją, „NICEVT OJSC“ kuria komunikacijos tinklą „Angara“ su 4D torių topologija, kuri gali tapti pagrindu sukurti vietines superkompiuterių plėtros technologijas.

Tinklas „Angara“

Pagrindiniai Angaros tinklo plėtros tikslai:

  • efektyvi parama vienpusėms komunikacijoms („put / get“) ir PGAS kalboms (kaip pagrindinei lygiagretaus programavimo priemonei),
  • Efektyvus MPI palaikymas
  • savo kristalų išleidimas (norint pasiekti aukštą duomenų perdavimo greitį ir mažą vėlavimą),
  • adaptyvus saugus paketų perdavimas,
  • efektyvus darbas su šiuolaikiniais procesoriais ir mikroschemų rinkiniais.

Pirmajame šio tinklo plėtros etape (2006 m.) Buvo atliktas įvairių tinklo variantų modeliavimas ir priimti pagrindiniai sprendimai dėl topologijos, maršrutizatoriaus architektūros, maršruto sudarymo algoritmų ir arbitražo. Be toroidinės topologijos, buvo nagrinėjami Cayley tinklai ir „storas medis“. Keturių matmenų torius buvo pasirinktas dėl paprastesnio maršruto nustatymo, gero mastelio ir aukšto sujungiamumo, palyginti su mažesniais tori. Tinklo modeliavimas leido išsamiai ištirti įvairių tinklo architektūros parametrų poveikį pagrindinėms veikimo charakteristikoms, suprasti užduočių srauto, turinčio intensyvią netaisyklingą prieigą prie atminties, modelius. Dėl to buvo parinktas optimalus buferio dydis, virtualių kanalų skaičius ir išanalizuoti galimi trūkumai.

2008 m. Pasirodė pirmasis FPGA maršrutizatoriaus prototipas - šešių „Virtex4“ mazgų tinklo jungtis, sujungta su 2x3 „torus“, kuriame buvo suderintos pagrindinės maršrutizatoriaus funkcijos, parengtas tolerantiškas duomenų perdavimas, parašyta ir suderinta tvarkyklė ir žemo lygio biblioteka, „Shmem“ bibliotekos buvo perkeltos ir MPI Dabar paleistas trečiosios kartos maketas, susidedantis iš devynių mazgų, sujungtų dvimatėje 3x3 torijoje. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. Ypatingas dėmesys buvo skirtas palaikyti kolektyvines operacijas (transliaciją ir sumažinimą), įgyvendinamas naudojant virtualų potinklį, kurio medžio topologija buvo uždėta ant daugialypio toriaus. Tinklas aparatūros lygiu palaiko dviejų tipų nuotolinius rašymo, skaitymo ir atominius veiksmus (papildomas ir išskirtinis ARBA). Nuotolinio skaitymo vykdymo schema (užklausos siuntimas ir atsakymo gavimas) parodyta fig. 2 (nuotolinis įrašymas ir atominės operacijos atliekamos panašiai). Atskirame bloke įgyvendinama logika sujungti iš tinklo gautus pranešimus, kad būtų padidinta naudingų duomenų dalis, tenkanti vienai operacijai, kai perduodama per sąsają su pagrindiniu kompiuteriu (pagrindinis kompiuteris yra procesoriaus-atminties tiltas).

Fig. 2. Nuotolinio skaitymo Angaros tinkle schema

Duomenų jungties sluoksnyje palaikomas saugus paketų perdavimas. Taip pat yra mechanizmas, skirtas apeiti nepavykusių ryšio kanalus ir mazgus, atstatant maršruto parinkimo lenteles. Įvairioms paslaugų operacijoms atlikti (visų pirma, sukonfigūruoti / atstatyti maršrutizacijos lenteles) ir atlikti tam tikrus skaičiavimus naudojamas paslaugų procesorius. Pagrindinio kompiuterio sąsaja naudoja „PCI Express“.

Fig. 3. Skaičiavimo mazgo su tinklo adapteriu / maršrutizatoriumi „Angara“ struktūra

Pagrindiniai maršrutizatoriaus blokai:

  • sąsaja su pagrindine sistema, atsakinga už paketų priėmimą ir siuntimą pagrindinėje sąsajoje,
  • įpurškimo ir išmetimo vienetas, kuris suformuoja paketus, kurie turi būti siunčiami į tinklą ir analizuoja iš tinklo gaunamų paketų antraštes,
  • užklausų apdorojimo vienetas, kuris apdoroja paketus, kuriems reikalinga informacija iš pagrindinės sistemos atminties (pavyzdžiui, skaitymo ar atominės operacijos),
  • kolektyvinio operacijų tinklo vienetas, kuris apdoroja paketus, susijusius su kolektyvinėmis operacijomis, visų pirma, vykdo mažinimo operacijas, generuoja transliavimo užklausų paketus,
  • paslaugų operacijų vienetas, kuris apdoroja paketus, einančius į ir iš bendro paslaugų teikėjo,
  • jungiklis, jungiantis įėjimus iš įvairių virtualių kanalų ir įėjimus iš injektorių su išėjimais į įvairias puses ir išstūmėjus,
  • ryšio kanalai duomenų perdavimui ir gavimui tam tikra kryptimi,
  • duomenų perdavimo blokas, skirtas siuntimui paketais tam tikra kryptimi, ir priėmimo bei nukreipimo blokas, skirtas priimti paketus ir nuspręsti dėl jų likimo.

Pagrindinio kompiuterio sąveika (kodas vykdomas centriniame procesoriuje) su maršrutizatoriumi vykdoma įrašant į atminties adresus, priskiriamus maršrutizatoriaus išteklių regionų adresams (atmintyje pažymėtas įėjimas / išėjimas). Tai leidžia programai sąveikauti su maršrutizatoriumi nedalyvaujant branduoliui, o tai sumažina paketų siuntimo išlaidas, nes perjungimas į branduolio kontekstą ir atgal reikalauja daugiau nei šimto laikrodžio ciklų. Norėdami siųsti paketus, naudojamas vienas iš atminties regionų, kuris laikomas žiedo buferiu. Taip pat yra atskiras regionas operacijų atlikimui nekopijuojant atminties atminties (duomenys nuskaitomi iš atminties ir per DMA operacijas įrašomi ryšių tinklo adapteriu) ir regionas su valdymo registrais. Prieigą prie tam tikrų maršrutizatoriaus išteklių kontroliuoja branduolinis modulis.

Norint pasiekti didesnį efektyvumą, buvo nuspręsta, kad viename mazge turėtų būti atliekama tik viena skaičiavimo užduotis, tai pašalino pridėtines išlaidas, susijusias su virtualiosios atminties naudojimu, išvengė užduoties trukdžių, supaprastino maršrutizatoriaus architektūrą, nes trūksta viso MMU ir vengė visų jo ryšių darbas vėluoja, taip pat supaprastinamas tinklo saugumo modelis, pašalinant iš jo įvairių užduočių procesų, esančių viename mazge, saugumą. Šis sprendimas nepadarė įtakos tinklo funkcionalumui, nes jis visų pirma skirtas didelėms užduotims (priešingai nei „InfiniBand“ - universalus tinklas, skirtas įvairaus dydžio užduotims atlikti). Panašus sprendimas buvo priimtas „IBM Blue Gene“, kur skyriui įvestas užduoties unikalumo apribojimas.

Aparatūros lygmeniu palaikomas daugelio vienos užduoties gijų / procesų vienu metu atliekamas darbas su maršrutizatoriumi - jis įgyvendinamas kelių įpurškimo kanalų pavidalu, kuriuos procesai gali naudoti per kelis žiedinius buferius, skirtus įrašyti paketus. Šių buferių skaičius ir dydis gali dinamiškai keistis.

Pagrindinis Angaros tinklo programavimo režimas yra bendras MPI, OpenMP ir Shmem, taip pat GASNet ir UPC naudojimas.

Atlikus tinklo patikros ir prototipų sudarymą, planuojama išleisti VLSI mikroschemą. VLSI partijos prototipas bus skirtas pagrindiniams technologiniams sprendimams derinti, technologiniam procesui atlikti ir eksperimentiniam modeliavimo rezultatų patikrinimui. Prototepe bus visos pagrindinės funkcijos, darbas su PCI Express gen2 x16 sąsaja ir jungtys, kurių pralaidumas 75 Gb / s.

„Angaros“ tinklą rinkoje ketinama reklamuoti dviem versijomis: kaip atskirą komercinį tinklą kaip „PCI Express“ korteles klasterių sistemoms su standartiniais procesoriais ir mikroschemų rinkiniais bei kaip keturių lizdų ašmenų sistemą, pagrįstą NICEVT kuriamais AMD procesoriais.

Žiūrėkite vaizdo įrašą: "Mados misija": Kaip pasiekti sėkmę Lietuvos mados industrijoje? (Spalio Mėn 2020).

Pin
Send
Share
Send
Send