:

Szerző: Asztalos Olivér

2018. augusztus 22. 13:58

Első ARM-alapú szuperszámítógépes chipjét taglalta a Fujitsu

Érdekes egyvelegnek tűnik az ARM és SPARC64 keverékéből született A64FX fejlesztés, amellyel komoly szuperszámítógépes babérokra tör a Fujitsu.

ARM-alapú szuperszámítógépes, A64FX (nem keverendő az AMD egykori termékével) processzoráról beszélt a Hot Chips 2018 konferencián a Fujitsu. A angliai székhelyű tervezőcég 64 bites utasításarchitektúrájára épülő fejlesztés kifejezetten érdekesnek tűnik, az ugyanis az ARM egyes megoldásait a japán vállalat egyes korábbi fejlesztéseivel, többek között a SPARC64 processzorokból ismert elemekkel gyúrja össze. A Fujitsu célja korábbi hangzatos ígérete szerint az első exascale szuperszámítógép hadrendbe állítása, amely 1000 petaflopsos számítási kapacitást jelentetne.

A Fujitsu állítja, házon belül fejlesztett, kizárólag az ARM 64 bites utasításarchitektúráját (AArch64, ARM v8.2) támogató processzora elsőként alkalmazza majd a brit cég SVE utasításkészletét. Az épp két éve leleplezett Scalable Vector Extensions flexibilis megoldást kínál az egyedi processzorokat tervező cégeknek, a SIMD ugyanis 128-tól egészen 2048 bitig skálázható, 128 bites lépcsőkben. Az utasításkészlet nem csak nevében hasonlít az Intel AVX-ére (Advanced Vector Extensions), hisz mindkét készlet vektorműveletek gyorsítására szolgál. Első körben a Fujitsu sem merészkedik tovább 512 bitnél, a házon belül fejlesztett mikroarchitektúra 512 bites SVE végrehajtókkal érkezik, magonként két pipeline-nal.

a64fx_1forrás: AnandTech

A komplett processzor 48 darab számításokra befogható, illetve 4 darab dedikált segédmagot vonultat fel. Ezeket négy csoportba rendezte a Fujitsu, amelyeket egy körbusz NoC (Network-on-Chip) kapcsol össze, a csoportok mindegyikéhez pedig egy darab 8 gigabájtos, 256 GB/s sávszélességre képes HBM2 chip kapcsolódik rendszermemória gyanánt. Ezzel a CPU aggregált memória-sávszélessége pontosan 1 GB/s, az összkapacitás pedig 32 gigabájt. A magok mellett egy 16 sávos PCI Express vezérlő, illetve a Fujitsu korábbi rendszereiből megismert Tofu (Torus fusion) interkonnekt is bekerült a chipbe (28 Gbps x 2 sáv x 10 port), amely így összesen 8,79 milliárd tranzisztort tartalmaz, elméleti maximális számítási teljesítménye pedig 2,7 TFLOPS körül mozoghat. A lapkát az aktuális tömeggyártásban elérhető legfejlettebb gyártástechnológiával, a TSMC 7 nanométeres eljárásával készítteti el a Fujitsu.

Machine recruiting: nem biztos, hogy szeretni fogod

Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Érdekes részlet, hogy a processzorhoz számos elemet emelt át az ugyancsak saját tervezésű SPARC64 családból a japán vállalat. A teljesség igénye nélkül itt a szuperskalár és out-of-order végrehajtási rendszert, illetve az elágazásbecslést hozta fel példaként a bemutató. A lépés logikusnak tűnik, hisz ily módon idő és kiadás takarítható meg, ráadásul a legutóbb bemutatott SPARC64 XII kifejezetten acélosra sikeredett, a bemutatást követően a processzor azonnal a SPECint_rate2006 lista első helyén kötött ki, amely az említett fejlesztések életképességét támasztja alá.

a64fx_2forrás: AnandTech

A Fujitsu hangsúlyozza, hogy az ARM megoldásának hála fejlesztése a többi CPU-hoz képest kifejezetten gyorsan képes különféle HPC és AI műveletek végrehajtására. A műveletek tárháza meglehetősen széles, lebegőpontosból a dupla-, az egyszeres-, valamint a félpontosságú is gyorsítható, egészszámosból pedig az INT64/32/16/8 a támogatott. Utóbbi teljesítményét kiemelte a vállalat, az ugyanis manapság a gépi tanulásos végrehajtás egy meghatározó mutatója. Az ígéret szerint egyetlen A64FX 21,6 TOPS-os tempóra lesz képes, amely bár kevesebb mint 10 százaléka a közelmúltban bemutatott új Nvidia gyorsító értékének, az ígéret szerint viszont ezt kimagasló hatékonyság mellett éri el a fejlesztés, amelyből várhatóan több ezer darab kerül majd a "Post-K" kódnéven emlegetett szuperszámítógépbe.

Végül, de nem utolsó sorban a Fujitsu elmondta, hogy nem az A64FX lesz az első és utolsó ARM-alapú fejlesztésük, vagyis a jövőben több, a brit tervezőcég utasításarchitektúráira épülő japán processzor is várható. A "Post-K" rendszerről túl sok új információt nem árul el a vállalat, annyi azonban egyre biztosabb, hogy a szuperszámítógép csak némi csúszással, 2020 helyett 2021-ben állhat össze.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról