Lassan javul a szuperszámítógépek hatékonysága
Az elmúlt egy évben nem javult számottevően a szuperszámítógépek hatékonysága, csupán a kínai Sunway TaihuLight tudott kiemelkedőt alkotni. Komoly aggodalomra azonban egyelőre nincs ok, a következő években ismét jelentősen nőhet a teljesítmény/fogyasztás mutató.
Lassan növekszik a szuperszámítógépek hatékonysága a legfrissebb Green500 lista szerint. Az elmúlt egy évben a top 10 átlaga szinte nem változott, a teljes listára levetített javulás pedig csak 20 százalék körüli. Ennek ellenére még van ok az optimizmusra, a készítők látnak még lehetőséget a nagyobb mértékű javulásra.
A lista első helyét továbbra is a japánban található Shoubu foglalja el, mely Haswell-EP Xeon processzorokat és PEZY-SC gyorsítókat vonultat fel, melyek kombinációjával 6673,8 MFLOPS/watt eredményre képes. A második pozícióba egy nagyon hasonló konfiguráció mászott fel, a Satsukiban található processzorok és gyorsítók típusa egyezik, a rendszer számítási kapacitása azonban lényegesen kisebb, az overheadnek betudhatóan a teljesítmény/fogyasztás mutatója csak 6195,22 MFLOPS/watt. Mindkét rendszer a japán állami kutatóintézet-hálózat RIKEN intézetében található, előbbi a számítástechnikai és kommunikációs, utóbbi pedig az asztrofizikai részlegen működik.
A többé-kevésbé kísérletinek tekinthető, széles skálázódás helyett hatékonyságra optimalizált, PEZY-alapú szuperszámítógépeket azonban rögtön a legnagyobb hal, a TOP500-at vezető Sunway TaihuLight követi - ez elképesztően nagy dolog, és jól mutatja, milyen hihetetlenül hatékony architektúrával támadnak a kínaiak. A kínai fejlesztésű gép 6051,3 MFLOPS/watt eredménye nagyjából 10 százalékkal marad el az első helyezettől, ami annak fényében ragyogó eredmény, hogy a rendszerben nyoma sincs Intel processzoroknak vagy épp Nvidia (vagy PEZY) gyorsítóknak, ahogy korábban taglaltuk, itt saját fejlesztésekről van szó.
Az első 10 helyezett eredményének átlaga 4934,3 MFLOPS/watt, ami ha csak minimálisan is, de kevesebb mint egy évvel korábban, tavaly ilyenkor 4993,5 MFLOPS/wattos eredményt kaptak a lista készítői. Ezt két okra vezetik vissza, egyrészt módosult a mérési protokoll, másrészt a listában szereplő rendszerek is változtak, a top 10-ben csak két konfiguráció maradt meg a tavalyi évhez képest. A lista mindegyik, összesen 500 tagjára levetítve jobb a helyzet, a tavalyi 915,8 MFLOPS/wattos átlag nagyjából 20 százalékkal, 1116,8 MFLOPS/wattra emelkedett, ugyanakkor ez is elmarad a korábbi években megszokott növekedési ütemtől.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A háttérben tendenciák és átmeneti okok is húzódnak. Az aktuális Intel Xeon Phi és Nvidia Tesla gyorsítók már nagyjából két évesek, az ezeket leváltó újabb modellek (P100, Knights Landing) pedig csak most kerülnek piacra, hatásukat legkorábban novemberben éreztethetik, a szélesebb körű elterjedéshez pedig még legalább fél év kell. Az eredményeken ugyancsak sokat dobhat majd a PEZY-SC2, bár ez legkorábban már csak jövőre bukkanhat fel.
Ennél nagyobb probléma, hogy bár Moore törvénye szerint a szilíciumlapkára integrálható tranzisztorok száma kétévente megduplázódik, ennek hatékonyságra gyakorlott hatása nem tükröződött megfelelően az elmúlt időszakban. Amennyiben nem történik pálfordulás, úgy nehezen lesz tartható a 2020-ra prognosztizált első exascale (exaflops nagyságrendű) rendszer megjelenése. Ahhoz, hogy egy ilyen rendszer értelmezhető módon megépíthető legyen, a szakértők szerint nagyjából 50 GFLOPS/wattos mutatót kellene elérni, ami közel hétszerese a jelenlegi listavezető Shoubu 6,67 GFLOPS/wattos értékének.
A hatalmas ugráshoz szükséges lesz alapjaiban újragondolni a rendszerek felépítését, mint ahogy azt a Sunway TaihuLight esetében tették a mérnökök. A rekorder gép ugyanis bizonyos helyeken inkább visszafejlődött, a gyorsítótárak és a memóriák felépítése egyszerűbb lett, kapacitásuk pedig csökkent. A rendszerben található 1,3 petabájt memória például elenyésző a 93 petaflopsos számítási kapacitáshoz képest, ez a szuperszámítógépek esetében általánosnak mondható 1 bájt per FLOPS értékhez képest csupán 0,014 bájt per FLOPS értéket eredményez. Megfelelő optimalizációkkal ezt sok esetben mégis sikerült kompenzálni, ami a TOP500-ban első, a Green500-ban pedig harmadik helyet jelentett.
Mindez jó példával szolgálhat egy eltérő, hatékonyabb irányhoz, ami az újabb technológiákkal párosítva (rétegezett memória, fejlettebb gyártástechnológiák, 3D XPoint, stb.) újraindíthatja a teljesítmény/fogyasztás mutató nagyobb mértékű emelkedését.