Nem állt le gigantikus chipjének fejlesztésével a Cerebras
Olybá tűnik, nem egyszeri próbálkozás volt a Cerebras Wafer Scale Engine-je. A startup közel két éve bemutatott koncepciója hamarosan második kiadással jelentkezik, mely a specifikációk alapján kényelmesen rádupláz az előd számítási kapacitására.
A rekord nagy, a sztenderd 300 milliméteres átmérőjű szilícium waferből kinyerhető legnagyobb, még egybefüggőnek tekinthető, 46 225 mm2 területű chipet a korábbi 16 helyett 7 nanométeres eljárással állítja majd elő a bérgyártó TSMC. A lényegesen alacsonyabb csíkszélességnek hála 400 000 darab AI feldolgozásra optimalizált mag helyett immár 850 000 darabból gazdálkodhat az újabb chip, amely önmagában 112,5 százalékos előrelépést jelent. A magokat a neurális hálóknál jellemző primitívekhez, pontosabban Tensor műveletekhez szabta a Cerebras, miközben az alapvető aritmetikai és logikai műveletek végrehajtása is támogatott. A magok az úgynevezett sparse processinget is támogatják, mely a gyorsabb végrehajtás érdekében képes kiszűrni a felesleges műveleteket.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
A végrehajtók etetésére szolgáló hatalmas és rendkívül gyors, SRAM-alapú tár kapacitása is megnő. Az első verzióban 18 gigabájt fért el, amit a 7 nanométeres csíkszélességnek hála 40 gigabájtra tudták növelni a mérnökök, 122 százalékkal felülmúlva a korábbi értéket. Utóbbinak, vagyis a hatalmas integrált memóriának kulcsszerep jut a grandiózus chipben. A jellemzően a CPU-k gyosítótárához használt SRAM mindössze 1 órajelciklusra a magoktól, így elérése villámgyors. A sávszélességre sem lehet panasz, melynek csúcsértéke a készítők szerint elérheti a 20 PB/s-ot. Mindez rendkívül fontos, a klasszikus gyorsítókártyáknál ugyanis minden esetben valamilyen külső memóriába dolgoznak a magok, amely jelentősen növeli a késleltetést, több kártyás rendszereknél pedig a komplexitást is megugrik.
A chip több szempontból is egyedinek számít. Hagyományos gyártási eljárással legfeljebb 858 mm2-es lapkát lehet előállítani a levilágítógépek limitációja miatt. Az iparágban sztenderdnek számító határvonalat a Cerebras egy sajátságos megközelítéssel lépte át. A 300 milliméteres átmérőjű waferből egyenlő hosszúságú oldalak mellett kinyerhető legnagyobb szilíciummal kalkuláltak a mérnökök, amelyre összesen 84 darab önálló áramkör került fel, darabonként 550 mm2-en. A csavart elsősorban az jelenti, hogy a szokványos eljárással szemben az egyes chipek végül a waferen maradnak, melyeket a határvonalat jelentő széleknél egy alacsony késleltetésű és magas, immár 220 Pb/s sávszélességű fabric segítségével huzaloztak össze. A háló topológiával (2D Mesh) összekapcsolt hatalmas, egybefüggő chip a Cerebras szerint megoldást jelent a skálázódás problémájára, azaz lényegesen hatékonyabb a jelenleg széles körben alkalmazott, több különálló gyorsítókártyából (vagy chipből) összeállított rendszereknél.
A rendhagyó fejlesztésnél komoly kihívást jelent a nagy méret (és tömeg), illetve a rendkívül magas, 20 kilowatt körüli disszipáció miatt, illetve az ezt elviselni képes tokozás elkészítése. A jelentősen eltérő hőtágulási mutatók okán a 2,6 billió tranzisztoros chip és a tokozás közé speciális áthidalást (connector) helyeztek, miközben a tápellátást is egyedi módon kellett megoldani, a disszipáció elvezetéséhez pedig nem is jöhetett szóba más, mint vízhűtés.
A Cerebras állítja, egyedi fejlesztésével akár egy komplett racknyi GPU-s rendszer is kiváltható, amely a lényegesen kisebb helyigény mellett alacsonyabb fogyasztást, nem utolsó sorban pedig magasabb teljesítményt is jelent. A WSE-2 jelölésű fejlesztés a készítők szerint valamikor a harmadik negyedévben kerülhet piacra a CS-2 típusú kiszolgálóval. Ez egy 15U kivitelű szervert jelent, amelyben egy darab WSE-2 chip található az ellátáshoz szükséges redundáns tápegységekkel, illetve az ugyancsak redundáns vízhűtéssel együtt. A CS-2 várható áráról egyelőre nem beszélt a Cerebras, ám a végösszeg valószínűleg több (5+) millió dollárra fog rúgni.