:

Szerző: Asztalos Olivér

2021. április 22. 10:58

Nem állt le gigantikus chipjének fejlesztésével a Cerebras

Olybá tűnik, nem egyszeri próbálkozás volt a Cerebras Wafer Scale Engine-je. A startup közel két éve bemutatott koncepciója hamarosan második kiadással jelentkezik, mely a specifikációk alapján kényelmesen rádupláz az előd számítási kapacitására.

A rekord nagy, a sztenderd 300 milliméteres átmérőjű szilícium waferből kinyerhető legnagyobb, még egybefüggőnek tekinthető, 46 225 mm2 területű chipet a korábbi 16 helyett 7 nanométeres eljárással állítja majd elő a bérgyártó TSMC. A lényegesen alacsonyabb csíkszélességnek hála 400 000 darab AI feldolgozásra optimalizált mag helyett immár 850 000 darabból gazdálkodhat az újabb chip, amely önmagában 112,5 százalékos előrelépést jelent. A magokat a neurális hálóknál jellemző primitívekhez, pontosabban Tensor műveletekhez szabta a Cerebras, miközben az alapvető aritmetikai és logikai műveletek végrehajtása is támogatott. A magok az úgynevezett sparse processinget is támogatják, mely a gyorsabb végrehajtás érdekében képes kiszűrni a felesleges műveleteket.

wse2_photo

Machine recruiting: nem biztos, hogy szeretni fogod

Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

A végrehajtók etetésére szolgáló hatalmas és rendkívül gyors, SRAM-alapú tár kapacitása is megnő. Az első verzióban 18 gigabájt fért el, amit a 7 nanométeres csíkszélességnek hála 40 gigabájtra tudták növelni a mérnökök, 122 százalékkal felülmúlva a korábbi értéket. Utóbbinak, vagyis a hatalmas integrált memóriának kulcsszerep jut a grandiózus chipben. A jellemzően a CPU-k gyosítótárához használt SRAM mindössze 1 órajelciklusra a magoktól, így elérése villámgyors. A sávszélességre sem lehet panasz, melynek csúcsértéke a készítők szerint elérheti a 20 PB/s-ot. Mindez rendkívül fontos, a klasszikus gyorsítókártyáknál ugyanis minden esetben valamilyen külső memóriába dolgoznak a magok, amely jelentősen növeli a késleltetést, több kártyás rendszereknél pedig a komplexitást is megugrik.

A chip több szempontból is egyedinek számít. Hagyományos gyártási eljárással legfeljebb 858 mm2-es lapkát lehet előállítani a levilágítógépek limitációja miatt. Az iparágban sztenderdnek számító határvonalat a Cerebras egy sajátságos megközelítéssel lépte át. A 300 milliméteres átmérőjű waferből egyenlő hosszúságú oldalak mellett kinyerhető legnagyobb szilíciummal kalkuláltak a mérnökök, amelyre összesen 84 darab önálló áramkör került fel, darabonként 550 mm2-en. A csavart elsősorban az jelenti, hogy a szokványos eljárással szemben az egyes chipek végül a waferen maradnak, melyeket a határvonalat jelentő széleknél egy alacsony késleltetésű és magas, immár 220 Pb/s sávszélességű fabric segítségével huzaloztak össze. A háló topológiával (2D Mesh) összekapcsolt hatalmas, egybefüggő chip a Cerebras szerint megoldást jelent a skálázódás problémájára, azaz lényegesen hatékonyabb a jelenleg széles körben alkalmazott, több különálló gyorsítókártyából (vagy chipből) összeállított rendszereknél.

wse2_spec

A rendhagyó fejlesztésnél komoly kihívást jelent a nagy méret (és tömeg), illetve a rendkívül magas, 20 kilowatt körüli disszipáció miatt, illetve az ezt elviselni képes tokozás elkészítése. A jelentősen eltérő hőtágulási mutatók okán a 2,6 billió tranzisztoros chip és a tokozás közé speciális áthidalást (connector) helyeztek, miközben a tápellátást is egyedi módon kellett megoldani, a disszipáció elvezetéséhez pedig nem is jöhetett szóba más, mint vízhűtés.

A Cerebras állítja, egyedi fejlesztésével akár egy komplett racknyi GPU-s rendszer is kiváltható, amely a lényegesen kisebb helyigény mellett alacsonyabb fogyasztást, nem utolsó sorban pedig magasabb teljesítményt is jelent. A WSE-2 jelölésű fejlesztés a készítők szerint valamikor a harmadik negyedévben kerülhet piacra a CS-2 típusú kiszolgálóval. Ez egy 15U kivitelű szervert jelent, amelyben egy darab WSE-2 chip található az ellátáshoz szükséges redundáns tápegységekkel, illetve az ugyancsak redundáns vízhűtéssel együtt. A CS-2 várható áráról egyelőre nem beszélt a Cerebras, ám a végösszeg valószínűleg több (5+) millió dollárra fog rúgni.

Eleged van az eltérő környezetekből és az inkonzisztens build eredményekből? Frusztrál, hogy órákat kell töltened új fejlesztői környezetek beállításával? Többek között erről is szó lesz az AWS hazai online meetup-sorozatának negyedik, december 12-i állomásán.

a címlapról

fab

0

Nem adhatja el a gyárait az Intel

2024. november 28. 12:39

A cégnek juttatott állami támogatás feltétele, hogy a vállalat többségi tulajdonos maradjon a gyártó leányvállalatban.