:

Szerző: Bodnár Ádám

2012. november 13. 14:32

Elrajtoltak az Intel Xeon Phi koprocesszorok

Hosszas fejlesztés után befutottak az első Xeon Phi alapú gyorsítókártyák. A több mint négy éve először meglebegtetett koncepcióból hosszas késlekedés és egy iránymódosítás után lett kereskedelmi termék.

A több tucat egyszerű x86 magot felvonultató lapka hosszú utat járt be, mire a Larrabee kódnevű fejlesztésből piaci termék lett. Ez alatt az idő alatt a koncepció is alapjaiban megváltozott, az Intel a grafikus gyorsításra használt lapkával kapcsolatos elképzeléseit jegelte és egy másik úton indult el, mégpedig a mérnöki-tudományos rendszerek felé.

Hogy jutottunk el idáig?

Több mint négy éve annak, hogy az Intel először beszélt nyilvánosan a Larrabee nevű chipjéről, amelyet kezdettől egy rugalmasan programozható, masszívan párhuzamos feladatvégrehajtásra alkalmas processzorként képzelt el, amellyel a professzionális vizualizációs piacot célozta meg. A 2008-as bejelentést több másik követte, 2009-ben az első negyedéves pénzügyi eredmények ismertetésekor Paul Otellini, az Intel vezére még 2010-es rajtról beszélt és még abban az évben nyilvánosan is demózta a Larrabee grafikus képességeit a vállalat.

2009 decemberében azonban teljesen más irányt vettek a fejlesztések. Ennek oka részben az lehetett, hogy a Larrabee fejlesztése nem halad a kívánt ütemben, a 45 nanométeres chipnek már az NVIDIA és az AMD fejlettebb technológián készült lapkáival kellett volna versenyeznie. A gyártástechnológiai hátrány azonban önmagában nem indokolt volna teljes hátraarcot. A projekt törlésének oka volt többek között az is, hogy a grafikus driverek állapota is tragikus volt, valamint a high-end GPU-t vásárló réteg is egyre szűkült.

Ennél sokkal fontosabb, hogy 2009 végére, 2010 elejére a grafikus processzorok (GPU) fejlesztése is más irányt vett és egyre inkább előtérbe került azok felhasználása a mérnöki-tudományos területeken. Addigra már nyilvánvalóvá vált, hogy ezekkel a masszív párhuzamos végrehajtásra fejlesztett chipekkel energiahatékonyan lehet bizonyos típusú HPC feladatokat végrehajtani, és hogy ez mennyire működőképes koncepció, azt mi sem bizonyítja jobban, hogy a Top500 listán már akkoriban is volt GPU-kat is csatasorba állító rendszer, mára a számuk pedig megközelíteti a 60-at.

Machine recruiting: nem biztos, hogy szeretni fogod

Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

A mérnöki-tudományos felhasználás a GPU-k fejlesztési irányaira is erőteljesen rányomta a bélyegét, és az Intel is ebbe az irányba fordult inkább, látva a grafikus piacon egyre rosszabb esélyeit. A Larrabee mint kódnév ment a süllyesztőbe, a helyét pedig átvette a Many Integrated Core (MIC) néven kommunikált elképzelés, amely azonos gyökerekből táplálkozik, csak teljesen mellőzi a grafikus feladatokat és tisztán a mérnöki-tudományos feladatok végrehajtására koncentrál, a GPU-kkal szembeni harcban pedig az x86-os világ ismert és széles körben használt fejlesztői eszközeire és programozási modelljeire támaszkodik.

Az előny: egyszerűbb programozhatóság

Az Intel szerint az x64 magok használatának legnagyobb előnye a GPGPU megközelítéssel szemben, hogy a fejlesztőknek nem kell új programozási modellt vagy nyelvet elsajátítani és a vállalat széles körben elterjedt fejlesztői eszközei (fordító, debugger) is használhatók. Az Intel felkészítette fordítóit és optimalizáló eszközeit (C, C , Fortran Compiler, Parallel Studio XE, Cluster Studio XE) a MIC támogatására, így a programozók azonos forrásból azonos fejlesztői eszközökkel olyan binárist készíthetnek, amely fut a Core/Xeon processzorokon, de a Xeon Phi gyorsítóchipek képességeit is kihasználja, ha vannak a rendszerben. Utóbbihoz mindössze néhány sort kell a kódban elhelyezni.

A vállalat sem vonja, nem is vonhatja kétségbe a GPU-gyorsítás létjogosultságát vannak és  lesznek olyan területek, ahol a GPGPU megközelítés rendkívül hatékony, ha rendelkezésre áll az a szoftverfejlesztői tudás, amivel kihozható a grafikus chipekből a bennük rejlő erő. Az Intelnél ugyanakkor úgy látják, a nagy számítási teljesítményre éhes felhasználók többsége nem akarja majd felvállalni a szoftverek átírásával vagy módosításával járó anyagi terheket és bonyodalmakat - a célpiacot nem a Top500 listán szereplő, "pénz nem számít" kategóriás rendszerek jelentik elsősorban, hanem a hétköznapi mérnöki-tudományos feladatok. A vállalat által prezentált teljesítményadatok szerint egy kétfoglalatos szerverbe egy Xeon Phi kártyát helyezve durván két-háromszoros gyorsulás érhető el, de vannak ügyfelek, amelyek ennél jóval nagyobb mértékű gyorsulást mértek - egy pénzügyi területen működő vállalat például 8-10-szeres sebességkülönbséget tapasztalt Monte Carlo szimulációt futtatva.

A termékek

A MIC koncepció első terméke most érte el a piacot, ezek a korábban Knights Corner néven emlegetett processzorra épülő gyorsítókártyák, amelyek végül Xeon Phi néven jelennek meg. A megvalósítás alapjai a Larrabeevel azonosak, egy ilyen processzoron 62 darab egyszerű x64 processzormag dolgozik 32 32 kilobájt elsőszintű és 512 kilobájt L2 cache társaságában. A magok a végletekig butítottak, nem támogatják az MMX és SSE utasításkészlet-kiterjesztéseket sem, cserébe 512 bites SIMD végrehajtóegységgel rendelkeznek és közel 100 új utasítást tartalmaznak, amelyek mérnöki-tudományos feladatok gyorsítását célozzák.

A Xeon Phi gyorsítókártyák kezdetben két változatban lesznek kaphatók. Az 5110P modellen egy 62 akítv magot tartalmazó processzor működik 1,05 GHz-es órajelen, 8 gigabájt GDDR5 memória társaságában. Ezt a kártyát elég passzívan hűteni, 225 wattos TDP értékkel rendelkezik "mindössze", így munkaállomásokba vagy sűrűbb szerverekbe is be lehet építeni, ilyenek dolgoznak a Stampede nevű szuperszámítógépben is, amely jelenleg a hetedik legerősebb a világon. A számítási teljesítményeként 1011 gigaflopsot ad meg az Intel dupla pontosságú műveletek alatt.

A Xeon Phi 3120A ezzel szemben 57 aktív magot dolgoztat, órajele 1,1 GHz, 240 GBps sávszélességű interfészen csatlakozó GDDR5 memóriája viszont 6 gigabájtos. Ezt a chipet azonban aktív hűtéssel látta el az Intel, teljesítménynek pedig 1 teraflops feletti értéket ad meg. Az 5110P modellt a vállalat már szállítja a kiemelt partnereknek, januárban pedig mindenki számára elérhetővé teszi 2600 dollárért darabonként, a 3120A pedig 2013 első felében érkezik, 2000 dollár körüli végfelhasználói áron. A cég prezentációja szerint ezeket később további modellek követik majd.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról