:

Szerző: Bodnár Ádám

2012. június 18. 15:04

Xeon Phi lesz az Intel x86-os koprocesszora

A tavalyi International Supercomputing Conference-en debütált először "élőben" az Intel mérnöki-tudományos számításokhoz kifejlesztett, masszívan párhuzamos chipje, amelyet akkor még Knigts Cornerként ismert a szakma. A cég ma közölte, a lapkák az idei második félév során kereskedelmi forgalomba kerülnek, a nevük pedig Xeon Phi lesz.

Larrabee, MIC, Xeon Phi

A korábban Larrabee kódnevű, később Many Integrated Core-ra átkeresztelt projekt célja, hogy visszaszorítsa a GPGPU-k térnyerését a mérnöki-tudományos számítástechnikai szegmensben. Az NVIDIA Tesla és AMD FireStream chipek masszívan párhuzamos felépítésük révén a PC-s és szerveres szoftverek futtatására tervezett x86 processzoroknál jóval magasabb hatékonyságot érnek el szilíciumterületre és energiafogyasztásra vetítve. Ezt az Intel egyszerű x64 magokkal, széles vektorizált (SIMD) kiterjesztéssel, 100 új utasítással (Larrabee New Instructions, LNI) és több utasításszál párhuzamos végrehajtásának lehetőségével (Hyper-Threading) próbálja meg ellensúlyozni.

A Xeon Phi legfontosabb előnye a Teslákkal és FireStreamekkel szemben, hogy a mindenki számára ismerős x86 utasításkészlet-architektúrára épülnek, így a fejlesztőknek gyökeresen új programozási paradigmákat és nyelveket sem kell elsajátítaniuk, sem új fejlesztési eszközöket megismerniük. Az Intel felkészítette fordítóit és optimalizáló eszközeit a Xeon Phi támogatására, így a programozók azonos forrásból, azonos fejlesztői eszközökkel olyan binárist készíthetnek, amely fut a Xeon processzorokon, de a gyorsítóchipek képességeit is kihasználja, ha vannak a rendszerben, utóbbihoz mindössze néhány sort kell a kódban elhelyezni.

Masszív, párhuzamos

Az idén várható premier ellenére a vállalat továbbra is rendkívül szűkszavú, ha a specifikációkra kerül a szó. A hivatalos közleményben az Intel több mint 50 magot említ, valójában egy Xeon Phi chip összesen 64 egyszerű x64 magot tartalmaz, amelyek közül legfeljebb 62 aktív, a fennmaradó 2 pedig tartalék az H-Online jól értesült forrásai szerint. Hogy a tartalék magokat hogy hasznosítja a chip, nem tudni, elképzelhető, hogy a BlueGene/Q processzorához hasonlóan a magok meghibásodása esetén "ugranak be", átvéve azok feladatait.

A Phi 64 bites magjai egyenként négy utasításszál párhuzamos futtatására képesek (62 aktív mag esetén ez 248 thread), 32 kilobájt elsőszintű adatcache-t tartalmaznak, a megoszott másodszintű gyorsítótár mérete pedig 512 (más források szerint viszont csak 256) kilobájt. A magok a végletekig butítottak, nem támogatják az MMX és SSE utasításkészlet-kiterjesztéseket sem, cserébe 512 bites SIMD végrehajtóegységgel rendelkeznek és közel 100 új utasítást tartalmaznak, amelyek mérnöki-tudományos feladatok gyorsítását célozzák. Az alkalmazások számára a Xeon Phi egy önálló számítási csomópontként "látszik",  amely saját Linux operációs rendszert futtat, írja az Intel közleménye. Az Intelmár ki is adott egy nyílt szoftverekből álló rendszert, amely kifejezetten a Xeon Phire optimalizált Linux kernelből, fordítókból (gcc) és egyéb eszközökből áll össze.

A Xeon Phi chipeket ugyanazzal a 22 nanométeres, 3D tranzisztorokra épülő technológiával állítja elő az Intel, amellyel az Ivy Bridge generációs processzorok is készülnek. A kereskedelmi példányok órajeléről egy szót sem ejtett a cég közleménye, csupán azt szögezi le, hogy az idei ISC konferencián demózott Xeon Phi-alapú "node" teljesítménye kettős pontosságú lebegőpontos műveletek alatt 1 teraflops a HPC szegmensben általánosan használt Linpack teszt szerint - ezt a benchmarkot használják egyébként a Top500 rangsorban elért pozíció meghatározásához is. Az Intel közleménye kitér arra, hogy 1997-ben az ASCII Red szuperszámítógépnek több mint 9 ezer Pentium processzor kellett az 1 teraflopsos álomhatár eléréséhez.

Nagy nevek

A cég tájékoztatása szerint a Xeon Phi nem egy termék, hanem egy teljes termékcsalád, amelynek a korábban Knights Corner néven ismert chip csak az első tagja. A Xeon Phi chipek PCI Express felületű kártyákon lesznek hozzáférhetőek, amelyeken a processzor mellett "legalább 8 gigabájt" GDDR5 memória kap helyet - feltehetően többféle modell is születik majd az idők során, különféle felhasználási területeket megcélozva, eltérő árakon. A mérnöki-tudományos világban ismert szervergyártók szinte kivétel nélkül beálltak a Xeon Phi mögé, az Intel közleménye alapján nem kevesebb mint 44 vállalat veszi a kínálatába a megoldást, köztük az IBM, a Cray, a HP, a Dell, a Bull és az NEC is.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

A Top500 listán jelenleg egyetlen rendszer van, amely Xeon Phi chipekre épül, de jövőre a számuk biztosan emelkedni fog. 2013-ban áll üzembe a "Stampede" fantázianevű gép, amelz nyolcmagos Intel Xeon E5 processzorok mellett Xeon Phi lapkákat is bevet: 10 petaflopsra tervezett számítási kapacitásának négyötödét x86-os koprocesszorok adják majd. Átadásakor a Stampede valószínűleg a világ 10 legerősebb szuperszámítógépe között lesz.

A Stampede alapját több mint 8 ezer Dell szerver szolgáltatja, amelyekbe a tervek szerint két  nyolcmagos Xeon processzor és 32 gigabájt memória kerül - a teljes konfiguráció összesen 272 terabájt memóriát és 14 petabájt lemezes háttértárat használ. A Xeonok számítási teljesítménye azonban "mindössze" 2 petaflops, további 8 petaflopsot Xeon Phi chipek adnak majd. A megrendelő Texas Advanced Computing Center tervei szerint a Stampede szuperszámítógépnek csak a kezdeti teljesítménye lesz 10 petaflops, üzembe állítása után röviddel másfélszeresére, 15 petaflopsra emelik a teljesítményét, amelyhez következő generációs Intel MIC processzorokat alkalmaznak majd.

a címlapról