:

Szerző: Bodnár Ádám

2011. november 16. 14:00

1 teraflops felett az Intel Knights Corner

A héten Seattle-ben zajló Supercomputing Conference 11 esemény kapcsán rendezett sajtótájékoztatóján az Intel működő mintapéldányok formájában mutatta be a jövőre kereskedelmi forgalomba kerülő Knights Corner chipjét, amelyet az NVIDIA és AMD GPU-k ellen küld csatasorba a mérnöki-tudományos számítástechnika világában.

Larrabeeből MIC

A Knights Corner kódnevű chip az Intel MIC (Many Integrated Cores) projektjének gyümölcse, amely az eredetileg grafikus processzornak indult Larrabbee folytatásának tekinthető. A vállalat elgondolása szerint több tucat egyszerű x64 processzormag egy lapkára integrálásával sikeresen veheti fel a versenyt a Teslákkal és FireStreamekkel a HPC szegmensben. A koncepció kísértetiesen hasonlít a GPGPU-k elgondolásához, azonban míg az NVIDIA és az AMD a grafikus chipek felől közelít az általános számítások felé, addig a MIC az általános célú x86 mikroprocesszorok oldaláról érkezik.

Az MIC projekt célja, hogy visszaszorítsa a GPGPU-k és más masszívan párhuzamos architektúrák térnyerését a HPC szegmensben, amelyek masszívan párhuzamosított felépítésük révén a PC-s és szerveres szoftverek futtatására tervezett  processzoroknál jóval magasabb hatékonyságot érnek el szilíciumterületre és energiafogyasztásra vetítve. Ezt a MIC egyszerű x64 magokkal, széles vektorizált (SIMD) kiterjesztéssel, 100 új utasítással és négy utasításszál párhuzamos végrehajtásának lehetőségével (Hyper-Threading) próbálja meg ellensúlyozni.

Az Intel szerint az x64 magok használatának legnagyobb előnye a GPGPU megközelítéssel szemben, hogy a fejlesztőknek nem kell új programozási modellt vagy nyelvet elsajátítani és a vállalat széles körben elterjedt fejlesztői eszközei (fordító, debugger) is használhatók. Az Intel felkészíti fordítóit és optimalizáló eszközeit a MIC támogatására, így a programozók azonos forrásból azonos fejlesztői eszközökkel olyan binárist készíthetnek, amely fut a Core/Xeon processzorokon, de a MIC gyorsítóchipek képességeit is kihasználja, ha vannak a rendszerben. Utóbbihoz mindössze néhány sort kell a kódban elhelyezni.

Rajeeb Hazra (Intel) a Knights Cornerrel

1 teraflops dupla pontosságú lebegőpontos teljesítmény

Az MIC projekt első mérföldköve a 45 nanométeres Knights Ferry kódnevű chip, ami 32 magot tartalmazott, ezeket a lapkákat tartalmazó PCI Express bővítőkártyákat az MIC projektben résztvevő Intel-partnerek, akadémiai intézetek kaphatták meg. Glenn Brook, az Oak Ridge National Laboratoryt és a University of Tennessee mérnöki-tudományos számítástechnikai erőfeszítései felett bábáskodó Joint Institute of Computational Sciences igazgatója az eseményen elmondta, a mérnökök számos alkalmazást, összesen mintegy 5 millió sornyi Fortran, C és C++ kódot ültettek át a 32 magos Knights Ferry tesztchipre, a tudományos szoftverek "portolása" egyenként egy napot vett igénybe.

A Knights Corner már 22 nanométeres csíkszélességgel készül, hogy a projekt mennyire előrehaladott állapotban van azt jól mutatja, hogy az Intel a héten már működő mintapéldányokat demózott az újságírók előtt. A vállalat továbbra sem árul el részleteket a chippel kapcsolatban, nem lehet tudni a pontos magszámot sem, az Intel "több mint 50" magról beszél, de jól értesültek szerint a Knights Corner 64 maggal kerül le a futószalagról, amelyekből néhányat az Intel deaktiválhat. Azt sem tudni egyelőre, milyen órajeleken működnek majd a Knights Corner chipek.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

A megcélzott szegmensben a legfontosabb mérőszám a teljesítmény, ebből pedig a Knights Corneren nincs hiány. Az Intel által demózott chipek az iparban széles körben elterjedt, dupla precizitást használó, mátrixszorzást végző DGEMM benchmark alatt 1 teraflops feletti teljesítményt értek el a Register beszámolója szerint, ami a jelenleg hozzáférhető legerősebb Tesla és FireStream lapkák által elért teljesítmény kétszerese és a 32 magos Knights Ferryhez viszonyítva is hasonló a különbség.

A GPGPU sem hal ki

A Knights Corner megjelenése előtt azonban az NVIDIA és az AMD is bemutat legalább egy új GPU-generációt, így a teljesítménykülönbség csökkenhet vagy akár a GPGPU-k javára is fordulhat a mérleg nyelve. A GPGPU-khoz elérhető szoftverfejlesztői eszközök, debuggerek, profilírozók is egyre javulhatnak és a GPGPU-k programozásához szükséges ismeretek is kezdenek széles körben elterjedni, hála az NVIDIA és az AMD erőfeszítéseinek.

Általánosságban igaz a HPC területre, hogy a nyerő architektúra nagyban függ a futtatni kívánt kódtól és ez feltehetően nem lesz másképp az Intel MIC és a GPGPU-k esetében sem. Az Intel sem vonja kétségbe a GPU-gyorsítás létjogosultságát vannak és  lesznek is olyan területek, ahol a GPGPU megközelítés rendkívül hatékony, ha rendelkezésre áll az a szoftverfejlesztői tudás, amivel kihozható a grafikus chipekből a bennük rejlő erő. Az Intelnél ugyanakkor úgy látják, a nagy számítási teljesítményre éhes felhasználók többsége nem akarja majd felvállalni a meglevő szoftverek átírásával vagy módosításával járó anyagi terheket és bonyodalmakat - mindig is olcsóbb volt új hardvert venni mint egy meglevő szoftvert újraírni vagy optimalizálni.

a címlapról