1 teraflops felett az Intel Knights Corner
A héten Seattle-ben zajló Supercomputing Conference 11 esemény kapcsán rendezett sajtótájékoztatóján az Intel működő mintapéldányok formájában mutatta be a jövőre kereskedelmi forgalomba kerülő Knights Corner chipjét, amelyet az NVIDIA és AMD GPU-k ellen küld csatasorba a mérnöki-tudományos számítástechnika világában.
Larrabeeből MIC
A Knights Corner kódnevű chip az Intel MIC (Many Integrated Cores) projektjének gyümölcse, amely az eredetileg grafikus processzornak indult Larrabbee folytatásának tekinthető. A vállalat elgondolása szerint több tucat egyszerű x64 processzormag egy lapkára integrálásával sikeresen veheti fel a versenyt a Teslákkal és FireStreamekkel a HPC szegmensben. A koncepció kísértetiesen hasonlít a GPGPU-k elgondolásához, azonban míg az NVIDIA és az AMD a grafikus chipek felől közelít az általános számítások felé, addig a MIC az általános célú x86 mikroprocesszorok oldaláról érkezik.
Az MIC projekt célja, hogy visszaszorítsa a GPGPU-k és más masszívan párhuzamos architektúrák térnyerését a HPC szegmensben, amelyek masszívan párhuzamosított felépítésük révén a PC-s és szerveres szoftverek futtatására tervezett processzoroknál jóval magasabb hatékonyságot érnek el szilíciumterületre és energiafogyasztásra vetítve. Ezt a MIC egyszerű x64 magokkal, széles vektorizált (SIMD) kiterjesztéssel, 100 új utasítással és négy utasításszál párhuzamos végrehajtásának lehetőségével (Hyper-Threading) próbálja meg ellensúlyozni.
Az Intel szerint az x64 magok használatának legnagyobb előnye a GPGPU megközelítéssel szemben, hogy a fejlesztőknek nem kell új programozási modellt vagy nyelvet elsajátítani és a vállalat széles körben elterjedt fejlesztői eszközei (fordító, debugger) is használhatók. Az Intel felkészíti fordítóit és optimalizáló eszközeit a MIC támogatására, így a programozók azonos forrásból azonos fejlesztői eszközökkel olyan binárist készíthetnek, amely fut a Core/Xeon processzorokon, de a MIC gyorsítóchipek képességeit is kihasználja, ha vannak a rendszerben. Utóbbihoz mindössze néhány sort kell a kódban elhelyezni.
Rajeeb Hazra (Intel) a Knights Cornerrel
1 teraflops dupla pontosságú lebegőpontos teljesítmény
Az MIC projekt első mérföldköve a 45 nanométeres Knights Ferry kódnevű chip, ami 32 magot tartalmazott, ezeket a lapkákat tartalmazó PCI Express bővítőkártyákat az MIC projektben résztvevő Intel-partnerek, akadémiai intézetek kaphatták meg. Glenn Brook, az Oak Ridge National Laboratoryt és a University of Tennessee mérnöki-tudományos számítástechnikai erőfeszítései felett bábáskodó Joint Institute of Computational Sciences igazgatója az eseményen elmondta, a mérnökök számos alkalmazást, összesen mintegy 5 millió sornyi Fortran, C és C++ kódot ültettek át a 32 magos Knights Ferry tesztchipre, a tudományos szoftverek "portolása" egyenként egy napot vett igénybe.
A Knights Corner már 22 nanométeres csíkszélességgel készül, hogy a projekt mennyire előrehaladott állapotban van azt jól mutatja, hogy az Intel a héten már működő mintapéldányokat demózott az újságírók előtt. A vállalat továbbra sem árul el részleteket a chippel kapcsolatban, nem lehet tudni a pontos magszámot sem, az Intel "több mint 50" magról beszél, de jól értesültek szerint a Knights Corner 64 maggal kerül le a futószalagról, amelyekből néhányat az Intel deaktiválhat. Azt sem tudni egyelőre, milyen órajeleken működnek majd a Knights Corner chipek.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A megcélzott szegmensben a legfontosabb mérőszám a teljesítmény, ebből pedig a Knights Corneren nincs hiány. Az Intel által demózott chipek az iparban széles körben elterjedt, dupla precizitást használó, mátrixszorzást végző DGEMM benchmark alatt 1 teraflops feletti teljesítményt értek el a Register beszámolója szerint, ami a jelenleg hozzáférhető legerősebb Tesla és FireStream lapkák által elért teljesítmény kétszerese és a 32 magos Knights Ferryhez viszonyítva is hasonló a különbség.
A GPGPU sem hal ki
A Knights Corner megjelenése előtt azonban az NVIDIA és az AMD is bemutat legalább egy új GPU-generációt, így a teljesítménykülönbség csökkenhet vagy akár a GPGPU-k javára is fordulhat a mérleg nyelve. A GPGPU-khoz elérhető szoftverfejlesztői eszközök, debuggerek, profilírozók is egyre javulhatnak és a GPGPU-k programozásához szükséges ismeretek is kezdenek széles körben elterjedni, hála az NVIDIA és az AMD erőfeszítéseinek.
Általánosságban igaz a HPC területre, hogy a nyerő architektúra nagyban függ a futtatni kívánt kódtól és ez feltehetően nem lesz másképp az Intel MIC és a GPGPU-k esetében sem. Az Intel sem vonja kétségbe a GPU-gyorsítás létjogosultságát vannak és lesznek is olyan területek, ahol a GPGPU megközelítés rendkívül hatékony, ha rendelkezésre áll az a szoftverfejlesztői tudás, amivel kihozható a grafikus chipekből a bennük rejlő erő. Az Intelnél ugyanakkor úgy látják, a nagy számítási teljesítményre éhes felhasználók többsége nem akarja majd felvállalni a meglevő szoftverek átírásával vagy módosításával járó anyagi terheket és bonyodalmakat - mindig is olcsóbb volt új hardvert venni mint egy meglevő szoftvert újraírni vagy optimalizálni.