Elrajtolt a Xeon Phi "Knights Landing"
Az Intel hivatalosan is bejelentette a második generációs Xeon Phi gyorsítót, melynek integrált memóriája nem csak villámgyors, de flexibilis is. A vállalat számos új technikai részletet ismertetett, ugyanakkor a termékek széleskörű elérhetőségére néhány hónapot még várni kell.
Az Intel a napokban zajló SC15 nevű, elsősorban szuperszámítógépekkel, illetve az azokhoz kapcsolódó fejlesztésekkel foglalkozó konferencián formálisan is bejelentette a második generációs Xeon Phi gyorsítót. A Knights Landing kódnéven futó fejlesztés a vállalat reményei szerint a GPGPU-k komoly alternatívája lehet majd a mérnöki-tudományos számítástechnika világában. Ezzel az új Xeon Phi a jelenleg legnépszerűbb megoldásnak számító Nvidia Tesla nagy konkurenciája lehet, mely jelenleg az TOP 500-as listán közel 70%-os részesedéssel bír a gyorsítót használó gépek között.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
A Knights Landingről számtalan részlet napvilágot látott az elmúlt 1-2 évben, így túl nagy meglepetéssel már nem tudott szolgálni az Intel. A 72 darab, Atom processzorokból már ismert Silvermont mikroarchitektúrára épülő magot úgynevezett csempékben csoportosították a tervezők. Egyetlen csempe két magot, illetve két VPU-t (Vector Processing Unit) tartalmaz, melyek az AVX-512 utasításkészlet támogatásáért felelnek. Utóbbi a 2017 környékén érkező Skylake-alapú Xeon processzorokban szintén elérhetővé válik. A másodszintű cache mérete egységenként 1 MB, ami a teljes lapkára levetítve 36 MB gyorsítótárat jelent. Az egyes csempék a háló topológiát (mesh) alkalmazva kommunikálnak egymással. A lapka 14 nanométeres FinFET gyártástechnológiával készül.
A második generációs Xeon Phi egyik újdonsága a kétféle felhasználási módban rejlik. A Knights Landing ugyanis képes önálló központi egységként is funkcionálni, ergo az (x86-os) operációs rendszerek futtatása sem okoz problémát számára. Fontos megjegyezni, hogy így csak egyprocesszoros rendszer építhető ki, ugyanis a lapka nem tartalmazza több egység összekapcsolásához szükséges QPI vezérlőt. Emellett az első generációhoz hasonlóan, akár koprocesszorként is viselkedhet az új Xeon Phi. Az out-of-order működésű, 1,3 GHz-es Silvermont magoknak hála számítási teljesítményben nagy ugrásra lehet számítani az elődhöz viszonyítva, mely még a legelső Pentium (P54C) magjait alkalmazza.
A memória-alrendszer terén a legfőbb újítást a Micron által fejlesztett, korábban csak HMC (Hybrid Memory Cube) néven emlegetett memória jelenti, mely leginkább a Hynix HBM-jéhez hasonlít. A HMC-t az Intel a Knights Landingen MCDRAM-nak (Multi-Channel DRAM) keresztelte el. A tokozásra, közvetlenül a processzor lapkája mellé telepített, összesen nyolc darab lapka 400 GB/s-nál is nagyobb sávszélességet képes biztosítani a magoknak, amihez kezdésnek 16 GB-os kapacitás társul. Mindezt még két különálló, egyenként 3-3 csatornás memóriavezérlő fejeli meg, mely DDR4-2400 szabványú modulokat támogatására képes, összesen legfeljebb 386 GB kapacitás erejéig.
Az MCDRAM három működési módba állítható. Lehetőség van harmadszintű, L3 gyorsítótárként használni mind a 16 GB-ot. Ennek előnye, hogy szoftveres oldalról semmiféle optimalizációt nem kíván meg, ugyanakkor növeli a RAM elérési idejét. A működési mód további hátulütője, hogy találati hiba (cache-miss) esetében nagyobb a büntetés, hisz a kérésnek először vissza kell futnia a magokhoz, majd onnan egy újabb kör jön a RAM-ig, melynek elérése alapvetően lassabb a beékelődött MCDRAM okán. Végül ott a triviális negatívum, miszerint gyorsítótárként alkalmazva a 16 GB-os tárkapacitás kvázi elvész, hisz ilyenkor ezt a területet nem lehet megcímezni.
Az úgynevezett Flat Mode esetében az MCDRAM által nyújtott kapacitás a DDR4-es rendszermemóriával együtt már kihasználhatóvá válik a szoftverek fejlesztői számára. Ezzel egy igen nagy sávszélességű és alacsony késleltetésű, de limitált méretű terület nyílik meg. Ennek optimális kihasználáshoz ugyanakkor megfelelő szoftverre van szükség, ráadásul nem minden kód képes profitálni az MCDRAM előnyeiből. Az MCDRAM és a DDR4 RAM jól megkülönböztethető egymástól, így a szoftverfejlesztők az alacsonyabb késleltetést kamatoztatni képes kódokhoz használhatják az MCDRAM-ot, az elérési időre kevésbé érzékeny, nagyobb kapacitást megkívánó részekhez pedig a DDR4-et. Ennek megvalósításához többféle mód kínálkozik az egyszerűbb NUMA-tól a különféle könyvtárakig (Memkind).
Végül a közelmúltban részletezett, saját fejlesztésű Omni-Path interkonnekt előnyeit is számszerűsítette az Intel. Az ehhez szükséges vezérlőlapka a Knights Landing esetében a tokozáson kap helyet, míg később teljesen bekerül a processzor lapkájába, teljesen integrálttá válik. A megoldás számtalan előnnyel kecsegtet, így például akár 17%-kal a késleltetés, 60%-kal a fogyasztás, illetve 26%-kal még a költségek is csökkenhetnek.
A Knights Landing szállítása már megkezdődött. A termékekből egyelőre csak a kiemelt ügyfelek és a fejlesztők kapnak, míg szélesebb körben jövő év első negyedévében válik elérhetővé a második generációs Xeon Phi. A konkrét modellekről, illetve azok árairól még nem beszélt az Intel.