Óriási előrelépést hozhat az IBM POWER9
Alaposan megújította POWER9-es szerverprocesszorát az IBM, a módosítások hatása pedig nem maradt el. A cég állítja, hogy bizonyos esetekben kétszeres gyorsulást is hozhatnak az új termékek.
A következő processzoráról beszélt a Hot Chips 2016 konferencián az IBM. A POWER9 egyik küldetése az Intel Xeonok adatközpontos hegemóniájának megtörése lehet, amihez a Nagy Kék számos fejlesztést vet be. A maximális magszám a duplájára nőtt, fejlődött a mikroarchitektúra, illetve új buszok kerültek a lapkába, amit már 14 nanométeren gyártat majd a cég, ezek együttes eredménye pedig hatalmas előrelépést jelenthet.
Ahogy az előd, úgy a POWER9 is két verzióban kerül piacra. A POWER9 SO scale-out rendszerekhez érkezik, ezekből a processzorokból legfeljebb két darab kerülhet majd egymás mellé, legkorábban valamikor a jövő év második felében. Ezt követően, valamikor 2018 folyamán kerül piacra a scale-up rendszerekhez szánt POWER9 SU, mely chipeket négy vagy több foglalatos node-okhoz tervezte az IBM.
A scale-out és scale-up rendszerekhez egyaránt 2-2 variáns kínál majd a Nagy Kék, felhasználási területtől függően, a POWER9 SO és SU is elérhető lesz 12, illetve 24 magos formában. Előbbi verzió SMT8-at támogat, azaz minden mag nyolc szálon képes feladatokat végrehajtani, így a processzor összesen 96 szállal dolgozhat. Ezt a megoldást a PowerVM ökoszisztémájához ajánlja az IBM, a cég szerint saját hypervisoruk gyengébb szálakkal is optimálisan működik. A 24 magos variáns SMT4-et támogat, tehát egyetlen mag négy szálon számolhat, ez pedig szintén 96 szálat eredményez. Az vállalat szerint ez Linuxhoz lehet ideális, ahol jellemzően erősebb végrehajtószálakra van szükség.
Az SO és SU verziók közötti különbség a foglalatok maximális száma mellett memória oldalon mutatkozik meg. Az SO összesen nyolc, DDR4 RAM-ot támogató memóriacsatornát kínál, a modulok pedig közvetlenül a processzor vezérlőjéhez kapcsolódnak, puffer nélkül. Ez a megoldás alacsonyabb késleltetést eredményez, miközben a sávszélesség stabilan 120 GB/s közelében lehet. A memória összkapacitása 4 terabájtra rúghat, melyhez ugyanakkor 256 gigabájtos modulokra lesz szükség, sztenderd 64 gigabájtos modulokkal 1 terabájt lehet a kapacitás.
A POWER9 SU ugyancsak nyolc csatornát kínál majd, de ez a verzió már tovább viszi az elődjénél megismert, külső vezérlőként működő "Centaur" puffert. Ennek hála egy foglalathoz akár 32 memóriafoglalat is társítható, amivel a maximális kapacitás elérheti a 8 terabájtot. A puffer negyedszintű gyorsítótárkén is funkcionál, ezzel pedig a sávszélesség elérheti a 230 GB/s-ot.
Nyolc milliárd tranzisztor
A huszonnégy magos POWER9 chip túlzás nélkül egy óriás, a lapka nem kevesebb mint 8 milliárd tranzisztorból épül fel, ami körülbelül 11 százalékkal több az ugyancsak 24 magos Broadwell-EX értékénél. A magas szám egyik oka, hogy a magok összesen 120 megabájt eDRAM-alapú L3 gyorsítótáron osztoznak, ami a lapka egy számottevő részét emészti fel. A 17 rétegű chip a GlobalFoundries üzemében készül 14 nanométeres FinFET HP (High Performance) gyártástechnológiával, ami ugyancsak előrelépést jelent a POWER8-nál alkalmazott 22 nanométeres planáris SOI-hoz képest.
Az IBM a processzormagok felépítéséhez is komolyan hozzányúlt, amely már úgynevezett super-slice egységekből épülnek fel. Ezek egy 64 bites compute, és egy 64 bites load-store egységből állnak, a nyolc szálat támogató SMT8 magban négy, a négyszálas SMT4-ben pedig két ilyen egység található. Utóbbi magban 32-32 kilóbájt utasítás- és adatcache található, a másodszintű gyorsítótár mérete pedig 512 kilobájt. Az IBM elárulta, hogy az új mikroarchitektúra öt fokozattal rövidebb futószalagot kapott, ami a korábbiaknál valamelyest alacsonyabb magórajelet sejtet.
Az új magok elsőként támogatják az IBM Power ISA 3.0 utasításkészlet csomagot, mely többek között tartalmazza a VSX-3 (Vector Scalar Extension) SIMD utasításkészlet, valamint támogatja a négyszeres pontosságú, 128 bites (IEEE 754) lebegőpontos műveletek végrehajtását is, utóbbi elsősorban bizonyos pénzügyi és biztonsági alkalmazásoknál lehet hasznos. Ugyancsak támogatott a 128 bites decimális integer végrehajtás, ami például adatbázisokhoz kapcsolódó műveleteknél segíthet. Ezek mellé az IBM egy egyutasításos véletlenszám generátort is beépített, amit a mérnökök még olyan funkciókkal fejeltek meg, mint Java és PHP esetében hasznos garbage collection, vagy az új megszakítási architektúra, ami virtualizációnál segíthet.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
A magok mellett a különféle buszok terén is újít a POWER9, a processzor elsőként támogathatja az egyelőre nem végleges PCI Express 4.0 szabványt, mindezt 48 sávval. E mellé került az IBM Bluelink busza, ugyancsak 48 sávval, darabonként 25 Gbit/s sávszélességgel. Ez több lehetőséget kínál, Power9 SU esetében a sávok SMP linkként is működhetnek, azaz ezekkel kapcsolódhatnak majd össze az egyes node-ok, de például az Nvidia NVLink 2.0 csatolójának is a Bluelink nyújtja az alapot, utóbbi az ugyancsak jövőre érkező Volta-alapú Tesla gyorsítókban kaphat helyet. Ugyancsak támogatott a CAPI 2.0 (Coherent Accelerator Processor Interface), mely szabvány a PCI Express és Bluelink buszra egyaránt ráültethető, ezzel különféle koprocesszorok (ASIC, FPGA) kapcsolhatók a CPU-hoz.
Hatalmas előrelépés
Az IBM néhány mérési eredményt is közölt, az előrelépés szemléltetéséhez pedig azonos mag- és szálszámot, illetve órajelet alkalmazott. Ez alapján óriási gyorsulást hozhat a POWER9, a Nagy Kék körülbelül 50-125 százalékos előrelépésről beszél, ekkora ugrást pedig csak nagyon ritkán hoz egy generációváltás.
Amennyiben a gyorsulás mértéke valós felhasználás mellett is realizálódik, úgy az IBM-nek reális esélye nyílhat arra, hogy hosszú idő után megtörje az Intel Xeonok adatközpontos egyeduralmát. A Google már korábban elmondta, hogy komolyan számol a POWER9-cel, a vállalat már több hónapja futtat egyedi POWER8-as szervereket adatközpontjaiban, így fejlesztői tesztelhetik a fontosabb kódokat és alkalmazásokat az IBM processzorain. A Google egyik szakember elmondta, hogy az infrastruktúrát már átportolták POWER-re, azaz a fejlesztői eszközök már az IBM architektúráján is működnek.