Vadiúj Xeonokkal fut az AMD után az Intel
Masszív csúszással mutatkozott be a nyilvánosságnak az Intel harmadik generációs Xeon Scalable processzorcsaládja. Az Ice Lake-SP (röviden ICL-SP) kódnevű központi egységek több processzormaggal, magasabb IPC-vel (egy órajelciklus alatt elvégzett műveletek), nagyobb memória-sávszélességgel, illetve egyéb társítható elemekkel próbálják ledolgozni (technológia) hátrányukat az első számú konkurens AMD-vel szemben. Bár a chipgyártó első 10 nanométeres szerverprocesszorai számottevő előrelépést mutatnak a közvetlen elődökhöz (Cascade/Cooper Lake-SP) mérten, a harmadik generációs Epyc CPU-kat összességében még így is csak megközelíteni tudják.
A harmadik generációs Xeon Scalable processzorokra pontosan kettő évek kellett várni, a Cascade Lake-SP ugyanis 2019 áprilisának elején jelent meg. Az Ice Lake-SP-nek azonban már évekkel ezelőtt, optimális esetben valamikor 2019-ben kellett volna piacra kerülnie. A komoly csúszás mögött a már sokat emlegetett 10 nanométeres gyártástechnológiát érintő problémák állnak, melyek a terjedelmes lapkaméretek miatt a Xeonok tömegtermelését hatványozottan érintették, a konkurencia legnagyobb örömére.
Végre búcsúzik a Skylake
Vitathatatlan, hogy az Ice Lake-SP számos előrelépéssel kecsegtet. Az első helyen a korábban már kivesézett Sunny Cove processzormagok állnak, amelyek optimális esetben 20 százalékos sebességnövekedést hozhatnak a konyhára, az előző generációval megegyező órajelet alapul véve. Erre jöhetnek rá a különféle új utasításokkal nyerhető pluszok. A Sunny Cove már alapértelmezetten támogatja az AVX-512 utasításkészletet, amely magában foglalja a különféle aritmetikai műveletek gyorsítására hivatott IFMA-t (Integer Fused Multiply Add) is. A Vector-AES-nek hála több AES művelet futtatható párhuzamosan, amely mellé sorakozik fel az ugyancsak kriptográfiai végrehajtás gyorsításához beépített Vector Carryless Multiply, Galois Field, illetve az SHA és SHA-NI. Végül, de nem utolsó sorban 57 bitesre szélesedett a lineáris, 52 bitesre pedig a fizikai címtér, melynek hála egy Sunny Cove-alapú szerverprocesszor akár 4 terabájt rendszermemória kezelésére is képesek.
A mikroarchitektúrális fejlesztések mellett a magszám is megugrott: Korábbi modellek 28 egységéhez képest más 40 magig skálázódik a Xeon Scalable sorozat. Ez 43 százalékos ugrást jelent (a korábbi egylapkás Xeonokat alapul véve), amely bár jelentős, az AMD Epyc 64 magjától még így is 38 százalékkal elmarad. A második és harmadszintű gyorsítótárak kapacitása is nőtt, ráadásul jelentősen. A Sunny Cove architektúrának hála magonként 25 százalékkal ugrott meg az L2 (1,25 MB), az egyetlen magra eső L3 pedig 9 százalékkal nőtt, amely összesen 60 megabájtot jelent. Utóbbi fontosabb szám, hisz a harmadszintű tár egészén több mag osztozhat, illetve akár egyetlen végrehajtó is kiaknázhatja a teljes kapacitást, bizonyos feltételek mellett.
A gyorsítótárak gyorsabb feltöltéséhez a memóriavezérlőt is átdolgozta az Intel. A csatornák száma hatról nyolcra, a támogatott szabvány DDR4-2933-ről DDR4-3200-ra ugrott, amit különféle újabb előbetöltő technológiákkal fejeltek meg tervezők. Mindezeknek hála az Intel szerint akár 100 százalékkal is magasabb sávszélességből gazdálkodhat a Ice Lake-SP (a közvetlen elődhöz képest), miközben a hatékonyság 25 százalékkal nőtt. Mindeközben a maximálisan támogatott kapacitás is nagyot ugrott, a korábbi sztenderd 1 terabájt helyett ugyanis a harmadik generációs Xeonok összes tagja képes 4 terabájt memória kezelésére, ami ráadásul Optane-nel kombinálva 6 terabájig is növelhető a Gold és Platinum modelleknél.
CI/CD-vel folytatódik az AWS hazai online meetup-sorozata! A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.
A memóriacsatornák mellett a PCI Express sávok száma is nőtt, 48-ról 64-re. Ennél egy fokkal fontosabb, hogy végre az Intelhez is elért a PCI Express 4.0 szabvány, amely sávszélesség duplázódást jelent minden egyes vonal esetében. Ezzel a chipgyártó egy újabb komoly lemaradását (és adósságát) dolgozta le, a konkurencia ugyanis már évek óta kínál Gen4 kompatibilis platformokat. A PCIe-hez kapcsolódóan a foglalatok közötti kommunikációt biztosító UPI interkonnekt sávszélessége is nőtt. A korábbi maximum 10,4 GT/s helyett immár 11,2 GT/s tempóra képes egyetlen link, habár utóbbi érték csak a Gold és Platinum modellekkel lesz kiaknázható, összesen három linkkel. (A Silver típusoknál be kell érni 10,4 GT/s-mal és két linkkel.) Ehhez kapcsolódó, fontos változás, hogy az új termékekkel legfeljebb kétutas szerverek építhetőek, a 4P vagy 8P összeállításra nincs lehetőség.
Közel 40 új processzor
Az Ice Lake-SP processzorok régi-új, LGA4189-4 tokozással érkeztek. A típusjelzés végén található számnak fontos szerepe van, a hasonlóság ellenére ugyanis az új processzorok nem kompatibilisek a Cooper Lake-hez készített LGA4189-5 foglalattal. A döntés hátterében vélhetően az áll, hogy utóbbi processzorokat főként a nagy felhőszolgáltatóknak szállítja az Intel, leginkább négy- és nyolcfoglalatos kiszolgálókhoz.
Az egyes Platinum, Gold, valamint Silver (a Bronze márkanevet kivezette az Intel) modellek között a magszám, az órajel, az L3 cache kapacitása, a támogatott memória sebessége, a TDP, az SGX enklávé kapacitása, illetve végül, de nem utolsó sorban az árazás jelentheti a legfőbb különbséget. A csúcsmodellt most is a 80-ra végződő Platinum 8380 képviseli (nettó 8100 dollárért), egyedüliként 40 aktív processzormaggal, ami a 10 nanométer ellenére a korábbinál magasabb, 270 wattos TDP-t kíván. A várhatóan leginkább népszerű Gold sorozatot most is két részre, 5000-es és 6000-es modellekre bontotta az Intel. Előbbi 8 és 26, utóbbi 8 és 32 mag között skálázódik, miközben a 6000-es típusok órajele jellemzően magasabb.
A kínálatot továbbra is különféle betűkkel komplikálja az Intel, így létezik kifejezetten IaaS (P-s típusok) és SaaS (V-s modellek) felhős kiszolgálókhoz optimalizált változat, illetve megmaradtak a hálózatos felhasználáshoz igazított "N" processzorok is. Érdekesség a 8368Q, amely 3700 MHz-es (egyszálas) turbójával a leggyorsabbnak számít a mezőnyben, ám ehhez már vízhűtést ajánl a chipgyártó.
Utóbbi nem véletlen, az Ice Lake-SP processzorok órajelei ugyanis több ponton is jelentősen elmaradnak a Cascade Lake-SP (vagy akár a Skylake-SP) modellek értékeitől. Azonos magszámmal és TDP-vel rendelkező modellek esetében különösen látványos és tisztán látható a visszaesés. Xeon Gold 6258R vs. 6330 összevetésben az alapórajelet és többszálas turbót tekintve 700, egyszálas turbónál pedig 900(!) MHz az új típus hátránya. A drasztikus különbség két tényre világít rá: A 10 nanométer csúszása miatt az Intel abszolút csúcsra járatta a 14 nanométeres technológiát (14+++++), miközben tranzisztorteljesítményt tekintve a 10 nanométer még mindig nincs ott, ahol azt a gyártó szeretné. Mindez bizonyos felállásokban még az (akár) 20 százalékkal magasabb IPC ellenére is számottevő hátrányt jelenthet egyes Ice Lake-SP modellek számára, ezért érdemes alaposan átgondolni az esetleges upgrade létjogosultságát.
Jó, de nem elég
Az AnandTechnek máris lehetősége volt lemérni a harmadik generációs Xeon Scalable processzorcsalád csúcsmodellét, a 8380-at. Bár a számok alapján az Ice Lake-SP jelentős előrelépést mutat a közvetlen előd Xeon 8280-hoz képest, az AMD közelmúltban bemutatott "Milan" Epyc 7763-as processzorával már leginkább csak egyszálas végrehajtásban tud szoros versenyre kelni, ott sem minden esetben. Mindez jól mutatja, hogy az Ice Lake-SP egy megkésett termék, amelynek még valamikor az előző évtizedben, optimális esetben 2019 végén kellett volna megjelennie. A 10 nanométer miatti késést a konkurens AMD jól használta ki, habár ebből mindeddig csak részben sikerült piaci részesedést kovácsolni: az Intel még mindig a zsebében tudhatja a piac bő 80 százalékát.
A chipgyártó az Ice Lake-SP gyenge pontjait különféle a hozzáadott értékekkel igyekszik elfedni. Többek között ilyen az Optane PM NVDIMM (nem keverendő az Optane SSD-kkel) támogatása, amelyekből a processzorok mellé megérkezett a második generáció. A 200-as sorozat nagyobb, 4 terabájtos foglalatonkénti kapacitást, magasabb sávszélességet, illetve közel 17 százalékkal alacsonyabb disszipációt kínál. Optane PM modulok egyik hozadéka, hogy azokkal már a memória-alrendszer szintjén jöhet létre tároló rétegzés. Az Intel ehhez két módot készített: Memory Mode és App Direct. A Memory Mode-dal a DRAM és 3D XPoint házasításából létrejött tárterületet transzparens módon, közvetlenül címzéssel kezeli az operációs rendszer és az azon futó szoftverek.
Friss szerverplatformja mellé természetesen saját 100 gigabites Ethernet vezérlőjét ajánlja az Intel. A Columbiaville kódnevű, 800-as szériába tartozó kontrollerek, illetve az arra épülő hálózati kártyák ADQ (Application Design Queues) és DDP (Dynamic Device Personalization) támogatással rendelkeznek. Az ADQ egy hardveres csomagprioritás kezelő, a DDP-vel pedig a csomagok küldését lehet részletesebben testre szabni, funkcionalitás és biztonság szempontjából egyaránt.