Megérkeztek az AMD vadiúj szerveres processzorai
Az Epyc központi egységekkel próbál visszakapaszkodni az eltávolodott piacra a tervezőcég.
Bemutatta vadiúj, Zen-alapú szerverprocesszorait, illetve az azoknak megágyazó Naples platformot az AMD. A tervezőcég első körben összesen 12 modellt leplezett le, amelyek közül 9 darab kétfoglalatos, három pedig egyfoglalatos szerverekbe illeszkedik. A processzorok 8, 16, 24, illetve 32 magot vonultatnak fel, utóbbi felülmúlja az Intel jelenlegi kínálatának csúcsán található Xeon magszámát. Ez ugyanakkor önmagában még nem lesz elég az AMD üdvösségéhez, ezért a gyártó rendhagyó módon differenciálja az Epyc processzorokat, amelyekkel elsősorban az egy foglalatos szerverek piacán lehet keresnivalója.
Ahogy korábban már részleteztük, az AMD egyetlen, Zeppelin (ZP) kódnevű dizájnnal próbálja lefedni a teljes asztali és szerveres piacot, az egyes processzorok között csupán a tokozáson elhelyezett szilíciumlapkák, illetve a kivezetett vezérlők jelentik majd a különbséget. A több lapkából összelegózott szerveres processzorok koncepciójának számos előnye lehet. Ily módon lényegesen egyszerűbb a gyártás, négy kisebb lapkát sokkal könnyebb (jól) legyártani, mint egy nagy monolitikusat, a kisebb egységekből pedig viszonylag rugalmasan alakíthatóak ki az egyes, különféle piacokat célzó termékek. A hátrányok közé sorolható a megfelelően gyors, alacsony késleltetésű interkonnekt kifejlesztése és üzemeltetése, valamint a bonyolultabb, és így drágább tokozás.
A négy lapka és a tokozásba épített huzalozás
Egyetlen Zeppelin egység nyolc processzormagot, 32 darab Gen3-as PCI Express sávot, két DDR4-es memóriacsatornát, 4 darab 10Gb Ethernet vezérlőt, illetve négy USB 3.0 portot vonultat fel, amelyek több lapka esetében összeadódhatnak. Az AMD minden esetében négy Zeppelin lapkát ültet egyetlen SP3 tokozásra, amivel a legfeljebb DDR4-2666 szabványú modulokat támogató memóriacsatornák az összes processzor esetében 8-ra, a PCI Express sávok száma pedig 128-ra is rúg, a maximális magszám 32, a végrehajtószálak száma pedig 64 lehet.
Fontos részlet, hogy a kívülről elérhető PCI Express sávok mennyisége egy- és kétfoglalatos kiépítés esetében egyezni fog, ugyanis a CPU-k közti koherens összeköttetést biztosító Infinity Fabric-ot a PCI Expressre ülteti rá a rendszer, ami a PCIe 3.0 linkenkénti 8 GT/s átviteli tempójához képest 10,6 GT/s-t kínál. Ez processzoronként kétszer 32 sávot foglal le, megfelezve az integrált vezérlő szabadon felhasználható kapacitását.
A négy lapkás, meglehetősen egyedi kivitelezés ugyanakkor a pozitívumok mellett kihívásokkal is kecsegtet. Az imént említett Infinity Fabric busszal ugyanis egy viszonylag bonyolult összeköttetési rendszert kellett kiépíteni ahhoz, hogy a processzor egyes lapkái, illetve azok magjai között a lehetőséghez mérten optimális legyen az adatkapcsolat sávszélessége és késleltetése, miközben a buszrendszer nem von el túl nagy szeletett a fogyasztási keretből. Ennek megvalósításhoz most is a NUMA (non-uniform memory access) memóriaarchitektúra vette alapul az AMD, amely lehetővé tette, hogy a processzorok egymás memóriáját viszonylag alacsony késleltetéssel és magas sávszélességgel érjék el.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
Egyetlen processzort alapul véve minden lapka közvetlenül eléri társait, az ehhez szükséges hat darab két irányú crossbar busz egyenként 42,6 GB/sec sávszélességet biztosít. Az AMD szerint az Infinity Fabric bitenként körülbelül 2 pJ energiát emészt fel, ami linkenként 0,672 wattot jelent, így a teljes processzora levetített fogyasztás 4,032 watt. A sávszélességet tekintve az Infinity Fabric megfelel az NVLink értékének, egészen pontosan annál 6,5 százalékkal nagyobb átviteli tempóra képes.
A két processzor, azaz a foglalatok közötti kommunikációt érdekesen oldotta meg az AMD, itt ugyanis egyetlen szélesebb kapcsolat helyett közvetlenül a processzorokon található egyes lapkákat köti páronként össze a platform. Az ebben az esetben alkalmazott Infinity Fabric egy kicsit lassabban működik (a távolsággal a maximális sávszélesség is esik), 42,6 GB/s helyett 37.9 GB/s a kapcsolat sávszélessége, miközben a fogyasztási keretből kétszer 5,48 wattot emészt fel az összeköttetés. Sajnos az ugyancsak fontos késleltetési értéket az AMD nem taglalta, ezzel meg kell várni az első független teszteket. Az már korábban kiderült, hogy azonos lapkán belül két CCX között 142 nanoszekundum a késleltetés, így várhatóan ennél nagyobb lesz az egyes CPU-n belüli lapkák, illetve két processzor között is.
Az Epyc processzor a támogatott leggyorsabb, DDR4-2666 szabványú modulok esetében 171 GB/s sávszélességet kínál a CPU-nként nyolccsatornás memóriavezérlő segítségével, ami legfeljebb összesen 2 terabájt memóriát kezel, ez pedig egy szerver esetében 4 terabájt összkapacitást jelenthet. Ennél egy fokkal érdekesebb adat, hogy a már egyetlen foglalat esetében is elérhető 128 PCI Express sávra akár 32 darab NVMe SSD is ráültethető. A HPE már ki is próbálta, hogy mit lehet így kihozni egy 1P rendszerből, a végeredmény pedig egy igencsak acélos, 9 millió IOPS lett, amely nyers eredmény (papíron) a felsőkategóriás tárolórendszerekkel összevetve is versenyképesnek hangzik, ami vonzó lehet a nagyobb teljesítményű, szoftveresen definiált tárolórendszerekre pályázó vállalatoknak.
Emellett a VM-eket és konténereket futtató vállalati rendszerekhez is készült egy fejlesztés, az SEV (Secure Encrypted Virtualization) a biztonságot célozza. Az Epyc rendszer ugyanis igény szerint képes titkosítani a rendszermemória tartalmát, amivel a VM és a hypervisor, illetve az egyes VM-ek és a kontérek saját memóriaterülete is biztonságosan elszeparálható egymástól, útját álva az esetleges támadásoknak többérlős környezetben, például egy felhős infrastruktúra esetében. A titkosítani kívánt memórialapokat az operációs rendszer és a hypervisor tudja kiválasztani, a DMA motoron keresztül pedig biztosítható, hogy az egyes rendszerben lévő eszközök (pl. háttértár, hálózati csatoló) hozzáférhessenek a szükséges részekhez. Az SEV az AMD-V része, a DRAM szintű titkosítást pedig egy az MMU-ba épített AES-128 motor végzi, azaz a processzormagokra többletterhelés nem hárul.
Végül, de nem utolsó sorban az energiamenedzsmentben is újított az AMD. Ennek köszönhetően két módot kínálnak az Epyc rendszerek, a fix számítási teljesítmény mellett a disszipációt válaszható az alapvető rendszerparaméterek fontossági sorrendjének élére. Az első esetben a platform fixálja az órajeleket, ezért cserébe viszont a disszipáció a névlegesnél magasabb lehet. A másik verzió ugyanez pepitában, ilyenkor a TDP értékét biztosan nem lépi át a rendszer, aminek bizonyos esetekben alacsonyabb órajel lehet az ára. Emellett már az AMD is kínál a névlegesnél alacsonyabb és magasabb TDP opciót, amely a névleges értéktől függően 15 vagy 25 wattal alacsonyabb, vagy 20 wattal magasabb lehet, amivel 105 és 200 watt között mozoghat az Epyc processzorok fogyasztási kerete.
12 új processzormodell
Az Epyc márkanév, illetve a Zen szerveres karrierje 12 darab új processzorral indul. Az AMD nem szegmentál túlságosan, az egyes modellek között a magszám, az órajel, illetve a TDP mellett az egy vagy kétutas kiépítési lehetőség jelenti a különbséget, az egyutas variánsokat "P" betűvel jelöli az AMD. Ennek megfelelően egy darab nyolcmagos, négy tizenhatmagos, három huszonnégymagos, illetve négy harminckétmagos processzor került piacra. Az Epyc 7601 jelzésű csúcsmodellt már össze is vetette az E5-2699v4 Xeon processzorral. A SPEC eredményei alapján az Epyc előnyben van, igaz ehhez teljes képhez hozzá tartozik, hogy az AMD megoldása 10 maggal többet kínál. Árazás szempontjából a két modell hasonló, az Intel 4115 dollárért kínálja processzorát, az AMD pedig 4000 dollár körüli összegről beszél, a pontos árcédulák még nem derültek ki.
Első ránézésre feltűnhet, hogy a legmagasabb alapórajel 2,4 GHz, ami nem túl magas. Ennek oka valószínűleg a magok mellé elhelyezett különféle vezérlőkben keresendő, amelyek relatíve nagy szeletet emésztenek fel a fogyasztási keretből. Erre jó példa a legkisebb, nyolcmagos verzió, amely 120 wattos TDP-je ellenére lényegesen alacsonyabb órajelen működik, mint az ugyanennyi magot tartalmazó asztali Ryzen 7 sorozat, amely négy helyett egyetlen lapkával oldja meg ugyanezt a magszámot, természetesen lényegesen kevesebb memóriacsatorna, és PCI Express sáv mellett.
forrás: The Linley Group
Egyelőre nem úgy fest, hogy az AMD kompromisszumot kötne ezen a téren, pedig az egyes vezérlők csatornáinak és sávjainak megvágásával sokat lehetne spórolni, amely egyenes utat nyitva a a magasabb magórajel felé. A tervezőcég valószínűleg úgy gondolja, hogy ez nem lenne elég a Xeonok ellen, így alternatív módon próbálja vonzóvá tenni processzorait, igyekszik inkább oda lőni, ahol a kvázi egyeduralkodó konkurensnek (még) nincs alternatívája. Többek között ennek is köszönhető, hogy az AMD feltűnően sokat beszél az egyfoglalatos megoldásról, ezzel a szegmenssel ugyanis az Intel nem foglalkozik kiemelten. A 32 magos modellek valamelyikével akár egy Xeonokból épített kétfoglalatos rendszer is kiváltható, alacsonyabb költségek mellett.
A kínai Google-ként is emlegetett Baidunak már megtetszett a rendszer, az AMD közleménye szerint az internetes keresőt (is) üzemeltető cég adatközpontjaihoz egyfoglalatos Epyc rendszereket vásárolt, ám az nem derült ki, hogy ez eddig pontosan hány eladott processzort jelentett az AMD-nek. Emellett a Microsoft is kipróbálja az Epycet, hisz ahogy korábban írtuk, a Project Olympus keretei között több más platformmal együtt a Naples is ott lesz.
A szervergyártók közül a három nagy szereplőt, a Dellt, HPE-t, és a Lenovót sorolja az AMD, ugyanakkor még ezek egyike sem jelentett be Epycre épülő konfigurációt. Érdekes lesz látni, hogy hosszú évek xeonos hegemóniája után hoz-e bármiféle változást az Epyc, például érkezik-e az AMD platformjára épülő PowerEdge vagy ProLiant szerver.