:

Szerző: Asztalos Olivér

2016. április 1. 15:39

22 magot kínál a legnagyobb Broadwell-EP Xeon

Az Intel bejelentette a kétutas szerverekhez tervezett Xeon E5-2600 v4 processzorsorozatát, mely 27 taggal debütált. A Broadwell-EP kódnevű termékek elsősorban a gyorsabb és kiszámíthatóbb virtualizációs teljesítményre fókuszálnak.

Megérkeztek a legújabb kétfoglalatos Intel szerverprocesszorok. A Broadwell-EP sorozat a 2014 szeptemberében megjelent Haswell-EP helyére érkezik, összesen 27 darab új processzorral. A széria legnagyobb tagja 22 magot (és 44 szálat) párosít 55 megabájt L3 gyorsítótárral, mindezt valamivel több mint 4000 dollárért cserébe. A Xeon E5-2600 v4 sorozat tagjai immár az Intel 14 nanométeres gyártástechnológiáján készülnek, a processzormagok alapjait pedig a másfél éve bemutatott Broadwell mikroarchitektúra nyújtja, amit helyenként a szerveres felhasználás igényeinek megfelelően egészítettek ki a mérnökök.

Az Intel már leáldozóban lévő tikk-takk stratégiájának "tikk" lépcsőjét képviseli a Broadwell, ennek megfelelően a Haswellhez képest csupán kisebb mikroarchitektúrális módosításokat eszközöltek a tervezők. 60-ról 64 eleműre bővült az out-of-order ütemező mérete, illetve másfélszeresére, azaz 1536 eleműre nőtt a másodszintű TLB (virtuális -> fizikai címfordítást végző/gyorsító egység). A szorzások végrehajtási időidénye 5 órajelről 3-ra, a PCLMULQDQ utasítások végrehajtása pedig 7-ről 5 órajelre csökkent, utóbbi számos hash/CRC algoritmusban megtalálható. Új utasításként bemutatkozott az ADCX és az ADOX, melyeket jellemzően olyan aszimmetrikus titoksító algoritmusok használják, mint például az RSA. Szintén fontos, hogy a Broadwell-EP processzorokban ismét elérhetővé vált a Haswell esetében bevezetett, majd később egy hiba miatt letiltott TSX (tranzakcionális memóriakezelés). Utóbbi ISA-kiterjesztéssel a párhuzamos programfuttatást teszi sokkal hatékonyabbá, ezzel gyorsulhatnak a több utasításszálat használó alkalmazások.

A Broadwell-EP esetében sem maradtak el az energiahatékonysággal kapcsolatos fejlesztések, változott az energiamenedzsmentet vezérlő áramkör felépítése. A processzorok jellemzően az intenzívebb lebegőpontos kódok futtatása mellett fogyasztanak a legtöbbet, ezért az Intel átdolgozta a Haswell-EP esetében bevezetett AVX turbót. Az előző generációban debütált technológia az AVX-et használó alkalmazások esetén nem engedi olyan magasra a frekvenciát mint AVX nélkül. A megoldásnak ugyanakkor van egy hátulütője, az a többi mag órajelét is lekorlátozza, a nem AVX-es kódokon dolgozó végrehajtók frekvenciája nem haladhatja meg az AVX-es magokét. A Broadwell-E ezt a limitet eltörli, mostantól a többi végrehajtónak nem kell igazodnia az AVX-es magok maximális órajeléhez.

A magok összekapcsolási módja nem változott, azok a Broadwell-EP esetében megismert módon csatlakoznak egymáshoz. Ennek megfelelően a legnagyobb, 454 mm²-es lapkára épülő 16, 20, és 22 magos modellek két független dupla körbuszt kaptak, amelyekben a késleltetés minimalizálása miatt egymáshoz képest ellentétes irányban mozognak az adatok, a két körgyűrű pedig két switchen keresztül tartja egymással a kapcsolatot. Egyetlen maghoz 2,5 megabájt harmadszintű gyorsítótár tartozik, melyek átlagos késleltetése 6 órajelciklus. A két összekapcsolt részhez fejenként egy kétcsatornás memóriavezérlő tartozik, melyeket összesítve áll össze a négycsatornás rendszer.

A gyorsítótár a MESIF koherenciaprotokollt követi. Ennek megfelelően a magoknak saját L3 szeletük van, melybe írhatnak, míg az adatok olvasása szempontjából a teljes L3 cache elérhető bármelyik végrehajtó számára. Mindehhez a konzisztencia fenntartása miatt úgynevezett snoop mechanizmus szükséges, amiben szintén újított a Broadwell-EP. A két körgyűrűn található magokat egy-egy NUMA csomópont alá rendezi a vezérlés, ami opcionálisan a "home snoop" móddal egészíthető ki.

Virtualizációra kihegyezve

A Broadwell-EP sorozat több, a virtualizáció sebességének növelésére hivatott fejlesztést hozott. A VM exit késleltetés tovább csökkent, a Haswell-EP 500 ciklusos értékét 400-ra mérsékelték az új széria tervezés során. Ehhez kapcsolódóan a megszakítások kezelésében is változások történtek, az Ivy Bridge-EP modellekkel megjelent APIC-V technológiát a posted interrupt váltotta. Segítségével megoldható a közvetlen megszakítás kiosztás, a virtuális gépnek nem szükséges VM exitet végrehajtani.

Mindez a gyakorlatra levetítve óriási előrelépést hozhat, míg a korábbi APIC-V mellett 4 és 47 mikroszekundum között ingadozott a késleltetés, addig a posted interrupt alkalmazásával már csak 2,4 és 5,2 között váltakozik az érték, ami nem csak alacsonyabb, de lényegesen kiszámíthatóbb működést is eredményez. Ez többek között a csomagváltásos felhasználás esetében lehet hasznos, ami például telkós környezetben igen gyakori.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ugyancsak javult gyorsítótár és memória erőforrás kezelés, illetve monitorozás. A virtuális gépek ezen erőforrásokon (is) osztozkodnak, ami bizonyos esetekben problémákhoz vezethet. Amennyiben egy (vagy több) gép nagyobb szeletet hasít ki magának, az hátrányosan érintheti a többit, jelentősen növelve a késleltetést, amivel a működés kiszámíthatatlanná válhat, rontva a QoS-t.

A probléma kiküszöbölésére egy új technológiát, az RDT-t (Resource Director Technology) kínálja Broadwell-EP. Az RDT-vel nem csak pontosan nyomon követhető az L3 cache és a memóriasávszélesség kihasználtsága, de végrehajtószálra, folyamatra, illetve virtuális gépre levetítve is dedikálható gyorsítótár, ezzel mintegy biztosítva a magas prioritású feladatok zavartalan működését. Magonként legfeljebb nyolc egységet lehet beállítani, fejenként tizenhat osztállyal, prioritás illetve gyorsítótár méret szerint.

27 darab új processzor

Az Intel nem kevesebb mint 27 standard SKU-t, azaz kereskedelmi forgalomban elérhető processzorváltozatot dobott piacra a Broadwell-EP generációs Xeonokból. Az új modellek a Haswell-E és -EP processzorokkal bevetett LGA 2011-3 foglaltba illeszkedne, ennek megfelelően pedig DDR4 memóriát támogatnak, típustól függően akár 2400 MHz-es modulokig. Ezzel a korábbi Haswell-EP rendszerek könnyen bővíthetőek, a kompatibilitáshoz csupán megfelelő BIOS frissítésre lesz szükség.

forrás: AnandTech

A rengeteg különféle processzorváltozatot három különféle dizájn szolgálja ki. Érdekesség, hogy a már említett legnagyobb, 454 mm²-es lapka alapvetően 24 magot tartalmaz, de abból (egyelőre) csak maximum 22 magot engedélyezett az Intel, illetve ugyanebből készülnek a 16 és 20 magos variánsok is. A középső, 306 mm²-es verzió 12 vagy 15 magot vonultat fel, a legkisebb változat pedig legfeljebb 10 aktív processzormagot tartalmazhat összesen 25 megabájt L3 cache mellett.

A processzorok TDP-je 65 és 145 watt között alakul, magszámtól és órajeltől függően, a listaárak a korábbi stratégiának megfelelően 213 dollártól 4115-ig mennek. A Xeon E5-2600 v4 processzorgeneráció azonnal elérhető a legnagyobb szervergyártók gépeiben, a korábbiakhoz hasonlóan olyan cégektől mint a HP, Dell, Fujitsu, Cray, Huawei, Lenovo, NEC, Oracle és Cisco.

a címlapról