2015. május 11. 13:45

Xeon E7 v3: gyorsabb, nagyobb, megbízhatóbb

Ideális esetben, TSX-kompatibilis szoftverek esetében akár háromszoros gyorsulást is el tud érni az új csúcs-Xeon az előző generációhoz képest.

Lerántotta a leplet a múlt héten az Intel processzorkínálatának új királyáról, az abszolút csúcsot képező Xeon E7 v3 családról. A Xeon E7 családot az Intel egyértelműen a RISC processzorokkal, a Powerrel és a SPARC-kal szemben pozicionálja, a legnagyobb, négy vagy még több foglalatos szerverek piacán. Jelen állás szerint ezen a területen az Intel már most is toronymagasan vezet a darabszámot tekintve, a cég által idézett IDC adatok szerint részesedése 94 százalék. A bevételt tekintve azonban még mindig igen komoly szereplő a RISC, ebben a dimenzióban az alternatív gyártók lapkáira épülő gépek még mindig mintegy ötödét viszik el a piacnak - ráadásul az IBM az x86-os részleg eladásával most újult erővel fogott a Power-ökoszisztéma kiteljesítésének.

A RISC chipeknek két fontos versenyelőnyük van az Intelhez viszonyítva: ezeket a processzorokat az alapoktól a nagy rendelkezésre álláshoz és scale-up filozófia mentén tervezték. Előbbi olyan képességeket jelent, melyekkel a rendszer és a futó alkalmazás még olyan extrém meghibásodást is túl tud élni, mint egy memóriamodul kiesése. Utóbbi, a scale-up pedig arra vonatkozik, hogy a processzorokat arra optimalizálják a gyártók, hogy adott foglalatszámból hozzák ki a maximumot, mivel a futtatandó szoftverek hagyományosan nem tűrik jól a fürtözést (scale-out), a szerverek számának sokszorozásával számottevően nem gyorsulnak.

A Xeon E7 legfontosabb újdonsága, hogy az előd generáció Ivy Bridge mikroarchitektúráját immár Haswellre cseréli (így kódneve Haswell-EX), annak minden hozadékával, közte a TSX utasításokkal együtt (erről később). A magok száma 15-ről 18-ra emelkedett, a gyártástechnológia azonban maradt az Intel 22 nanométeres FinFET eljárása. További komoly változást kapott a memória alrendszer. Első körben: immár a DDR4-es memóriát is támogatja a processzor, köszönhetően az új Jordan Creek 2 pufferchipnek, amely a memóriamodulok és a processzor között közvetít, de támogatja az eredeti Jordan Creek chipet is, így a DDR3 is elérhető marad. Az E5-ös lapkákhoz képest az E7 jóval több memóriát támogat: processzoronként 24 memóriafoglalat 64 gigabájtos modulokkal szerelve 1,5 terabájt RAM-nak felel meg. A legnagyobb, nyolcutas kiszerelésben 12 terabájt, négyutas szerverekben pedig ennek fele, 6 terabájt memória az elérhető maximum.

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez

Ezúttal egy mindenki számára kötelező, de laza jogi különkiadással jelentkezünk. Ennyi a minimum, amit munkavállalóként illik tudnod.

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez Ezúttal egy mindenki számára kötelező, de laza jogi különkiadással jelentkezünk. Ennyi a minimum, amit munkavállalóként illik tudnod.

A hardveres megbízhatóság és RAS oldalán számos ponton igyekszik előrelépni az E7 v3. A memóriaterületek tükrözése bevett gyakorlat, az új chipek azonban képesek megkülönböztetni a kritikus és nem kritikus memóriaterületeket, és csak ez utóbbit tükrözni. Ez azt jelenti, hogy a hagyományos tükrözéssel ellentétben nem kell lemondani azonnal a nyers kapacitás feléről, miközben az érzékeny adatok is maximális védelmet élveznek. A lapkák támogatják az új "multiple rank sparing" funkciót is, vagyis processzoronként néhány memóriamodul dedikáltan félretehető arra az esetre, ha azonnal át kellene venni egy kieső modul helyét.

Haswell a felső házban - tarolhat végre a TSX

Az Intel Haswell generációs processzorainak egyik legfontosabb műszaki újdonsága egy új utasításkészlet-kiterjesztés, amely a tranzakcionális memóriakezelést hivatott gyorsítani. A TSX (transactional synchronization extension) két új utasításpárral bővíti az x86 ISA-t a többszálú programfuttatás gyorsítása érdekében. A TSX-et itt mutattuk be részletesen, a lényeg, hogy a párhuzamos végrehajtásra komolyan kihegyezett szoftverek hatalmasat tudnak profitálni az új utasításokból - hol lenne tehát fontosabb ez, mint a sokmagos, sokfoglalatos, jellemzően adatbázisok futtatásával foglalkozó szerverek esetében.

A TSX bevezetése ugyan nem volt zökkenőmentes, az első, konzumer Haswell és Broadwell chipekben hibás az implementáció, így annak működését az Intel le is tiltotta. A Xeonokban azonban már működik az utasításkészlet-kiterjesztés, használatához azonban újrafordított, TSX-kompatibilis szoftverre van szükség. Az Intel szerint ez már nem lesz probléma, az SAP például már elvégezte ezt a munkát a HANA in-memory adatbázisok esetében, így azok maximálisan ki tudják használni az új processzorokat.

És mennyivel emeli a TSX a HANA teljesítményét? Az Intel saját mérései szerint az E7-4890 v2-ről E7-8890 v3-ra váltás önmagában mintegy 50 százalékkal növelte a teljesítményt, a TSX aktiválása pedig tovább duplázta azt. Azonos szoftverkörnyezetet és memóriamennyiséget alapul véve a mintegy 3,2-szeres sebességnövekedés generációk között bizony elképesztő előrelépést jelent, különösen ha figyelembe vesszük, hogy a két processzor listaára nagyjából azonos (6600 dollár vs 6800 dollár).

Vékony gyorsulás

A fenti adatokat egyelőre azért érdemes óvatosan fogadni, a publikusan elérhető eredmények ugyanis ilyen gyorsulást nem támasztanak alá. Az SAP oldalán közzétett adatok szerint például az előző generációs Xeont használó négyutas HP Proliant DL580 Gen8 még 133570 SAPS-pontot ért el, ezzel szemben az új verziós Gen9 160720 pontja mintegy 20 százalékos növekedést hoz - igaz, a felhasznált szoftverkörnyezet (Windows Server 2012+SQL Server 2012+SAP ERP 6.0) még nem TSX-kompatibilis.

A TSX hatása az általános célú végrehajtás alatt sem érződik (nyilván), az Intel által ígért háromszoros gyorsulást a SEPCint_rate_base_2006 iparági tesztek sem támasztják alá. A Dell PowerEdge R930, amelyben E7-8890 v3 dolgozik, 2740 pontot ér el a teszt alatt, az előző generációs, E7-4890 v2 ezzel szemben 2320 pontot kapott - egész számos műveletek alatt tehát a sebességnövekedés nagyjából megfelel annak, amit a magszám 15-ről 18-ra emelése amúgy is indokol.

Nincs kétutas E7

Hogy a tulajdonképpeni processzorokról is beszéljünk: az Intel számottevően egyszerűsítette a csúcs-Xeonok felhozatalát. Első lépésként kivezette a kétutas szerverekbe szánt E7-es kiadásokat, a processzorok ezentúl csak négyfoglalatos és nyolcfoglalatos verzióban lesznek elérhetőek, az E7-4XXX és E7-8XXX név alatt. Az alapmodell 2 GHz-es, 8 magos, 20 megabájt gyorsítótárral és 115 wattos TDP-vel, ezzel szemben a csúcsot jelentő E7-8890 v3 már 18 magot kínál (szemben az előd sorozat 15 magjával), a gyorsítótár 45 megabájtra hízik, az órajel 2,5 GHz. Ennek az Intel is megkéri az árát, az alapverzió 1224 dolláros listaárával szemben ez már 7175 dollárba kerül - ez már elég jelentős áremelés az előd 6841 dolláros árához képest is.

Az egyes szegmensekre optimalizált kiadások továbbra is elérhetőek lesznek, így órajelre, fogyasztás/teljesítmény és szuperszámítógépes munkára optimalizált verzió is maradt. Az órajelre kihegyezett E7-eseket elsősorban olyan szoftverek alá kínálja az Intel, ahol a licencdíjat processzormagonként kell fizetni, ezért a magonkénti teljesítmény abszolút kritikus. Ezek a processzorok 4 és 10 magos kiszerelésben is kaphatóak, a maximális órajel pedig 3,2 GHz is lehet, a "normál" csúcsmodell 2,5 GHz-es sebességével szemben, de megtartják annak hatalmas harmadszintű gyorsítótárát és összes egyéb képességét.

Xeon E7 v3: gyorsabb, nagyobb, megbízhatóbb

Ideális esetben, TSX-kompatibilis szoftverek esetében akár háromszoros gyorsulást is el tud érni az új csúcs-Xeon az előző generációhoz képest.

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez

Milliárdos gyomrost kap Amerikától az Nvidia

Tőzsdére lépne a Figma az Adobe-üzlet kútba esése után

Ráveti magát a Meta AI az európai adatokra

Xeon E7 v3: gyorsabb, nagyobb, megbízhatóbb

Ideális esetben, TSX-kompatibilis szoftverek esetében akár háromszoros gyorsulást is el tud érni az új csúcs-Xeon az előző generációhoz képest.

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez

Milliárdos gyomrost kap Amerikától az Nvidia

Tőzsdére lépne a Figma az Adobe-üzlet kútba esése után

Ráveti magát a Meta AI az európai adatokra

Ötmilliárd angol fontra perlik a Google-t a keresődominancia miatt

Drágul az optikai meghajtó nélküli PlayStation 5

Még több pénzt önt a félvezetőiparára Dél-Korea

Ötmilliárd angol fontra perlik a Google-t a keresődominancia miatt

Drágul az optikai meghajtó nélküli PlayStation 5

Még több pénzt önt a félvezetőiparára Dél-Korea