Megjelentek az Intel új kétfoglalatos Xeonjai
A múlt pénteki Core M "paper launch" után egy újabb processzorról rántotta le a leplet az Intel: egy hétfő esti webcaston elrajtolt a legújabb Xeon-generáció, a kétfoglalatos gépekbe fejlesztett Haswell-EP, amely Xeon E5-2600/1600 v3 néven lesz elérhető. Ebben az esetben azonban nem csak papíron mutatkoztak be a chipek, azok a nagy szervergyártók gépeiben azonnal el is érhetők.
A Haswell-EP a 22 nanométeres technológiájú, Haswell kategóriás desktop és mobil chipek leszármazottja, néhány fontos különbséggel. Az egyik természetesen a megcélzott felhasználási területhez illő magas magszám (a csúcsmodell 18 magos) és passzoló cache-méret (akár 45 MB L3), a másik az integrált memóriavezérlő, amely DDR3 helyett már DDR4-et támogat. Ennek megfelelően az új processzorok nem passzolnak a korábban legyártott gépekbe, azokhoz egy teljesen új platform is érkezett, Grantley kódnéven.
Keveset változtak a magok
Maguk a processzormagok alig változtak az előző (Ivy Bridge) generációhoz képest, azonos az utasítás-futószalag és az elsőszintű, valamint a másodszintű cache mérete sem változott, továbbra is 64, illetve 256 kilobájttal gazdálkodhatnak a magok. A cache-ek sávszélességét viszont duplázták a mérnökök, feltehetően az AVX2 utasításkészlet-kiterjesztés miatt, amelynek része egy FMA (fused multiply-add) utasítás is, ez a vállalat szerint egyes lebegőpontos kódok esetén akár duplázhatja is a teljesítményt.
Két új portot kapott a "Unified Reservation Station", így a Haswell elméletben már 8 utasítás egyidejű ütemezésére képes. Átdolgozták az elágazásbecslő logikát, megnőtt az L2 TLB (címfordítás tár) mérete és a soron kívüli ütemező több utasításból választhatja ki a következőt, hogy a végrehajtóegységek a lehető legjobban ki legyenek használva. A vállalat szerint azonos órajelen a Haswell teljesítménye egész műveletek alatt nagyjából 10 százalékot javult azonos órajelen, a lebegőpontos teljesítmény viszont az AVX2 miatt szélsőséges esetben kétszeres is lehet.Egy processzormag a korábbiakhoz hasonlóan két utasításszál párhuzamos végrehajtására alkalmas a Hyper-Threading révén, a legolcsóbb, hatmagos verziókban ezt a képességet azonban az Intel letiltotta.
A Haswell egyik nagy dobása a tranzakcionális memóriakezelés. A Transactional Synchronization Extension (TSX) ISA-kiterjesztés a párhuzamos programfuttatást teszi sokkal hatékonyabbá, ezzel sokat gyorsulhatnak a több utasításszálat használó alkalmazások. A TSX-szel kapcsolatban nemrég probléma merült fel, ezeket az utasításokat az Intel átmenetileg (alapértelmezésként) letiltotta a chipjeiben, bekapcsolás egyelőre csak saját felelősségre ajánlott, kizárólag fejlesztési, tesztelési célokra.
Energiatakarékosság
A Haswell-EP ugyanúgy 22 nanométeres technológiával készül mint elődje, így az energiahatékonysággal kapcsolatos fejlesztések a mikroarchitektúra szintjén keresendők. A desktop és mobil verziók jóval takarékosabbak az Ivy Bridge-nél, elsősorban a rendkívül lecsökkentett üresjárati fogyasztás miatt, szerverek esetén az idle állapot kevéssé jellemző, de azért itt sem maradt fejlesztés nélkül az új Xeon, nem véletlen, hogy az Intel mérnökei a korábbinál több magot tudtak besűríteni azonos fogyasztási keretben - igaz, az órajelek jellemzően nem növekedtek.
A Haswell-EP több mint 20 hőszenzorral rendelkezik, így jobban nyomon követhető a lapka hőtermelése, amely révén a hűtés által korlátozott környezetekben (nagy teljesítménysűrűségű telepítések) jobban kézben tartható a fogyasztás és a teljesítmény. A magok és az "uncore" rész frekvenciája már eltérhet a Haswell-EP esetén, így a magokat intenzíven, de az "uncore" részt kevéssé kihasználó alkalmazások miatt utóbbi órajelét nem kell megemelni, így nagyobb keret áll a processzormagok rendelkezésér. A logika persze fordítva is igaz, az uncore-t kihajtó (pl. I/O-intenzív) szoftverek nem okoznak felesleges magfrekvencia-emelkedést.
A processzorok jellemzően a lebegőpontos-intentív kódok futtatása alatt fogyasztanak a legtöbbet, az új Xeonokban ezért az Intel átdolgozta a Turbo módot és bevezette az AVX Turbót, amely az AVX-et használó alkalmazások esetén nem engedi olyan magasra a frekvenciát mint AVX nélkül. Az E5-2699 v3 processzor névleges órajele 2,3 GHz, de a magok akár 2,8 GHz-ig is felpöröghetnek, AVX kód futtatása esetén azonban 1,9 és 2,6 GHz között változik az órajel. A vállalat szerint az AVX2 miatt az ilyen alkalmazások még alacsonyabb órajelen is jóval gyorsabban futnak.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A magszám növekedésével együtt megváltozott a magok összekapcsolásának módja is. A Xeon E5-2600 v2 generációs processzorokban (Ivy Bridge-EP) a magok és a harmadszintű cache még két, ellentétes irányú körbuszon kommunkáltak, a v3 generáció 14 és 18 magot felvonultató csúcsmodelljei viszont már két független dupla körbuszt kaptak, amelyek switchen keresztül tartják egymással a kapcsolatot.
A DDR4 előnyei
Ahogy már korábban írtuk, a Haswell-EP egyik nagy dobása az átállás DDR3-ról DDR4 memóriára. Az új memóriaszabvány két ponton hoz érdemi előrelépést: egyrészt jóval magasabb sávszélesség elérését teszi lehetővé, másrészt alacsonyabb feszültséget (1,2V) igényel a működéshez, így alacsonyabb a fogyasztása, ami a nagy memóriakapacitású szerverek esetén lehet fontos. A Xeon E5-2600 v3 generáció 2133 MHz-es memóriát támogat jelenleg, a csúcsmodelleknél ez 68 GB/s sávszélességet jelent 4 memóriacsatornán, míg az előző generációnál 59,7 GB/s volt a csúcs. A maximális memóriakapacitás foglalatonként 768 gigabájt, ez azonos az Ivy Bridge-EP értékével, de a jövőben érkező LRDIMM (Load Reduced DIMM) modulokkal azonban 1,5 terabájtra duplázható.
A DDR4 egyik előnye a DDR3-mal szemben, hogy a nagy memóriakapacitású konfigurációkban nem kell annyira korlátozni a memória órajelét. A korábbi, DDR3-at támogató Xeonok esetében 1866 MHz volt a maximális memóriafrekvencia, azonban ha egy foglalathoz 512 gigabájtnyi háttértár kapcsolódott, az órajel 1666 MHz-re csökkent, a maximális 768 gigabájtnál pedig még tovább. A DDR4-et támogató Haswell-EP esetén még 768 gigabájtos foglaltonkénti kapacitás esetén is 1666 MHz a memória órajele, ennél kisebb kiépítések esetén pedig tartható a 2133 MHz.
32+20 új processzor
Az Intel nem kevesebb mint 32 standard SKU-t, azaz kereskedelmi forgalomban elérhető processzorváltozatot dobott piacra a Haswell-EP generációs Xeonokból, ezekhez csatlakozik további 20, amelyet a vállalat legnagyobb ügyfeleinek megrendelésére egyedileg konfigurált, ezek nem is kerülnek forgalomba és a specifikációik sem nyilvánosak egyelőre. A rengeteg különféle processszorváltozatot három különféle "die" szolgálja ki, a legkisebbek 4-8 magot tartalmaznak, a középső verzió 10 vagy 12 magot vonultat fel, a csúcsváltozat pedig legfeljebb 18 aktív processzormaggal és hatalmas, 45 megabájtos L3 cache-sel érkezik.
A különféle Haswell-EP verziókat meg sem kíséreljük felsorolni, a részletekért az Intel weboldalát érdemes böngészni. Azt azért érdemes tudni, hogy még a legkisebb verziók is 4 magot és 10 megabájt L3 cache-t tartalmaznak, a csúcsváltozat, az E5-2699 v3 pedig 18 magot és 45 megabájt L3-at állít csatasorba. A processzorok TDP-je 52 és 145 watt között alakul, magszámtól és órajeltől függően, a listaárak 213 dollártól 4115-ig mennek.
A Xeon E5-2600 v3 processzorgeneráció azonnal elérhető a legnagyobb szervergyártók gépeiben. Az Intel tájékoztatása szerint több mint 60 konfiguráció azonnal rendelhető az olyan cégektől mint a HP, Dell, IBM, Fujitsu, Cray, Huawei, Lenovo, NEC, Oracle és Cisco, év végére pedig bőven 200 fölé nő majd azoknak az adatközponti eszközöknek a száma, amelyekben Haswell-EP generációs chipek dolgoznak. Ezek között szerverek mellett persze megtalálhatók lesznek tárolók, illetve hálózati eszközök is. A Xeon E5-2600 v3-ról az Intel azt állítja, több mint 20 különféle benchmark-rekordot állított fel. A lapkák teljesítményét egy külön cikkben fogjuk tárgyalni.
Új, 40 GbE hálózati vezérlő
Az új processzorok mellett egy új hálózati vezérlőt is bemutatott az Intel tegnap. A Fortville kódnevű XL710 modellszámú kontroller legnagyobb dobása a 40 GbE támogatása, a nagyobb sávszélesség elsősorban virtualizált környezetben lehet érdekes, amikor egy szerveren a VM-ek sűrűségét a hálózati hozzáférés korlátozza. A Fortville három konfigurációban készül, már az alapváltozat is hozza az előd (X710) 2x10 GbE támogatását, a középső verzió 1x40 GbE, a csúcskivitel pedig 2x40 GbE interfésszel rendelkezik. A Fortville nem csak nagyobb sávszélességet biztosít a korábbi Intel vezérlőknél, hanem üresjáratban és terhelés alatt is kevesebbet fogyaszt.