Részletek az Intel következő RISC-gyilkosáról
Az Intel most először, a Hot Chips konferencián konkretizált néhány részletet a Westmere-EX kódnevű fejlesztésével kapcsolatban, amely a skálázódó Xeon processzorok következő generációját képviseli valamikor jövőre.
A következő lépcső: 10 mag, 20 szál
A Westmere-EX az Intel skálázódó szerverekbe szánt 32 nanométeres szerverprocesszora, amelynek célja az üzleti kritikus és mérnöki-tudományos feladatok által támasztott igények kiszolgálása - széles tartományban skálázható teljesítmény, nagy memóriasűrűség, magas fokú megbízhatóság a tervezési sarokpontok. A Westmere-EX a Boxboro-EX platformba illeszkedik, amely a Xeon 7500 és 6500 (Nehalem-EX) sorozattal együtt idén tavasszal jelent meg. A platform 8 processzorfoglalatig nem követel meg addicionális rendszervezérlő chipsetet, a processzorok közvetlenül is képesek összekapcsolódni, mindeközben lehetővé teszi a szervergyártók számára, hogy egyedi chipsetfejlesztésekkel különböztessék meg magukat, amelyekkel 16-32, de szuperszámítógépes installációk esetében akár még tovább növeljék a rendszer méretét.
A jelenleg már intenzív tesztelés alatt álló Westmere-EX chipek a 45 nanométeres csíkszélességű Nehalem-EX processzorokat váltják, az Intel termékciklusainak hossza alapján valószínűleg 2011 nyár végén vagy ősszel. Mivel a Westmere-EX a jelenlegi platformba illeszkedik bele, teljesen foglalatkompatibilis a rendszerlapokkal, ezért viszonylag gyors váltás várható, az új chipekkel szerelt első szerverek még jövőre megvásárolhatóak lehetnek.
Ahogyan kódneve is jelzi, a Westmere-EX inkább inkrementális változásokat hoz magával, ami az egyes magok mikroarchitekturális felépítését illeti, legnagyobb részt a Nehalem miniatürizált változata, hasonlóan a már piacon lévő Westmere-EP Xeon chipekhez. Ennek ellenére hiba volna lebecsülni jelentőségét, mivel a 32 nanométeres csíkszélességű gyártástechnológiának köszönhetően a Westmere-EX nyolc helyett már 10 processzormagot és arányosan növelt, 30 megabájtos harmadszintű gyorstárat (L3 cache) integrál egyetlen szilíciumlapkára, közölte az Intel. A magok számának növelése nem okoz problémát, ugyanis a Nehalem-EX projekt egy olyan chipre integrált belső, full-duplex körbuszt dolgozott ki, amely jól skálázódik az újabb magokkal. A magok természetesen kétszeresen párhuzamosítottak a Hyper-threading révén, így a 10 mag 20 szálat jelent, ami egy négyfoglalatos gép esetében már 80 hardveres utasításszál.
A Westmere-EX chipek valószínűleg magasabb órajeleken üzemelnek majd, konzervatív becsléssel 2,4-2,6 gigahertz közötti névleges frekvenciára lehet számítani (Turbo Boosttal 2,8-3 GHz a kis számításigényű, például tranzakcionális feladatok esetében) a csúcsmodellek esetében, ha a TDP továbbra is 130 watt marad, ami a platform stabilitása érdekében szinte bizonyos. Ez 10-15 százalékkal magasabb a jelenleginél, így az elődökhöz képest összességében nagyjából 40 százalékkal nőhet a chipek nyers feldolgozási kapacitása.
Mint ahogyan már ismert, a Westmere magok minimális fejlesztéseket tartalmaznak, igaz, ezek a Westmere-EX szempontjából mind relevánsak. Az adattitkosítás felgyorsítása érdekében 7 új, hardveresen támogatott utasítás jelent meg, amelyek az AES algoritmussal végzett kriptográfiai feladatok alatti sebességet növelik meg drasztikusan. Ez különösen jól jöhet nagy terhelésű üzleti tranzakcionális rendszereknél, ahol az adatok védelme egyaránt kritikus fontosságú a hálózati kommunikáció, a feldolgozás és a tárolás esetében is. Szintén növekszik a virtualizációs teljesítmény is a virtuális gépek közti gyorsabb váltás és a I/O-megszakítások hatékonyabb kezelése révén - ez a VT-x3/i3. A tovább okosított elágazásbecslők pedig a kevesebb téves elagázáson keresztül segítenek a processzormagok által elpazarolt időszeleteket csökkenteni, vagyis a hasznos teljesítményt növelik a fogyasztás emelkedése nélkül.
Új koherencia mechanizmus - jobb skálázódás
A Westmere-EX azonban tartalmazni fog egy további képességet, amely a többfoglalatos rendszerek skálázódását hivatott javítani. A Nehalem-EX tervezőcsapata a szimulációk során úgy találta, hogy 8 foglalatos vagy nagyobb rendszerekben sokat segítene, ha a chipek közti adatkoherencia fenntartását biztosító protokollt megtámogatnák egy címtárral. Ez meggyorsítaná a lekérdezéseket, valamint jelentősen csökkenteni tudnák az ezzel kapcsolatos chipek közti forgalmazást, amely a hasznos adatok elől fogyasztja az összeköttetések sávszélességét.
A Nehalem-EX fejlesztőcsapata azonban úgy döntött, nem implementálják ezt a címtárat, mivel ezzel azt kockáztatták volna, hogy csak később tud megjelenni a piacon. A Westmere-EX csapatának azonban már volt ideje arra, hogy megvalósítsa ezt a címtárral megtámogatott koherenciaprotokollt, amely egyfajta nyilvántartást vezet arról, hogy a gyorstárba került egyes adatoknak melyik chipen melyik processzormag a gazdája, és ha vannak, melyeknél találhatóak még másolatok. A legelterjedtebb megközelítésben a koherencia fenntartása folyamatos kommunikációval valósul meg a chipek közt, ez azonban a chipek számának növekedésével négyzetesen növeli a protokollhoz kapcsolódó forgalmazást (mindenki beszél mindenkihez, mindenki figyel mindenkire), ami eldugítja az adatbuszokat, és az egész rendszert lelassítja.
A címtárral felgyorsítható a közös adatokkal végzett munka, mivel nem kell várni a lekérdezések feloldására, az adat elhelyezkedése, tulajdonosa és használói mind villámgyorsan ismertté válnak. Ezzel együtt drasztikusan visszaszorítható a koherenciaprotokoll által generált kommunikáció mennyisége is, mivel a chipeknek nem kell folyamatosan az összes többi számára közzétenni az egyes cache adatsorokkal végzett műveleteket, valamint minden más chipet figyelni annak érdekében, hogy nyomon kövessék az adatok elhelyezkedését, és koherensen tartsák azokat - kommunikáció kizárólag a tulajdonosok és a másolatokkal rendelkezők közt folyik. Így növekszik a processzorok közti összeköttetések hasznos sávszélessége - a végeredmény gyorsabb válaszidő és nagyobb rendszerszintű teljesítmény.
Nem világos, hogy a Westmere-EX pontosan milyen protokollt valósít meg, az Intel címtárral támogatott körbekérdező (az angol zsargonban snoopy) protokollról beszél, ami arra utal, hogy a mérnökök vegyítették a teljesen címtáras technikát a klasszikus megközelítéssel. A teljesen címtáras megközelítés hátránya, hogy a processzorchipek számának és a rendszerben található memória mennyiségének növekedésével jelentős memóriaterületet igényel, a négymagos Itanium processzorokon például 1,92 MB cache csak ezt a feladatot szolgálja.
Összességében az várható a koherenciaprotokoll fejlesztésétől, hogy a Westmere-EX rendszerek teljesítménye 8 foglalatos vagy nagyobb méretben extrém terhelés alatt sem törik le. A Nehalem-EX esetében 8 foglalatnál (a 4 foglalathoz képest) arányaiban akár 20 százalékos teljesítménycsökkenés is megfigyelhető a lineáris skálázódáshoz képest, számítás- és I/O-intenzív kódoknál egyaránt - igaz, még ez is kifejezetten jónak számít, hiszen a teljesítmény nem csak a processzoron múlik. A Westmere-EX chipek felépítéséről és várható viselkedéséről remélhetőleg több részlet derül majd ki a szeptemberi Intel Developer Forum alkalmával.