Látványos előrelépés az új Xeon MP platform
Hivatalosan is elrajtol ma az Intel következő generációs Xeon MP platformja, melynek kódneve Caneland. A Caneland nemcsak gyökeresen megújult alapokat hoz, hanem új processzorokat is. A négymagos Tigerton processzorok bevezetésével az Intel végrehajtotta teljes x86-os portfoliójának migrálását a tavaly nyáron debütált Core mikroarchitektúrára, nyugdíjba küldve ezzel a múlt évezredben kifejlesztett Netburstöt. Az Intel új Xeon MP rendszerei drasztikusan javuló teljesítménnyel és energiahatékonysággal kecsegtetnek, lelépve a négyutas rendszerek terén leginkább versenyképes AMD Opteronokat.
Kicsiben és nagyban
Az Intel még július végén, valamivel több mint egy hónapja közölte, hogy megkezdte partnerei felé a Tigerton kódnéven ismert új Xeon MP-k szállításait. A 7300-as sorozatban megjelenű chipek két kétmagos, Core mikroarchitektúrájú chipből épülnek fel, melyek lényegében megegyeznek a tavaly nyáron megjelent Woodcrest lapkákkal, ugyanakkor az Intel extra validációs idővel biztosítja magasabb megbízhatóságot. A 7200-as sorozatban megjelenő Xeon MP-k két maggal érkeznek majd, vagyis egyetlen chipet tokoznak.
Kezdetben kilenc új Xeon MP válik elérhetővé, melyek közül a legerőteljesebb a 2,93 gigahertzes, kétszer 4 megabájt másodszintű gyorsítótárat (L2 cache) alkalmazó X7350, ahol az X a mindenkori csúcsteljesítményű modelleknek fenntartott 130 wattos termális keretet jelöli. A 80 wattos mainstream változatok az E jelölést kapják. Az E7340 2,4 gigahertzes órajelen fut, míg az E7330 szintén 2,4 gigahertzes, azonban mindössze 6 megabájt L2 tárat engedélyezett benne az Intel. A vállalat alacsony fogyasztásra optimalizált változatot is elérhetővé tesz, mely 50 wattos kerettel (L) 1,86 gigahertzen üzemel, ára pedig megegyezik a csúcsteljesítményű változatéval.
A Tigerton család tagjai
Modell | Órajel | L2 cache mérete | Listaár, dollár |
X7350 | 2,93 GHz | 8 MB | 2301 |
E7340 | 2,4 GHz | 8 MB | 1980 |
E7320 | 2,4 GHz | 6 MB | 1391 |
E7320 | 2,16 GHz | 4 MB | 1171 |
E7310 | 1,6 GHz | 4 MB | 856 |
L7345 | 1,86 GHz | 8 MB | 2301 |
E7220 | 2,93 GHz | 4 MB | 1117 |
E7210 | 2,4 GHz | 4 MB | 856 |
Forrás: Intel |
Új alapok
A kétutas rendszerekhez képest magasabb fokú megbízhatósági, rendelkezésre állási és szervizelhetőségi képességeket kínáló Caneland az eddigi értékesítést domináló Trulandnél több mint két és félszer nagyobb elméleti sávszélességet biztosít a processzorok számára, köszönhetően a megemelt órajel (1066 vs. 800 megahertz) és a minden foglalat számára dedikált buszszegmens kombinált hatásának (kettő helyett négy adatbusz). A 34 gigabájt másodpercenkénti áteresztőképesség azonban immár 16, a korábbinál jelentősen nagyobb teljesítményű magra oszlik szét, így a magonként 33 százalékkal magasabb elméleti sávszélesség már csak kevéssé enyhítené a magok éhségét -- a Tulsa-magos Xeon MP ezt brutális méretű L3 cache alkalmazásával kezelte.
A multiprocesszoros rendszerekben az adatbuszok sávszélességének nagy részét felemésztő koherenciaforgalom csökkentésére azonban a Caneland chipsetje, a Clarksboro már szűrőt (snoop filter) alkalmaz 64 megabájtos saját tárral, mellyel leszorítható a buszok elszemetelődése, és a sávszélességeket hatékonyabban képes a rendszer kiaknázni. Ezen túlmenően itt is megjelent a kétutas Bensleynél megismert I/O gyorsító, mely tehermentesíti a processzort a TCP/IP csomagok feldolgozásától, minimalizálva annak processzidőbeli költségét, mely az így felszabadult erőforrásait értékesebb feladatokra fordíthatja.
Hogy a rendszer valóban leadja teljesítményben a nyers erő növekedését, a memóriaalrendszer is áttervezésre került. A Caneland négycsatornás fully-buffered vezérlőt kapott, mely 667 megahertzes FB-DIMM modulokat kezel, és helyes konfiguráció esetén másodpercenként 32 gigabájtos sávszélességet biztosít, ami 25 százalékkal magasabb papíron a Truland DDR2-400-as alrendszerénél. Ezen túlmenően a Caneland immár 256 gigabájt memóriát képes lekezelni, mely alkalmassá teszi még nagyobb adatbázisok és üzleti szoftverek futtatására.
Az FB-DIMM, ahogy neve is mutatja, buffereket alkalmaz a memóriában, aminek következtében nemcsak egyszerűbb és elegánsabb a memóriaalrendszer elektronikai implementációja, hanem az egyidejűleg kiszolgálható memóriaműveletek száma is megugrik, vagyis magas terhelés esetén nagyobb teljesítményt ad le a memória -- alacsonyabb késleltetés, vagy magasabb sávszélesség. Ezért viszont magasabb fogyasztással, és alacsony memóriaterhelés mellett magasabb késleltetéssel kell fizetni.
Hosszú csíkot húz
Az inkább műszaki, tudományos és fejlesztői alkalmazásokra releváns SPECCPU teszt tanúsága szerint a Tigerton/Caneland páros jópár kód alatt drámai mértékű teljesítményugrást mutat a Tulsa/Trulandhez képest, míg más kódok alatt a papírformához képest akár kiábrándító is lehet a változás. A lebegőpontos műveletekből álló, háromdimenziós képalkotáshoz alkalmazott ray-tracingben (POV-Ray) alatt az új Xeon MP platform több mint négyszeres teljesítmény ad le, és hasonló gyorsulás figyelhető meg a molekuláris dinamikai és kvantumkémiai számítások alatt is. Harminc százalék körüli gyorsulás figyelhető meg mindössze ugyanakkor lineáris programozáskor (szimplex algoritmus). Lebegőpontos (SPECfp_rate_base2006) teljesítményben az átlagos növekmény 84 százalékos többletet ad ki a négyutas rendszerek összevetésekor, a fele annyi Opteronnal maggal szemben ugyanakkor mindössze alig 10 százalék a Caneland fölénye, vagyis a négymagos Opteronok minden bizonnyal hamarosan felülkerekednek.
Az egész számokkal végzett kalkulációk közül bődületes gyorsulást mutat a H.264 videokódolás, itt 2,8-szeres teljesítményt ad le a 16-magos Caneland, de a mesterséges intelligenciával kapcsolatos számítások terén is 3-4-szeres sebességet, míg tömörítés és fordítás (bzip2 és gcc) alatt 2 és 2,5-szeres fölényt mutat. Ebben a versenyszámban, az egészpontos műveletekben (SPECint_rate_base2006) a Tigerton/Caneland 2,3-szer erősebb a Tulsa/Tigertonnál, és nagyjából 70 százalékkal mutat nagyobb teljesítmény a legjobb négyutas, 8-magos Opteron rendszernél.
A szerverfeladatokra relevánsabb TPC-C (adatbázis-alapú tranzakciófeldolgozás) tesztben az Intel előzetes becslése (nem hivatalos mérés) szerint 67 százalékkal több tranzakciót képes lekezelni egy csúcskiépítettségű Caneland egy Trulandhez képest, amiben jelentős szerepet játszik a kétszeres memóriakapacitás is. Enélkül nagyjából másfélszeres teljesítményre számíthatunk. Ez az 50 százalékos plusz talán kevésnek tűnik elsőre, ugyanakkor a TPC-C a Tulsa egyik erősségének számít, amit többek között brutális méretű 16 megabájtos L3 tárának, és a HyperThreadingnek köszönhet.
A cikk publikálását követően láttak napvilágot az első hivatalos TPC-C és SAP SD 2-tier eredmények. TPC-C alatt a vártnál gyengébb pontszám született egyelőre. A HP ProLiant DL580 G5 eredménye a Tigerton 4 csúcsváltozatával mindössze 28 százalékkal nagyobb eredményt ért el egy hasonló Tulsa konfigurációnál. Az SAP Sales and Distribution (S/D) tesztjében azonban 75 százalékkal több felhasználót képes egyidejűleg kiszolgálni. Az előzetes eredmények azt jelzik, hogy a Caneland memóriaalrendszere a késleltetésérzékeny alkalmazásoknál kis előrelépést képes tud csak felmutatni.
Villámgyors felfejlődés
Az Intel rendkívül gyors ütemben kívánja felfuttatni a Tigerton/Caneland szállításait. A jelenleg folyó harmadik negyedévben a Xeon MP értékesítések 13, míg a negyedikben 55, a jövő év első negyedévben pedig már 80 százalékát tervezi az új platformmal. A vállalat célja bizonyosan az, hogy az egyes becslések szerint mára a rendkívül nyereséges négyutas x86-os piac akár felét is megszerzett AMD-t minél gyorsabb ütemben visszaszorítsa. Az AMD ugyanis napokon belül indítja útnak következőgenerációs Opteronjait, melyek négy továbbfejlesztett magjukkal jelentősen javítanak majd a vállalat szerverpiaci versenyképességén.
A Caneland nagyjából másfél évig fog az Intel Xeon MP platformjaként szolgálni, otthont adva a jövő év közepére várható, már 45 nanométeres négymagos Dunningtonoknak (Penryn-generáció), mielőtt valamikor 2009-ben az Intel teljesen új rendszerarchitektúrára vált. A CSI (Common System Interface) néven ismert infrastruktúrára tervezett Xeon MP-k integrált memóriavezérlővel és a processzorokat közvetlenül összekötő linkekkel fognak rendelkezni, foglalatonként akkora vagy nagyobb sávszélességet biztosítva, mint ma Caneland teljes aggregát kapacitása.