:

Szerző: Bizó Dániel

2010. február 9. 12:41

Csalódás az új Itanium, de legalább megjelent

Néhány órával az IBM Power7 processzorát követően jelentette be az Intel az Itanium következő generációját, amelyet Tukwila néven ismerünk. A hatalmas csúszások után az Intel újabb csalódást okozott, a chipek lassabbak és éhesebbek a vártnál, ennek ellenére megmentik az Itaniumot.

Az elvesztegetett évtized

Az elmúlt évtizedben minden amellett szólt, hogy az Itanium segítségével az Intel meghódítsa szerverpiac legfelsőbb szegmenseit is, és bevegye a RISC/UNIX- és mainframe-szállítók erődjeit. A hatalmas PC-piaci volumennek köszönhetpen az Intel olyan méretgazdaságosságra tett szert, amelynek más processzorgyártók a közelébe sem érhetnek, és a tömegpiacból kitermelt dollármilliárdos nyereségekből akkora összegeket fordít kutatás-fejlesztésre és beruházásokra, amivel képtelenség a lépést tartani.

Mindehhez társult a kereskedelmi modell, vagyis boldog-boldogtalan vásárolhat Itaniumot, amivel nagyobb piacot és méretgazdaságosságot lehet elérni, mint az IBM, a Sun vagy a Fujitsu vertikálisan erősen integrált UNIX-modelljeivel, amikor egy processzor csak házon belül gyártott szerverekbe kerülhet bele. Az Itanium eredetileg egy sok szervergyártó által nagy forgalmat bonyolító termékcsalád szerepére készült.

Az Intel x86-os gépezetére támaszkodva az Itanium feladata az lett volna, hogy műszakilag egyértelműen maga mögé utasítsa a RISC-es brigádot. Az Itanium elviekben a számítástechnikai tudomány legkorszerűbb koncepcióit valósítja meg, túllépve a CISC és a RISC utasításkészlet-architektúrák vélt vagy valós korlátain, amihez az Intel hatalmas fejlesztési erőforrásait és csúcstechnológiájú gyárait is megkapja, amelyek legalább egy évvel a riválisok előtt járnak.

A Tukwila, avagy polgári nevén Itanium 9300 sorozat, az évtized utolsó Itaniuma, és ezzel nyugtázható, ezt az évtizedet közel elvesztegette az Intel, már ami az Itanium RISC-ölő feladatának teljesítését jelenti. Az elmúlt évtizedben az Itanium processzorcsalád összesen 7 különböző szilíciumon 5 generációt produkált, és ebből három súlyos késésekkel és csalódásokkal terhelt - az Itanium stílusosan katasztrófával kezdte, és kudarccal zárja ezt az időszakot.

Várakozások szerint várakozások alatt

A most piacra kerülő négymagos Tukwilának egy projekttörlést és újraindítást követően 2007 közepén kellett volna megjelennie, a korai várakozások szerint akár 2 GHz feletti órajeleken. Ehhez képest a Tukwila most, közel három évvel az eredeti céldátum után érkezik, 65 nanométeres csíkszélességű gyártástechnológián, amin még a saját üzemekkel nem rendelkező Sun is túllépett már. Az Intel már a kettő generációval fejlettebb eljáráson, 32 nanométeren termeli legújabb x86-os chipjeit.

A Tukwila névleges órajele az extra fejlesztési idő ellenére legfeljebb 1,73 GHz, ami a már megismert Turbo Boosthoz hasonló technikával 1,86 gigahertzig merészkedhet - a Montecito, avagy Itanium 9000 sorozat csúszását okozó Foxton technológia továbbra sincs jelen. Az egyetlen pont, ahol a Tukwila számszerűleg felülmúlja a várakozásokat, a fogyasztás: a chip TDP-je 185 Watt, szemben a korábbi 170 wattos várakozásokkal. Ez az energiakeret 80 százalékkal magasabb az előző, 90 nanométeres kétmagos generációénál, miközben a névleges órajel alig 5 százalékkal magasabb. Pedig a Tukwila magjainak mikroarchitektúrája az eddig publikáltak alapján lényegében megelőzik az elődével, vagyis a 2002-ben debütált McKinely mikroarchitektúra egy továbbcsiszolt változata.

A képlet összetett, mivel figyelembe kell venni az eltérő gyártástechnológiát, a megkétszereződött magszámot, valamint a Tukwila legnagyobb újítását, a buszrendszert leváltó QuickPath pont-pont összeköttetéseket és az integrált memóriavezérlőt, valamint a címtáralapú (directory) koherenciamechanizmust is. A végeredmény azonban egyszerű, a Tukwila elődjéhez képest elektronikailag egyáltalán nem nyújt semmi csettintést érdemlőt, még ha a 2 milliárd integrált tranzisztor és a 700 négyzetmilliméteres méret tiszteletet is követel. Erre a legjobb bizonyíték, hogy az alacsony órajeleken a szakmában gyakorlatilag mindenki meglepődött, mikroelektronika-tervezési tapasztalatokkal rendelkezőket is beleértve. Triviális magyarázat nincs, elképzelhető, hogy a parametrikus selejtarány leszorítása a cél. A teljes modellválaszték az Intel friss árlistájában tekinthető meg.

Az IBM Power7 után az Intel Itanium 9300 egyáltalán nem lenyűgöző. Az IBM 45 nanométeres csúcskategóriás processzora egyetlen gyártástechnológiai ugrással megnégyszerezte és alapjaiban áttervezte a magokat, így azok teljesítménye nem csökkent a Power6-hoz képest, megnyolcszorozta az egyidejűleg kezelhető utasításfonalak számát, megnövelte a memória- és rendszersávszélességeket, átdolgozta a koherenciaprotokollt, és a világon elsőként integrált eDRAM-ot a processzorral közös szilíciumra, valamint számos dinamikus órajelkezelő technikát is bevezet. Mindez nemcsak öncélú mérnöki siker, a Power7 a következő napok és hetek során felbukkanó üzleti benchmarkokban megsemmisíti ellenfeleit.

A Tukwila rajtja azonban más szempontból sem sült el a legjobban. Az Intel korábban azt ígérte, hogy a súlyos csúszásokat követően az Itanium gyártástechnológiai szempontból is ismét partiba kerül, aminek érdekében az átugorja a 45 nanométeres generációt, és a következő generációt, a Poulsont már 32 nanométerre tervezik. Az Intel most úgy fogalmazott, hogy ezentúl szigorúan igyekeznek tartani magukat a kétéves termékfejlesztési ciklusokhoz, vagyis a legfrissebb információk szerint a Poulson valamikor 2012 elején érkezhet. Ez bár valóban elegendő lehet az IBM és az AMD felső szegmensben történő terjeszkedésének befogásához, de az Intel x86-os termékvonalához képest továbbra is nyomasztó hátrányt jelent.

Életmentő

Mindez ugyanakkor nem jelenti azt, hogy az Itanium elbukott, a Tukwila ugyanis minden késlekedése és vártnál gyengébb specifikációi ellenére is hatalmas előrelépést hoz majd az architektúra életében, sokkal ütőképesebbé és versenyképesebbé téve a termékvonalat. Mindezt annak köszönheti, hogy míg az elődök nagy teljesítményű magjai egy szűkös osztott adatbuszon és memóriavezérlőn lógtak, futásidejű elemzések alapján idejük nagyobb részét gyakorlatilag várakozással töltve, addig a Tukwila úszik a sávszélességekben.

A korábban legfeljebb 10,6 GB/s teljes sávszélesség, amelynek a koherenciát, memóriaeléréseket, I/O-t is ki kellett szolgálnia, összesen 130 GB/s elméleti maximumra ugrik. Ebből 96 GB/s jut a többi processzor, távoli memória és I/O felé, és 34 GB/s a lokális memóriához. A Tukwila könnyedén skálázódik addicionális logika nélkül 8 foglalatig, vagyis 32 magig, de a NUMA-topológia bonyolításával és némi skálázódási áldozattal akár a 16 foglalat (64 mag, 128 szál) is triviális módon megvalósítható lenne - a relatív teljesítményveszteség miatt azonban gyakorlatban azonban valószínűleg nem születik ilyen megvalósítás. Ennél nagyobb gépekhez a szervergyártónak kell chipsetet biztosítania. A skálázódást támogatja a címtár alapú koherenciacache is, amellyel minimalizálható a felesleges forgalmazás, így a linkek sávszélességével és a processzorok idejével is hatékonyan bánik egy Tukwila-rendszer.

[+] A Tukwila technikai bemutatása

Mindezek hatása drámai, az Intel belső mérései szerint a Tukwila teljesítménye a rendszer méretétől a kód típusától függően kettő-négyszeresére ugrik, minél nagyobb konfigurációkat és minél sávszélesség és késleltetésérzékenyebb alkalmazásokat vetünk össze, annál jobban. A Tukwila tipikusan OLTP-szerű felhasználási területeken brillírozhat majd, itt a gyorsulás a három-négyszeres tartományban fog mozogni a várakozások szerint. A fejlesztőmérnökök egyetlen vigaszdíjának az ígérkezik, hogy három év késéssel ugyan, de megalkották a világ valaha készült legnagyobb teljesítményű és legnagyobb 65 nanométeres mikroprocesszorát.

Hivatalos benchmarkok egyelőre nem publikusak, mivel az Intel a kommunikáció nagyobb részét a szervergyártó partnerekre bízza. A legnagyobb szállító, a HP azonban majd csak áprilisban magasságában kezd beszélni az új gépekről, és valószínűleg mások, például a Bull eredményeire is várni kell még egy keveset, mire megkezdik a szállításokat.

A Tukwilával szerelt első gépek várhatóan tavasszal érkeznek, és az egyre nagyobb konfigurációk több lépcsőben az év második felében, így a csúcskategóriájú rendszerekkel legkorábban ősszel lehet kalkulálni. Az Itanium bár továbbra sem fogja a RISC-világot megszégyeníteni, köszönhetően az IBM-nek, életben tartja az architektúrát és potens versenyt támaszt majd a kritikus célú szerverek piacán, ami elegendő lesz ahhoz, hogy további teret nyerjen a SPARC és a már kifutott RISC-architektúrák kárára.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról