Frissítve: Lassabb lesz a vártnál a négymagos Itanium, de így is átütő előrelépés
Újabb információk láttak napvilágot az Itanium processzorcsalád közelgő új tagjával kapcsolatban, mely Tukwila kódnévre hallgat. Az Intel mérnökei egy chiptervező konferencián számolnak be a jelentős előrelépést képviselő chipről, aminek kapcsán a vállalat egy konferenciahíváson összegezte a főbb jellemzőit. A Tukwila cache-hierarchiájával kapcsolatos információk frissítésre kerültek.
A Tukwila a 2001-ben debütált Itanium processzorcsalád ötödik generációja, ugyanakkor lényegében továbbra is a 2002-ben piacra került McKinley mikroarchitektúráját implementálja inkrementális továbbfejlesztésekkel. Ez azonban nem jelenti azt, hogy a Tukwila ne képviselne gyökeres fejlődést 2008 végi megjelenésekor: a chippel legalább kétszeres teljesítménynövekedés érhető el az Intel becslése szerint.
A Tukwila az Intel 65 nanométeres csíkszélességű gyártástechnológiájával négy nagyteljesítményű, két utasításszálat felváltva végrehajtó magot integrál egyetlen szilíciumszeletre, összesen 24 megabájt harmadszintű gyorsítótárral (magonként 6 MB L3), és magonként 256 kilobájt dedikált L2 adat és 512 kilobájt dedikált L2 utasítás tárrral -- ez utóbbi fele akkora, mint a Montecito egy-egy magjáé, megjelent viszont az úgynevezett directrory cache, melynek mérete 1,92 megabájt, célja pedig valószínűleg az adatkoherencia támogatása. A lapka mérete megközelíti a 700 négyzetmillimétert, vagyis közel két és félszer nagyobb a négymagos AMD Barcelonánál, ami nem csoda, hiszen több mint 2 milliárd tranzisztorból épül fel.
A magok architekturálisan lényegében megegyeznek a Montecitóval megismert felépítéssel, a mérnökök az elektronikai újratervezésre koncentráltak a fogyasztás kordában tartása és a bithibák valószínűségének leszorítása érdekében. Justin Rattner, az Intel műszaki vezérigazgatója elmondta, hogy a Tukwila nagy része ellenálló a bithibákkal szemben, különösen tekintettel a regiszter fájlokra -- az erőfeszítéseknek köszönhetően a Tukwila a kétszeres tranzisztorszám és az elektromagnetikus sugárzásra érzékeny kisebb struktúrák ellenére a bithibák valószínűsége nem növekedett a Montectio/Montvale-hez képest.
[+] IBM: az Itanium és a SPARC a végét járja; a HP és a Sun szerint ez nonszensz
A Tukwila igazi újdonsága azonban nem a magokban rejlik, hanem a rendszerarchitektúrában. A négymagos Itanium ugyanis a család történetében elsőként szakít a HP PA-RISC elavult buszrendszerének örökségével, és a QuikcPath Interconnect (QPI) nevet kapó (korábban Common System Interface, CSI) pont-pont összeköttetéseket, valamint integrált memóriavezérlőt alkalmaz. A magok számának duplázása mellett az új infrastruktúra is hatalmas előrelépést jelent: a QPI-linkek akár 96 gigabájt másodpercenkénti aggregát sávszélességet is biztosíthatnak más processzorok felé, miközben a két négycsatornás FB-DIMM vezérlő összesen 34 gigabájt áteresztőképességel rendelkezik -- ehhez képest a Montvale legfeljebb 10,6 gigabájtos sávszélességgel gazdálkodhat.
A QPI révén a Tukwila magok gazdag, órajelenként akár 6 utasítás végrehajtására képes erőforrásai magasabb kihasználtsággal üzemelhetnek, a rendszerek pedig sokkal jobban skálázódnak a foglalatok számával. Az Intel szerint Tukwila egy négyutas rendszerben TPC-C és SPECCPU tesztek alatt átlagosan kétszer nagyobb teljesítményt nyújt 25 százalékkal magasabb (130 wattos TDP osztály) fogyasztás mellett, miközben a nagyobb energiaosztályú modellek ennél is nagyobb többletre képesek. A Tukwila gyakorlatilag minden megfelelően többszálusított szoftver esetében hatalmas előrelépést képvisel, leginkább azonban üzleti alkalmazások alatt szerepelhet fényesen.
A Tukwila órajele legfeljebb 2 gigahertz lesz, fogyasztása pedig a International Solid State Circuits Conference alkalmával prezentáltak alapján 170 wattra is rúghat. A TDP lazítását vélhetően az IBM Power6 rendszerekkel szembeni versenyképesség indokolja. Az Intel korábbi prezentációiban indirekt módon 2,5 gigahertzes órajelet ígért, amit valószínűleg csak a Foxton néven ismert energiagazdálkodási technológia aktiválásával lehetne elérni. Úgy tűnik, az eredetileg a Montecitóban implementált Foxton egyelőre a Tukwilában is alvó állapotban marad, az indokokat az Intel nyilvánosan nem tárgyalja, ugyanakkor gyanítható, hogy a Foxton komplex feszültség-órajel szintetizáló mechanizmusa komolyabb validációs problémákat vetett fel.