:

Szerző: Bodnár Ádám

2007. május 21. 18:03

Minden idők legerősebb processzora: itt a 4,7 gigahertzes IBM Power6

Az IBM bejelentette Power6 processzorát, illetve a ráépülő első szervereket. A vállalat állítása szerint a 4,7 GHz-es Power6 minden idők legerősebb processzora, kétszer gyorsabb elődjénél, a Power5-nél.

[HWSW] Az IBM bejelentette Power6 processzorát, illetve a ráépülő első szervereket. A vállalat állítása szerint a 4,7 GHz-es Power6 minden idők legerősebb processzora, kétszer gyorsabb elődjénél, a Power5-nél.

Energiatakarékos bestia

Amint azt lapunk már korábban megírta, a kétmagos Power6 az IBM 65 nanométeres technológiájával készül az East Fishkill-i üzemben. A chip több mint 790 millió tranzisztort tartalmaz és 341 négyzetmilliméter méretű, amelynek jelentős részét az integrált 8 megabájt L2 cache teszi ki, amelyből egy-egy magra 4 megabájt jut. Bár a Power6 órajele több mint kétszerese a Power5 család legerősebb, 2,3 GHz-es változatáénak, a fogyasztása lényegében változatlan. Ezt energiatakarékos technikák erőteljes alkalmazásával érték el az IBM mérnökei.

A Power6-ban csak a processzormagok üzemelnek a chip névleges órajelén, más részegységek ennek a felével futnak csak, emellett a lapka órajele és feszültsége működés közben csökkenthető a fogyasztás és hőtermelés mérséklése érdekében. Az egész processzort úgy tervezték, hogy képes legyen alacsony feszültségen is működni, ennek köszönhetően a Power6 változtatás nélkül alkalmazható akár blade szerverekben is. Azok a részegységek, amelyek valamilyen oknál fogva nem tudnak alacsony feszültségen üzemelni, saját tápvonalon vannak. Az IBM mérnökei a Power6 egyes részegységeit kézzel optimalizálták a minél alacsonyabb fogyasztás érdekében.

A Power6 magjai egyenként két utasításszál párhuzamos végrehajtására képesek. A chip futószalagjának hossza lényegében megegyezik a Power5 mikroarchitektúráéval, és nagyjából hasonló a végrehajtóegységek felépítése is. A Power6 egész futószalagja azonban in order, vagyis az utasítások végrehajtása szigorúan sorrendben történik. Ez lehetővé teszi a futószalag egyszerűbb kialakítását és az extrém magas órajel elérését. A teljesítmény csökkenését agresszív prefetcheléssel rejtették el: a szál megakadása esetén a chip azonosítja a független LOAD utasításokat és az adatokat a cache-be tölti, hogy mire a végrehajtás rájuk kerül, elérhetők legyenek.

A saját fejlesztésű memóriainterfész lehetővé teszi, hogy a nem használt memóriákat ki lehessen kapcsolni, illetve akár le is lehet lassítani a memóriaműveleteket, ha túlmelegedés veszélye áll fenn -- bár a teljesítmény ilyenkor nyilván csorbát szenved, mégsem kell az egész gépet leállítani. Az IBM állítása szerint a Power6 a Power5-höz képest összességében kétszeres teljesítményt nyújt azonos fogyasztás mellett, vagy azonos teljesítmény mellett fele annyit fogyaszt.

Érdekes újításként a Power6 tartalmaz egy olyan lebegőpontos egységet, amely tizes számrendszerben számol, ami jótékony hatással van az üzleti alkalmazások (pl. ERP) alatt nyújtott teljesítményre. Ilyen megoldással már korábban is találkozhattunk más chipekben, azonban a Power6 az első "UNIX-processzor", amely képes erre. A lapka emellett -- a Power5-höz hasonlóan -- támogatja az AltiVec vektoros utasításkészlet végrehajtását is.

Sávszélesség, sávszélesség, sávszélesség!

Amiben a Power6 lényegesen előrelépett a Power5-höz képest, az a rendelkezésre álló sávszélesség. A saját fejlesztésű SMI (Synchronous Memory Interface) memória irányába másodpercenként 70 gigabájt a sávszélesség, az off-chip L3 cache irányába 75 GBps, az I/O sávszélesség pedig 19 GBps -- 4,7 GHz-es órajelet feltételezve. Az I/O link a Power5 esetében az órajel harmadán futott, a Power6-nál viszont már az órajel felén. Figyelembe véve az órajel kétszeres emelkedését, I/O-szinten háromszoros sávszélességről beszélhetünk.

Az előző generációs Power processzorokhoz hasonlóan a Power6 lapkák is ún. mulitchip modulokba vannak szervezbe, egy ilyenben legfeljebb négy darab processzor (egyenként két maggal) és a hozzájuk tartozó L3 cache található. A multichip modulon belüli kommunikáció másodpercenkénti 75 gigabájtos sávszélességű csatornákon zajlik -- a Power5 esetében ennek kevesebb mint fele állt rendelkezésre. A multichip modulok közötti sávszélesség másodpercenként 47 gigabájt. Egy szerverbe legfeljebb 8 multichip modul, azaz összesen 32 processzor építhető be, ami 64 magot és 128 párhuzamos programszálat jelent.

A Power6 erejét mi sem bizonyítja jobban, hogy a chipre épülő új System p 570 szerver összesen 25 különféle benchmark-rekordot állított fel, köztük a SPECint2006, SPECfp2006, SPECjbb205 és TPC-C tesztekben. Ez az első eset, hogy e négy tesztben ugyanazon rendszeré a legjobb eredmény. Az online tranzakciókezelést vizsgáló TPC-C tesztben a 8 processzoros System p 570 némileg nagyobb eredményt produkált egy 16 darab Power5 chippel szerelt eServer p5 595. A 8 darab Power5 processzoros p5 570-nál a Power6-tal szerelt verzió 60 százalékkal fürgébb.

a címlapról