AMD Athlon 64 FX és Intel Pentium 4 Extreme Edition processzorok tesztje
Az Athlon 64 FX és a Pentium 4 Extreme Edition egyaránt szerverekbe szánt processzorok asztali kiadásban. Vajon az AMD-nek, vagy az Intelnek sikerült jobban a báránybőrbe bújtatott farkasa? A legnagyobb teljesítményű x86 processzorokat felvonultató tesztünkből kiderül.
Eleinte mindenki azt várta, hogy az AMD kizárólag a szerverek piacát célozza meg 64 bites megoldásával, épp ezért volt jelentős meglepetés, amikor kiderült, hogy a vállalat az asztali processzorok területén is be kívánja vetni 64 bites architektúráját. Teltek a hónapok, az évek, egyre több részlet látott napvilágot a K8-ról, és amikor idén tavasszal az AMD piacra dobta a szerverekbe és munkaállomásokba szánt Opteront, a szakma már kívülről fújta a chip újdonságait, azaz a 12 fokozatú futószalagot, az integrált memóriavezérlőt, a Hyper-Transport interfészt és persze a 64 bites felépítést. Jelen cikkünkben a K8 architekrúra részletes felépítését nem tárgyaljuk, hiszen ezt már "Bemutatkozik az AMD Hammer" című írásunkban megtettük.
Az AMD Opteron azonban így is tudott meglepetést okozni, hiszen teljesítmény-mutatói még a legoptimistább becsléseket is felülmúlták, a chip számos tesztben ért el kiemelkedő eredményt, és kiderült, hogy egyes esetekben még a neves gyártók RISC processzorait is meg tudja szorongatni. A jelentős szervergyártók közül az IBM azonnal az Opteron mögé állt, és bejelentette kétprocesszoros eServer 325 kiszolgálóját. Az Opteron a HPC-közösség fantáziáját is megmozgatta, az áprilisi premier óta számos olyan szuperszámítógépről vagy fürtről lehetett hallani, amely az AMD nyolcadik generációs processzorára épül.
Az Opteron tehát látványos sikereket ért el a szerverek területén, azonban amióta nyilvánosságra került, hogy az AMD legújabb generációs asztali processzorai is a K8 magra épülnek, a felhasználók leginkább arra kíváncsiak, hogy vajon méltó ellenfele lehet-e az Intel Pentium 4-nek. Az Opteron teljesítmény-adatait figyelembe véve ez akár nem is lehet kérdés, azonban tudjuk, hogy a szerverek esetében egészen mások a követelmények, mások a futtatott alkalmazások, mint az asztali gépeknél.
Többszöri halasztás és csúszás után szeptember 23-án az AMD fellebbentette a fátylat asztali gépekbe szánt processzorairól. A vállalat semmit sem bízott a véletlenre, és egyszerre rögtön két változattal is előrukkolt, az AMD Athlon 64-et asztali és hordozható számítógépekbe szánja a vállalat, az Athlon 64 FX-et pedig kifejezetten a csúcskategóriás teljesítményt igénylő felhasználók figyelmébe ajánlja.
[oldal:Bemutatkozik az Athlon 64]
Az Athlon 64 és Athlon 64 FX egyaránt 128 Kbyte elsőszintű és 1 Mbyte teljes magsebességen működő másodszintű gyorsítótárat tartalmaz. Az Athlon 64 és Athlon 64 FX között jelentős különbség, hogy előbbi csupán egycsatornás integrált DDR400 memóriavezérlővel rendelkezik, utóbbi DDR400 memóriavezérlője azonban kétcsatornás, amely elvben kétszer akkora -- 6,4 Gbyte/sec -- memória-sávszélességet biztosít a processzor számára. Természetesen a memóriavezérlők támogatják a lassabb -- DDR200, DDR266, DDR333 -- típusú memóriákat is.Mit is eredményez az integrált memóriavezérlő? E funkció rendkívül alacsony késleltetést (latency) biztosít, hiszen a kéréseknek nem kell keresztülhaladni a a front side buszon és a chipkészleten, a processzor közvetlenül a memóriával kommunikál. Az előrelépés annyira jelentős, hogy még maga az AMD is elismeri: a Hammer teljesítménye elsősorban e megoldás révén múlja felül a korábbi generációs Athlonokét. A vállalat becslései szerint a K8 azonos órajelen az integrált memóriavezérlőnek köszönhetően mintegy 20-25 százalékkal gyorsabb a K7-nél, az egyéb architekturális fejlesztéseknek betudható teljesítménynövekedés csupán pár százalékra tehető.
Az Athlon 64 FX az Opteronéhoz hasonló memóriavezérlőt tartalmaz, ami azt jelenti, hogy a processzor kizárólag regiszteres ECC memóriamodulokkal használható, amelyek DDR400 kivitelben egyelőre csak igen kevés gyártó kínálatában érhetőek el és igen drágák. A pletykák szerint a jövő év elején megjelenő Athlon 64 FX modellek már nem igénylik a méregdrága memóriák meglétét. Ezek a chipek 940 helyett már csak 939 tűs tokozással rendelkeznek.
Opteron | Athlon 64 FX | Athlon 64 | |
Felhasználás | szerver, munkaállomás | munkaállomás, high-end PC | PC, notebook |
Tranzisztorok száma | 105,9 millió | 105,9 millió | 105,9 millió |
Magméret | 193 mm2 | 193 mm2 | 193 mm2 |
Elsőszintű gyorsítórár | 128 kbyte | 128 kbyte | 128 kbyte |
Másodszintű gyorsítótár | 1 Mbyte | 1 Mbyte | 1 Mbyte |
Hypertransport link | 3 | 1 | 1 |
Integrált memóriavezérlő | 144-bit DDR333 | 144-bit DDR400 | 64-bit DDR400 |
Memória sávszélesség | 5400 MByte/sec | 6400 Mbyte/sec | 3200 Mbyte/sec |
SMP támogatás | van, 2-8 CPU | nincs | nincs |
Foglalat | Socket 940 | Socket 940 | Socket 754 |
Az Athlon 64 és Athlon 64 FX processzorok magja egyaránt 105,9 millió tranzisztorból áll és az AMD által jelenleg alkalmazott, 0,13 mikronos csíkszélességű SOI (silicon-on-insulator) gyártástechnológiával előállítva 193 mm2 méretű. A chipek egyaránt 1,55 Voltos magfeszültséggel működnek. Az Athlon 64 processzor 754 tűs kerámiatokozásban kerül forgalomba, az Athlon 64 FX kerámiatokozásán -- a kétcsatornás memóriavezérlő miatt -- 940 kivezetés található.
Az Athlon 64 premierjét érdekes mozzanat előzte meg. A szeptember közepén rendezett Intel Developer Forum első napján Louis Burns, az Intel asztali platformokért felelős igazgatója váratlanul bejelentette a vállalat legújabb processzorát, amely a Pentium 4 Extreme Edition nevet kapta. A gigászi, 2 Mbyte harmadszintű gyorsítótárral rendelkező chipet a vállalat elsősorban a számítógépes játékok kedvelőinek, illetve asztali gépek csúcsteljesítményre éhező tulajdonosainak szánja.
[oldal:Felsorakoznak az ellenfelek]
Szerkesztőségünk egy 2,2 GHz-es Athlon 64 FX-51 processzorra és ASUS SK8N alaplapra épülő tesztkonfigurációt látott vendégül, amelyet az AMD termékek magyarországi disztribútora, az Elbatex Kft. juttatott el hozzánk. A gyönyörű -- és méregdrága -- CoolerMaster WaveMaster házban terpeszkedő számítógépben 2x512 Mbyte DDR400 regiszteres ECC memória kapott helyet. Noha hozzánk a gép GeForce FX 5900 Ultra videokártyával érkezett, első dolgunk volt ennek lecserélése; a teljesítményteszteket ATI Radeon 9800 Pro kártyával végeztük. Az nForce3 Pro 150 chipkészletre épülő SK8N alaplapba a legújabb, 1003 verziójú végleges állapotú BIOS-t írtuk be.Ellenfélként két Intel-alapú rendszer állítottunk hadrendbe, egyikben 3,2 GHz-es Pentium 4, másikban pedig Pentium 4 Extreme Edition processzor teljesített szolgálatot. A konfigurációk alapja mindkét esetben ugyanaz az Intel D875PBZ alaplap és 2x512 Mbyte DDR400 memóriamodul volt. A grafikus kártya természetesen itt is ATI Radeon 9800 Pro volt. Mindkét számítógépre Windows XP Professional operációs rendszert telepítettünk, a videokártyát pedig a legújabb, 3.8 verziószámú Catalyst driverrel hajtottuk.
Pentium 4 | Pentium 4 EE | |
Felhasználás | PC | High-end PC |
Mikroarchitektúra | NetBurst | NetBurst |
Kódnév | Northwood | Gallatin |
Tranzisztorok száma | 55M millió | 169 millió |
Csíkszélesség | 0,13 mikron | 0,13 mikron |
Mag mérete | 141 mm2 | 237 mm2 |
L1 I$ | 12 ezer mikroutasítás | 12 ezer mikroutasítás |
L1 D$ | 8 kbyte | 8 kbyte |
L2 cache | 512 kbyte | 512 kbyte |
L3 cache | nincs | 2 Mbyte |
Hyper-Threading | támogatott | támogatott |
Front side busz | 800 MHz | 800 MHz |
FSB sávszélesség | 6,4 Gbyte/sec | 6,4 Gbyte/sec |
Foglalat | Socket478 | Socket478 |
Noha az Athlon 64 FX-et tartalmazó tesztkonfigurációra Windows XP 64-bit Edition operációs rendszer is fel volt telepítve, ezzel a változattal teljesítményméréseket nem folytattunk, ugyanis az általunk használt grafikus kártyához még nem érhető el a megfelelő meghajtóprogram. Az NVIDIA azóta már kiadott egy AMD64 rendszerekben használható, béta állapotú Detonatort, azonban ez pár nappal azután történt, hogy a tesztkonfigurációt visszaadtuk jogos tulajdonosának. A "Windows XP 64-bit Edition for 64-bit Extended Systems" operációs rendszer végleges változata a jövő év második felében várható, talán addigra a driverfejlesztők is összekapják magukat.
Korábban már szóltunk róla, hogy az Athlon 64 FX-51 kétcsatornás memóriavezérlővel rendelkezik. Tesztünk során a rendszer teljesítményét egycsatornás beállítás mellett is megmértük. Az így elért eredmény hellyel-közzel megfeleltethető egy azonos órajelű Athlon 64 eredményének, noha ilyen változat egyelőre nincs a piacon. Bár kétségtelen, hogy ez a beállítás nem feltétlen tekinthető "üzemszerű" állapotnak, mégis rendkívül zavaró volt, hogy a számítógép rendkívül instabillá vált, egyes tesztprogramok nem futottak le, a rendszer többször lefagyott vagy resetelt. Kétcsatornás működés esetén semmiféle hibajelenséget vagy instabilitásra utaló jelet nem tapasztaltunk.
[oldal:Szintetikus tesztek, professzionális alkalmazások]
A memóriával kapcsolatos méréseket az AIDA32 és a ScienceMark segítségével végeztük el.
AIDA32
ScienceMark 2.0 beta
Az eredmények nem túl meglepőek, a kétcsatornás memóriavezérlővel rendelkező Athlon 64 FX-51 messze megelőzi vetélytársait. Az integrált memóriavezérlőnek köszönhető alacsony késleltetés jól látható a ScienceMark grafikonról: az AMD processzor esetében a memória-hozzáférés ideje mind órajelciklusok számát, mind pedig másodpercben mért időt tekintve lényegesen rövidebb, mint az Intel Pentium 4 esetében.
Az irodai és multimédiás alkalmazásokból álló SYSmark 2002 tesztben az Intel Pentium 4-alapú rendszer került előre, de ez sem meglepetés, politikailag korrekten fogalmazva azt mondhatjuk, hogy az Intel processzoros számítógépek hagyományosan jól szerepelnek ebben a benchmarkban.
SYSmark 2002
Érdemes figyelmünket azonban az Athlon 64 FX és a Pentium 4 közötti különbségre irányítani, ami szinte minimális. Az összehasonlíthatóság érdekében a táblázatban egy Athlon XP 3200+ processzorra épülő rendszer eredménye is szerepel. Az Athlon 64 FX-51 és az Athlon XP közötti különbség szembeszökő, ez egyfelől nyilván az integrált memóriavezérlőnek köszönhető, másfelől pedig annak az örvendetes ténynek, hogy az Athlon 64 processzorok is támogatják az SSE2 utasításokat, ami jótékony hatással van a multimédiás alkalmazások alatt mutatott teljesítményre.
Noha nem túl széles körben ismert, benchmarknak mégis kiváló az AudioGoGo 2.0 MP3-tömörítő alkalmazás, amelynek kódoló modulja -- a népszerű LAME továbbfejlesztése -- a ma létező összes x86-kiterjesztés használatára fel van készítve és támogatja a Hyper-Threading technológiát is. Ennek köszönhetően a tömörítési idő rendkívül alacsony, a tesztben használt 560 Mbyte méretű WAV állományt az AudioGoGo bő fél perc alatt alakította át 160 kbps bitrátájú sztereó MP3 fájllá.
AudioGoGo 2.0
Noha arra számítottunk, hogy e streaming-jellegű alkalmazásban a Pentium 4 kerül előre, tévedtünk, az AMD processzoros rendszerek minimális különbséggel ugyan, de felülkerekedtek. A fenti táblázatban megadott értékek másodpercek, azaz a kisebb érték jelent nagyobb teljesítményt.
Dr. DivX 1.0.3
Hasonlóan meglepő eredményt kaptunk a Dr. DivX videotömörítő alkalmazás futtatásakor. Ebben a tesztben a Matrix: Reloaded című film első 30:29 percét alakítottuk át MPEG2 formátumból DivX-be, a DivX Pro 5.1 kodek használatával. A leggyorsabban az Athlon 64 FX-51 végzett, a 45700 képkockából álló anyagot 20,4 fps sebességgel alakította át. A fenti táblázatban megadott értékek másodpercek, azaz a kisebb érték jelent nagyobb teljesítményt.
SPECViewPerf 7.0
Cinebench 2003
A professzionális grafikai teljesítményt a SPECViewPerf 7.0, illetve a Maxon Cinebench 2003 szoftverekkel mértük le. Előbbiben az Athlon 64 FX magabiztosan győzött, utóbbinak rendering tesztjében a Pentium 4 Hyper-Threading funkciója miatt messze maga mögött hagyta a vetélytársat.
[oldal:Játéktesztek]
Ami a játékokat illeti, három first person shooter és egy szimulátor került a képbe. A Wolfenstein: Enemy Territory egy ingyenesen letölthető online fps, amely a Quake III motor továbbfejlesztett változatára épül. A Halo a Microsoft Xbox nagysikerű játékának PC-s átirata, ami rendkívül hardver-igényes, az Unreal Tournament 2003-at valószínűleg senkinek sem kell bemutatni. A Comanche 4 egy DirectX motorra épülő helikopter-szimulátor. A teszteket 640x480 és 1024x768 pixeles beállításban futtattuk, a hangot kikapcsoltuk. A Wolfenstein és a Halo esetében 640x480 pixeles beállítás esetén a grafikai részletességet minimálisra csökkentettük.
Wolfenstein: Enemy Territory
Unreal Tournament 2003
Halo
Comanche 4
Az Athlon 64 FX-51 messze maga mögött hagyja a konkurenciát, még egycsatornás memóriakonfiguráció esetén is felülmúlja a Pentium 4-et, egyedül a Pentium 4 Extreme Edition tud lépést tartani az Athlonnal. A 2 Mbyte harmadszintű cache láthatóan jót tesz a Pentium 4 eredményeknek, a teljesítmény látványosan javul.
[oldal:Konklúzió]
Az elvégzett tesztek alapján nem lehet vitás, hogy az Athlon 64 FX-51 a ma kapható legnagyobb teljesítményű x86-processzor. Sajnos ezt a tényt nem a HWSW derítette ki, vagyis már mások is tudják, épp ezért magas, 733 dolláros ára ellenére a termék iránti kereslet felülmúlja a kínálatot, az Athlon 64 FX-51 szinte mindenhol hiánycikknek számít, ráadásul a kiszolgálásához szükséges, regiszteres DDR400 memóriamodulok sem találhatók meg minden sarki üzletben.Természetesen azt is el kell ismernünk, hogy 925 dolláros listaár mellett a Pentium 4 Extreme Edition sem az ár/teljesítmény arány bajnoka, bár ennek a megoldásnak annyi előnye azért van, hogy bármelyik i875P vagy i856P/G chipkészletes alaplapban használható és nem igényel speciális memóriát sem, azonban a teljesítménye nem éri el az Athlon 64 FX-ét. Utóbbi egy kiváló termék, a ma létező -- de sajnos nem kapható -- legjobb. Vitának helye nincs.
Az AMD-től és az alaplapgyártóktól származó információk szerint a harmadik negyedévben 10 ezer, a negyedikben 15 ezer, a jövő év első negyedévében 330 ezer, a második negyedévben pedig 1,5 millió Athlon 64 FX processzor leszállítása várható. Egyelőre úgy tűnik, hogy az AMD nyilatkozatai ellenére sem oldódtak meg teljesen az Athlon 64 gyártásánál használt technológia problémái. További nehézséget okoz a chipek rendkívül nagy magmérete: egy 193 mm2 maggal rendelkező lapka tömeggyártása még a fejlett félvezetőgyártási technológiával rendelkező AMD számára is problémát okozhat, hiszen a vállalat mindössze egyetlen chipgyárral rendelkezik, amelynek maximális kapacitása mindössze heti 6000 darab 200 milliméteres wafer.
Elemzők egyetértenek abban, hogy a vállalatnak minél hamarsabb be kell vezetnie a 90 nanométeres csíkszélességű gyártástechnológiát, amelynek nyomán lényegesen csökkenhet a chipek magmérete és növekedhet a legyártott lapkák száma. A vállalat tervei szerint a 90 nanométeres technológiával gyártott chipek legkorábban a jövő év második negyedévében kerülhetnek kereskedelmi forgalomba. További előrelépést jelentene a 300 milliméter átmérőjű waferekre való átállás, azonban a cég tervei szerint ez csak a 65 nanométeres csíkszélesség bevezetésével együtt történik meg, amire várhatóan 2006 környékén kerülhet sor.