Rajtra készen: Intel Pentium 4
Cikkünkben a Pentium 4 bemutatása mellett szeretnénk sorra venni, miben is különbözik elődjétől, a Pentium III-tól, és be szeretnénk mutatni a processzor szűkebb környezetét, azaz az i850 chipkészletet is. Minderre kiváló apropót szolgáltatott a processzor Budapesten tartott európai sajtó-premierje.
Európa összes részéből idesereglettek az újságírók, hogy lássák azt a chipet, amely az Intel reményei szerint az elkövetkezendő években egyértelműen meghatározza a legfelsőbb kategóriás asztali gépek és munkaállomások paramétereit. A rendezvényen az Intel részéről a német Jürgen Thiel (az európai, közel-keleti és afrikai régiók értékesítési vezetője) és a lengyel Pawel Gepner (a Pentium 4 termékspecialistája) mutatták be a Pentium 4 processzor legfontosabb jellemzőit.
Az Intel jelenlegi termékpalettáján található Pentium III és Celeron, valamint a már kifutott Pentium II processzorok alapját képező "P6" mikroarchitektúra 1995-ben debütált a Pentium Pro-ban. Sokak szerint a P6 a maga öt éves múltjával már-már múzeumba való őskövület, mások szerint azonban egyszerűen csak kiállta az idő próbáját, hogy most átadja a helyét egy korszerűbb megoldásnak.
[oldal:A vizuális Internet látomás]
Talán egy évvel ezelőtt lehetett, hogy az első részletek napvilágot láttak az Intel "Willamette" nevű processzoráról, amelyet a Pentium III leváltására tervezett. Később kiderült, hogy a gyártó Intel szeretné továbbvinni a népszerű Pentium nevet, így a processzor a keresztségben a Pentium 4 nevet kapta. Ez alatt az egy év alatt szinte hihetetlen mennyiségű spekuláció, elemzés, érv és ellenérv látott napvilágot ezzel a processzorral kapcsolatban, de a mai nappal a találgatásoknak vége szakad, ugyanis az Intel hivatalosan is bejelentette az 1,4 és 1,5 GHz sebességű Pentium 4 processzort.
Az Intel látomása szerint a jövő egyértelműen a teljesen grafikus és interaktív "vizuális Internet" korszaka lesz. A vizuális Internet olyan számításigényes alkalmazások futtatását követeli meg, mint a valósidejű 3D grafika, adattitkosítás, multimédiás állományok be- és kitömörítése. A Pentium 4 processzort ilyen feladatok elvégzésére fejlesztették ki az Intel mérnökei, és a chip alapját képező mikroarchitektúrát a hangzatos NetBurst névvel illették. Cikkünkben a mikroarchitektúra bemutatása során szeretnénk sorra venni, miben is különbözik a Pentium 4 elődjétől, a Pentium III-tól, és be szeretnénk mutatni a Pentium 4 szűkebb környezetét, azaz az i850 chipkészletet is.
Az Intel reményei és tervei szerint a NetBurst mikroarchitektúra nem csak a Pentium 4 processzor, hanem számos jövőbeli termék alapjául is szolgál majd, ezért megalkotásánál fontos szempontot jelentett a skálázhatóság. Ez alatt jelen esetben azt értjük, hogy a NetBurst lehetőséget ad olyan órajel-tartományok elérésére, amely a Pentium III-mal annak tervezésből adódó korlátjai miatt - már lehetetlen lenne.
[oldal:A Hyper-pipeline jelentősége]
A NetBurst mikroarchitektúra egy teljesen újratervezett megoldás, ami bár sok helyen megtartotta elődjének, a P6-nak a sajátosságait, mégis merőben eltér attól. Ha valaki ránéz egy processzorra, az első kézenfekvő kérdése az órajelre irányulhat. Nos, a Pentium 4 bejelentésekor 1,4 és 1,5 GHz-es kivitelekben hozzáférhető, azaz az induló órajele 40 illetve 50 százalékkal magasabb a leggyorsabb Pentium III órajelénél, mindezt azonos, 0,18 mikronos csíkszélességű gyártástechnológia mellett. Ezt a hyper-pipelined technológia teszi lehetővé.A Pentium 4 hasonlóan a Pentium III-hoz szuperskalár felépítésű futószalag-processzor. Ez azt jelenti, hogy az utasítások végrehajtása időben és térben egyaránt párhuzamosított. Ám amíg a P6 mikroarchitektúra futószalagja 10-fokozatú, a NetBurst-ben ennél pontosan kétszer nagyobbat, 20-fokozatút találunk. Azaz a végrehajtandó utasításokat sokkal több részfeladatra bontja le a NetBurst, mint a P6. A részfeladatokat elvégző áramköri elemek bonyolultsága ezzel csökkenthető, ami lehetőséget ad az órajel növelésére. Az Intel reményei szerint a Pentium 4 még a jelenleg elterjedt 0,18 mikronos gyártástechnológia alkalmazásával is elérheti az 1,7 vagy 1,8 GHz-es órajelet - erre a Pentium III már nem alkalmas.
A NetBurst csakúgy, mint a P6 spekulatív elágazásbecsléssel dolgozik, azaz a vezérlésben (programban) található elágazások becslése után képes a kód átrendezésére és nem-sorrendi végrehajtására (out-of-order execution). Ennek lényege, hogy a kód a lehető leginkább a hardverre illeszthető és a processzor leghatékonyabb kihasználtsága biztosítható.
Mindkét mikroarchitektúra valódi dinamikus elágazásbecslést használ, azaz a korábbi elágazásbecslések eredménye alapján jelzi előre a soron következő elágazások végrehajtásának menetét. A korábbi becslések eredményeit tároló puffer (branch target buffer) a P6 esetében 512 bejegyzést tartalmazott, míg a NetBurst esetében ezt 4096-re növelték. Továbbá finomítottak az elágazásbecslő rutinon is, az Intel állítása szerint a P6 helytelen becsléseit további 33 százalékkal redukálták.
[oldal:Az Execution Trace Cache]
Miért is fontos a minél pontosabb elágazásbecslés? Mert téves becslés esetén a futószalag fokozataiból ki kell törölni a betöltött utasításokat és a program futtatását a másik (helyes) ágon kell folytatni, azaz fel kell tölteni a futószalag fokozatait. Könnyen belátható, hogy egy 20-fokozatú futószalag esetén ez a művelet több időt vesz igénybe, mint egy 10-fokozatú futószalagnál.Az Intel a NetBurst megtervezésénél ezért komoly figyelmet fordított a téves elágazásbecslések elkerülésére és kezelésére. A fent leírt módszereken kívül alkalmazták az Execution Trace Cache-t, amely tulajdonképpen a korábbi processzorokból ismert elsőszintű utasítás-cache implementációja. A korábbi gyakorlat szerint az elsőszintű utasítás-cache x86 utasításokat tartalmazott. Ennek mérete a P6-nál 8 kbyte volt.
Az Execution Trace Cache ezzel szemben már dekódolt x86 utasításokat, azaz mikroutasításokat tárol. Ez két esetben is jól láthatóan növeli a processzor hatékonyságát. Egyrészt ciklusoknál nincs szükség egy utasítás többszöri dekódolására, másrészt téves elágazásbecslés esetén is megtakarítható az ismételt dekódolás, hiszen az elágazás mindkét ágának utasításai az Execution Trace Cache-ben találhatók. Ez a cache egyébként 12000 mikroutasítás tárolására alkalmas.
Az adatok folyamatos áramlását biztosítandó a NetBurst-ben a hatékony nem-sorrendi utasításvégrehajtás érdekében a (vezérlés-, adat- és erőforrás) függőségek feloldásához 126 utasításos ablakot alkalmaztak, ami a P6-ban található 42 utasításos ablak háromszorosa.
Miért is van szükség az adatfolyam minél folyamatosabbá tételére? Mert a nagyfrekvenciás mikroarchitektúrák esetében a legtöbb gondot a várakozás okozza. A NetBurst-ben található Rapid Execution Engine lehetővé teszi, hogy az ALU-k (arithmetical logical unit) a processzor órajelének kétszeresével üzemeljenek, ezzel lehetővé téve egyes utasítások számára, hogy akár 1/2 órajel alatt hajtódjanak végre. Ezzel csökkenthető a késleltetés (latency) és lehetőség adódik az egy órajel alatt elvégzett utasítások számának növelésére. (A félreértések elkerülése végett: az 1,4 GHz-es Pentium 4 esetén az ALU-k 2,8 GHz effektív sebességgel üzemelnek.)
[oldal:A cache-struktúra és az SSE2]
A NetBurst cache-struktúrája az Execution Trace Cache alkalmazásán kívül másban is eltér a P6-ban megismerttől. Bár az adatcache mérete nem változott, azaz továbbra is 8 kbyte maradt, az elérési idejét jelentősen csökkentették, 3 órajelciklusról 2-re. Valós időben ez azt jelenti, hogy egy 1 GHz sebességű Pentium III processzoron egy utasítás betöltése 3 nanosecundum alatt megy végbe, egy 1,4 GHz-es Pentium 4 esetében ez 1,4 nanosecundum. A NetBurst 8 kbyte-os adatcache-e 4 utasan asszociatív és 64 byte-os "csatlakozókkal" látták el.A másodszintű cache a Pentium III Coppermine chipekből már ismert, Advanced Transfer Cache-nek nevezi az Intel. A NetBurst esetében ez a processzor órajelével működik, 256 kbyte méretű, 8 utasan asszociatív és 128 byte-os vezetékeken keresztül kommunikál a "külvilággal". Mind az első-, mind a másodszintű cache sávszélessége 44,8 Gbyte/sec (1,4 GHz-es processzort figyelembe véve), azaz közel háromszor nagyobb az 1 GHz-es Pentium III cache-struktúrájának 16 Gbyte/sec sávszélességénél.
A Pentium 4 rendszerbusza gyökeresen megváltozott elődjéhez képest. Míg a Pentium III 100 vagy 133 MHz sebességű 64 bites buszt használt, és ezzel legfeljebb 800 illetve 1060 Mbyte/sec átviteli sebességet érhetett el, a Pentium 4 rendszerbusza effektív 400 MHz órajelű, ami 3200 Mbyte/sec csúcssebesség elérését teszi lehetővé. Ez a Pentium 4 egyik legnagyobb előnye elődeihez és vetélytársaihoz képest. A processzorhoz tervezett i850 chipkészlet kétcsatornás RDRAM vezérlővel rendelkezik, és PC800 RDRAM modulokat figyelembe véve épp képes kielégíteni a Pentium 4 hatalmas étvágyát, már ami az adatokat illeti.
Nem szóltunk még egy fontos újításról, az SSE2 (Streaming SIMD Extension 2) utasításkészletről. Ez 144 új SIMD (single instruction multiple data) utasítást jelent, amelyek segítségével lehetővé válik 128 bites egész SIMD és 128 bites kettős pontosságú lebegőpontos SIMD műveletek elvégzése is. Ez főképp olyan nagy számításigényű feladatoknál jön jól, mint a kép-, hang- és beszédfeldolgozás, grafika, adattitkosítás vagy tudományos alkalmazások. Az SSE2 támogatásának erősödésével a Pentium 4 kulcspozícióba kerülhet azon processzorokkal szemben, melyek nem képesek ezen utasítások kezelésére. A jövőben várhatóan egyre több és több szoftver jelenik meg, melyet optimalizálnak az SSE2 új utasításaira, ezek segítségével a Pentium 4 teljesítménye ugrásszerűen növelhető. Az SSE2 utasításkészlet a tervek szerint megtalálható lesz az AMD x86-64 (Clawhammer, Sledgehammer, stb.) processzoraiban is.
[oldal:A Pentium 4 kívülről]
Nos, a processzor "belsejének" áttekintése után nézzük meg a külsejét is! A Pentium 4 processzorok jelenleg 1,4 és 1,5 GHz-es kivitelben kaphatók, FCPGA tokozással készülnek és Socket423 foglalatba illeszthetők. Bár a chip hőleadása kisebb, mint azt korábban jósolták, a tervezők semmit sem bíztak a véletlenre és a jobb hőleadás érdekében aprócska fémsapkával látták el, ami nagyobb felületen tudja a hűtőbordának átadni a hőt.
A Pentium 4 egyébként speciális hűtőbordát igényel, az Intel kifejezetten rézből készült darabokat ajánl hozzá. A bordákat nagy tömegük miatt olyan módon alakították ki, hogy az alaplapon kívül a számítógép házához is rögzíteni lehessen őket sőt, ez szükséges is.
A Pentium 4 stabil energiaellátását biztosítandó az ATX tápcsatlakozón kívül egy dedikált 12V-os csatlakozót is elhelyeztek az alaplapokon, amelyre a speciális ATX12 tápegységek megfelelő kábelét kell csatlakoztatni. Összességében ez azt jelenti, hogy aki Pentium 4-alapú rendszert szándékozik építeni, annak új alaplap, ház és tápegység is szükséges természetesen a processzoron kívül.
Fotó: GamePC
A korábban már említett i850 chipset sokban hasonlít a Pentium III-alapú munkaállomásokhoz kifejlesztett i840-hez. Mindkét lapkakészlet dual-channel RDRAM vezérlővel van ellátva, ezzel 3,2 Gbyte legnagyobb átviteli sebességet érhetnek el, támogatják az AGP 4x módot és 266 Mbyte/sec sebességgel képesek az I/O eszközökkel kommunikálni. A dual-channel RDRAM vezérlő két azonos méretű RDRAM modul meglétét feltételezi, azaz a memóriákat (hasonlóan a SIMM modulokhoz) párban kell majd használni és vásárolni. Ez némileg megnehezíti majd a bővítést, de valószínűleg cserében eddig még sosem látott memóriasebességet kapunk, ami minden alkalmazás futási sebességére jótékony hatással van. A Pentium 4 alaplapokon minden valószínűség szerint az Intel ICH2 southbridge-et találjuk majd, amely legfeljebb 6 PCI slot és 4 USB port kezelésére képes, ezen kívül tartalmaz egy 10/100 Mbit Ethernet és egy kétcsatornás ATA/100 kompatibilis IDE vezérlőt.
[oldal:A jövő processzora - ma]
Miután mi magunk még nem tesztelhettünk Pentium 4 processzoros gépet, nem nagyon tudunk az új chip teljesítményéről nyilatkozni. Persze a világhálón több teszteredmény is található, de ezeknek az eredménye nagyonis eltérő. Az mindenesetre bizonyos, hogy a Pentium 4 egy teljesen új utat jelöl ki a modern PC-k számára.Az Intel tervei szerint a Pentium 4 chipek minden eddignél gyorsabban fognak elterjedni, és minden alkatrész elegendő mennyiségben áll rendelkezésre ahhoz, hogy a valóságban is így történhessen. A nagy PC-gyártók egyike sem akar kimaradni az őrületből, mint ahogy a nagy alaplapgyártók is teljes mellszélességgel az Intel mellett állnak.
A bemutató látványosságai
Az egyetlen kérdés, hogy vajon a rendszerek ára mikor zuhan annyira, hogy egy átlagember is megengedhessen magának egy ilyen számítógépet. Nos, az Intel szerint 2002 előtt biztosan nem. Addig is csak reménykedünk, hogy sikerül egy tesztkonfigurációt beszereznünk attól a Senorg Rt-től, aki már a bemutatón is kiállította Pentium 4-alapú számítógépét. Ha ez sikerül, első kézből számolhatunk be olvasóinknak a szerzett tapasztalatokról.