NVIDIA GeForce 6800: új a nap alatt
Az eladási és piaci részesedési adatok egyaránt az ATI előretörését mutatták, ezért az NVIDIA-nak mindenképp nagyot kellett dobnia, hogy visszahódítsa a vevőit és némileg kifényesítse megfakult renoméját. A vállalat ma jelentette be korábban NV40 kódnéven ismert videochipjét, a GeForce 6800-at.
A pletykák szerint a kaliforniai Santa Clarában székelő NVIDIA összesen egymilliárd dollárt költött legújabb generációs videochipjének, a korábban NV40 kódnéven ismert GeForce 6800-nak a kifejlesztésére. Az első impressziók alapján azt mondhatnánk, nem hiába: a tesztek azt mutatják, hogy az NV40 teljesítménye a piacon egyedülálló, valóban nem túloztak az NVIDIA képviselői, amikor arról beszéltek, hogy az előző generációs chipekhez képest akár kétszeres gyorsulás is lehetséges. A vállalat emellett egy nagyszabású marketing-kampányt is útjára indít, hogy minden felhasználónak az eszébe vésse, hogy a GeForce 6800 az első grafikus chip a világon, amely teljes körű DirectX 9.0c gyorsítást kínál.
Az NV40 szíve a harmadik generációs CineFX motor, amely a világon elsőként támogatja a Pixel Shader és Vertex Shader 3.0 specifikációkat. Az új pixel és vertex shader specifikációk talán legfontosabb újdonsága, hogy segítségükkel a fejlesztők a korábbinaknál lényegesen hosszabb és bonyolultabb shader programokat írhatnak. Ezt részben az utasítások számának növekedése, másrészt a dinamikus elágazáskezelésnek köszönhető, utóbbi teszi lehetővé a shader programokban a feltételes elágazásokat. Végső soron a Vertex és Pixel Shader 3.0 szabvány lehetőséget ad a programozók számára, hogy a CPU-kra írt programokhoz hasonló megoldásokat valósítsanak meg a grafikus chipeken.
A pixel és vertex shaderek kapcsán meg kell említenünk, hogy a legújabb specifikációk támogatása mellett az NVIDIA jelentősen javított a teljesítményen is, így a GeForce 6800 lényegesen gyorsabban futtatja majd a már meglevő DirectX 8 és DirectX 9 szoftvereket is. Az NV40 nem kevesebb, mint 6 vertex shader egységet és 16 renderelő futószalagot tartalmaz. Összehasonlításképp: az ATI Radeon 9800XT 4 vertex shaderrel és 8 renderelő futószalaggal rendelkezik. Az NVIDIA állítása szerint a GeForce 6800 elődjénél nyolcszor gyorsabban futtatja a pixel shader programokat és kétszer gyorsabban a vertex shadereket.
Emlékezetes, hogy a GeForce és a Radeon chipek korábbi generációinak összevetésekor sok vitát szült, hogy az egyes processzorok milyen pontossággal számolnak. Az NVIDIA a színkomponensenkénti 16 és 32 bites lebegőpontos ábrázolást támogatta, az ATI a 24 bites pontosság mellett döntött. A DirectX legújabb verziója 32 bites pontosságot ír elő, ennek a GeForce 6800 maradéktalanul eleget is tesz, mivel az összes funkcionális egység 32 bites lebegőpontos értékekkel dolgozik. Az NVIDIA emellett lehetőséget ad 16 bites lebegőpontos értékek használatára is, ez akkor jöhet jól, ha valami okból takarékosan kell bánni a grafikus memóriával.
[oldal:Új DirectX effektek]
Az NVIDIA új videochipjében többek között újdonság a displacement mapping eljárás hardveres támogatása. A displacement mappingről korábban a Matrox cég termékei kapcsán hallhattunk először, a 2002-ben megjelent Parhelia volt az első videochip, amely támogatta ezt az eljárást. A displacement mappingről a DirectX 9 előzetes bemutatójában már írtunk:- A DirectX 8-ban vezették be először az ún. N-patch felületeket, amelyek révén az alacsony részletességű, darabos objektumokat részletesebbé, gömbölyűbbé, természetesebbé lehetett tenni. Az N-Patchelést (Normal Patch) mind a DirectX 8, mind az OpenGL támogatja. Az eljárás lényegében a három dimenziós objektumokat alkotó háromszögeket az oldalak osztásával több kisebb háromszögre bontja fel. Az eredeti objektumot alkotó háromszög csúcspontjainak normálisa az adott csúcspontban találkozó háromszögek normálisainak eredője. Ez alapján megállapítható, hogy az a háromszög egy ív része volt-e, és ha igen, az ív hogyan görbült. Az N-Patchelés után létrehozott új háromszögeket ezen ív mentén már térben rendezi a videochip, ezzel részletesebb és finomabb objektumot hozva létre.
A DX9 természetesen itt is továbbmegy egy lépéssel: az ún. displacement mapping révén a háromszögek felbontása, darabolása és mozgatása nem geometriai egyenletek alapján történik, hanem egy textúra alapján, ez a textúra a displacement map. A technológiát elsőként a Matrox alkalmazta a Parhelia chipben, és bekerült a DirectX 9.0-ba is. A displacement mapping lényegében hasonlít a bump mappingre, azonban a bump mapping esetében csak a felület normálvektora módosul annak érdekében, hogy az másképp verje vissza a fényt, így becsapja a nézőt, aki azt hiszi, érdes felületet lát, holott valójában a felület továbbra is sík.
A fenti képen látható, hogy míg DOT3 bump mapping használatával a gumi éle továbbra is egyenes marad, displacement mapping esetén már a kontúrja a futófelület barázdáihoz igazodva változik, mivel a displacement mapping magát a test geometriáját változtatja meg. A folyamatos tesszeláció azt jelenti, hogy az N-patchelt, illetve displace mappelt felületek valós időben a grafikus chipen számítódnak ki, és folyamatos az átmenet a részletes, illetve kevésbé részletes modellek között. Például ha megközelítünk egy objektumot, az először még csak kevés háromszögből áll, nem túl részletes, azonban mire közel érünk hozzá, minden apró részlet láthatóvá válik, a tárgy részletes, és finoman ívelt. A displacement mapping technológia nagy előnye, hogy segítségével alacsony poligonszámú modellek és kis méretű textúrák segítségével igen bonyolult felületek hozhatók létre, ráadásul valós időben, hardveres gyorsítással.
Újdonságként említhetjük a továbbfejlesztett élsimítási eljárást, amely az ún. rotated grid technológián alapul. A korábbi változatok ún. ordered grid eljáráson alapultak. Noha a GeForce 6800 továbbra is négy mintát vesz pixelenként, a mintavételek helye megváltozott, ez a vállalat reményei szerint jelentősen javuló képminőséget eredményez. A külföldi tesztelők szerint a GeForce 6800 anti-aliasing eljárásának képminősége megközelíti legújabb ATI Radeon chipekét. Az NVIDIA emellett bevezetett egy új, 16x anizotropikus szűrési eljárást is.
Balra a GeForce FX, jobbra a GeForce 6800 anti-aliasing mintavételi pozíciók
Az NVIDIA a hangzatos "High Dynamic Range lighting" névvel illeti a 32 bites nagy pontosságú frame puffer mód használatát, amelynek segítségével négyszer több fényességértéket lehet ábrázolni, így sokkal természetesebbnek tűnő látvány hozható létre. Szintén a DirectX 9-ben mutatkozott be a "Multiple Render Targets", amelyet már az NV40 is támogat: ez lehetőséget biztosít arra, hogy egy három dimenziós jelenetben a fényeket csak a látható geometria teljes kiszámítása után kezdje el kiszámítani a chip, így a tér nem látható részeinek fényeire nem pazarol erőforrást, vagyis összességében a megjelenítés gyorsul.
Említésre méltó még az NVIDIA szabadalmaztatás alatt álló UltraShadow II technológiája, amelynek révén villámgyorsan hozhatók létre bonyolult fény-árnyék hatások. Az NVIDIA állítása szerint a Doom III megjelenítése az UltraShadow II-nek köszönhetően akár négyszer gyorsabb lehet a GeForce 6800-on, mint a korábbi generációs kártyákon. Ez részben annak köszönhető, hogy a chip az árnyékok kiszámításánál lehetőséget ad a fényforrás által be nem világított térrészek elhagyására, ami jelentős időmegtakarítást jelent.
Jelenet a Doom III-ból
[oldal:Ultra vagy nem Ultra, az itt a kérdés]
A GeForce 6800 nem csak teljesítmény, hanem multimédiás szolgáltatások tekintetében is kiemelkedőt nyújt: a chip egy dedikált, HDTV-kompatibilis videoprocesszort is tartalmaz, amely hardveresen gyorsítja az MPEG2, MPEG4, DivX és Windows Media Video 9 formátumú videók lejátszását, azaz a rögzítést és lejátszást. A kiváló minőségű videolejátszást a beépített "motion adaptive" de-interlacing funkció, a javított skálázás, szűrés és de-blocking algoritmusok biztosítják majd. A HDTV-kimeneten 480-, 720- és 1080-soros progresszív képet is megjeleníthet a videoprocesszor. A GeForce 6800 a legújabb trendeknek megfelelően két kijelző meghajtására képes, a chipben két 400 MHz-es RAMDAC mellett egy 1024x768 pixeles felbontást is támogató TV-enkóder is helyet kapott. A referenciakártyákon két DVI-csatlakozó mellett egy S-Video kimenetet lehet látni.Az NV40 eredendően AGP8X felületű, azonban egy HSI (High Speed Interconnect) chip közbeiktatásával PCI-Express 16x csatlakozásra is képes. Amint az ismert, az AGP8X felület a videochip irányába legfeljebb 2,1 Gbyte/sec sávszélességű lehet, visszirányba pedig mintegy 200 Mbyte/sec. A PCI-Express 16x előbbinek kétszeresét biztosítja, ráadásul full-duplex, azaz mindkét irányban 4 Gbyte/sec a sávszélesség. Mivel a HSI chip a kártyán, a grafikus processzor közvetlen szomszédságában kapott helyet, ilyenkor a két lapka közti kommunikáció az AGP8X szabványban leírtaknál kétszer gyorsabban történik, a HSI és az NV40 között mindkét irányban 4 Gbyte/sec a sávszélesség, azonban a kommunikáció adott pillanatban csak az egyik irányba zajlik.
Látható, hogy PCI-Express kivitelű kártya használata esetén sem jelent szűk keresztmetszetet az AGP8X 2,1 Gbyte/sec sávszélessége. Ennek a megközelítésnek a hátránya, hogy a kártyákon szükség van a HSI chipre, ami növeli a költségeket, bonyolítja a tervezést és a gyártást. Egy natív PCI-Express felületű megvalósítás némileg nagyobb teljesítményre képes, hiszen a HSI és a videochip közötti kommunikáció irányának megváltozásakor egy rövid időnek el kell telnie, míg az alkatrészek adás módból vétel módba kapcsolnak. Az NVIDIA által alkalmazott, fordítóchipes megoldás előnye azonban, hogy a kártyagyártók a piaci igények függvényében, tetszésük szerinti mennyiségben gyárthatnak AGP8X és PCI-Express 16x felületű termékeket, ráadásul a HSI chip nem csak az új, hanem a régebbi videochipekkel is társítható. Az NVIDIA erre építve jelentette be februárban PCI-Express felületű GeForce FX megoldásait.
222 millió tranzisztor
Az NV40 kódnevű grafikus processzor nem kevesebb, mint 222 millió tranzisztort tartalmaz és az IBM East Fishkill-i, csúcsmodern félvezetőgyártó üzemében készül 0,13 mikronos csíkszélességgel. A GeForce 6800 Ultra változaton a lapka 400 MHz-es órajelen működik, a chiphez kapcsolt 256 Mbyte GDD3 memória pedig 1,1 GHz-en ketyeg, ez 256 a bites memóriabuszt figyelembe véve 35,2 Gbyte/sec sávszélességet biztosít. A GeForce 6800 változat ennél némileg szerényebb paraméterekkel rendelkezik: a chip és a memória órajele is alacsonyabb lesz az Ultra változaténál, emellett a lapka 16 renderelő futószalag helyett csak 12 futószalaggal rendelkezik majd.
A "sima" változat várhatóan kevesebb aktív tranzisztort tartalmaz mint az Ultra, ezért hőleadása is alacsonyabb, így a kártyákon vékonyabb hűtőrendszer kap helyet, míg az Ultra esetében a korábbi csúcskategóriás NVIDIA chipekéhez hasonló, gigászi méretű borda gondoskodik a forrófejű chip és a villámgyors memóriák megfelelő hőmérsékleten tartásáról. A GeForce 6800 Ultra kártyák beépítéséhez sajnos két szabad kártyahelyre lesz szükség, a GeForce 6800 azonban beéri egy szabad sínnel is. A gigászi GeForce 6800 Ultra videochip fogyasztása sem mindennapi, a pletykák 100 Wattot is meghaladó teljesítményfelvételről beszélnek, ezért a kártyákon két Molex tápcsatlakozó is helyet kapott.
NVIDIA GeForce 6800 Ultra
A GeForce 6800 Ultrára és a GeForce 6800-ra épülő videokártyák várhatóan májusban kerülnek a boltokba, a termékek természetesen az összes jelentős videokártya-gyártó -- Aopen, ASUS, BFG, Chaintech, eVGA.com, Gainward, Gigabyte, Leadtek, MSI, Palit, PNY, XFX -- palettáján megtalálhatók lesznek. A GeForce 6800 Ultra chipes kártyák ajánlott kiskereskedelmi ára 499 dollár, a GeForce 6800 változat köré épített termékekért pedig várhatóan 299 dollárt kell fizetni.