Szerző: Bizó Dániel

2010. július 12. 13:36

GeForce GTX 460: így kellett volna kezdeni

Az NVIDIA bejelentette a GeForce GTX 460 chipjével szerelt videokártyák elérhetőségét, amelyekkel a kétszáz euró alatti árszegmenst veszi célba, hogy jobban meg tudja szólítani a PC-játékosok tömegét - Magyarországon ez a 60 ezer forint alatti tartományt jelenti. A titkok nyitja az olcsóbban termelhető chipekben rejlik.

Jóval kisebb

Az eseményeket messziről követők könnyen abba a hibába eshetnek, hogy a GTX 460 kártyák megjelenését elintézzék egy legyintéssel, azt gondolván, hogy csak egy újabb, tovább butított Fermiről van szó. A GTX 460 valójában az NVIDIA első terméke, amely valóban a középkategória számára készült, az igényes, de az árra már érzékeny játékosok számára, akik nem fizetik meg a felső- és csúcskategóriát. A legfontosabb, hogy a termék már nem a GF100, hanem egy új, GF104 jelölésű chipre épül, amely jóval kisebb az eredeti Ferminél.

A GF104 méretét az NVIDIA ugyan nem árulja el, az 529 négyzetmilliméteres GF100 szilíciumnál azonban biztosan jóval kisebb - egyes források szerint az optimalizációknak köszönhetően nagyjából fele akkora, rosszabb esetben is 300 négyzetmilliméter körüli. A kisebb lapkaméret és a kör alakú szilíciumszeletek széleinél keletkező kisebb veszteség miatt szeletenként nagyjából kétszer annyi GF104 nyerhető ki, mint GF100, továbbá a selejtes lapkák okozta veszteség is kisebb, így a GF104 szilíciumköltsége a HWSW becslései szerint kevesebb mint fele a nagyobb testvérének. A GF104-et ugyanúgy a TSMC gyártja 40 nanométeres csíkszélességű eljárásán.

Ez a Fermi nem az a Fermi

Az árazás szempontjából kétségtelenül ez a legfontosabb, ugyanakkor ennél sokkal érdekesebb, hogy az NVIDIA hozzányúlt a mikroarchitektúrához is, így a GF104 lényegében egy Fermi 1.5-nek tekinthető, ami egyúttal a Fermi gyenge versenyképességének beismerését is jelenti, már ami a területre és energiafogyasztásra vetített grafikus teljesítményt illeti az AMD Radeonjaival szemben. A GF104 nem 16, hanem 8 blokkból, hagyományos számítástechnikai megközelítésben processzorból épül fel, két csoportra osztva.

Egy-egy blokk, vagyis mag azonban sokkal szélesebbé és erőteljesebbé vált, vagyis a GF104 mikroarchitektúrájának hangsúlya eltolódott az alacsonyabb szálszintű párhuzamosságtól a magon belüli adat- vagy utasításszintű felé, aminek magyarázata kétségtelenül a magasabb átlagos kihasználtság és a felépítés magasabb elektronikai hatékonysága volt. Az NVIDIA mérnökei látványosan újraoptimalizálták a Fermi mikroarchitektúrát, kétségtelenül, hogy az kiegyensúlyozottabbá váljon a klasszikus grafikus feladatokra.

Az új processzorblokkok ennek megfelelően 64 helyett 96 végrehajtóegységgel rendelkeznek összesen, amelyek párba szervezve (egy 32 bites lebegőpontos és egy 32 bites aritmetikai egység) alkotják a 48 CUDA magot, az NVIDIA terminológiájában. A kihasználtság érdekében nem kettő, hanem négy darab kétportos diszpécser egység kezeli az utasítások eljuttatását az egyes egységek számára.

Ennek eredményeként a memóriaműveletek és a rögzített funkcionalitású egységeket kezelő egy-egy port levonása után nem 2, hanem 6 port marad, így háromszorosára nőtt az órajelenként elindítható utasítások száma. Ez azt is eredményezi, hogy az egy portra jutó CUDA magok száma 16 helyett 8 lett, vagyis nem csak a számítási erőforrások nőttek másfélszeresükre, de átlagos kihasználtságuk is jóval magasabb lehet. A megnövekedett belső párhuzamosság miatt a mérnökök nyolcszorosára növelték a regiszterfájl méretét, így az már 32 768 darab 32 bites értéket tud villámgyorsan eltárolni.

A processzorblokkok, vagyis az NVIDIA terminológiában szimultán multiprocesszorok (SM) tehát sokkal nagyobb számítási kapacitással bírnak, duplázódott a speciális műveleteket (pl. sinus-cosinus számítások) végző egységek (SFU) száma is, duplázódott a textúrázók száma is, ami egyértelműen arra utal, a klasszikus grafikus feladatok alatt mutatott teljesítményt a lehetőségekhez képest maximalizálni akarták a mérnökök, megváltoztatva az eredeti Fermi arányait. Eközben nem változott a processzorok tesszelációs teljesítménye, vagyis a tesszelációt is végző PolyMorph motorból továbbra is egy található blokkonként.

Jobb lett

Összességében a GF104-től arányaiban sokkal jobb grafikus teljesítményt várhatunk el, mint a GF100 chipektől. A selejthányad leszorítása érdekében a GTX 460 nyolcból csak 7 blokkot használ, így amennyiben a gyártás során sérülés keletkezik valamelyik processzorblokk területén, még mindig nem kell kidobni a chipet. A 7 blokk összesen 336 CUDA magot, 56  SFU-t és 56 textúrázó és 32 raszterizációs egységet hordoz magában, órajele pedig a kevesebb tranzisztornak és kisebb méretnek köszönhetően 675 megahertz, a CUDA magoké pedig ennek duplája. A memóriavezérlő szélessége memóriakiépítettségtől függően (1 GB vagy 768 MB) 256 vagy 192 bit, ami szintén a költségek leszorítását segíti, ugyanis sokkal kevesebb huzalozás szükséges, ami olcsóbb tokozást és NYÁK-ot tesz lehetővé.

A mérnökök erőfeszítései, hogy optimalizálják a Fermit, sikerrel is járt, meg nem is. A sikert inkább gazdaságossági és üzleti szempontból lehet értékelni, mivel az NVIDIA a GTX 460 kártyákkal agresszív árazással, nyereségesen jelenhet meg egy versenyképes termékkel a 200 eurós árszegmensben.  A vállalat ezzel komoly konkurenciát állít az AMD Radeonoknak és valószínűleg árcsökkentést kényszerít ki riválisától is, mivel a GTX 460 sokszor a drágább Radeon HD 5850 kártyák közelében teljesít. Műszakilag az architekturális erőfeszítésekkel kapcsolatban nem ennyire egyértelmű a kép, a változtatások hatására nem minden esetben lett sokkal hatékonyabb a chip, igaz, a GTX 460 sokszor 10-15 százalékon belülre megközelíti a harmadával magasabb memória-sávszélességgel és harmadával több CUDA maggal rendelkező GTX 470-et is. A GF104 megfelelő krafttal rendelkezik, hogy a legtöbb játékot akár full HD felbontásban folyékonyan jelenítse meg, mindezt a korábbiaknál jóval megfizethetőbb áron, ami a legjobb vétellé teszi az NVIDIA kínálatában.

a címlapról