Energiahatékonyságra gyúr a Maxwell
Ha a Kepler az egységesedő mikroarchitektúráról szólt, akkor a Maxwell esetében a darabolódás viszi a prímet. A "hátraarc" oka a megváltozott prioritás, míg az előző generáció a nyers teljesítményre gyúrt, a Maxwell már okosabban egyensúlyoz a fogyasztás és teljesítmény között.
A piacon is elérhető az NVIDIA következő generációs mikroarchitektúrája, a Maxwell. Az első megvásárolható kártyák a középkategóriát célozzák, elfogadható teljesítményük mellé meglepően alacsony fogyasztás társul. A Maxwell nagy dobása a Tegrákban és a notebookokban lesz, de sehol sem hátrány a visszafogott étvágy.
Fókuszban az energiahatékonyság
A Maxwell fejlesztését alapvetően meghatározta az NVIDIA stratégiai döntése, amely szerint a jövőben egyetlen közös mikroarchitektúrát használ a legegyszerűbb okostelefonos lapkáktól a szuperszámítógépes GPGPU-kig. A Maxwell nem az első architektúra, amely a teljes NVIDIA-skálát kiszolgálja, ezt a Kepler már eljátszotta, azonban a Maxwell fejlesztésekor került igazán fókuszba a telefonokban, tabletekben és noteszekben fontos energiahatékonyság.
Az azonos teljesítmény melletti alacsonyabb fogyasztás (vagy azonos fogyasztás melletti magasabb teljesítmény) a félvezetőiparban jellemzően két hatás eredménye: egyrészt a tranzisztorok egyre kisebb csíkszélességű eljárással készülnek, másrészt az egyre kifinomultabb mikroarchitektúrák hatékonyabb kódfuttatást tesznek lehetővé. Az NVIDIA számára az első lehetőség most nem állt rendelkezésre, a Kepler generációs kártyákhoz hasonlóan a Maxwell is a TSMC 28 nanométeres High Performance gyártástechnológiáján készül. Ugyan az elmúlt bő két évben az eljárás maga sokat finomodott, magasabb lett a kihozatal, stabilabb a tranzisztorok kapcsolásához szükséges feszültség, ez jelentős fogyasztáscsökkenést most nem hozott (maximum a gyártást tette számottevően olcsóbbá).
A Maxwell magasabb energiahatékonysága tehát szinte kizárólag a mikroarchitektúra alapos átdolgozásából származik, ennek fényében különösen látványos, hogy (az NVIDIA saját adatai szerint) sikerült a Keplerhez képest megduplázni a teljesítmény/fogyasztás mutatót. A Kepler architektúrájának egyik jellegzetessége az egyes erőforrások megosztása volt, vagyis a feldolgozó egységek ("magok") nagyobb modulokba rendeződtek, amelyeket megnövelt, közös áramkörök szolgáltak ki. Ilyen megosztott erőforrás volt a modulonként egységes regiszter, az ütemező ("scheduler") vagy az elsőszintű gyorsítótár. A Maxwell esetében az NVIDIA ezeket a nagy modulokat feldarabolta, a feldolgozómagok kisebb csoportonként kapnak egy-egy szerényebb teljesítményű schedulert, utasításpuffert, illetve regisztert.
A két elrendezés kiválóan mutatja, hogy a mikroarchitektúrák tervezése egy optimalizációs feladat, amely különböző célok esetén különböző megvalósítást igényel, anélkül, hogy bármelyik alacsonyabb rendű lenne. A Kepler nagyobb moduljai magasabb nyers teljesítménnyel rendelkeznek és kevesebb tranzisztort használnak (tehát a tranzisztoronként számolt hatékonyság magasabb). Azonban a nagyobb modulok részterhelésen többet is fogyasztanak, a masszív összekötő egységek csak egyben kapcsolhatóak le. A Maxwell ebből a szempontból a rugalmasságra helyezi a hangsúlyt a nyers erővel szemben, csak azok a modulok működnek, amelyek valóban terhelés alatt vannak, így az eltérő elrendezés még azonos építőkockák esetén is energiamegtakarítást hoz. Az NVIDIA azonban természetesen alacsonyabb szintű optimalizációt is végzett, például az újraírt ütemezők használatával kevesebb az üresjárat és magasabb a végrehajtóegységek kihasználtsága.
Fontos újdonság az átalakult memória-alrendszer. Az NVIDIA szerint a modern számítási feladatok alatt immár megéri növelni a másodszintű gyorsítótár méretét, amely így az előző generáció 256 KB-os méretével szemben hatalmasra, 2 megabájtosra hízott. A gyártó szerint a lépés következtében nagyot esik a grafikus memória sávszélesség-igénye, így a Kepler 192 bites szélességű memóriavezérlője helyett most elegendő 128 bit. Ez nem mellékesen további jelentős energiamegtakarítást hoz, a GDDR5 ugyanis híresen nagy étvágyú mind a vezérlő, mind a busz, mind a memórialapkák oldalán, a harmadával visszavágott szélesség tovább emeli a hatékonyságot.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
A Maxwell generációs lapkák a funkciók terén nem hoznak érdemi előrelépést, a mikroarchitektúra továbbra is csak a Direct3D 11.0-hoz nyújt teljes körű támogatást, amelyet megspékel néhány 11.1 és 11.2 funkcióval. Míg az AMD jelen generációja dedikált áramkörök garmadáját hozta a fejlett hangfeldolgozástól a vezeték nélküli kijelzők jobb támogatásáig, az NVIDIA most csak a videofeldolgozásért felelős részt fejlesztette, amely így a Keplerhez képest mintegy dupla teljesítményt nyújt. Ez egyrészt alacsonyabb fogyasztást jelent, ha akkuról nézünk videót, illetve jobb minőség érhető el például szerveres videofeldolgozásnál (NVIDIA GRID).
Az első kártyák
A Maxwell első körben két asztali kártyában ölt testet, érthető módon, mivel ezek átfutási ideje messze a legrövidebb. A két termék a GeForce GTX 750 és GTX 750 Ti, amelyek árban pontosan az előző generációs GTX 650 Ti-t váltják. A GTX 750-ben 512 feldolgozóegység teljesít szolgálatot, 1020 MHz-es névleges frekvencián és 1 gigabájt, 5 GHz-en (effektív) ketyegő VRAM társaságában. A TI utótagú modellben némileg több, 640 CUDA mag dolgozik, azonos frekvencián, hajszállal magasabb órajelű, 5,4 GHz-es, azonban megduplázott mennyiségű memória mellett. Érdemes megjegyezni, hogy a lapkák egységesen 1,87 milliárd tranzisztorból állnak, szemben a GTX 650 1,3 milliárdos és a GTX 660 2,54 milliárdos értékével.
Az NVIDIA portfóliójában az új jövevények fölött továbbra is a GTX 660 csücsül, teljesítményét az új kártyák nem érik el, lejjebb pedig a GTX 650 marad, amely kisebb méreténél fogva olcsón gyártható, hátránya a szerényebb teljesítmény és magasabb fogyasztás. Az új kártyák nagy előnye lehet a piacon, hogy 75 wattnál kevesebbet fogyasztanak, vagyis tápellátásuk megoldható kizárólag a PCI Express csatolón keresztül, így beszerelhetőek a márkás desktopok nagy részébe is.
NVIDIA GTX 750 - apró lett
Az AMD kínálatával összevetve az új kártyák nem számítanak már annyira jó vételnek pusztán az ár/teljesítmény arányt figyelve. A GTX 650 Ti azonos árban van, mint a (hamarosan globálisan elérhető) Radeon R7 265, azonban annál mintegy 20 százalékkal lassabb. Ugyanígy a GTX 650 kikap a saját ellenfelétől, a Radeon R7 260 mintegy 10 százalékkal gyorsabb nála. A képet természetesen árnyalja az NVIDIA modellek lényegesen alacsonyabb fogyasztása, azonban ha ez nem szempont, akkor jelenleg ezeken az árpontokon az AMD a nyerő. A teljesítményt illetően az Anandtech tesztje itt, a Prohardveré itt érhető el.
A java hátra van
A fogyasztásra helyezett hangsúllyal az NVIDIA nagyon nagyot kaszálhat a Maxwell generációban. Ha a való életben is visszaköszön a Keplerhez képest megduplázott energiahatékonyság, az hatalmas előrelépést hoz majd mind a Tegrák, mind a noteszgépes GeForce-ok között. Mindkét környezetben a fogyasztás jelenti a teljesítmény egyetlen igazi korlátját: az okostelefonok esetében az üzemidőt drámaian befolyásolni tudja a GPU fogyasztása (különösen játék közben), a laptopok esetében pedig a beépíthető hűtés mérete (és így az elszállítható hőmennyiség) jelenti a felső korlátot.