:

Szerzők: Bodnár Ádám, Gálffy Csaba

2012. március 22. 16:05

Visszavette a vezetést az NVIDIA csúcskártyája

Módosított és alacsonyabb csíkszélességgel készülő Fermi - így foglalható össze a Kepler kódnéven fejlesztett NVIDIA lapka architektúrája. A gyártó kiegyensúlyozta a funkcionális elemek számát és teljesítményét, a nyers erő helyett a hatékonyság lett a vezérelv.

A GTX 680 videokártyában a GK104 kódnevű lapka teljesít szolgálatot, amely nem a korábbi csúcsot képviselő GF110, hanem a kisebb, konzumer központú GF114 eszmei utódjának számít. Ennek megfelelően a jövőben várható egy jóval erősebb, azonban drágább lapka megjelenése is, amely a Tesla és a Quadro családok csúcsmodelleket (és várhatóan a konzumer skála krémjét) alkotja majd.

Egységes órajel

A chip felépítését tekintve a legnagyobb változásnak a külön shader blokkok eltűnése számít, ezután a CUDA magok végzik ezt a feladatot is. Ez azt is jelenti, hogy a shader egységek eltérő órajele is a múlté, a teljes lapka azonos (“graphics”) órajelen üzemel. A lépés következtében azonban az egyes funcionális egységek számítási kapacitása megfeleződött, ennek ellentételezésére a gyártó megduplázta az egységek méretét - majd számukat is megkétszerezte, immár a teljesítmény növelése érdekében.

A shader órajel megjelenésekor az iparág alacsony órajelekkel és hatalmas lapkákkal küzdött, így a funkcionális egységek hatékonyságának maximalizálásához jó ötletnek tűnt eltérő órajelek alkalmazása . Mára azonban a helyzet megfordult, a felhasználók energiahatékonyságot követelnek, a megduplázott órajelek pedig már túl magasakká váltak. Ezt kiegészíti a fejlettebb gyártástechnológia, amellyel a funkcionális egységek méretének megduplázása is elképzelhetővé vált, a lapka méretének kordában tartása mellett.

FP64-blokk és memóriavezérlő

A jövőben megjelenő Tesla és Quadro GPGPU-k felépítésére utal a lapka 15-ös számú blokkja, amely az FP64 (64 bites pontosságú lebegőpontos) műveletek végrehajtására specializálódik. Míg korábban a CUDA-blokkok egyharmada volt képes FP64-végrehajtásra, a Kepler funkcionális blokkjai erre már egyáltalán nem képesek, ezért a gyártó mellékelt egy specializált egységet. A 8 CUDA magot tartalmazó egység azonos sebességgel hajtja végre a nagypontosságú számításokat, mint az egyszerűbb, 32 bites műveleteket. Elképzelhető, hogy a speciális feldolgozóegység a professzionális lapkákban jóval nagyobb számban lesz jelen, ami rendkívül erős FP64 teljesítményt ígér.

Említésre méltó az is, hogy az NVIDIA-nak sikerült elérnie a 6 GHz-es memóriasebességet - szemben a korábbi generáció 4 GHz-es maximális effektív órajelével. Ez korábban súlyos problémákat okozott a Fermi-családnak, a lapka felépítése ugyanis megkövetelte a minél magasabb memória-sávszélességet. A Keplerrel sikerült végre elérni a megfelelő órajeleket, ami 50 százalékos gyorsulást jelent. Bár a GDDR5 szabványú memóriamodulok a 7 gigahertzes effektív órajelet is könnyedén elérik, egyelőre az NVIDIA az egyetlen, akinek sikerült ezt megközelítő sebességű memóriavezérlőt készítenie. Ez azt jelenti, hogy azonos sávszélesség érhető el harmadával kevesebb memóriamodullal (és huzalozással), ami egyrészt a költséghatékonyságot javítja, másrészt a fogyasztást is csökkenti.

Csúcsdarab

A külföldi és magyar szaklapok már le is tesztelték az új versenyzőt. Az AnandTech és a Prohardver mérései alapján elmondható, a legtöbb benchmarkban a GeForce GTX 680 jelentősen túlteljesíti közvetlen elődjét, a GTX 580-at, és változó előnnyel ugyan, de rendszeresen megelőzi legközelebbi riválisát, a januárban piacra dobott AMD Radeon HD 7970-et is. Ezzel a GTX 680 a ma kapható legerősebb egychipes grafikus kártya, az NVIDIA tehát le tudta taszítani a trónról az AMD-t, ami némileg meglepő annak a fényében, hogy a 7970 mennyivel több tranzisztort állít csatasorba és papíron is erősebbnek tűnik.

Az előny nem csak teljesítményben van az NVIDIA-nál, hanem fogyasztásban is, a GTX 680-nal szerelt konfiguráció a Prohardver tesztje szerint üresjáratban és terhelés alatt is kevesebbet fogyasztott a Radeon-sorozat jelenlegi csúcsmodelljét tartalmazó gépnél. Üresjárat esetén az eltérés minimális, 1 watt mindössze, de terhelésen már 30 wattot is eléri - hiába, közel 800 millióval kevesebb a tranzisztor és 20 százalékkal kisebb a magméret.  Igaz, aki nem sajnálja a pénzt egy csúcskategórás grafikus kártyát és az azt kihajtani képes processzort, tápot, valamint egy elég nagy felbontású monitort is tartalmazó gamer konfigurációra, azt a villanyszámlán jelentkező különbség feltehetően nem fogja zavarni. A GeForce referenciakártya hűtése némileg csendesebb is a Radeonnál, állapítja meg a Prohardver.

Konzumer elágazás

Úgy tűnik, a Keplerrel az NVIDIA végleg szétválasztotta a professzionális felhasználásra szánt (Tesla, Quadro) termékvonalat a grafikus lapkáktól. A 2010-ben rajtolt Fermit már a kezdetektől professzionális piacokra tervezte a vállalat, a belőle készült asztali grafikus chipek (GTX 480) ennek megfelelően nagyok voltak (529 mm2), drágák és sokat is fogyasztottak - nem is fogytak jól. A cég a 2010 őszén debütált, áttervezett GF104-gyel köszörülte ki ezt a csorbát, és lett újra versenyképes a középkategóriában.

Machine recruiting: nem biztos, hogy szeretni fogod

Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

A GK-generáció esetében a recept eltérő, először érkezik a piacra a kimondottan videokártyákba szánt GK104, hogy a vállalat legnagyobb piacát lefedje, és később követheti a “Nagy Kepler”, amelyből a Quadro és Tesla csúcsmodellek készülnek. Persze elképzelhető, hogy megfelelő kihozatal esetén ebből is lesz asztali grafikus kártya, de ha mégsem, az NVIDIA akkor sincs bajban, kétchipes megoldással is ki tudja szolgálni azokat, akiknek nem elég a GTX 680 teljesítménye.

Olcsóbb, jobb

Az új GeForce teljesítmény és fogyasztás mellett árban is a versenytársa elé lép egy picivel. Az NVIDIA ugyanis az 550 dolláros Radeon HD 7970 alá lőtte be a GTX 680 500 dolláros árát, így elég nehéz helyzetbe hozva az AMD-t. Erre azért lehet lehetősége, mert a GTX 680 az új csúcskategóriás Radeonok 4,3 milliárd tranzisztorával szemben “csak” 3,54 milliárdból áll, a chip alapterülete 365 mm2 helyett 294 mm2, ráadásul a memóriabusz is csak 256 bites 384 helyett, így a tokozás és a nyomtatott áramkör is olcsóbban állítható elő. További jelentős költségtényező a memória mérete és órajale, a Radeon 7970 referenciakártyák 3 gigabájt GDDR5 memóriával rendelkeznek, a GeForce GTX 680-ra viszont csak 2 gigabájt került.

Árharcra azonban nem érdemes számítani, mivel mindkét GPU a TSMC 28 nanométeres csíkszélességű gyártástechnológáján készül, amely egyelőre szűkös kihozatallal üzemel, így kevés mozgásteret ad az engedményekre, az legfeljebb a profit rovására történhet, abból pedig az AMD grafikus részlegénél sincs sok.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról