:

Szerző: Asztalos Olivér

2017. február 6. 18:11

Egy nagy és pár kisebb Nvidia Quadro kártya érkezett

Egy fél tucat új videokártyával célozza a professzionális vásárlóközönséget az Nvidia, így már az összes Pascal-alapú GPU elérhető Quadro kivitelben is.

Teljessé tette Pascal-alapú Quadro kínálatát az Nvidia, a tervezőcég összesen hat darab új, elsősorban munkaállomásokba szánt professzionális videokártyát mutatott be, kiegészítve a tavaly júliusban leleplezett P5000 és P6000 modelleket. Az újdonságok között egy igazi érdekesség is lapul, a kínálat új csúcsát jelentő Quadro GP100 ugyanis az Nvidia jelenlegi legnagyobb grafikus processzorát hozza el egy-egy Teslás szerepvállalás után.

Utóbbi kártyának már az elnevezése is rendhagyó, azt ugyanis a GPU kódneve után keresztelte el az Nvidia. A GP100 volt az első Pascal-alapú grafikus processzor, az a Tesla P100 gyorsítóval mutatkozott be még tavaly tavasszal. A 610 mm²-es területű monstrum elsősorban compute képességeivel emelkedik ki, duplapontosság (FP64) mellett ugyanis az egyszeres (FP32) tempó felét kínálja a GPU, ami tizenhatszor magasabb arány a sorban második GP102 értékénél. A szóban forgó Quadro esetében ez a gyakorlatban 5,15 TFLOPS-os tempót jelent, szemben a P6000 0,75 TFLOPS-ával, ugyanakkor egyszeres pontosságban fordul a kocka, ebben a P6000 12 TFLOPS-ra képes a GP100 10,3 TFLOPS-szával szemben. Félpontosságot (FP16) tekintve ismét a GP100 van előnyben az egyszeres tempó duplájával, azaz 20,6 TFLOPS-szal.

Memória tekintetében vegyes a kép, sávszélességben utcahosszal vezet a GP100, hála a rétegzett, HBM2-es memóriák által biztosított 720 GB/s-nak, ami 66 százalékkal múlja felül a P6000 432 GB/s-os értékét. Utóbbi kártya kompenzálhat 50 százalékkal magasabb kapacitásával, hisz míg a GP100 "csak" 16, addig a P6000 24 gigabájt memóriát vonultat fel. A nagyobb kapacitásra a megbízhatósággal tud rálicitálni a GP100, a kártya ugyanis támogatja a bithibák javítására hivatott ECC-t, ami üzleti kritikus felhasználás mellett gyakorlatilag kötelező.

Végül, de nem utolsó sorban egy újdonsággal próbálja még vonzóbbá tenni új csúcskártyáját az Nvidia, amivel megfelelő külső hidak mellett kettőt lehet összekötni a még nagyobb teljesítmény eléréshez. Itt a technológia alapja jelenti az újdonságot, ahhoz ugyanis már az NVLink busz nyújtja a kapcsolatot. Az NVLink közvetlenül a processzorok között teremt összeköttetést, az interfészben nincsenek közvetítőlapkák és elosztók, ezzel egy GPU a rendszerben lévő másik GPU memóriájához is hozzáférhet, abban végrehajthat (akár atomi) műveleteket. A busz egy differenciált vezetékpáron keresztül 20 gigabites átvitelt tesz lehetővé, vagyis az átvitel hallatlanul magas, 20 gigatranszfer másodpercenkénti tempón ketyeg számításaink szerint. Egyetlen blokk 8+8 sávot tartalmaz, ez adja ki az aggregált 40 gigabájtos sávszélességet két irányba, ami lapkánkénti négy linkkel egészen 160 GB/s-ig skálázható.

A Quadro GP100-zal elsősorban az intenzív FP64 vagy FP16 számításokra építő (GPGPU-alapú) felhasználási módok profitálhatnak, a kártya elsősorban ezeken a területeken nyújthat többet a P6000-nál. Ebbe a gépi tanulás mellett beletartozhatnak az üzleti kritikus mérnöki CAD/CAE folyamatok, illetve egyéb, memória-sávszélesség igényes felhasználási módok is, ugyanis ilyen tekintetben jelenleg nincs vetélytársa a Quadro GP100-nak. Az újdonságot a jövő hónaptól szállítja az Nvidia, amelynek árazásáról egyelőre nem beszélt a cég, de a P6000 árcédulája alapján legalább 5000 dollárra lehet számítani.

A kisebbek és az egészen kicsik

A GP100 mellé még összesen öt Quadro érkezett, a középkategóriát és a belépőszintet célozva. A sorban első Quadro P4000 a tavaly nyáron leleplezett P5000 kissé megnyirbált variánsa, így az bár a GP104 GPU-ra épül, de a végrehajtók számát jelentősen csökkentette az Nvidia. A CUDA magok száma 2560-ról 1792 darabra esett vissza, ami természetesen maga után hozza a számítási teljesítmény csökkenését, így a 8,9 TFLOPS-os tempó 5,3 TFLOPS-ra mérséklődött, amiért cserébe az egy kártyahelyet foglaló, 8 gigabájt GDDR5 memóriával szerelt Quadro TDP-je 105 wattban tetőzik. Az előző generációs M4000-hez képest az előrelépés ezzel együtt is tetemes, szinte pontosan kétszeres tempót hoz a P4000 15 wattal alacsonyabb fogyasztási csúcsérték mellett.

CI/CD-vel folytatódik az AWS hazai online meetup-sorozata!

A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.

CI/CD-vel folytatódik az AWS hazai online meetup-sorozata! A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.

Az egy szinttel lejjebb tanyázó Quadro P2000 már a GeForce GTX 1060-ról ismerős GP106-ra épül, ugyancsak egy kártyahelyet foglaló kivitellel. Az 1024 CUDA aktív magot felvonultató konfiguráció 3 TFLOPS tempóra képes 75 wattos TDP mellett, ami így 66 százalékkal múlja felül a közvetlen előd Quadro M2000 számítási teljesítményét, hasonló fogyasztás mellett.

Az alsóházat jelentő három modell egyaránt a GP107-es GPU-ra épül, amely félmagas és egyetlen kártyahelyet foglaló termékek közül a Quadro P1000 a legerősebb, ez a termék a GeForce GTX 1050-hez hasonló teljesítményre, azaz 1,8 TFLOPS-ra képes, amivel majdnem rádupláz az előd K1200 értékére, miközben TDP mutatója csak 4,5 százalékkal magasabb. Az ez alatt húzódó két, P600 és P400 jelülésű modellhez alaposan megcsonkította legkisebb Pascal GPU-ját az NVidia, előbbibe csupán 384, utóbbiba pedig mindössze 256 darab aktív CUDA mag jutott, ezzel 1,1 és 0,6 TFLOPS-os teljesítményt eredményezve, ami még így is 45, illetve 100 százalékkal múlja felül a közvetlen elődök értékeit.

A kisebb kártyák piaci elérhetőségét is márciusra ígéri az Nvidia, amely cég az árazásról csupán annyit árult el, hogy az összegek hasonlóak lesznek a közvetlen elődök esetében látottakhoz.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról