:

Szerző: Asztalos Olivér

2019. szeptember 24. 09:19

A gépi tanulásos gyorsítókártyák piacával is bepróbálkozik a Huawei

Új piacok után ered a Huawei, amely gépi tanulásra kifejlesztett klaszterét követően a diszkrét gyorsítókártyák és a vállalati alaplapok piacát is célba veszi.

A kínai cég két darab, PCI Express bővítőkártya formátumú terméket mutatott be múlt heti rendezvényén. A gyorsítókártyák egyik érdekessége, hogy azok házon belül fejlesztett chipekre építenek, melyek a Huawei szerint bőven felveszik a versenyt a piacvezető szereplők megoldásaival. E mellett a cég az vállalati alaplapok piacán is szerencsét próbál a Kunpeng termékeivel, melyekkel első körben a szerveres és munkaállomásos rendszereket veszi célba.

Az Atlas 300 (Model: 9000) a korábban már látott Ascend 910 gépi tanulásos chipre épít. A chip az Ascend-Max széria legerősebb tagja, melynek alapját az ugyancsak saját tervezésű DaVinci Max mag jelenti, amelyből összesen 32 darab került az Ascend 910-be. A végrehajtóegységeket háló topológiával (mesh) kapcsolták össze a tervezők, működésüket pedig 32 megabájt megosztott gyorsítótár segíti. A magok mellé fixfunkciós dekódolók is kerülteket, melyek segítségével valós időben dolgozható fel 128 különálló videócsatorna adatfolyama, amely például különféle megfigyelőrendszereknél jöhet kapóra. A lapkában található memóriavezérlőhöz négy darab HBM 2-es memória kapcsolódik összesen 32 gigabájt összkapacitással. Ezt egészíti ki a kártya áramkörére épített 16 gigabájt DDR4-es memória, amivel összesen 48 gigabájtból gazdálkodhatnak a jellemzően memóriaigényes gépi tanulásos algoritmusok.

atlas_accelerator

Az Ascend 910 félpontosságú lebegőpontos műveleteknél (FP16) 256 TFLOPS-os, INT8 (8 bites integer) műveleteknél pedig 512 TOPS csúcsértéket produkál. Ezek nagyon magas értékek, a Tesla V100-as gyorsítója ugyanis FP16 esetében 31,4 TFLOPS-ra, INT8-nál pedig 125 TOPS-ra képes. A specifikációk alapján tehát félpontosságú lebegőpontos műveleteknél az Ascend 910 közel kilencszer gyorsabb az Tesla V100-nál, legalábbis papíron, a független mérésekre ugyanis még várni kell. A Huawei szerint kártyája másodpercenként 1802 darab kép elemzésével végez, szemben "a piac legerősebb gyorsítóival", melyek ugyanennyi idő alatt csak 965 képpel végeznek.

Hello, itt az idei SYSADMINDAY!

Szabadtéri helyszínen idén is megrendezzük a hazai Sysadmindayt. Melós hónapok után ez egy jó lehetőség, hogy találkozzunk barátokkal, kollégákkal.

Hello, itt az idei SYSADMINDAY! Szabadtéri helyszínen idén is megrendezzük a hazai Sysadmindayt. Melós hónapok után ez egy jó lehetőség, hogy találkozzunk barátokkal, kollégákkal.

Szintén fontos szempont a kártya fogyasztása, amiről a Huawei egyelőre nem beszélt, ám vélhetően az Atlas 300 TDP-je is a kategóriában szabványosnak tekinthető 250-300 watt körül mozog. A termék PCI Express 4.0 csatolóval rendelkezik, hátoldalán pedig egy 100 gigabites RoCE (Remote Direct Memory Access over Converged Ethernet) interfész található. Ez az alkalmazás és a kernel közötti adatmásoláskor fellépő, és a TCP/IP protokoll miatti többletterhelést csökkentésére (is) hivatott, amit kiaknázva akár 70 százalékkal is mérsékelhető a szinkronizációs késleltetés.

A Huawei másik, Atlas 300 (Model: 3000) kártyája lényegesen szerényebb teljesítményt céloz, INT8 (8 bites integer) műveleteknél ugyanis csak 64 TOPS-ra képes a gyorsító, ami a 9000-es modell nyolcada. Az Ascend 310 chip a végrehajtóegységek mellett fixfunkciós dekódolókat is tartalmaz, melyek segítségével valós időben dolgozható fel 64 különálló HD felbontású videócsatorna adatfolyama. A félmagas, PCI Express 3.0-s kártyán 32 gigabájt LPDDR4 memória található, TDP-je pedig mindössze 67 watt.

Huawei alaplapok

A gyorsítókártyák mellé más, eddig meglehetősen profilidegennek tűnő termékeket is bejelentett a Kunpeng alaplapok formájában a Huawei. A kétprocesszoros szerver, illetve az egyprocesszoros desktop alaplap is a cég Kunpeng 920-as processzorára épít. A CPU 64 darab Armv8 utasításarchtektúrára alapozó egyedi magokat tartalmaz nyolccsatornás DDR4 memóriavezérlő és PCI Express 4.0 kontroller mellett.

kunpeng_boards

A Huawei elsősorban szerverekbe és munkaállomásokba pakolná a processzoraival integrált alaplapokat, melyeket az IBM OpenPower kezdeményezésének mintájára megnyit az érdeklődők előtt. A cég ettől különböző gyártók és partnerek közötti együttműködéseket remél, melyek kimondott célja létrehozni egy ökoszisztémát a megnyitott technológiák körül. Ehhez a Huawei számos kapcsolódó szellemi termékét teszi licencelhetővé a processzoroktól egészen a firmware-ekig.

A K8s annyira meghatározó technológia, hogy kis túlzással szinte az összes IT-szakemberre nézve karrier-releváns.

a címlapról

jogsértés

39

Bajban lehet az X az EU-ban

2024. július 12. 13:21

A Bizottság előzetes döntéshozatali eljárása szerint a közösségi platform működése több ponton is törvénysértő.