Mindenkit legyűrne legújabb processzorával a Huawei
Bejelentette legújabb csúcs alkalmazásprocesszorát a Huawei szárnyai alá tartozó HiSilicon. A legújabb központi egységgel egyértelmű vezető pozíciót céloz a kínai vállalat, amely erőforrásokat nem sajnálva készítette el fejlesztését.
A Kirin 980 névre keresztelt modell legfőbb érdekessége, hogy abba az ARM eddigi messze legerősebb, Cortex-A76 magjai kerültek, amely fejlesztés acélos számítási teljesítményt ígér. Emellett az integrált GPU is fejlődött, amelynek hála az újdonság közel 50 százalékkal múlhatja felül elődjét. Ezzel párhuzamosan a tavaly debütált, a mesterséges intelligenciás műveletek gyorsításához beépített NPU-t (Neural Processing Unit) is tovább erősítette a tervezőcsapat, aminek teljesítménye ezzel szinte duplájára ugrott. Hab a tortán, hogy a lapkát a piacon elérhető legfejlettebb gyártástechnológiával, a TSMC 7 nanométerével készíttette a kínai cég, amely a tervek szerint már októberben leleplezheti a Kirin 980-ra épülő első készülékét.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
Már nem számít meglepetésnek, hogy a Huawei (pontosabban a HiSilicon, bár a hivatalos közlemény kizárólag az anyacég nevét fényezi) nagyon komolyan veszi az alkalmazásprocesszorok tervezését, amely lehetőséget nyújt az arra épülő különféle készülékek (elsősorban okostelefonok) differenciálásához. Az androidos konkurensek döntő többsége ugyanis a Qualcomm valamely fejlesztésére épít, kivételt leginkább csak a Samsung jelent, amely mára a Huawei legfontosabb ellenfelévé vált a piacon.
Bivalyerős ARM magokkal
Az újdonság legnagyobb durranása tehát az ARM legújabb üdvöskéjének, az Cortex-A76-nak a bevetése, amely a HiSilicon (vagyis a Huawei) törekvéseinek hála hamarosan piacképes termékben is napvilágot láthat. Fejlesztését még nyár elején leplezte le a tervezőcég, amely az Intel Skylake-ével emlegeti egyazon lapon új csúcsmagjának számítási teljesítményét. Az ígéret szerint ugyanis az A76-tal 10 százalékra csökkenti lemaradását az ARM, papíron átlagosan ennyivel lassabb a Skylake-nél a várhatóan már ősszel piacra kerülő mag. A HWSW-n nyár elején részletesen bemutatott fejlesztés további érdekessége, hogy azt eredetileg PC-kbe, egészen pontosan notebookokba szánta az ARM.
A HiSilicont azonban ez láthatóan nem különösebben hatotta meg, hisz a magok egy elsősorban okostelefonokba szánt processzorban debütálhatnak. Ehhez azonban némileg testre szabta az összesen négy darab Cortex-A76 főbb paramétereit a tervezőcég, azok ugyanis a hatékonyság jegyében az ARM által megcélzott 3 GHz helyett lényegesen alacsonyabb órajelen üzemelnek. Az optimális üzemhez a négy egységet két párra osztotta a HiSilicon. A legerősebb duó 2,6 GHz-es csúcsfrekvenciát kapott, amely 13,3 százalékkal marad el az ARM által korábban kommunikált értéktől. A másik, az utóbbitól feszültségellátás szempontjából is elszeparált kettős az aranyközéputat célozza 1,92 GHz-es órajelével, ehhez várhatóan közepes teljesítményszint esetében nyúl majd az ütemező.
A kifejezetten alacsony terheltségű, illetve üresjárati üzemhez került be a tavaly bemutatott Cortex-A55-ből négy darab. Ez a népszerű A53-mal megismert alapokat egészíti ki, illetve finomhangolja, elsősorban a magasabb számítási teljesítmény érdekében. Ez nagyjából 15-20 százalékos előrelépést jelent, amely összhangban van az inkrementális fejlesztésekkel. A négy darab "energiatakarékos" mag maximális órajelét 1,8 GHz-re lőtte be a HiSilicon, amely elégséges a végrehajtókkal megcélzott alacsony számítási teljesítményt igénylő munkafolyamatokhoz, amelyet az A55-ös magok rendkívül hatékonyan képesek elvégezni.
Az új magokhoz hasonlóan fontos fejlesztésnek tekinthető az ARM big.LITTLE utódjaként megjelent DynamIQ rendszer, amely többek között a processzorban található különféle részegységek (CPU, GPU, stb.) összeköttetéséért felel. A többek között jobb skálázódást biztosító fejlesztés bevezetésével jelentősen átalakult a cache-alrendszer. A korábbi, big.LITTLE-re épülő processzoroknál a klaszterekbe rendezett magok egy nagyobb, másodszintű gyorsítótáron osztoztak, amelynek kapacitása az előd Kirin 970 esetében 2 megabájt volt. Az utód ezzel szakít, és rátér az Intel és AMD által (is) alkalmazott megközelítésre, amely szerint minden mag privát másodszintű gyorsítótárral rendelkezik, az ezek közötti adatcseréért pedig egy nagyobb, harmadszintű gyorsítótár felel. Ennek szellemében az A76-os magok mindegyike 512 kilobájt, az A55-ösök pedig 128 kilobájt L2 cache-sel rendelkeznek, amelyek alá egy nagyobb, 4 megabájtos harmadszintű tár sorakozik be.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
Mindezen fejlesztések együttes hatásától tetemes előrelépést vár a HiSilicon, amely a Kirin 970-hez viszonyítva 75 százalékos gyorsulást kommunikál. A tervezőcég az androidos okostelefonos piac aktuális zászlóshajójának számító Snapdragon 845 mellé is odatette a Kirin 980-at, amely a belső mérések szerint számítási teljesítményben 37, hatékonyságban pedig 32 százalékot ad a Qualcomm fejlesztésének. Ez utóbbi természetesen már javában dolgozik Snapdragon 845 utódján, amely jó eséllyel szintén megkaphatja a tetemes előrelépéssel kecsegtető Cortex-A76-os magokat.
A körítés is fejlődött
A processzormagok mellett a többi részegység, első helyen a rendszer teljesítményében ugyancsak nagy szerepet játszó GPU is sokat fejlődött. Az ugyancsak az ARM műhelyéből származó Mali G76MP10 nevével ellentétben egy 20 darab végrehajtóból álló grafikus egység, amely az előd Kirin 970-ben látott G72MP12 szinte duplázásának tekinthető. Végrehajtóegységek tekintetében 66,6 százalékos az előrelépés (12->20), amelyhez hozzájön a mikroarchitektúrából adódó javulás. Mindezek együttesétől 46 százalékos javulást vár a HiSilicon, miközben a hatékonyságot tekintve 178(!) százalékos lehet az ugrás, többek között a TSMC fejlettebb gyártástechnológiájának hála. Előbbi (papíron) még épp nem elég a Snapdragon 845 befogásához, amelynek jelen állás szerint bő 10 százalék előnye marad megjelenítési tempóban.
Ugyancsak fontos részlet, hogy a végrehajtókat memóriával kiszolgáló kontroller is fejlődött, amely immár támogatja 2133 MHz-es LPDDR4X chipeket. Ezt meglovagolva a sávszélesség 20 százalékkal nőhet, a késleltetés pedig 22 százalékkal csökkenhet. Szintén fejlődött az ISP, azaz a képfeldolgozó, amely 46 százalékkal nagyobb teljesítményre képes, lehetőséget adva a (még) nagyobb felbontásnak. Szintén ide kapcsolódik a 10 bites HDR rögzítés megjelenése, illetve a többlépcsős zajszűrés, valamint az új videokódoló futószalag, amely 33 százalékkal alacsonyabb késleltetést ígér. Utóbbi ugyanakkor nem felel meg maradéktalanul a kor követelményeinek, a 4K60 paraméterű kódolást ugyanis továbbra sem támogatja.
Az előddel debütált NPU, vagyis a mesterséges intelligenciás műveletek gyorsításához beépített fixfunkciós egység is komoly bővítésen esett át. Ahogy a "Dual NPU" is utal rá, a mérnökök egyszerűen megduplázták a végrehajtóegységek számát, amelynek köszönhetően több mint kétszeresére nőtt a teljesítmény. Ennek hála perecenként 4500 következtetést (inferences) képes elvégezni a Kirin 980, amely a Snapdragon 845-nél 90, az Apple A11-nél pedig 208 százalékkal jobb eredmény. Mindezen előnyt persze valahogyan kamatoztatni is kellene, amely kihívás a szoftverfejlesztőkre vár. Végül, de nem utolsó sorban a beépített 4G modem is fejlődött, ami a Cat 21-nek hála 1400 Mbps-os letöltésre képes a háromszoros vivő aggregáció és a 4x4 MIMO kombinációjával.
A cikk eleji említésnek megfelelően a komplett lapkát a TSMC 7 nanométeres technológiájával gyártatja le a HiSilicon, aminek köszönhetően a 6,9 milliárd logikai tranzisztort felvonultató lapka mérete 100 mm2 alatt maradt. A processzor a nyár folyamán került tömegtermelésbe, így az arra épülő első termékek megjelenése már csupán karnyújtásnyira van, hisz az október 16-ra ígért Huawei Mate 20 már fedélzetén a Kirin 980-nal érkezik majd.