Ütős processzormag került a legújabb Exynosba
Szaftos részleteket hozott nyilvánosságra házon belül fejlesztett harmadik generációs processzormagjáról a Samsung. Az Exynos M3-ra keresztelt magnál komolyan hozzányúlt az első két fejlesztésnél megismert alapokhoz, a tervezők például jelentősen, 50 százalékkal növelték a mikroarchitektúra szélességét.
A különféle fejlesztéseknek hála a vadiúj processzormag (illetve az arra épülő rendszerchip) azonos órajel mellett akár 50 százalékkal is felülmúlhatja az előző generáció tempóját. A konkrét mérési eredményekre már nem kell sokat várni, az új fejlesztés ugyanis az Exynos 9810-as rendszerchippel debütál, amely a tavasszal piacra kerülő Samsung Galaxy S9 okostelefonok központi egysége lesz. A Samsung iránya alapján ugyanakkor már az sem kizárt, hogy cég később kilépne az okostelefonok és tabletek világából, és szélesebb körben (pl. notebookoknál) alkalmazná saját processzorait.
A szóban forgó új Exynos legnagyobb dobása tehát az M3-as mag, amely több ponton is szakít a lassan két éve bemutatott M1-gyel, illetve az azt követő, leginkább ráncfelvarrásnak tekinthető M2-vel. Az M3-at ugyanis jelentősen kiszélesítették a tervezők, a dekóder a korábbi 4 helyett már 6 utasítást képes egy órajel alatt lefordítani (12 micro-op). A szélesség mértékét jól szemlélteti, hogy az Intel Skylake legfeljebb 5, az AMD Zen 4 , az ARM jól ismert A72-es fejlesztése pedig 3 utasítás dekódolására képes. A szélesedéshez, illetve a végrehajtók hatékonyabb etetéséhez az ROB-t (ReOrder Buffer), tehát az átrendező körpuffert is alaposan megnövelte a Samsung, az elődök 96 bejegyzéses egységét 137,5 százalékkal 228-ra bővítve a tárat. (Skylake: 224).
forrás: AnandTech
Mindez persze önmagában még nem feltétlenül eredményezne tetemes ugrást, a dekódolt utasításokat ugyanis hatékonyan végre is kell(ene) hajtani. Ezért a tervezők a back-endet is alaposan átszabták. Az M1/M2 mikroarchitektúra összesen 9 darab végrehajtóporttal rendelkezik, amelyet az M3-ra harmadával, 12 portra bővített a Samsung. A masszív bővítés természetesen nincs ingyen, az a több tranzisztor és az ezzel járó magasabb disszipáció mellett a futószalagot is megnyújtotta, az elődök 13 fokozatú pipeline-ja 15 fokozatúra nyúlt. Téves elágazásbecslés esetén ez lassabb végrehajtást eredményezhet, ám ahogyan az jellemzően generációról generációra megtörténik, a tervezők vélhetően a mikroarchitektúra ezen képességén is javítottak, tovább csökkentve a fals jóslatok esélyét.
Magasabb szinteken is komoly változásokat látni, a Samsung ugyanis a Qualcommhoz hasonlóan DynamIQ-ra cseréli az évekig alkalmazott big.LITTLE technológiát, amellyel javulhat a rendszerchip skálázhatósága. A számítási teljesítmény, a hatékonyság, illetve a késleltetés csökkentésére egyaránt hivatott ARM DynamIQ bevezetésével jelentősen átalakult a cache-alrendszer. A korábbi, big.LITTLE-re épülő processzoroknál a klaszterekbe rendezett magok egy nagyobb, másodszintű gyorsítótáron osztoztak, amelynek mérete az Exynos 8895 esetében az erősebb magokat tartalmazó csoportban 2, a gyengébbeknél pedig 512 kilobájt volt.
A DynamIQ-ra alapozó Exynos 9810-nél már minden mag saját L2-vel rendelkezik, amelynek kapacitása nem hivatalos források szerint 512 kilobájt per M3 mag, az azok mellé társított, minden szempontból szerényebb teljesítményű Cortex-A55 magok mellé pedig darabonként 128 kilobájtos másodszintű gyorsítótárat szabott a Samsung. Szintén újítás, hogy a cache-eket egyetlen harmadszintű (L3) gyorsítótár fogja össze, amelynek mérete nem hivatalos források szerint 4 megabájt.
Érdekes kérdést vet fel a magok órajele, amelyet a chiptervező meglehetősen magasra lőtt be. A nagy teljesítményre kihegyezett, négy tagból álló M3-as fogat frekvenciája 2,9 GHz-ben tetőzhet, az energiahatékonyság növeléséhez beépített A55-ös magoké pedig legfeljebb 1,9 GHz-ig kúszhat fel. Mindez ugyanakkor nem feltétlenül jelenti azt, hogy a processzorokra épített különféle termékek ezt maradéktalanul ki is használják majd, a Samsung Galaxy S7 készülékek esetében például 2,6 GHz-ben maximalizálták az amúgy az Exynos 8890 specifikációja szerint 2,7 GHz-re képes M1 magok frekvenciáját. Borítékolható, hogy többszálas végrehajtás esetében a 2,9 GHz közelében sem lesznek a 9810-be épített M3-as magok, a feljebb ecsetelt bővítések alapján ugyanis azoknak meglehetősen magas lehet a disszipációja, amelyet több mag együttes használata esetén már nem bírna el a kompakt okostelefonok hőelvezetése.
Ennek ellenére jó eséllyel többszálú végrehajtásnál is jelentősen felülmúlja majd elődjét (is) az Exynos 9810, ám az igazán nagy dobás az egyszálas tempó lehet, ebben valószínűleg az Apple kivételével(?) mindenki mást maga mögé utasít majd a Samsung új fejlesztése. A mikroarchitektúrális fejlesztések hatására ugyanis akár 50 százalékkal is nőhetett az IPC (egy órajelciklus alatt elvégzett műveletek száma), tehát azonos órajelet alapul véve ennyivel lehet jobb elődjénél az Exynos 9810. Amennyiben ehhez még hozzávesszük az egy szál esetében jó eséllyel elérhető ~2,9 GHz-es órajelet, úgy akár 70 százalék feletti is lehet az előrelépés, amely óriási ugrás lenne az eddig jellemzően inkább többszálas tempóra fókuszáló, Androidhoz fejlesztett processzorok táborában.
Arról egyelőre csak találgatni lehet, hogy miért ugrott hirtelen ekkorát saját fejlesztésű processzorával a Samsung. Elsőre az Apple juthat eszünkbe, amely már régóta, utcahosszal vezeti az ARM-os mezőny listáját, az "A" jelölésű processzorok magjai egy szálon mindenkit vernek, tetemes előnnyel. Az Apple ugyanakkor csak saját termékeihez fejleszti processzorait, és egyelőre semmi jele annak, hogy a cég a jövőben változtatna ezen gyakorlatán, mint ahogy arra sincs reális esély, hogy mástól vásároljon iOS-es termékeibe központi egységet a cég. A Samsung processzorai számára ugyanakkor egy potenciális piacot jelenthet a bimbózó Windows 10 ARM-os ökoszisztéma, ahol az x86-os emuláció erőforrásigénye miatt épp kapóra jönne az erős processzormag.
A körítés is fejlődött
A legnagyobb előrelépést jelentő M3-as processzormag mellett az Exynos 9810 több más eleme is fejlődött. A GPU szerepét immár a Mali G72 "Heimdall" fejlesztése tölti be, amelyet az elődhöz képest kettővel kevesebb, 18 maggal épített be a Samsung. A kevesebb végrehajtót magasabb órajellel próbálja kompenzálni a cég, nem hivatalos információk szerint 700 MHz körüli lesz a GPU maximális frekvenciája, miközben az elődben található Mali G72 546 MHz-is skálázódott. Az immár HDR képes, HEVC (H.265), H.264 és VP9 formátumú mozgóképek dekódolására és kódolására kifejlesztett fixfunkciós egységek mellett leginkább az integrált LTE modemhez nyúlt hozzá a Samsung. A Shannon márkanevű, Cat 18/13 rádiós egység immár 1,2 gigabites letöltést és 200 megabites feltöltési sávszélességet produkálhat az erre felkészített hálózatokon.
forrás: AnandTech
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
A komplett dizájnt természetesen most is saját műhelyében állítja elő a Samsung. A 10LPP kódnevű fejlesztés a dél-koreai vállalat legújabb tömegtermelésben elérhető gyártási eljárása (ezen készül a Snapdragon 845 is), amely az elődnél alkalmazott 10LPE-hez képest 10 százalékkal nagyobb órajelet kínálhat azonos fogyasztással, vagy változatlan frekvencia mellett 15 százalékkal lehet alacsonyabb a disszipáció.