Heterogén magokra fogad az ARM is
Alacsonyabb fogyasztású és teljesítményű, Cortex-A7 névre keresztelt processzormagokat mutatott be az ARM. Az apró magok olcsón gyárthatóak, így egyesével vagy párosával helyet kaphatnak az olcsó okostelefonokban, a gyorsabb, nagy fogyasztású A15-ösök mellé integrálva pedig az üzemidőt növelhetik.
Az NVIDIA után az ARM is at eltérő fogyasztású és teljesítményű processzormagokra fogad, a zöldekkel szemben azonban nem eltérő megmunkálás, hanem eltérő architektúra adja a különbséget. A Cortex-A7 magok nem csak a nagyobb teljesítményű magok mellett állják meg a helyüket, hanem magukban is jól működnek, az ARM tervei szerint egymagos és kétmagos formában beveszik az alsó- és középkategóriás okostelefonok piacát.
Kompatibilis architektúra
Technikai szempontból az A7 egy meglehetősen egyszerű, in-order rendszerű processzormag, 8 fokozatú utasításfeldolgozással. Integer műveletek esetén az A7 képes két utasítás párhuzamos kibocsátására, lebegőpontos és NEON utasításokkal azonban csak egyenként bánik el. Elődjéhez, az A8-as maghoz képest a Cortex-A7 javított, számottevően hatékonyabb elágazásbecslő egységet kapott, amely a rövidebb futószalaggal karöltve nagyobb kihasználtságot eredményez. Az A7 mellé rendkívül alacsony, mindössze 10 órajeles késleltetésű másodszintű gyorsítótár jár, ennek mérete és paraméterei a gyártókra van bízva. Az ARM szerint a magok gyártását 40 és 28 nanométerre is előkészítik, így a SoC-gyártók rugalmasan használhatják az egységet különböző termékeikben.
Az A7 legnagyobb előnye a közvetlen előddel, a Cortex-A8-cal szemben a modernizált felépítés: míg a 2003-ban bemutatott A8 képes volt akár 1 GHz-es órajelet is elérni, ehhez a licencelt mag mellé a gyártóknak egyéni tervezésű elemeket is kellett készíteniük, ami megnehezítette a gyártást és kitolta a piaci bevezetést. A Cortex-A7 ezzel szemben már a licencelt verzióban is képes 1,5 GHz-es sebességre 28 nanométeres csíkszélesség mellett, miközben alapterülete fele-harmada a Cortex-A8-nak. Egyetlen A7 mérete kevesebb mint fél négyzetmilliméter, ez azt jelenti, hogy rendkívül költséghatékonyan gyártható.
Az olcsó, de a magas órajelnek köszönhetően elég gyors Cortex-A7 az ARM reményei szerint drámaian leszállítja az okostelefonok belépő árát, a vállalat szerint 2013-ra a százdolláros készülékek az A7 segítségével hozni fogják a mai csúcstermékek teljesítményét. Ez azt jelenti, hogy néhány éven belül a felhasználók tömegei számára lesz elérhető az okostelefonok szolgáltatáskínálata, ami újabb lökést adhat az ilyen eszközök ma is robbanásszerű növekedésének.
Dublőr
A Cortex-A7 rendkívül kis mérete és teljes utasításkészlet-kompatibilitása alkalmassá teszi egy másik, egyelőre szokatlannal számító szerepkörre is. Az ARM bejelentése szerint a magok egyszerűen (és olcsón) az A15-ös egységek mellé csomagolhatóak, és elláthatják az egyszerűbb, jelentős teljesítményt nem igénylő feladatokat. Az okostelefonok és tabletek esetében ez azt jelenti, hogy a háttérben futó feladatok végrehajthatóak a nagyobb, erősebb, de többet is fogyasztó magok felébresztése nélkül.
Az ARM elképzelésében a Cortex-A7 magok egyféle dublőrként működnének, ugyanazt a feladatot látnák el, mint az A15-ös egységek, csak lassabban. A koncepció szerint a teljes kompatibilitás lehetővé teszi, hogy munka közben zökkenésmentesen kapcsolja át a magokat a processzor, az ilyen kontextusváltás az ARM szerint mindössze 20 mikromásodperc alatt lezajlik. A megoldás a jelenlegi operációs rendszerek felé teljesen transzparensen történik, de a következő generációs, fejlettebb rendszerek beavatkozhatnak és manuálisan is vezérelhetik a váltásokat.
Nem skálázódik?
A Cortex-A15-ös mag hatalmas előrelépést jelent az ARM architektúrát használó mobilprocesszorok teljesítményében. Elődjéhez, a Cortex-A9-hez hasonlóan out-of-order felépítésű, vagyis a függőségeket figyelembe vételével képes átrendezni az utasítások végrehajtásának sorrendjét a végrehajtóegységesk maximális kihasználása érdekében. Az A15 azonban jóval "szélesebb", mint az A9, a Qualcomm Kraithoz hasonlóan három utasítás egy időben történő dekódolására képes. Ez azonban megnövekedett komplexitással és rengeteg új áramkörrel is jár, ami megnöveli a magok fogyasztását.
2025: neked mennyi pénzt ér meg a home office? Itt vannak az IT munkaerőpiaccal kapcsolatos 2025-ös prognózisaink.
A probléma gyökerét a skálázódás jelenti, az ARM szerint az A15 teljes terhelés mellett többet fogyaszt mint a közvetlen előd A9, azonban normál használat mellett mégis hosszabb üzemidőt nyújt. Az ellentmondás kulcsa a nagyobb teljesítmény: az A15 számottevően gyorsabban képes elvégezni a feladatot és lekapcsolni mint az A9, így az elfogyasztott energia mennyisége alacsonyabb lehet - normális feladatok mellett tehát az A15 nem szerepel rosszul.
A nagy és komplex magok felébresztése azonban rengeteg energiát fogyaszt, így a háttérben futó, alacsony teljesítményt igénylő feladatokat hatékonyabb az egyszerűbb, alacsony fogyasztású magokra bízni. Korábban az ARM azzal érvelt az Intel architektúrák ellen, hogy a hatalmas, OoO-rendszerű magok egyszerűen képtelenek megfelelő hatékonysággal üzemelni pehelysúlyú feladatok alatt - úgy tűnik, hogy a vállalat megfogadta saját tanácsát és nem erőlteti a nagy magok lefelé skálázódását, helyette apró, olcsó magokra bízza a triviális feladatok végrehajtását.