Kommentálta a Ryzen CPU-k gyermekbetegségeit az AMD
A Ryzen processzorok egyes gyengébb eredményei mögött húzódó problémákra igyekezett rávilágítani az AMD, amely cég blogbejegyezésben reagált a média és a felhasználók felvetéseire.
Lassan két hete, hogy elrajtoltak az AMD Ryzen processzorai, ez idő alatt pedig számos kérdés merült fel a minden porcikájában új platformmal kapcsolatban, annak teljesítménye ugyanis bizonyos alkalmazásokban (pl. egyes játékokban) elmaradt a várakozásoktól. A processzorokat tervező cég közleményben reagált a független tesztek és a felhasználok által felvetett kérdésekre, megvilágítva a homályos foltokat.
Az AMD hivatalos blogján megjelent nyilatkozat elsőként a Windows szálkiosztását taglalja, erről ugyanis számos esetben feltételezték, hogy nincs teljesen kibékülve a Ryzen processzorok egyedi topológiájával. Ez a nyolc- és hatmagos asztali processzorok esetében háromszintű (CCX->mag->szál), ugyanis a lapkába két négyes csoportban (CCX, vagy Core Complex) helyezkednek el a magok, amelyek között a Data Fabric biztosítja az adatkapcsolatot.
Ennek megfelelően első körben célszerű egyetlen CCX magjait terhelni, ezzel kiiktatva a két komplexum közötti kommunikációt, miközben a másik CCX-et az energiamenedzsment teljesen lekapcsolhatja, a felszabadult fogyasztási keretből pedig turbóval maximalizálhatja az aktív magok órajelét. Időközben kiderült, hogy a Data Fabric sávszélessége valóban szűk keresztmetszet lehet, az ugyanis órajelciklusonként 32 bájt adatot képes forgalmazni a CCX-ek irányába, mindenkori frekvenciája pedig megegyezik a memória órajel-frekvenciájával (MemClk), ami a hivatalosan támogatott leggyorsabb, DDR4-2667 memória esetében 1333 MHz-et jelent. Ez 41,66 GB/s-os sávszélességet eredményez, ugyanakkor azt egyelőre nem tudni, hogy az érték mindkét irányban áll, vagy a 32 bájt a két irány összege (16 bájt fel és 16 bájt le), utóbbi egy irányban már csak 20,83 GB/s-ot eredményezne.
A Data Fabric és a memória órajel-frekvenciájának szinkronja miatt a nyolcmagos Ryzenek a szokásosnál többet profitálnak a gyorsabb RAM modulokból. A német HT4U.net oldal mérései szerint DDR4-2667 és DDR4-3200 között akár bő 10 százalékos különbség is lehet utóbbi javára, igaz ez a differencia csak olyan esetekben jön ki, amikor a két CCX között kiélezett az adatcsere. Erre egy jellemező példa a tömörítés, a szóban forgó teszt szerint 7-Zip alatt titkosítás nélkül a rendszer 9,6 százalékot gyorsult a 20 százalékkal gyorsabb memória hatására, ami a Data Fabric átviteli sebességén is ugyanekkora mértékűt lendített.
Ettől függetlenül a Windows 10 a Zeppelin lapka felépítéséhez igazodva, optimálisan osztja ki a szálakat, amit a PC Perspective részletes elemzése is megerősít. Az online magazin vizsgálata szerint a Microsoft operációs rendszere négy szálig egyetlen CCX-et terhel, és csak ezt követően kezdi el használni a másik komplexum erőforrásait. E mellett a SMT-t, azaz a magonkénti kétszálas végrehajtást is megfelelően aknázza ki a kernel, amely először a processzormagok páros szálait terheli (0, 2, 4, 6, stb.), az SMT miatt ugyanis két egyetlen magon belüli szál jóval lassabb végrehajtást kínál mint két mag egy-egy szála (kb. 2x60% vs. 2x100%).
Az AMD szerint a szálkiosztással kapcsolatos kérdéseket a Sysinternals Coreinfo eszközének régebbi verziói generálták, azok fals adatokat adtak vissza, az eszköz v3.31-es verziója viszont már helyesen riportolja a működést. E mellett a cég kitért a Windows 7 és Windows 10 közötti eredménykülönbségekre is, ugyanis a régebbi rendszer alatt a Ryzen kedvezőbb mérési eredményeket produkált, ami az AMD szerint a két szoftver közötti alapvető architektúrális különbségeknek tudható be.
Bár a szálkiosztással nincs gond, a Windows 10 energiamenedzsmentje nincs teljesen kibékülve a Ryzennel, ezért az AMD azt javasolja, hogy a felhasználok a maximális teljesítményére eléréséhez állítsák High Performance (nagy teljesítmény) módba a rendszert. Ennek oka, hogy Balanced (kiegyensúlyozott) állásban a magokat igyekszik a lehető leggyorsabban parkolóállásba tenni a Windows, miközben azok frekvenciája és órajele lassabban is változik, ami például a turbó reakcióidejére van negatív hatással. A High Performance mód bár ezeket kiküszöböli, cserébe megnő a processzor üresjárati fogyasztása, amit egy frissítés fog kiküszöbölni, amivel várhatóan az alapértelmezett Balanced mód mellett is optimális lesz a teljesítmény. Azt egyelőre nem tudni, hogy ez Windows update formájában érkezik, vagy valamilyen saját megoldással készül az AMD, de április elején kiderül, a cég ugyanis ekkora ígérte a javítást.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A cikk tárgyát adó bejegyzés a processzorok hőmérsékletére is kitért, ugyanis a beépített hődióda az 1700X és 1800X modellek esetében a vártnál magasabb értéket jelezhet. Ennek oka, hogy a rendszer 20 fokot ad hozzá a mért adathoz (Tj), amire az AMD szerint a konzisztens ventilátor szabályzás miatt van szükség. A gyakorlatban ugyanakkor nincs ekkora különbség az alaplap és a CPU-ba integrált dióda mérése között, csupán előbbi lassabban éri el a dióda által jelzett értéket.
Végül, de nem utolsó sorban a játékokra is kitért a közlemény, a gyenge eredmények mögött sokan az SMT-t, azaz a magonkénti kétszálas végrehajtást sejtették. Az AMD szerint nem itt van a kutya elásva, a cég saját mérései szerint legrosszabb esetben semleges az SMT, negatív hatást nem mutattak ki a belső mérések, bár ennek néhány független teszt ellent mond. A cég szerint problémát a feljebb ecsetelt topológia okozhat, a szoftverek ugyanis felülbírálva a Windows kernelét, saját kezükbe vehetik a szálkiosztást, ami bizonyos esetekben negatívan befolyásolhatja az fps értékeket. Ezt az AMD szerint viszonylag egyszerűen lehet orvosolni, a cég már dolgozik a fejlesztőkkel, amihez első körben összesen nagyjából 300 tesztplatformot küldött ki.
Már csak jobb lehet
Bár a Ryzen rajtja sem volt tiszta, a processzorok lényegesen jobb benyomást tettek a médiára, mint a Bulldozer családot bevezető FX-ek, vagy éppen az első Phenomok. A piaci bevezetés után az AMD és az alaplapokat gyártó partnerek koncentrálhatnak a gyermekbetegségek javítására. Az egyes problémákat kipipálva már csak javulhat a platform teljesítménye, amire különösen játékok alatt lenne szükség, hisz a konzumer PC-piac jelenlegi mozgatórugóját épp a gamer társadalom jelenti.