Kisebb léket kapott a Skylake
A prímszámok kutatásával foglalkozó Mersenne komolyabb hibára bukkant a Skylake processzorok mikroarchitektúrájában. Pánikra nincs ok, a javítás már úton van.
A teljes rendszer fagyását eredményező hibára bukkant az Intel Skylake processzoraiban az extrém nagy prímszámok kutatásával foglalkozó Mersenne-közösség. Az épp most 20 éves Prime95 alkalmazás bizonyos beállítások mellett végzetes hibát okozhat a Hyper-Threading technológiával ellátott Skylake processzorok esetében. Az eset pikantériája, hogy a program egy szintén prímszámokkal operáló rendszerstabilitás-tesztet is tartalmaz. Az Intel hivatalos fórumán tett bejelentésből továbbá kiderült, hogy a hibának az AVX-hez is köze lehet, ugyanis az FMA3 utasításkészletet használva a probléma nem jelentkezik.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A tavaly december közepén tett észrevétel után többen is reprodukálni tudták a jelenséget, amit az Intel alkalmazottai már a bejelentést követően komolyan kezeltek. Végül múlt héten a vállalat egyik szakembere közölte, hogy sikerült azonosítaniuk a probléma gyökerét, melyhez egy mikrokód-frissítés keretein belül érezik a gyógyír. Ezt a gyártópartnerek BIOS frissítések formájában juttathatják majd el az ügyfelekhez, tehát a hiba szoftveresen is orvosolható, nincs szükség a termékek visszahívására.
Az processzordizájnok mintegy természetes velejárója az úgynevezett erratum (tsz.: errata), mely a tervezésből eredő különféle hibákat takarja. A szakemberek ezeket a tesztelési folyamatok során részletesen dokumentálják, nagy részükhöz pedig nem szükséges javítás. A szeptemberben kiadott specifikációs frissítés alapján a Skylake processzorokban 53 darab ismert erratum volt, ami a szóban forgó eset miatt eggyel már biztosan gyarapodott azóta.
Nem az első, és nem is az utolsó
Jól szemlélteti a tervezési és tesztelési folyamatok bonyolultságát, hogy a jelenlegihez hasonló bakik rendszeresen előfordulnak, súlyosabb esetekben pedig nem orvosolhatóak szoftveres úton. Az Intel legutóbb a TSX, azaz a tranzakcionális memóriakezelés kapcsán futott bele komoly problémába. A vállalat végül BIOS frissítéssel egyszerűen letiltotta az utasításkészlet használatát, amit csak később, a Broadwell processzorok második steppingjében engedélyezett újra. Ennél lényegesen nagyobb galibát okozott az 5 évvel ezelőtti chipset probléma. A H67-es és P67-es lapkákat érintő komolyabb hiba miatt az vállalatnak 6 millió terméket kellett visszahívni, ami nagyjából 700 millió dollárjába került.
Ennél egyesek számára emlékezetesebb lehet az 1994-es FDIV erratum. A Pentium processzorban talált osztási hibát egy szintén prímszámokat kutató szakember, Thomas Nicely matematikus fedezte fel. A központi egységek első változatai bizonyos lebegőpontos (FDIV) osztási műveleteknél rossz eredményt adtak, és noha a vállalat váltig állította, hogy a hétköznapi vásárlókat a hiba nem érinti, a média annyira felkapta az esetet, hogy közfelháborodás miatt végül minden érintett chipet ki kellett cserélni. Az eset 475 millió dollárjába került az Intelnek.