Randa porszem miatt megy tönkre az Intel Atom órája
A vártnál sokkal gyorsabban "romlanak meg" az Intel processzorai, a nagyjából három éves központi egységeket cserélnie kell a vállalatnak, ami a processzorgyártónak százmilliós nagyságrendű kiadást, az érintett partnereknek és azok ügyfeleinek pedig kellemetlenséget okozhat.
Végzetes hibára bukkant C2000-es sorozatú, B0 steppinges Atom processzoraiban az Intel, a kellemetlen baki miatt a processzorok idő előtt elromlanak, az arra épülő rendszerek pedig emiatt teljesen használhatatlanná válnak. A problémát tetézi, hogy az érintett családba tartozó Avoton és Rangeley kódnevű processzorok elsősorban vállalati környezetben, szerverekben, különféle hálózati eszközökben üzemelnek, így a hiba bizonyos esetekben súlyosabb következményekhez vezethet.
Az AVR.54 számú hibát az Intel már dokumentálta, illetve arról egy rövid hivatalos tájékoztatót is elérhetővé tett. Ez alapján a probléma a rendszerchipbe integrált LPC-ben (Low Pin Count) gyökerezik, a 33,3 MHz-es órajelet vezérlő rész működése idő előtt megáll, ami nélkül rendszer használhatatlanná válik. Az LPC alaplapi busz ugyanis az IBM PC rendszerű gépek egy alapvető eleme, ami alacsony átviteli sebességű összeköttetést biztosít példádul a BIOS/UEFI vagy a Super I/O között. Az ISA busz egy helyettesítőjeként bemutatott LPC specifikációja összesen 7 kötelező jelet ír elő a kétirányú adatforgalomhoz, amelyek közül 4 szállítja a multiplexelt címet és adatot, a 3 másik pedig a vezérlőjel (frame, reset és órajel).
A The Register megpróbálta kideríteni a hiba pontos okát. A magazin kérdésére reagálva az Intel névtelenségbe burkolt szóvivője elmondta, hogy a hibát az áramkör gyorsabb degradálása okozza, a félvezetők egy csoportjának tulajdonságai a vártnál sokkal hamarabb változtak meg. A hiba első hallásra nagyon hasonlít a Sandy Bridge (Cougar Point) lapkakészleténél későn felfedezetthez, az épp hat éve történt bakit a 3 Gbps-os SATA vezérlő órajeltovábbító hálózatában található tranzisztor okozta, amely a vártnál nagyobb áramot szivárogtatott, emiatt pedig a félvezető idővel tönkrement, minek következtében a teljes, négy portos vezérlő meghibásodott.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
A probléma egyik legnagyobb elszenvedője a Cisco, akinek számos hálózati terméke épít a 2013 nyarán bejelentett C2000-es sorozatú Atom processzorokra, a listába 2016 november 16 előtt gyártott routerek, tűzfalak, és switchek egyaránt tartoznak. A Cisco nem erősítette meg, hogy a meghibásodások az Intel Atom processzorok miatt történnek, a vállalat ilyen esetekre vonatkozó belső szabályzata ugyanis tiltja az érintett beszállító megnevezését, a hivatalos közleményből viszont könnyen kikövetkeztethető, hogy problémát az Intel termékei okozzák.
De nem a Cisco az egyetlen elszenvedője a problémának, az Atom C2538-re épülő Synology DS1815+ NAS-ok is hullanak, a gyártó emiatt cseréli az érintett termékeket. A két említett márka mellett még több cég is épített a problémás Atomokra, a listán az Aaeon mellett a HP, az Infortrend, a Lanner, a NEC, a Newisys, a Netgate, a Netgear, a Quanta, a Supermicro, illetve a ZNYX Networks is ott van. Az Intel nem árulta el, hogy összesen hány darab hibás processzor került piacra a tizenöt különféle modellt számláló szériából, a probléma pénzügyi hatását viszont jól szemlélteti a január végi pénzügyi jelentés, ahol az adatközponti részleg üzemi eredmény 290 millió dollárt (13 százalék) esett egy egyszeri, nem részletezett nagyobb kiadás miatt, ami valószínűleg az Atomok garanciális cseréjét takarta.