ARM és szerver? A Qualcomm új lapkával próbálkozik
Határozott belépővel próbál szerencsét az ARM-os szereplőknek eddig bevehetetlennek tűnt piacon a cég, a első számú célpontot a felhős adatközpontok jelentik.
Bemutatta első, szerverekhez tervezett processzorait a Qualcomm. Centriq 2400 családdal mindent beleadott a kaliforniai tervezőcég, a magok száma mellett a gyártástechnológiával sem spóroltak a mérnökök. A processzor legfeljebb összesen 48 magot vonultat fel, ráadásul az azokat tartalmazó lapka 10 nanométeres gyártástechnológiával készül, ami előnyt jelent a piacot évek óta uraló Intel 14 nanométeres megoldásaival szemben. Ezek ellenére a siker korántsem garantált, a területen abszolút kezdőnek számító Qualcommnak most tucatjával kellene meggyőznie a potenciális ügyfeleket arról, hogy ruházzanak be a mindeddig vajmi kevés sikert felmutató ARM-os ökoszisztémába.
A Qualcomm egy meglehetősen komplex lapkát állította össze belépőnek, abban ugyanis párba szedve (Falkor duplex) összesen 48 darab processzormag, azokhoz kapcsolódóan pedig 12 megabájt L2, illetve 60 megabájt L3 cache kapcsolódik. A magok közötti kapcsolatot egy kétirányú, (kör)gyűrűs buszrendszer biztosítja, amely másodpercenként 250 GB/s-os sávszélességet biztosít. A processzormagok teljesen egyediek és kimondottan a szerverekhez készültek, amelyhez korábbi AMD, Intel, és Broadcom mérnököket is szerződtetett a Qualcomm. Az így megszületett ARMv8-A utasításarchitektúrát használó, kizárólag 64 bites kódot futtató Falkor mikroarchitektúra egyes részleteiben egyezik a legújabb Snapdragonokból ismert Kryo családdal.
A magok külvilághoz kapcsolódását egy hatcsatornás, DDR4-2667 memóriát támogató vezérlő biztosítja, amely a legfeljebb 768 gigabájt összkapacitású modulukra 128 GB/s sávszélességet kínálhat, amit inline tömörítéssel fejel meg a kontroller, növelve az effektív értéket. A beépített PCI Express vezérlővel már kicsit szerényebben bánt a Qualcomm, az ugyanis csupán 32 Gen3-as sávot kínál, amely az Intel és AMD aktuális megoldástól egyaránt elmarad, ami például az NVMe SSD-k számát korlátozhatja. A tervezőcég kiemeli, hogy lapkája a chipsetet is integrálja, így a gyártóknak nem kell helyet (és hűtést) biztosítani egy külső lapkához.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
Ahogy a HWSW korábban megtippelte, mindezt a Snapdragonok gyártásánál is partner Samsung bérgyártó üzletága önti szilíciumba. A 835-ös alkalmazásprocesszorokkal már megismert 10LPE kódnevű eljárás tranzisztorsűrűségben felülmúlja a szerverpiacon legnagyobb rivális Intel 14 nanométerét, teljesítményre (órajelre) kihegyezett lapkánál közel 17 százalékkal kisebb SRAM cellák gyárthatóak a dél-koreai cég eljárásával. Mindez kapóra is jött a Centriqnek, az ugyanis nem kevesebb, mint 18 milliárd tranzisztort vonultat fel, amit a Samsung eljárásának hála viszonylag kicsi, 398mm2-es területen sikerült csatasorba rendezni.
A felsorolt egységeket első korbán három modellel osztotta fel a Qualcomm. A csúcsot a Centriq 2460 képviseli, amelyben minden aktív, tehát a 48 mag és a 60 MB L3 is, előbbiek alapórajele pedig 2,2 GHz, ami turbóval 2,6 GHz-re szökhet fel, az első hallásra alacsony, 120 wattos TDP erejéig. Ennél alig kínál kevesebbet a Centriq 2452, amelyben két magot (vagyis egy Falkor duplexet) és az azokhoz kapcsolódó 2,5 megabájt L3 cache-t tiltotta le a Qualcomm, más nem változott. A legolcsóbb, 2434 számozásra hallgató modellben már picit jobban megszaladt az olló, ez 40 magot és 50 MB L3-at kínál 2,3 GHz-es alap-, és 2,5 GHz-es turbó mellett, a TDP pedig 110 watt. A processzorokat rendre 1995, 1373, illetve 888 dollárért kínálja a cég, amely alapján a középső darab, azaz a Centriq 2452 tűnik a legjobb vételnek.
A Qualcomm ezeket három Intel modell ellen küldi harcba: a 2460 a Xeon Platinum 8180 (28 mag, 2,5-3,8 GHz, 205W TDP), a 2452 a Xeon Gold 6152 (22 mag, 2.1-3.7 GHz, 140W), a 2434 pedig a Xeon Silver 4116 (12 majd, 2,1-3,0 GHz, 85W TDP) ellenfele lenne. A Qualcomm szerint processzorai minden tekintetbe, így számítási teljesítmény, hatékonyság, illetve ár szempontjából is jobbak. A cég ezeket saját SPECint_rate2006 méréseire alapozza, amely alapján tempóban hozza az Inteleket, bizonyos esetekben pedig gyorsabb azoknál. Hatékonyságban már egyértelmű az előny, az árazást tekintve pedig nagyjából négyszer kedvezőbb a Centriq processzorok mutatója.
Sokadik nekifutás
Az ARM-alapú szerverprocesszorok kalandjába eddig jóformán mindenki belebukott, a Calxeda mellett a listán ott az Applied Micro X-Gene családja, vagy a Broadcom Vulcan projektje, és az AMD kvázi halva született Opteron A1100 sorozata is, fél évtizedes távlatban sem sikerült akár részsikereket sem elérniük a rendszereknek. A kudarc oka nagy részt az Intel igen agresszív stratégiájában is keresendő, a domináns, a piacot magának tartogató gyártó roppant agresszív megelőző csapásokkal gátolta meg az ARM piacszerzését, a Xeon D családdal vagy az Atom magok szerveres implementációjával (Avoton és Centerton família) minden versenyelőnyüktől megszabadította a konkurenciát.
A Centriq tulajdonságait tekintve azonban talán még sosem mutatkozott ilyen jó esélye ARM-os tervezőcégnek. A Qualcomm szerint már akadnak is érdeklődők megoldására, az Alibaba, és az ARM-os világgal már korábban bepróbálkozott (Moonshot) HPE épít a Centriqre. Ezek mellett már ott a Microsoft is, amely már hónapokkal ezelőtt elárulta, hogy a Project Olympus keretein belül a Qualcomm fejlesztését is kipróbálja. Végül, de nem utolsó sorban a rövid listán ott a másik adatközpontos mamut, a Google is, amely korábban elmondta, hogy már 20 százalékkal kedvezőbb költség/teljesítmény mutató mellett átállnának POWER processzorokkal szerelt rendszerekre, és ez nyilván áll más utasításarchitektúrákra is.
Ma már ugyanis az eltérő utasításarchitektúra nem jelent annyira komoly akadályt az egyedileg kiépített adatközpontok esetében - itt ugyanis a szoftveres kötöttség nem olyan nagy probléma, a szabad szoftveres környezetek és a saját szerveroldali alkalmazások relatíve könnyen fordíthatóak újra más processzorokra. A szervergyártók és a szoftverfejlesztők tehát készen állnak a potenciális váltásra, a mikroszerverekkel már mindenki szerzett elegendő tapasztalatot, a Linux után pedig már a Windows Server is barátkozik az ARM utasításarchitektúrával.