Megjelentek az új generációs Opteronok
Egy héttel az asztali gépekbe szánt új generációs FX processzorok megjelenése után az AMD piacra dobta az új fejlesztésű, Piledriver magokkal felvértezett Opteronokat is. A 6300-as modellszámot viselő generáció célja megállítani az AMD térvesztését a szerverpiacon.
Tíz nap híján egy éve, hogy az AMD bemutatta régóta várt Bulldozer magos Opteronjait, az innovatív designtól a cég azt várta, szerverpiaci részesedése erősödik az Intel ellenében. A Bulldozer azonban nem váltotta be a hozzá fűzött reményeket ezen a téren, a chipek kétszeres magszámmal is csak megközelíteni tudták az akkor hozzáférhető Xeonokat, így olyan piacokra szűkült be a megcélozható piacuk, ahol a szoftverek nem a magok száma alapján licencelődnek, vagyis a kereskedelmi szerverfeladatok helyett a webhoszting és HPC területre.
Miben más?
Most frissítést kapott az Opteron termékcsalád és megérkezett a 6300-as chipgeneráció, amelyek a Bulldozer erőteljes továbbfejlesztésével létrehozott Piledriver kódnevű magokat kapták. A koncepció továbbra is változatlan, két processzormag megosztozik a frontenden és a lebegőpontos egységen, azonban minden területen történtek kisebb-nagyobb fejlesztések, amelyeknek köszönhetően ezek a lapkák azonos órajelen is érezhetően gyorsabbak az elődöknél. Az AMD mérnökei áttervezték az elágazásbecslő logikát és az utasítás-ütemezőt, finomhangolták a fixpontos és lebegőpontos egységeket, javítottak az L1 és L2 cache hatékonyságán, valamint a prefetchelő egységen is.
Az Abu Dhabi kódnevű új Opteron "látképe"
Emellett megjelent a 6300-as sorozatú Opteronokban négy új utasítás is. Az FMA3 egy lebegőpontos "fused multiply add" utasítás, amely leginkább tudományos szimulációkban és jelfeldolgozásban gyakori vektor- és mátrixműveletek futását gyorsítja, és egyébként kompatibilis az Intel "Haswell" generációs chipjeiben megjelenő FMA3 paranccsal. Új utasítás a BMI (Bit Manipluation Instruction) és TBI (Trailing Bit Instruction), amelyekkel egyes bitmanpulációs műveletek ("suffling") végrehajtási idejét lehet rövidíteni. A negyedik új parancs az F16c, amely a 32 bites egyszeres pontosságú és a 16 bites "half precision" formátumok közti konvertálásra való és az AMD szerint elsősorban multimédiás alkalmazásokban érdemes használni.
Az infrastruktúra az új magok körül viszont maradt a régi: az elsőszintű utasításcache mérete magpáronként 64 kilobájt, az adatcache pedig magonként 16 kilobájt. A másodszintű gyorsítótár magpáronként továbbra is 2 megabájt, a harmadszintű pedig 16 megabájt, ezen a magok osztoznak. A 6300-as sorozatú Opteronok négy memóriacsatornával rendelkeznek, újdonságként támogatottak az 1,25 V feszültségű modulok is, valamint az 1,87 GHz-es sebességű DDR3 modulok - egy foglalathoz 12 DIMM tartozhat, ami 384 gigabájt memóriát jelent. A HT linkek száma legfeljebb 4 lehet. Nem változott a rendszerplatform sem: az Opteron 6300-as generációjú chipek ugyanabba a Maranello platformba illeszkednek mint a tavaly piacra dobott 6200-as változatok, így a már megvásárolt G34 foglalatos szervereket egy BIOS-frissítés után rögtön lehet az új processzorokkal használni - az AMD pechjére viszont az installált bázis elég kicsi.
Az új generáció
Az AMD az architekturális fejlesztések mellett igyekezett arra is elegendő gondot fordítani, hogy a lapkákat a Globalfoundries 32 nanométeres technológiájához igazítsa. Az előző generáció esetében erre feltehetően időszűke miatt nem került sor, mára viszont az AMD és a Globalfoundries is elegendő adattal rendelkezik a kezdetben "köhögősen induló" félvezetőgyártási eljárásról a sikeres optimalizációhoz. Ennek az eredményeképp az új Opteron-generácó csúcsmodellje, a 6386SE 2,8 GHz-es névleges órajelen indul, ami egészen 3,6 GHz-ig is emelkedhet "turbóval" - ez máris 100 MHz-es növekedés a korábbi 6284SE csúcsváltozathoz képest, amelyet idén nyáron dobott piacra a cég, miután rendelkezésére állt megfelelő számú "válogatott" darab. A másik véglet a 6366HE, amely egy 16 magos 1,8 GHz-es darab 85 wattos TDP-vel, 3,1 GHz-es maximális "turbó" órajellel. Általánosságban elmondható, hogy az AMD új Opteronjai 100-200 MHz-cel magasabb órajelet bírnak el azonos fogyasztás mellett mint a korábbi változatok.
Na jó, de mennyire gyors?
Az Opteron 6300-as sorozatú processzorokkal készült nyilvános teszteredmények száma egyelőre limitált, a vállalat saját weboldalán azonban közölt néhány adatot, amelyek képet adnak a nyers számítási teljesítményről, a mérnöki-tudományos feladatok alatt mutatott sebességről, valamint a Java futtatás sebességéről és a Java alatt mutatott energiahatékonyságról.
Az iparágban standardként használt SPEC CPU2006 teszteredmények alapján két- és négyfoglalatos konfigurációban a 2,5 GHz-es, 115 watt TDP értékű Opteron 6380 7-8 százalékkal erősebb a 2,4 GHz-es, szintén 115 wattos Opteron 6278-nál, amely az előző generáció legerősebb "mainstream" chipje volt. Az AMD által mutatott számok szerint nincs érdemi különbség a fix- és lebegőpontos teljesítmény változása között, a legnagyobb eltérés 8,2 százalék, a legkisebb pedig 7,1 százalékos. Az órajelkülönbség 4,1 százalékos a két chip között, további 4 százalékot jelentenek tehát az architekturális fejlesztések eme metrika szerint.
(100% = Opteron 6278)
A vállalat számos mérnöki-tudományos alkalmazás alatt végzett teszt eredményét is közölte, itt az Opteron 6380 eredményét az Opteron 6276-éhoz viszonyította, ami egy 2,3 GHz-es 16 magos processzor, 115 wattos TDP értékkel. Itt már jóval nagyobbak az eltérések, ami a 8,6 százalékkal magasabb órajel mellett a gyorsabb memória támogatásának, na meg az új utasítások beépítésének is köszönhető. A molekuláris dinamikát modellező LAMMPS az új generációs Opteronon futtatva 60-70 százalékkal gyorsult, de a jellemző különbség a két processzor között inkább 10-20 százalékos.
(100% = Opteron 6276)
Publikált az AMD egy SPECjbb2005 eredményt is, amely Java üzleti feladatok alatt mutatja meg a rendszerek teljesítményét, valamint egy SPECpower_ssj benchmark mutatót is, amely Java szerverfeladat futtatása alatt méri az energiahatékonyságot. Az új chip feltehetően az elágazásbecslőn végzett fejlesztéseknek és a hatékonyabb cache-kezelésnek köszönheti a látványos javulást, amely kétfoglalatos konfigurációban 24, négyfoglalatos rendszerben pedig 31 százalék. A SPEC oldalán azonban még nem érhető el az eredmény, így nem tudni, a szoftverkörnyezetben milyen változások történtek, a teljesítménynövekedéshez például újabb Java-verzió is hozzájárulhatott.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A látványosan nagyobb Java sebességnek köszönheti ugrásszerű növekedését az energiahatékonyságot mérő SPECpower_ssj2008 tesztben az új Opteron. Az új lapka az energiahatékonyságban viszonylag kis javulást mutató elődjénél 40 százalékkal jobb (4040 művelet/watt) eredményt ért el ebben a tesztben kétfoglalatos konfigurációban, ami a látványosan magasabb teljesítmény mellett annak is köszönhető, hogy a szerver csúcsterhelésen 308 wattot fogyasztott, míg a korábbi Opteront tartalmazó konfiguráció 320-at. Az új chippel szerelt gép üresjárati fogyasztása is kedvezőbb, 77,9 watt a 82,6 wattal szemben.
Kereskedelmi szerverfeladatok (például SAP SD, TPC, SPECvirt vagy VMware Vmark) alatt végzett további tesztek viszont egyelőre nem nyilvánosak, így nem lehet megítélni, a tavaly óta elvégzett fejlesztések révén az Opteronok alkalmasabbak lettek-e arra, hogy a jellemzően magszám alapján licencelt vállalati alkalmazásokat rájuk bízzák a cégek. Másképp fogalmazva a kérdés az, sikerült-e kitágítani az Opteronok megcélozható piacát, vagy végleg beszorulnak a hosztingszolgáltatók és a HPC telepítések területére. Erre feltehetően a következő hetekben választ kapunk, ahogy az új szerverekkel elvégzett tesztek eredményeit publikálják a cégek a hitelesítő szervezetek oldalain.
Mikor lehet megvenni?
Az AMD tájékoztatása szerint a legnagyobb szervergyártók közül a HP és Dell még az év vége előtt megjelenik a piacon Opteron 6300-as sorozatú processzorokra épülő rendszereivel, de a lapkák már hozzáférhetők a hosztingpiacot és a HPC területet megcélzó Cray, SGI és SuperMicro gépeiben.