FlasK avagy az optimalizáció csodákra képes
Nos, a program szinte siralmasan gyengén futott az Intel Pentium 4 processzoron, ám pár nap múltán az Intel kiadott egy Pentium 4-re és SSE2-re optimalizált változatot, aminek segítségével 366%-os sebességnövekedést értek el. Így már száguldott a Pentium 4 és hátul kullogott az Athlon.
Ezen felbátorodva az AMDZone FlasK projekt keretében Sean Stanek és Alex Goodrich kevesebb, mint egy óra alatt elkészítették a program Athlon-ra és 3DNow!-ra optimalizált változatát, ami 259%-ot gyorsult az eredeti verzióhoz képest. Így az 1,2 GHz-es Athlon és az 1,5 GHz-es Pentium 4 nagyjából egyformán teljesít.
És hogy mi a hír? Nincs hír. Csupán szerettük volna egy kézzelfogható példával illusztrálni a SIMD utasításkészletek (MMX, SSE, SSE2, 3DNow!) erejét és a bennük rejlő lehetőségeket. Sokak szerint az x86 processzorok már-már annyira komplex felépítésűek, hogy a térbeli utasításpárhuzamosítás helyett sokkal nagyobb lehetőségek rejlenek a hatékony SIMD utasításokban, de természetesen csak akkor, ha a fejlesztők kihasználják azokat.
Szerény véleményem szerint a fenti példa elég jól érzékelteti, milyen tartalékok vannak a Pentium 4-ben, és biztos vagyok benne, hogy az első SSE2-re kihegyezett "komoly" szoftverek megjelenésekor sokan fogják komolyan megfontolni az Intel új processzorára épülő számítógépek megvásárlását.