Foszlányalgoritmus, komparátor: új eszközök az SCO Group elleni harcban
[HWSW, eWEEK] A nyílt forráskódú szoftverek világának kiemelkedő
Amint arról korábbi híreinkben beszámoltunk, az SCO-ügy még márciusban kezdődött, amikor a cég keresetet nyújtott be az egyik utahi bíróságon az IBM ellen a két vállalat közt fennálló, Unix rendszerekkel kapcsolatos szerződés állítólagos megszegése miatt. Az SCO Group szerint az IBM lehetővé tette egyes Unix-technológiák átszivárgását a Linuxba, ezért a cég először egymilliárd dolláros kártérítést követelt az IBM-től, amit később hárommilliárd dollárra egészített ki, és az elmúlt hónapokban több ízben is, minden elérhető fórumon figyelmeztette a vállalati Linux-felhasználókat a Linuxszal kapcsolatos szellemi tulajdon jogosulatlan felhasználásából eredő esetleges jogi bonyodalmakra, majd augusztusban bejelentette azt a Linux binárisok futtatását lehetővé tevő licenccsomagot is, amellyel a helyzet szerintük megoldható.
Raymond neve az események során többször is előkerült, utoljára az SCO Group elnök-vezérigazgatója, Darl McBride említette tegnapi nyílt levelében, azonban ennél sokkal fontosabb volt Raymond májusi akciója, amikor a hacker bejelentette, hogy adatokat gyűjt az SCO Group ellen, és olyan Unix-hackerek jelentkezését várja, akik munkájuk során már hozzáfértek valamelyik jogvédett Unix binárisain és dokumentációján kívül a rendszer forráskódjához is úgy, hogy nem kellett aláírniuk harmadik felet kizáró titoktartási szerződést (non-disclosure agreement, NDA). "Tegyünk róla, hogy megbánják azt a napot, amikor még úgy gondolták, hogy ez egy jó ötlet, bizonyítsuk be, hogy nincsenek üzleti titkaik" -- írta a felhívással egyidejűleg Raymond, utalva arra, hogy a Unixok több mint harmincéves örökségét nem sajátíthatja ki egyetlen vállalat.
A héten kiadott új eszköz talán épp az adatgyűjtés legfontosabb eszköze lesz, a Comparator a megadott forrásfákat egy ún. shred algoritmus (foszlányalgoritmus) segítségével rövid -- alapértelmezésben háromsoros -- egyező részletekre bontja, ezekhez a részletekhez pedig egyenként egy MD5 értéket generál. A komparátor képes egy teljes forrásfáról tördelőalgoritmussal (szintén MD5 hash) olyan számadatokat generálni, amelyek egy későbbi összehasonlításkor (az esetleg zárt kódú) forrásfa helyett megadhatók a program számára, így ideális eszköze lehet a különféle kereskedelmi Unixok és a Linux közötti összehasonlításoknak. A Comparator kimenete a Unix guruk kedvenc fejlesztőeszközében, az Emacs-ben feldolgozható formátumban készül el, de a csomag Filterator néven tartalmaz egy utófeldolgozó segédprogramot is.
Raymond az eWEEK-nek elmondta: "A shred technikának két előnye van: az egyik, hogy csodálatosan gyors, a másik pedig, hogy ha egyszer megvan a hash lista egy adott forrásfáról, akkor az eredeti kód nélkül is készíthetők összevetések más forrásfákkal. Az általam készített verzióban van egy javítás az eredeti shred algoritmuson, és egy olyan implementációs trükköt is bevetettem, amelynek az eredményeképp, ha megfelelő mennyiségű memória van a számítógépben az [MD5] összegek [...] tárolásához, akkor jelentős gyorsulás érhető el." A program a hírek szerint egy 1,8 GHz-es Athlon rendszeren másodpercenként 55000 sor összehasonlítására képes. A Comparator Raymond weboldaláról tölthető le.