Nyártól érkezik az adat-deduplikálás a HP virtuális szalagkönyvtáraiba
Júniusban érkeznek a HP első virtuális szalagkönyvtárai, amelyek már képesek adat-deduplikálásra. A technológia segítségével csökkenthető a tárolt adatok mennyisége, vagyis kevesebb kapacitás is elég, ráadásul gyorsítható a mentés és a visszaállítás is.
Az adat-deduplikáció megszületéséhez az a felismerés vezetett, hogy adatmentésnél tetemes mennyiségű redundáns információt tárolnak el a cégek, még akkor is, ha inkrementális mentésről van szó. Gondoljunk bele, hogy egy, a munkatársaknak szétküldött Word-dokumentum vagy Excel-táblázat hány példányban van jelen a vállalati hálózaton, a dolgozók gépein, de akár egyetlen dokumentumból is több példányt, több verziót őrizhetünk, amelyek adott esetben csak alig térnek el egymástól.
Inkrementális mentésnél csak az előző mentés óta megváltozott állományokat tároljuk, de a mentőszoftverek a fájlokat akkor is teljes egészében elmentik ilyenkor, ha csak minimális változtatások történtek bennük. Az adat-deduplikáció lényege, hogy a granularitást egy szinttel csökkentve már nem a fájlok, hanem blokkok szintjén történik a változások ellenőrzése. A tárolni kívánt adatokat a mentés során apró (2-12 KB) blokkokra szeletelik, és hash-elik (pl. MD5 vagy SHA-1), amiket egy index tárol. Ténylegesen csak azok az adatok kerülnek mentésre, amelyek hash-e még nem szerepel a táblázatban, azaz újak.
A deduplikáció segítségével tehát látványosan csökkenthető a ténylegesen mentett adatok mennyisége: a vállalat összes dolgozójának postafiókjában megtalálható vezetői levelet fizikailag csak egyszer tárolja a rendszer, mint ahogy az a sok változatban megőrzött prezentációt is, amelynek mindig csak ugyanazt az oldalát módosítottuk. A deduplikáció azonban nem csak dokumentumok mentésénél lehet hasznos, hanem például hatalmas, de lassan változó adatbázisok (pl. ügyféladatok) hatékony tárolásánál is.
A kevesebb tárolt adatmennyiség számos kézzelfogható előnnyel jár a vállalatok számára. A tömörítés révén kisebb diszk- vagy szalagkapacitás is elegendő az adatok tárolására, ezáltal kisebb beruházás is elegendő lehet, illetve fix kapacitás esetén több mentés őrizhető meg. Nem csoda, hogy az adat-deduplikáció az adattárolási iparág egyik legfelkapottabb témája.
A HP első, deduplikációra képes termékei belépő szintű virtuális szalagkönyvtárak lesznek (StorageWorks 2500, 4500) , de a technológia őszre a csúcskategóriás modellekbe (VLS EVA Gateway család) is megérkezik. Az algoritmus teljesen transzparens, vagyis a mentőszoftvertől független, így nem szükséges annak frissítése vagy cseréje -- mindazonáltal várható, hogy a jövőben megjelenő mentőszoftvereket is felkészítik majd erre a gyártók.