Egységes infrastruktúrát kap az SQL és a Hadoop
Azonos szekrényekbe pakolhatóak a strukturálatlan és strukturált adatok az új EMC Greenplum DCA rendszerrel.
Az EMC bemutatta Modular Data Computing Appliance névre keresztelt új rendszerét, amely képes egységes infrastruktúrát kínálni a relációs adatbázisok és a strukturálatlan adatokat tartalmazó Apache Hadoop adatbázisok számára is.
Felületkezelés
A Modular DCA szekrényébe négy modul illeszthető, ezek lehetnek a szokásos Greenplum Database Module-ok (Standard illetve nagy kapacitású változatban), de lehetnek Hadoopot futtató Greenplum HD modulok is. A rack fogad ezen felül Data Integration Accelerator (DIA) egységeket is, amelyeken a partnerek alkalmazásai futnak. A rendszer képes az egységeket minden kombinációban fogadni - ebben azonban ki is merül a különböző adatstruktúrák egyesítése.
A közös tárolószekrényeken kívül ugyanis a kétféle, SQL-alapú és Hadoop-alapú adatbázis-rendszer között nincs átjárás, így a Modular DCA semmilyen szinten nem képes összeolvasztani a két forrásból származó adatokat - erről az analitikára használt eszközöknek kell gondoskodniuk. Az egységes infrastruktúrának természetesen vannak előnyei, az egy felületről üzemeltethető, azonos platformon futó rendszerek jelentős költségcsökkentést hozhatnak.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
Bár az egyes versenytársak (például a Teradata által felvásárolt Aster Data) már képesek a különböző adatok közötti határ elmosására, az EMC megoldása erre egyelőre nem képes. Ugyan a közös platformra hozott rendszerek már a jó irányba tett lépésként értékelhetőek, a gyártó által hangoztatott teljes integráció még messze van. A Hadoopot nagy tételben használó szervezetek számára kérdéses marad, hogy az ilyen rendszerekhez tipikusan használt tömeghardverrel az EMC árban fel tudja-e venni a versenyt, illetve a kínált előnyök felül tudják-e írni az esetleg számottevően magasabb árat.
Workbench - tesztelésre
Az appliance-szel egyi dőben egy Greenplum Analytics Workbench nevű hosting szolgáltatást is bemutatott az EMC. A több mint ezer node-ból álló rendszert a Hadoop nyílt forráskódú fejlesztői közösség rendelkezésére bocsátják, tesztelésre. Az EMC várakozásai szerint a Workbench segítségével felgyorsulhat a Hadoop fejlesztése, stabilabbak lehetnek a kiadások - nem mellékesen pedig a közösség az EMC termékeire is optimalizálhatja a szoftvert. A most bemutatott Modular DCA a minőségbiztosítás utolsó fázisában van, általánosan az év végére lesz elérhető.