Milyen változásokat tartogat idén az adatpiac?
Nem csak a HWSW teszi meg minden decemberben a következő évi technológiaipari jóslatait, hanem ennél egy szűkebb szegmensben, az adatpiacon is minden évben megszületnek a predikciók. Mi igazolódott a 2019-es jóslatokból és mi várható 2020-ban?
Az AI-lufi még nem pukkadt ki, az adatelemzők nem feküdtek rá az ok-okozati összefüggések elemzésére, viszont a Hadoop érának tényleg az alkonyához közelítünk – foglalható össze Prekopcsák Zoltán, Prezi adatelemzési vezető 2019-es jóslatainak kiértékelése. A szakember évek óta minden év elején tesz három-három jóslatot az adatpiaccal kapcsolatban, így a korábbi évek kiértékeléseit és a jövő évi jóslatokat is meghallgathattuk a Big Data & Analytics meetup évindító rendezvényén, melynek Prezije itt található.
A Hadoop éra végét több tényezővel is igyekezett alátámasztani a Prezi szakértője, melynek bizonyításaként a LinkedInről vett összeállítást is használt. A szakmai közösségi oldalról Prekopcsák Zoltán és Hellinger Péter rendszeresen kigyűjti, hogy az adott hónapban a Hadoop érához tartozó cégekben mennyien dolgoztak, ami talán nem pontos érték, de a tendenciákat mutatja.
Az ábra alapján jól látszik, hogy a MapR földbe állásával erősen megcsappant a Hadoophoz köthető cégeknél dolgozók száma. Sőt, a Cloudera és a Hortonworks összeolvadását követően a közös vállalat is havonta 50-100 főt veszít a dolgozói létszámból. Lassan a Cloudera is távolodik a Hadooptól, hiába számít klasszikus vendornak, mostanra egyre több a Kubernetes alapú fejlesztése – tette hozzá az adatelemző.
2025: neked mennyi pénzt ér meg a home office? Itt vannak az IT munkaerőpiaccal kapcsolatos 2025-ös prognózisaink.
Szóval a Hadoop éra végének 2019-es jóslata igazolódni látszik, ellentétben az ok-okozati elemzések (causality) felfutásának jóslatával, amiben nem jött még el az áttörés. Prekopcsák Zoltán arra tippelt ugyanis, hogy 2019-től már nem csak korrelációkat fogunk nézni az adatokban, hanem tudományos alapon állapítjuk meg az ok-okozatokat. A jelenlévő közönség is alátámasztotta a jóslat sikertelenségét, mindössze egy-két ember jelentkezett a kérdésre, hogy készített már ilyen vizsgálatot. Ugyanígy a harmadik predikciós sem igazolódott, mely szerint az AI fejlesztések hangoztatása, és a sajtó érdeklődése is alábbhagy a téma iránt. Úgyhogy az adatszakértő 2020-ra újra megkockáztatta ezt a jóslatot.
Vége az AI-körüli felhajtásnak?
Most már aztán tényleg kipukkad a lufi 2020-ban – jósolta Prekopcsák. Hozzátette, hogy hatalmas félreértések vannak a fogalommal kapcsolatban, ezért egy „szubjektív térképen” szemléltette, hogy milyen témaköröket szokás a fogalom alatt felsorakoztatni. Az ábrán egy fogalom minél közelebb van a bal alsó sarokhoz, annál inkább elterjedt a hétköznapokban. A határoló vonalak pedig szemléltetik, hogy mit tekinthetünk mindenki számára elérhetőnek, mikor válik egy fejlesztés praktikussá (vagyis annyi pénzből megvalósíthatóvá, hogy megérje), és végül mi tartozik még a lehetséges kategóriába.
Ezen keretek közt találhatók meg az ábrán a használati esetek. Például az ajánlórendszerek, a spamfilterek, a beszédfelismerés már régóta jól működő dolgok, a hétköznapi élet részei. A praktikus kategóriába tartozik a gépi fordítás, a tárgyfelismerés és az önvezetés alapszintű részei. A praktikus és lehetséges határok közt jelenik meg a szakember szerint az elmúlt években nagy áttöréssel járó képfelismerés, képgenerálás, kamuvideó (deepfake) generálás. A tényleges önvezető autó és az Artificial General Intelligence (a magát fejlesztő AI) viszont elég messzi jövőnek tartható.
A mesterséges intelligencia lufi kipukkadásától mindenki csalódott lesz, Prekopcsák merész jóslata szerint megszüntetik a projekteket. Majd kell pár év, hogy visszatérjünk egy korábbi fázishoz, mikor praktikus és értelmes projektek készültek.
Végre jobb lesz az SQL
Sok olyan cég kap hatalmas befektetést, ami nem mesterséges intelligenciát vagy gépi tanulást ígér a felhasználóknak, hanem jól meg akarja csinálni az SQL-t – mutatott rá a Prezi adatalemzési vezetője. A cloud data warehouse-ok, és a többféle storage fölé ráülő virtuális SQL rétegek 20-50 millió dolláros befektetéseket kapnak. Míg régen a kockázati tőkés befektetők önmagukban kevésnek találták volna ezeket a fejlesztéseket mondjuk mesterséges intelligencia használata nélkül, addig mostanra elkezdték felismerni a fontosságát. Például a Starburst a befektetéséről szóló jelentésben is kifejezetten az szerepelt, hogy egy jó SQL engine-t fognak csinálni. Érdekes kihívásnak tűnik 2020-ra, hogyan lehet a változatos adatforrások fölé egységes elemzői felületet tenni, anélkül, hogy az összes eszközünket egyesével minden adatforráshoz integrálni kellene.
Folytatódik az adatkonszolidáció
Tavaly nagy átrendeződés kezdődött az adatpiacon a már emlegetett MapR-problémákkal, a Cloudera és Hortonworks összeolvadásával. Továbbá a Tableau-t megvette a Salesforce, a Lookert pedig akvirálta a Google. Mindez igazán nagy és váratlan lépés volt, de annyi vendor és annyi adattal kapcsolatos eszköz van a piacon, hogy értelemszerű a tisztulás. Prekopcsák Zoltán harmadik jóslata szerint idén is folytatódik az erőviszonyok átrendeződése a piacon, méghozzá nem csak az adatinfrastruktúra és a vizualizáció rétegében. Hanem a teljes datastackben megjelennek azok a szereplők, akik összevásárolják a jó fejlesztéseket, hogy aztán teljes platformot szolgáltassanak.