:

Szerző: Hlács Ferenc

2017. március 9. 12:44

A felhős videóelemzés és analitika mögé is gépi tanulást tesz a Google

Felhős, gépi tanulásra építő videóelemző API-val és egy sor újdonsággal nyitotta idei Cloud Next konferenciáját a Google. A cég az új technológiák igába hajtásában akár személyesen segít partnereinek.

Teljes gőzzel zakatol a Google Cloud Next '17 konferenciája, a keresőóriás már az esemény első napján lerántotta a leplet néhány fontos újdonságról, amelyek a felhőalapú gépi tanulás területét veszik célba.

Tartalomalapú videórendszerezés

A bejelentések sorát a Cloud Video Intelligence API nyitotta, amely zártkörű béta verzióban már elérhető a fejlesztők számára. Az automatizált videóelemzést segítő interfész deep learning modellekre épít, amelyeket a cég TensorFlow és hasonló keretrendszerekre támaszkodva hozott létre. A megoldás a vállalat szerint az első hasonló eszköz a piacon, amellyel a fejlesztők egyszerűen kereshetnek a videók között, azok tartalmára vonatkozó kulcsszavak alapján. Ezek nem csak a különböző objektumokra vonatkozó főnevek lehetnek, mint "ember" vagy "virág", de akár igék is, mint a "fut", az "úszik" vagy a "repül".

A frissen bejelentett API-t a cég elsősorban nagy médiacégeknek és konzumer technológiákat fejlesztő vállalatoknak szánja, amelyek azt igába hajtva egyszerűen felépíthetik saját médiajegyzékeiket, illetve kezelhetik a felhasználók, ügyfelek által generált nagy mennyiségű strukturálatlan tartalmakat. A megoldásra a Cantemo nevű cég már fel is építette saját videómenedzsment megoldását.

Egyedileg igazított okos analitika

A videóelemző megoldások mellett a gépi tanulás a Google Analytics felületére is utat talált: a Cloud Machine Learning Engine már az analitikai rendszerben is elérhető, azzal a szolgáltatást használó szervezetek saját igényeikhez szabott gépi tanulási modelljeiket képezhetik ki és vethetik be felhős környezetben. Az ugyancsak TensorFlow-alapú megoldással lényegében bármilyen adattípusra kihegyezett gépi tanulási modellek kifejleszthetők, amelyeket a szervezetek tetszőleges szintre skálázhatnak. A terméket a cég továbbá a Google Cloud Platform teljes adatelemző pipeline-jával integrálja, beleértve az adatfeldolgozásra szánt Cloud Dataflow-t, az adatkutatási munkafolyamatokat célzó Cloud Datalabet, illetve az SQL analitikát célzó Google BigQueryt is.

De a Cloud Machine Learning Engine-t harmadik feleknek is lehetőségük van saját rendszereik mögé beállítani, ahogy azt a közelmúltban a Google több partnere is megtette, ennek eredménye többek között a végfelhasználóknak valós idejű analitikát biztosító SpringML, illetve a zero-day sebezhetőségeket felkutató és blokkoló SparkCognition.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Az újdonságok mellett egyébként a bő egy éve elérhető Cloud Vision API is tatarozáson esett át: a szoftver már több millió entitást képes felismerni a Google Knowledge Graph-ra támaszkodva, illetve OCR-ben is erősebb lett, így könyvek, szerződések szövegének felismerésére és digitalizálására is bevethető. A jelenleg 1.1-es verziónál járó API ugyanakkor még nem vetette le a béta címkét.

Ne fejleszd, béreld a gépi tanulást

A Google tehát nagy erőkkel népszerűsíti a gépi tanulást, annak használatához pedig akár közvetlen segítséget is biztosít partnereinek, Advanced Solution Lab (ASL) programján keresztül. Itt a cégek közvetlenül együttműködhetnek a keresőóriás szakértőivel különböző projektjeik kapcsán.

Az iparágban persze mások is ezerrel fejlesztik a saját gépi tanulási megoldásaikat, amelyeket aztán szolágáltatás formájában értékesítenek az ügyfelek számra. Ilyen rendszerekért például a Microsoftnak sem kell a szomszédba menni: az Azure Media Analytics platform a videókban arc-, érzelem- és szövegfelismerésre is képes, a Cognitive Services szolgáltatáscsomag pedig egészen változatos bemenetek feldolgozásával is megbirkózik, a szöveges inputtól a hanganyagon át a képekig és videókig.

Az újabb és újabb gépi tanulásra támaszkodó elemzőmegoldásokkal a cégek láthatóan igyekeznek mindenkit lebeszélni arról, hogy saját, hasonló eszközöket fejlesszen, helyette azonnal igénybe vehető szolgáltatásokat kínálnak, bizonyos esetekben akár egészen az ügyfél specifikus igényeire szabva, mint a Google ASL esetében látható, a cégek ehhez akár egészen a személyes konzultációig is elmennek.

a címlapról