Gépi tanulással bővült a Microsoft felhős médiaplatformja
Az Azure Media Analytics többek között arc-, érzelem- és szövegfelismerést kapott, és a Hyperlapse videostabilizáló is bekerült a szolgáltatáscsomagba.
Számos új funkcióval bővíti felhős médiafeldolgozó és -steaming szolgáltatáscsomagját a Microsoft. Az Azure Media Services mellé egyelőre nyilvános előzetesként tette elérhetővé a cég az Azure Media Analytics csomagot – ebben olyan fejlesztések kaptak helyet, melyek használatával jelentősen csökkenthető nagy mennyiségű videós tartalom feldolgozásának (emberi) erőforrásigénye.
A Media Services lényegében a néhány héttel ezelőtti Build konferencián bemutatott Cognitive Services API-k nagyvállalati felhasználásra szánt változata, az ehhez szükséges bővített terméktámogatással, rendelkezésre állási és biztonsági vállalásokkal, skálázási lehetőségekkel. A gépi tanulás bevetésével gyakorlatilag szinte valós időben lehet végrehajtani különböző analitikai műveleteket streaming videoforrásokon, így egyrészt a feldolgozás hatékonysága, másrészt az automatizális foka is növelhető.
A Media Analytics része az arc- és érzelemfelismerés, melynek alkalmazásával például nagyobb rendezvényeken lehet akár utólag, akár már az esemény során felmérni a résztvevők reakcióit – utóbbi esetben így a szituációhoz illő gyors beavatkozás is megoldható. Persze az ilyen funkciók mindig komoly adatvélelmi kérdéseket is felvetnek, a hatályos szabályozások teljesüléséről és a megfelelő tájékoztatásről a Microsoft mellett természetesen az érintett cégeknek is gondoskodniuk kell.
First-person Hyperlapse Videos
Még több videó2025: neked mennyi pénzt ér meg a home office? Itt vannak az IT munkaerőpiaccal kapcsolatos 2025-ös prognózisaink.
A "sima" mozgásfelismerés sem hiányzik a portfólióból, amit például biztonsági felvételek szűrésénél lehet alkalmazni, továbbá bekerült a csomagba bejelentésekor meglehetősen pozitív visszhangot kiváltó, és azóta előzetes verzióban elérhető videostabilizáló, a Hyperlapse is – immár a 10 ezer képkockás felső limit nélkül.
Szövegfelismeréssel kapcsolatos fejlesztésekből rögtön három is rendelkezésre áll. Az egyikkel a videós tartalomba ágyazott szöveges információt lehet kinyerni (OCR), és van egy úgynevezett Indexer is, mellyel nyolc nyelv esetében (angol, német, francia, spanyol, olasz, portugál, arab és kínai) beszéd-szöveg átalakítást is igénybe vehetnek az ügyfelek. Szintén szövegelemzéssel kapcsolatos a tartalommoderálás (például nagy forgalmú fórumon) megkönnyítését, esetleg automatizációját célzó funkció – ezt, és az OCR-t jelenleg csak privát előzetesként, meghívásos úton lehet kipróbálni.