Nyílt bétában a Google Cloud Vision API-ja
Bárki használatba veheti a Google Photos mögött is dolgozó fejlett képfelismerő megoldást. A Google lezárta a Cloud Vision API zárt bétatesztjét, a fejlesztői interfész továbbra is béta státuszban már szabadon igénybe vehető
Megnyitja fejlett képfelismerő API-ját a Google az érdeklődő fejlesztők előtt. A vállalat blogbejegyzésben jelentette be, hogy az egyelőre béta címke alatt elérhető Google Cloud Vision API-val mostantól bárki kiaknázhatja a Photos online képtárhely impresszív keresője alatt is dolgozó technológiát. A vállalat először tavaly december elején tette elérhetővé a megoldást néhány kiválasztott partner számára, akik a cég szerint már sok millió képnél bevetették azt. A szoftver az elmúlt hónapokban ezen fejlesztők visszajelzései alapján csiszolódott publikus bétáig.
A Cloud Vision API a vele "megetetett" képeken számos objektum felismerésére képes, mindennapi tárgyak széles skálájától a földrajzi helyeken át, egészen az emberi arcokig. Utóbbiakon a különböző érzelmeket is meg tudja különböztetni, mint az öröm, harag vagy szomorúság. Az API emellett OCR (Optical Character Recognition) képességeket is kapott, így segítségével a szöveges tartalmak is kibányászhatók az egyes fotókból, leolvashatók vele például az utcatáblák vagy egyéb feliratok. A szoftver számos nyelvvel megbirkózik.
What is Cloud Vision API?
Még több videóÜnnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
A szöveges tartalmakon túl a megoldás a különböző vállalati logókat is kiszúrja a képeken, sőt, segítségével biztonságos képkeresési megoldások is létrehozhatók, amelyek a találatok közül adott kritériumok alapján kiszűrik a nem megfelelőnek ítélt - például korhatáros - képeket. Az API-ra mindezek mellett a kép számos általánosabb tulajdonságának elemzése is rábízható, például a fotón domináns színek meghatározása.
Az API egyes funkcióit a Google használatalapú modellben teszi elérhetővé, így ha egy projekthez csak az OCR-re van szükség, a többi képesség értelemszerűen kimarad a csomagból. A fejlesztők havi legfeljebb ezer kép erejéig a teljes Cloud Visiont ingyenesen használhatják, fölötte a Google három árkategóriába rendezte a különböző funkciókat.
Az említett OCR esetében például ezer darab elemzett képenként 2,5 dollárt kér, ha az egy hónap alatt vizsgált képek száma nem haladja meg az egymilliót. Ugyanakkor ha ez a szám ötmillióig hízik, az egységár 2 dollárra csökken, ha pedig az ötmilliót is meghaladja, 60 centre. A béta időszak alatt a Google legfeljebb havi húszmillió kép elemzését teszi lehetővé. A fenti korlát, illetve a béta státusz miatt a cég érthető módon egyelőre nem javasolja, hogy a Cloud Vision API-t bárki kritikus fontosságú feladatokhoz vesse be.