2003. április 29. 17:40

Beszédfelismerés ajakmozgás-követéssel támogatva: Intel AVSR

Az Intel kutatói tegnap egy olyan szoftvert bocsátottak ki nyílt forráskódú

Az Intel kutatói tegnap egy olyan szoftvert bocsátottak ki nyílt forráskódú licencfeltételekkel, amely lehetővé teszi az ajakmozgások követését, és képes azokat értelmezni. Bár a modern beszédfelismerő algoritmusok jól működnek, ha háttérzajt sikerül kiküszöbölni például egy headsettel, a hangfelismerés pontossága jelentős mértékben csökken, ha az alkalmazásoknak a zajos környezettel (a közterületek például már ilyennek számítanak) is meg kell küzdeniük.

Az új Audio Visual Speech Recognition (AVSR) szoftver az Intel OpenCV nevű arcmozgás-felismerő könyvtárának képességeit kihasználva képes a beszélő arcának detektálására és az ajakmozgás követésére. A videoadatok és a hagyományos beszédfelismerési technológiák segítségével sokkal pontosabb eredmény érhető el mint korábban, így ott is alkalmazhatóvá válik a rendszer, ahol eddig ez a háttérzaj miatt elképzelhetetlen lett volna.

Az Intel olyan technológiát szeretne kifejleszteni, amely képessé teszi a számítógépeket az "emberi" kommunikációra. A gyorsabb mikroprocesszorok, a digitális képfeldolgozó eszközök árának csökkenése és az olyan, nagyobb video-sávszélességet biztosító technológiák, mint az USB2 lehetővé teszik az ilyen algoritmusok futtatását egy PC-n is.

A 2000 óta letölthető OpenCV kódját a programfejlesztők a játékoktól kezdve az ipari alkalmazásokig sokféle rendszerbe építették bele. A C nyelven írt kód az egyik legengedékenyebb nyílt forráskódú licencszerződés, a BSD licenc feltételei mellett érhető el. A most kiadott, az OpenCV-re épülő AVSR pedig a szabad szoftverek világában megszokott decentralizált fejlesztési modell alapján készül, világszerte több mint 70 labor együttműködésével, bár az AVSR munkacsoport legtöbb tagja Pekingben dolgozik, az 1998-ban létrehozott Intel China Research Centerben.

Beszédfelismerés ajakmozgás-követéssel támogatva: Intel AVSR

Az Intel kutatói tegnap egy olyan szoftvert bocsátottak ki nyílt forráskódú

Galaxy S25 Edge: Itt a Samsung vékony mobilja

Gépi tanulással javítana az iPhone-ok üzemidején az Apple

Meredeken esnek Kínában a külföldi okostelefon-márkák eladásai

Beszédfelismerés ajakmozgás-követéssel támogatva: Intel AVSR

Az Intel kutatói tegnap egy olyan szoftvert bocsátottak ki nyílt forráskódú

Galaxy S25 Edge: Itt a Samsung vékony mobilja

Gépi tanulással javítana az iPhone-ok üzemidején az Apple

Meredeken esnek Kínában a külföldi okostelefon-márkák eladásai

Xperia 1 VII: Nem adja fel a Sony a csúcsmobilokat

Az adatvédelemre gyúr rá a Bluetooth 6.1

Megindultak a tech cégek a kínai-amerikai megegyezés hírére

Xperia 1 VII: Nem adja fel a Sony a csúcsmobilokat

Az adatvédelemre gyúr rá a Bluetooth 6.1

Megindultak a tech cégek a kínai-amerikai megegyezés hírére