Beszédfelismerés ajakmozgás-követéssel támogatva: Intel AVSR
Az Intel kutatói tegnap egy olyan szoftvert bocsátottak ki nyílt forráskódú
Az új Audio Visual Speech Recognition (AVSR) szoftver az Intel OpenCV nevű arcmozgás-felismerő könyvtárának képességeit kihasználva képes a beszélő arcának detektálására és az ajakmozgás követésére. A videoadatok és a hagyományos beszédfelismerési technológiák segítségével sokkal pontosabb eredmény érhető el mint korábban, így ott is alkalmazhatóvá válik a rendszer, ahol eddig ez a háttérzaj miatt elképzelhetetlen lett volna.
Az Intel olyan technológiát szeretne kifejleszteni, amely képessé teszi a számítógépeket az "emberi" kommunikációra. A gyorsabb mikroprocesszorok, a digitális képfeldolgozó eszközök árának csökkenése és az olyan, nagyobb video-sávszélességet biztosító technológiák, mint az USB2 lehetővé teszik az ilyen algoritmusok futtatását egy PC-n is.
A 2000 óta letölthető OpenCV kódját a programfejlesztők a játékoktól kezdve az ipari alkalmazásokig sokféle rendszerbe építették bele. A C nyelven írt kód az egyik legengedékenyebb nyílt forráskódú licencszerződés, a BSD licenc feltételei mellett érhető el. A most kiadott, az OpenCV-re épülő AVSR pedig a szabad szoftverek világában megszokott decentralizált fejlesztési modell alapján készül, világszerte több mint 70 labor együttműködésével, bár az AVSR munkacsoport legtöbb tagja Pekingben dolgozik, az 1998-ban létrehozott Intel China Research Centerben.