:

Szerző: Bizó Dániel

2005. február 2. 13:32

Minden eddiginél pontosabb beszédfelismerés mobiltelefonon

[NE Asia Online] A japán NEC és leányvállalata, az NEC Electronics bejelentették, hogy közös munkájuk gyümölcseként olyan szoftvert fejlesztettek ki mobiltelefonok számára, amely villámgyors beszédfelismerést tesz lehetővé.

A bemutatott tesztmodell képes volt a természetes beszédet felismerni egy több tízezer szót tartalmazó szótár segítségével. A felismerés gyorsaságát és hatékonyságát az teszi lehetővé, hogy a szoftver a feldolgozás egyes fázisait párhuzamosan végezteti el az NEC Electronics által kifejlesztett, több magot implementáló mobilprocesszorral. Az MP211 jelölésű chip három ARM magot és egy audio-video DSP-t (digitális jelfeldolgozó) tartalmaz, így a mobiltelefon rendkívül válaszképes maradhat komolyabb feladatok végzése alatt is. Az MP211 200 MHz-en ketyeg.

A felismerés folyamatát a szoftver három részfeladatra bontja, melyeket egy-egy ARM maghoz rendel. Az első mag az emberi beszéd és a tárolt referenciahang-modellek közötti hasonlóságot becsli, mely alapján a második mag folyamatosan szűkíti a lehetséges szavak körét, végül a harmadik mag az első két számítás eredményei alapján meghatározza az optimális illeszkedést, és meghatározza a felismert szavak sorrendjét, majd megpróbálja értelmezni azok jelentését.

Ezzel a megoldással összetett feladatokra is utasíthatjuk mobiltelefonunkat saját hangunkkal, valós időben, azaz késlekedés nélkül. Ennek demonstrálására a vállalatok létrehoztak egy prototípust, amely képes elektronikus felhasználói kézikönyvben keresni szóbeli kérés alapján, és megjeleníteni a releváns oldalakat.

a címlapról