:

Szerző: Folyó Gergely

2011. július 21. 11:23

Kinecttel figyelik a robotok az emberek ténykedését

Valószínűleg hosszú éveket kell még arra várnunk, hogy minden háztartásban személyi robotok segítsenek a hétköznapi teendőinkben, de a fejlődés már megindult ezen a téren is. Legutóbb a New York állambeli Cornell Egyetem állt elő új tanulmánnyal, amelyhez még a Microsoft Kinectet is bevetették.

A robottartásban kétségtelenül az egyik legvonzóbb, hogy bármikor a gépünkre sózhatjuk majd a takarítást vagy a mosogatást, de emellett az új ötletekkel a robotok számtalan területen lehetnek a segítségünkre. A Cornell Egyetem kutatóinak új szoftverével felismerik az emberek összetettebb cselekvéseit, ezért arra is beprogramozhatók, hogy figyelmeztessenek bennünket: igyunk elegendő vizet a kiszáradást elkerülendő, vagy vegyük be az előírt gyógyszereinket – persze mindezt csak akkor, ha előtte nem látták, hogy kell csinálni.

Mosott ma már fogat?

Hasonló próbálkozások korábban is születtek ugyan, de akkor a fejlesztők vagy szimpla videokamerát használtak a megvalósításhoz, vagy az RFID technológiát próbálták bevetni – mint utóbb kiderült, előbbi meglehetősen pontatlan volt, a másikat pedig rendkívül körülményes lett volna a hétköznapokban alkalmazni, elvégre minden embert és tárgyat tele kellene aggatni a felismeréshez szükséges jelölőkkel. A kutatók választása éppen ezért ezúttal egy 3D-s, mozgásérzékelős kamerára esett, mégpedig a viszonylag olcsón hozzáférhető Kinectre.

Mint arról korábban beszámoltunk, a Microsoft a Kinectet eredetileg az Xbox 360-hoz szánta, elsődlegesen pedig játékos kiegészítőként kellett helytállnia, azonban az első nem hivatalos driver nyilvánossá tétele után és a kamerában rejlő lehetőségek miatt egy csapásra komoly modder közönség sorakozott fel a kütyü mögött. A redmondiak végül júniusban kiadták a hivatalos SDK-t is, amelyet nem kereskedelmi, kutatási célokra bárki ingyenesen felhasználhat.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

A cselekvések felismeréséhez a Kinect térbeli, csontvázkövető képességét használják ki – erre épülnek egyébként a játékok is. A kamera az előtte álló ember képe alapján megpróbál felállítani egy tizenöt ponton mozgó csontvázas modellt, így az aktuális testhelyzetet összeveti a korábban eltárolt pózokkal, ami alapján már tud utasításokat adni a számítógépnek. A Kinect viszont önmagában képtelen az összetett mozdulatsorok beazonosítására, ezért nem véletlen, hogy a játékokat is csak egyszerű karcsapkodással vagy lábmozgatással tudjuk irányítani.

Lépésről lépésre

A vízivás vagy a fogmosás azonban már összetett mozdulatsornak számít, éppen ezért a rendszer a tanulási folyamat során lépésekre bontja le a cselekvést: a fogmosás részei közé tartozik például a fogkrém nyomása, a fogkefe felemelése vagy a fogak sikálása, a számítógép a megfigyelések alatt ezeket próbálja elkülöníteni és beazonosítani. Persze mindenki minden alkalommal a korábbinál rövidebb vagy hosszabb ideig foglalkozik az egyes fázisokkal, ezért a robot több alkalommal fogja vizsgálni a mozgást, és a cselekvés részeinél mért időket átlagolva tárolja majd el a végleges mintát.

Hasonlóan nehéz helyzetbe kerülhet a gép a felismeréskor is. Ugyan azt tudni fogja, hogy a mozdulatsorokat le kell bontania, azonban miután minden ember máshogy végez el bizonyos tevékenységeket, ezért pontosan nem, csak nagy valószínűséggel tudja megállapítani, hogy mit csinálnak éppen előtte. Az első eredmények viszont biztatóak: a kutatók négy különböző emberrel, öt különböző helyszínen – konyhában, nappaliban vagy irodában – tesztelték a fejlesztést, és a rendszer 84 százalékban pontosan ismerte fel a cselekvést, ha már "ismerős" emberrel dolgozott, míg 64 százalékos volt ez az arány azoknál, akiket a kísérletek alatt látott először. Az emberi tevékenységet felismerő Kinect-szoftver letölthető a Cornell Egyetem weboldaláról.

A kutatók jelentése szerint a robotok 12 mozdulatsort képesek már felismerni, köztük a már említett fogmosást és vízivást, illetve a kanapén való heverészést és a számítógépen történő dolgozást. Bár néhányak számára bizonyára kényelmetlen lehet, hogy egy gép folyamatosan figyeli a cselekvéseit, a magánszféra megőrzéséért nem kell aggódni: a robotot ki lehet küldeni a szobából, az ajtót pedig be lehet zárni.

a címlapról