:

Szerző: Koi Tamás

2025. március 13. 13:37

Simán tudna uzsonnát csomagolni a gyereknek a Google DeepMind robottechnológiája

A robotokat vezérlő szoftverek a nagy nyelvi modellek fejlődésével egyre szofisztikáltabbak, illetve egyre jobbak abban, hogy felismerjék a környezetüket és szóbeli utasításokra manipuláljanak tárgyakat.

A humanoid robotok működése ma még meglehetősen messze áll a hollywoodi víziótól, a mesterséges intelligencia fejlesztéseknek köszönhetően azonban ennek a területnek a fejlődése is szárnyra kapott az elmúlt években. 

Szerdán a Google DeepMind csapata két olyan AI-modellről is lerántotta a leplet, melyek a Gemini 2.0 nagy nyelvi modellre építve a gépi látással összedrótozott szóbeli parancsfeldolgozásnak (vision-language-action, azaz VLA) köszönhetően képesek a környezetükre és a szóban kapott utasításokra bizonyos fizikai műveletek elvégzésére.

03:00
 

Gemini Robotics: Bringing AI to the physical world

Még több videó

Mentorhatás: tapasztalt szememmel vezetem a kezedet

A sikeres IT karrierek többsége mögött ott áll egy erős mentor, szerepének azonban nagyon sokféle árnyalata lehet.

Mentorhatás: tapasztalt szememmel vezetem a kezedet A sikeres IT karrierek többsége mögött ott áll egy erős mentor, szerepének azonban nagyon sokféle árnyalata lehet.

A fejlesztőcsapat által közzétett demó alapján a Gemini Robotics-szel vezérelt robotkarok meg tudják különböztetni a különböző gyümölcsöket, illetve azokat képesek elhelyezni abban az edényben, amit a vezérlőszemélyzet szóban kijelöl a számukra. A robotkarok emellett a finommotorikus mozgást igénylő feladatokban is egyre ügyesebbek, így nemrég ugyanezek a karok cipőfűzőt kötöttek be, most pedig gond nélkül behúzzák egy táska zippzárját, illetve becsomagolnak egy szendvicset.

01:42
 

Gemini Robotics: Dexterous skills

Még több videó

Ha ez nem lenne elég, a robotkarok már origamit is képesek hajtogatni, illetve akár amőbázni is be tudnak szállni. A Gemini Robotics nyelv nagy áttörése, hogy a robotok ezzel olyan tárgyakkal is képesek interakcióba lépni, melyekkel soha nem találkoztak még korábban, illetve a műveletvégzés nem lett előre felprogramozva.

Aki azonnal az utcákon emberekre lövöldöző terminátoroktól kezdett rettegni, azt szeretnénk megnyugtatni, hogy a Google már elkezdett dolgozni egy olyan keretrendszeren, mely hatékonyabban kívánja megakadályozni azt, hogy a robotok fizikai kárt okozzanak, az AI-modell révén a robot ugyanis képes megérteni és kontextusba helyezni a tetteinek a következményét. Már ha ez bárkit megnyugtat.

A most először, április 24-én Budapestre érkező nemzetközi Kubernetes Community Day programja immár elérhető. A programba kerülő 26 előadást a világ minden tájáról beérkezett, több mint 100 pályázat közül választottuk ki. Figyelem, a rendezvényre már csak 30 jegy elérhető!

a címlapról