Késve kap szót az OpenAI búgó hangú asszisztense
Úgy tűnik, kissé korai fázisú demót láthatott a nagyközönség az OpenAI múlt hónapban tartott, új nagy nyelvi modelljével felvértezett hangalapú AI-asszistensének működéséből, legalábbis erre utal, hogy a cég a megoldás premierjét lényegében év végére halasztja.
Elképesztő dolgokat produkált az OpenAI múlt hónapban tartott bemutatója során a GPT-4o modellre épülő hangasszisztens, az érzelmek felismerésétől kezdve a gyors, tulajdonképpen valós idejű beszédfelismerésen és fordításon keresztül a lefotózott matematikai képletek instant megoldásáig bezárólag.
A teljesen életszerű gép-ember kommunikáció eljövetelére az eredeti tervekhez képest azonban kicsit tovább kell várni, kiderült ugyanis, hogy a modell még az alfaváltozatban sincs kész a premierre.
Az OpenAI az X-en közzétett tegnapi bejegyzésében bejelentette, hogy bár az eredeti tervek szerint az új modellt június végén tették volna elérhetővé a ChatGPT Plus felhasználók egy szűkebb csoportja számára, a felhasználói teszt legalább egy hónapot csúszik majd.
A cég ezen felül annyit közölt, hogy a hangasszisztens, illetve a rá épülő szolgáltatások valamikor év vége felé válhatnak elérhetővé az összes fizetős felhasználó számára.
CI/CD-vel folytatódik az AWS hazai online meetup-sorozata! A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.
A ChatGPT ugyan eddig is megértette a kimondott beszédet, illetve képes volt felolvasni a válaszait, ez az üzemmód még csak távolról emlékezetett egy igazi párbeszédre. A májusi bemutatóra az új modell képességei mellett más aspektusból is ráirányult a média figyelme: Scarlett Johansson amerikai színésznő a bemutatót követően a hangja lemásolásával vádolta meg az OpenAI-t, a jogi csatározást elkerülendő pedig pár nappal később a cég eltávolította a problémás hangmintát.
Az új modell premierjének elhalasztásával egy időben új fejlesztésként jelent meg egyelőre macOS platformon a dedikált ChatGPT alkalmazás, mely az option és a szóköz gombok megnyomására bármilyen képernyőn elővarázsolja a beviteli mezőt.