:

Szerző: Dömös Zsuzsanna

2024. július 31. 14:38

Elérhetővé vált az OpenAI fejlett hangasszisztense

Egyelőre a ChatGPT Plus szűkebb felhasználói köre próbálhatja ki az Advanced Voice Mode-ot, aminek az elérhetőségét fokozatosan terjeszti ki a cég a következő hónapok során.

A fizetős ChatGPT Plus szolgáltatás előfizetőinek szűk köre már kipróbálhatja az OpenAI új hangasszisztensét, az Advanced Voice Mode-ot, aminek a rajtja kissé mostohán indul, lévén ennek kapcsán rúgta össze a port a cég és Scarlet Johansson, aki nehezményezte, hogy a  „Sky” fantázianévre keresztelt beállítás túlságosan hasonlít az ő hangjára.

Az OpenAI májusban mutatta be az újgenerációs GPT-4o (omni) modellt, ami „natívan multimodális", tehát képes tartalmat generálni, vagy parancsokat értelmezni hang, szöveg vagy kép formájában, és minden bemeneti módszernél jelentősen javulni tudott az elődjéhez képest, valós időben, késleltetés nélkül tud kommunikálni kamerakép, írott szöveg és élő beszéd alapján is. 

alpha

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Kiemelhető újdonság, hogy miként képes kezelni a modell az audióbemenetet, ez egyben a legrémisztőbb is: a hangasszisztensi funkció valós időben, gyakorlatilag késleltetés nélkül reagál, a fejlesztők elmondása szerint átlagosan körülbelül 320 ezredmásodperc alatt. Egy 2009-es tanulmány szerint ez hasonló az emberek közt zajló beszélgetések alatt mért reakcióidőhöz, és jelentősen rövidebb, mint a korábbi modelleknél tapasztalt tipikus 2-3 másodperces késés.

A hangasszisztenst alfaverzióban júniusban tervezte kiadni az OpenAI, végül egy hónappal elhalasztotta a bevezetését, mivel az még fejlesztésre szorult. A funkció idő közben új szűrőket is kapott, amelyek felismernek és blokkolnak bizonyos zenei vagy más, szerzői jog által védett hanganyagok generálására irányuló kéréseket. Az ősz folyamán minden ChatGPT Plus felhasználó megkapja az új módot, ami négy különböző preset hangján szólalhat meg.

a címlapról