:

Szerző: Dömös Zsuzsanna

2023. augusztus 23. 13:00

100 nyelven tud fordítani a Meta új MI-modellje

Az első többnyelvű fordítási és átírási MI-modell kiadásával dicsekszik a Meta, ami a cég szerint a metaverzumban is fontos szerepet játszik majd a jövőben.

Több tucat nyelv fordítására és átírására képes a Meta kedden bejelentett új mesterségesintelligencia-modellje, ami a valós idejű kommunikáció minőségét javíthatja a különféle nyelvi szolgáltatásokban. A cég bejegyzése szerint a SeamlessM4T modell közel 100 nyelven támogat szöveg és beszéd közti fordítást, beszédről beszédre fordítás esetén pedig 35 nyelvvel használható.

A Meta a SeamlessM4T modellt nyilvánosan, ingyen tette elérhetővé nem kereskedelmi használat céljából.  A világ legnagyobb közösségimédia-cége idén rengeteg, többnyire ingyenes mesterségesintelligencia-modellt adott ki, köztük a Llama nevű nagy nyelvi modellt, ami komoly kihívás elé állítja a Microsoft által támogatott OpenAI és az Alphabet szabadalmaztatott modelljeit.

meta-ai-chat-bots_(1)

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Mark Zuckerberg vezérigazgató szerint a nyitott mesterségesintelligencia-ökoszisztéma a Meta javára válik, a fejlesztés apropóján pedig nem volt rest megemlíteni a metaverzumot, mivel szerinte az ilyen eszközök fogják megkönnyíteni a világ különböző tájain élő felhasználók közti interakciókat.  

Mindazonáltal a Meta hasonló jogi kérdésekkel néz szembe, mint az iparág többi tagja, ha a modellek képzéséhez felhasznált adatokról van szó. Júliusban Sarah Silverman humorista és két másik szerző szerzői jogok megsértése miatt pert indított a Meta és az OpenAI ellen, azzal vádolva a cégeket, hogy engedély nélkül használják fel a könyveiket képzési adatként.

A SeamlessM4T modell esetében a Meta kutatói tanulmányban szögezték le, hogy a több mint 4 millió órányi hangképzési adatokat nyilvánosan elérhető hangtárakból gyűjtötték be,  a szöveges adatok pedig olyan tavaly létrehozott adatkészletekből származnak, amelyek a Wikipédiáról és a kapcsolódó webhelyekről gyűjtöttek tartalmakat.

a címlapról