100 nyelven tud fordítani a Meta új MI-modellje
Az első többnyelvű fordítási és átírási MI-modell kiadásával dicsekszik a Meta, ami a cég szerint a metaverzumban is fontos szerepet játszik majd a jövőben.
Több tucat nyelv fordítására és átírására képes a Meta kedden bejelentett új mesterségesintelligencia-modellje, ami a valós idejű kommunikáció minőségét javíthatja a különféle nyelvi szolgáltatásokban. A cég bejegyzése szerint a SeamlessM4T modell közel 100 nyelven támogat szöveg és beszéd közti fordítást, beszédről beszédre fordítás esetén pedig 35 nyelvvel használható.
A Meta a SeamlessM4T modellt nyilvánosan, ingyen tette elérhetővé nem kereskedelmi használat céljából. A világ legnagyobb közösségimédia-cége idén rengeteg, többnyire ingyenes mesterségesintelligencia-modellt adott ki, köztük a Llama nevű nagy nyelvi modellt, ami komoly kihívás elé állítja a Microsoft által támogatott OpenAI és az Alphabet szabadalmaztatott modelljeit.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
Mark Zuckerberg vezérigazgató szerint a nyitott mesterségesintelligencia-ökoszisztéma a Meta javára válik, a fejlesztés apropóján pedig nem volt rest megemlíteni a metaverzumot, mivel szerinte az ilyen eszközök fogják megkönnyíteni a világ különböző tájain élő felhasználók közti interakciókat.
Mindazonáltal a Meta hasonló jogi kérdésekkel néz szembe, mint az iparág többi tagja, ha a modellek képzéséhez felhasznált adatokról van szó. Júliusban Sarah Silverman humorista és két másik szerző szerzői jogok megsértése miatt pert indított a Meta és az OpenAI ellen, azzal vádolva a cégeket, hogy engedély nélkül használják fel a könyveiket képzési adatként.
A SeamlessM4T modell esetében a Meta kutatói tanulmányban szögezték le, hogy a több mint 4 millió órányi hangképzési adatokat nyilvánosan elérhető hangtárakból gyűjtötték be, a szöveges adatok pedig olyan tavaly létrehozott adatkészletekből származnak, amelyek a Wikipédiáról és a kapcsolódó webhelyekről gyűjtöttek tartalmakat.