Google Fordítóval igyekszik terjeszkedni a Wikipédia
Elérhetővé tette a Wikipédia a Google Translate-et is a tartalomfordító szolgáltatásán belül, hogy ezáltal a szócikkeket a szerkesztők könnyebben fordíthassák le egyik nyelvről a másikra.
Partneri megállapodást kötött a Wikipédia és a Google Translate annak érdekében, hogy még több nyelven és még több szócikk jelenjen meg az online enciklopédián keresztül. A Wikimédia Alapítvány közleményben fejtette ki, hogy több mint 7000 nyelv létezik a világon, de mindebből a Wikipédia nagyjából "csak" 300 nyelven elérhető. A zulu nyelvet például 12 millió ember tartja elsődleges nyelvének és 16 millió másodlagosnak, miközben csak 1100 Wikipédia-szócikk érhető el zuluul. A Wikimédia a víziója szerint viszont a "világ tudását" ingyenesen és mindenkinek a saját nyelvén szeretné eljuttatni az oldalain keresztül, és a tervei szerint ehhez járul hozzá a szerkesztőfelületbe beépített Google Translate is, amellyel egyébként a magyar nyelvű szócikkfordítások is elérhetőek.
A Wikipédia a Google fordítóját a saját tartalomfordító (Content Translation) szolgáltatásába építette be, amely eddig is rendelkezett több szótárral és gépi fordítóval - köztük az Apertium, a LingoCloud, a Matxin, a Yandex és a Youdao. A megoldás elsődleges célja, hogy a tudást minél több nyelven elérhetővé tegye minél rövidebb idő alatt, ezért a szócikkek lefordítását igyekszik megkönnyíteni egyik nyelvről a másikra - segítségével a Wikipédia szerkesztői már több mint 400 ezer szócikket fordítottak le.
Azonban az eddigi tartalomfordító megoldás nem támogatott minden nyelvet, ezért az önkéntes szerkesztők egyik legfőbb igénye volt a Google Translate befoglalása a szolgáltatásba. Ennek köszönhetően most a Content Translation 15 új nyelvvel bővült, úgy mint a zulu, a hausza, a jaruba vagy a kurd - a magyar egyébként 2015 májusa óta része a szolgáltatásnak. Ezzel pedig a Wikipédia tartalomfordítója már összesen 121 nyelvet képes támogatni.
A Google Translate természetesen többek közt magyar nyelvre is fordít, bár még mindig akadnak nehézségei a nyelvünkkel. A keresőóriás megoldása az utóbbi időben azért erősen próbálkozott, tavaly az offline fordítási lehetőségek közé, idén pedig az Assistant CES-en bejelentett tolmácsmódjába is bevette a magyart, amely egyébként egyelőre csak 27 nyelvet támogat. Azért mindenesetre a Wikipédia szerkesztőinek még mindig érdemes lesz fenntartásokkal és ellenőrzéssel kezelnie a Google Translate-tel magyarra fordított szócikkeket.
"Nem adunk át személyes adatot"
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
A szervezet igyekszik kikötni, hogy a Google Fordítónak a Wikipédia-féle tartalomfordító eszközbe integrálása során a Google vagy Wikimédia Alapítvány semmilyen személyes adatot nem kap meg. A szócikkeket a Wikimédia szerverei küldik meg a Google szervereinek, miközben nem történik direkt kommunikáció a felhasználó és a külső szolgáltatások közt, így a keresőóriás szerverei nem kapják meg az IP-címet vagy a felhasználónevet. Továbbá a Google Fordító a fordításokat ingyenes licenccel küldi vissza a Wikipédiának (a Translate API ingyenes változatán keresztül), így az eszköz integrálása a szolgáltatásba a szervezet licencszabályainak megfelelően történik. Ez utóbbit a szervezet azért is igyekszik kikötni, mivel a Wikipédia elsősorban nyílt forrású szoftvereket használ, amibe a Translate API egyébként nem tartozik bele.
Ha pedig a felhasználó nem tart igényt a Google Translate fordítására, akkor ki is kapcsolhatja azt a Wikipédia tartalomfordító szolgáltatásán belül. "Bár a Content Translation felhasználói közül nagyon sokan igényelték ezt a fordító szolgáltatást, minden felhasználó önállóan dönthet róla, hogy szeretné-e használni vagy sem" - írja a MediaWiki önálló szócikke.
A Google és a Wikimédia közötti megállapodás egyelőre csak egy évre szól a Translate API ingyenes használatáról, majd ezt követően a partnerek újratárgyalják a feltételeket. Addig is a Wikipédia Content Translation szolgáltatása fejlődik, mivel letárolja a fordításokat, illetve a Content Translation API-n keresztül bárki számára szabadon elérhetővé teszi, hogy azzal a kutatócsoportok, nyílt forrású projektek vagy akár a kereskedelmi cégek a saját gépi fordító rendszereiket fejlesszék.