:

Szerző: Dömös Zsuzsanna

2024. december 20. 14:53

Szaktudás nélkül értékelhetik a contractorok a Google Gemini válaszait

A belsős dokumentum némi aggodalomra adnak okot: a Gemini válaszainak pontosságát tesztelők nem ugorhatnak át olyan témaköröket, amikhez nem értenek.

A generatív AI szolgáltatásokat fejlesztő cégek számos contractort alkalmaznak, akiknek feladata a chatbotok által generált outputok pontosságának értékelése. A TechCrunch nemrég hozzájutott a Google szerződéses megbízottjainak készített belsős dokumentumokhoz, amelyek arról árulkodnak, hogy a Gemini modell hajlamos arra, hogy pontatlan információkat közöljön érzékenyebb témákról, például egészségüggyel kapcsolatos kérdések esetén, és ebben szerepe lehet annak a folyamatnak is, ahogyan a keresőcég finomítja,

A Gemini eredményeinek javításán dolgozó vállalkozók kiszervezéséért a Hitachi nevű cég tulajdonában lévő GlobalLogic felel. A bedolgozó munkavállalók feladata, hogy értékeljék a Gemini által adott válaszok pontosságát, vagy értékeljék, hogy mennyire értelmezhető egy adott prompt.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Mindeddig lehetséges volt, hogy a dolgozóknak ne kelljen értékelni bizonyos válaszokat, amennyiben egy adott speciális területen nem érzik magukat jártasnak, de a jövőben többé nem hagyhatják ki azokat az utasításokat sem, amelyek speciális ismereteket igényelnek. Mindössze két esetben lesz lehetséges: amennyiben hiányos a prompt, vagy ha káros tartalommal kapcsolatos.

Shira McNamara, a Google szóvivője szerint az értékeléseket végző vállalkozók feladatok széles skáláját hajtják végre számos különböző Google-termékeken. Nem csak a tartalomra vonatkozó válaszokat tekintik át, hanem visszajelzést adnak a stílusról, formátumról és egyéb tényezőkről is. A keresőcég hangsőlyozza, hogy a contractorok által adott értékelések nem befolyásolják közvetlenül az algoritmusok működését, de összesítve hasznos adatpontot szolgáltatnak, melyekkel mérhetőbbé válik, hogy mennyire működik jól a rendszer.

a címlapról