Potenciális bizonyítékokat törölhetett az OpenAI
A The New York Timest és más feleket képviselő ügyvédek több mint 150 órát töltöttek az OpenAI adatai közt való bóklászással, de a munkájuk a semmibe veszett, miután a cég mérnökei állítólag véletlenül az ügy szempontjából releváns adatokat törölhettek.
Még tavaly decemberben indult el a precedens értékű per, amit a világ egyik legnagyobb lapjának számító New York Times indított a Microsoft és az OpenAI ellen azért, mert a cégek a kiadó szerint szerzői jogokat sértettek, amikor az újságcikkeket a nagy nyelvi modellek feltanítására használták.
A manhattani szövetségi körzeti bíróságnak benyújtott dokumentumok szerint az OpenAI cikkek millióit használhatta fel jogtalanul a ChatGPT és a Microsoft Copilot szolgáltatások alatt dolgozó modellek betanítására a lap hozzájárulása nélkül, így The Times arra szólította fel az OpenAI-t, hogy távolítsa el a jogsértő anyagokból származó képzési adatokat, emellett nem számszerűsített kártérítésre fejezte ki igényét a „több milliárd dolláros” kárért.
A jogi eljárás megindítását egy hosszú hónapokig tartó egyeztetési folyamat előzte meg, ám a felek végül nem jutottak megállapodásra az alapvető kérdésekben. A per még mindig korai szakaszban tart, amikor a két fél bizonyítékokat kér be és szolgáltat a tárgyalások megkezdéséhez. Ez viszont a tervezettnél is hosszabbra húzódhat, mivel a New York Times szerdán benyújtott bírósági dokumentuma szerint az OpenAI mérnökei „véletlenül” törölhették azokat a bizonyítékokat, amelyeknek a felkutatása és összeállítása eddig több hetet vett igénybe.
Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.
Az OpenAI-nak hozzáférést kellett adnia a képzési adatokhoz, amit olyan módon oldott meg, hogy egy sandbox környezetet alakított ki. Ezután a NYT jogi csapata több mint 150 órányi kutatást és adatszűrést végzett a szerzői jogsértést alátámasztó bizonyítékok felderítése érdekében két virtuális gépen, mielőtt az OpenAI állítólag óvatlanul törölte az egyik virtuális gépen a tárolt keresési adatokat.
Az adatok visszaállítása részlegesen sikerült, de a mappastruktúra és a fájnevek elvesztek, számos használható bizonyítékkal együtt. Az OpenAI szerint hibáról volt szó, míg a New York Times képviselője szerint nincs okuk azt hinni, hogy szándékos lett volna az eset. A munkát lényegében a semmiből kell elölről kezdeni.
A per kimenetele a későbbiekben precedens értékű lehet, hiszen meghatározhatja a többi kiadó és a sajtótermék, valamint a nagy nyelvi modellek fejlesztőinek viszonyát. A mesterséges intelligencia modellek feltanítási folyamatával kapcsolatos legfőbb tartalomgyártói aggály, hogy az üzemeltetők engedély nélkül "etetik" jogvédett anyagokkal az AI-t.
A The Times már több mint egymillió dollárt költött az OpenAI elleni küzdelemre a bíróságon, amit kevés kiadó tud magának megengedni. Közben a ChatGPT-fejlesztő már számos megállapodást kötött olyan nagy kiadókkal, mint az Axel Springer, a Conde Nast és a The Verge anyavállalata, a Vox Media, ami azt sugallja, hogy sok kiadó szívesebben dönt a partnerség, mint a jogi csatározás mellett.