Szerző: Dömös Zsuzsanna

2025. április 16. 14:45

Szintetikus adatokat hív segítségül az Apple az AI képzéséhez

Az egyáltalán nem zökkenőmentesen rajtoló Apple Intelligence korszakban az almás cégnek nincs egyszerű dolga abban, hogy a felhasználói adatokat is védje, de közben a szolgáltatása alatt működő AI-modellt is képezhesse és fejlessze.

Az adatokat tömegesen harácsoló AI-fejlesztő cégek korában nincs egyszerű dolga a privátszféra és adatvédelem szószólójának, az Apple-nek. A vállalat nemrég blogbejegyzésben osztotta meg, hogyan tervezi finomítani és fejleszteni saját mesterségesintelligencia-modelljét anélkül, hogy az iPhone-okról és Macekről származó felhasználói adatokat használná fel a képzéshez.

A cupertinói óriás az úgynevezett differenciális adatvédelmi megközelítést fogja alkalmazni, ami a szintetikus adatokon, tehát nem a tényleges felhasználók, hanem mesterségesen előállított adatokon alapul, hogy az Apple Intelligence által készített e-mail összefoglalók minőségét javítsa. A cég lényegében a valódiakat mímelő mesterséges e-maileket hoz létre, amelyek az általánosabb mintákat tükrözik, ebből készít összefoglalókat, úgynevezett beágyazásokat a hossz, téma, formátum és más jellemző információkkal.

Az Apple végül nem az üzeneteket, hanem a beágyazásokat küldi el az eszközök egy kis csoportjának, azoknak, akik beleegyeztek az elemzések megosztásába a Device Analytics programon keresztül. Mindegyik felhasználó eszköze a helyben tárolt mintákkal és levelekkel fogja összehasonlítani a leküldött szintetikus adatokat, majd ezután az eszköz visszajelzést küld az Apple-nek arról, hogy mely minták álltak legközelebb a valósághoz. Így összességében az Apple csak trendeket és mintákat lát, de az üzenetek tartalma nem hagyja el az eszközt. Ezután a leggyakrabban kiválasztott szintetikus minták kerülnek felhasználásra az AI szövegkimeneteinek, például az e-mail-összefoglalóknak a javítására.

apple-fingerprint

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez

Ezúttal egy mindenki számára kötelező, de laza jogi különkiadással jelentkezünk. Ennyi a minimum, amit munkavállalóként illik tudnod.

Jogod van tudni: mankó kirúgáshoz, munkahelyi szkanderezéshez Ezúttal egy mindenki számára kötelező, de laza jogi különkiadással jelentkezünk. Ennyi a minimum, amit munkavállalóként illik tudnod.

A szintetikus adatokat széles körben használják a különféle modellek képzéséhez, de számos hátránya van csak ezekre támaszkodni, többek között az esetleges torzítások, a hiányosság, pontatlanság és a modell teljesítménye miatt. A cég az új megközelítést használja a későbbiekben a Genmoji modelljei fejlesztésére, később az Image Playground, az Image Wand, a Memories Creation és a Writing Tools, valamint a Visual Intelligence szolgáltatások és eszközök esetében is. 

Ez az önkéntes hozzájáruláson alapuló megközelítés finomabb a Meta hozzáállásánál. A közösségi óriás a közelmúltban bejelentette, hogy folytatja mesterséges intelligencia-modelljei képzését az európai felhasználók nyilvános tartalmain, beleértve a publikus bejegyzéseket, kommenteket az AI-funkciója képzéséhez. Ezen felül a Meta AI-jal folytatott interakciókat is, tehát az egyes kérdéseket és lekérdezéseket szintén begyűjti magának. A felhasználók hamarosan értesítést kapnak az űrlap linkjével, melyen keresztül leiratkozhatnak az adataik ilyen célból történő felhasználásáról.

a címlapról