:

Szerző: Dojcsák Dániel

2013. március 13. 10:48

A lájkokból pontosan kirajzolható a személyiség

Mindenkinek van elképzelése arról, hogy a webes szolgáltatók mennyi mindent tudhatnak rólunk, felhasználókról. Ha valaki foglalkozott már a közösségi oldalakkal behatóbban, az sejtheti, hogy a like-ok, kattintások, kommentek, feltöltések és a felületen végzett egyéb aktivitások képesek összeállni egy egységes személyiségprofillá.

A Google és a Facebook nem tagadja, hogy a felhasználók aktivitásaiból profilt épít, sőt, a nagy webes szolgáltatók bevallott célja, hogy egyszerű, tapasztalati módszerekkel, külön, önkéntes adatmegadás nélkül személyes profilokat építsen, aminek segítségével személyre szabott hirdetések és tartalmak jelenhetnek meg egyedi tálalásban. Arról azonban a cégek mélyen hallgatnak, hogy pontosan hogyan is néz ki egy ilyen profil és mennyi mindent tudhatnak rólunk.

Mi lenne ha?

Soha nem derült még ki, hogy mennyire pontos részleteket árulnak el akár a legkisebb közösségi interakciók, mint például egy Facebook-lájk. Az amerikai Cambridge Egyetem kutatói 58 ezer önkéntessel egy vizsgálatot készítettek, amiben egy gépi intelligenciát fejlesztve a felhasználók Facebook-aktivitásai alapján személyes információkat próbáltak megjósolni, kitalálni. A következtetéseket pusztán a tényleges aktivitásból vonta le a rendszer, nem vette figyelembe a megadott személyes adatokat.

Az eredmény meglepően pontos lett, a rendszer kis hibaszázalék mellett meg tudta állapítani az adott felhasználó nemét, korát, kapcsolati státusát. Ezen felül közeli eredményeket adott az illető személyiségjegyeire, intelligenciájára, de akár bőrszínére, szexuális irányultságára is. A rendszer képes volt 95 százalékos pontossággal kideríteni, hogy az illető fehér vagy fekete bőrszínű. Körülbelül 90 százalékos valószínűséggel kiderült, hogy a vizsgált profilhoz férfi vagy nő tartozik, illetve az, hogy homo- vagy heteroszexuális, demokrata vagy republikánus. Kisebb pontossággal ugyan, de arra is készültek becslések, hogy az alany használ-e drogokat vagy elváltak-e a szülei.

Az alapvető személyiség- és intelligencia értékeket szintén viszonylag jól becsülte a rendszer és pusztán a lájkok alapján hasonló eredmények születtek mint az önkéntesek által kitöltött  tesztekben. A kutatók szerint amennyiben a lájkok összekombinálhatóak lennének további adatbázisokkal, mint például a szavazói adatbázisok, közüzemi számlák, anyakönyvek és egyéb, a valós élethez fűződő források, akkor még könnyebb lenne pontosítani az elemzéseket.

Kombinált adatbázisok

Ugyan a fenti csak a kutatók feltevésének tűnik, érdemes megjegyezni, hogy a Facebook nemrégiben lépett partneri viszonyba olyan offline adatbáziskezelőkkel, mint az Epsilon, az Acxiom vagy a Datalogix, amik éppen ilyen adatokat rendszereznek az amerikai lakosságról. A New Scientistnek egy technológiai adatvédelemmel foglalkozó cég, az Abine jogásza elmondta, könnyen elképzelhető az is, hogy a biztosítók a jövőben a Facebook-adatokkal kombinálják saját adatbázisaikat, hogy könnyebben beazonosíthassák a kockázatos ügyfeleket, és még szerződéskötés előtt extra díjakkal reagáljanak. Downey szerint a fenti kutatás az első kézzelfogható példa arra, hogy mennyire hatékony személyiségprofil jött létre a közösségi szolgáltatóknál. Sőt, ezek a profilok sokkal megbízhatóbbak mint a kérdőíves vagy egyéb kutatások, hiszen mi magunk sokszor nem emlékszünk részletekre, de a Facebook mögött álló adatbázis soha nem felejt.

Ez azonban nem csak veszélyeket és kiszolgáltatottságot hordoz magában, hanem sok esetben a fogyasztók az előnyét is élvezhetik. A Facebook és más személyes profilt tároló szolgáltatók minden ember számára működhetnek egyfajta online személyiségtrezorként. A személyes információk, preferenciák, ízlés szükség esetén azonnal előhívhatóak és az épp szükséges részletek alapján bármilyen tárgy, eszköz, szolgáltatás testreszabható.

A kérdés mindössze az, hogy a Facebook vagy épp a Google mennyire jó gazdája ennek a rengeteg adatnak. A Facebook esetében például a lájkok publikusak, sőt, ez a megosztás alapegysége, a Graph Search bevezetésével pedig az egész kereshetővé válik a felhasználók számára is. A Facebook esetében komoly rizikónak értékeli a szakma, hogy a szolgáltató nem házon belül fűzi össze a személyes profilokat a hirdetői vagy egyéb eszköztárakkal, hanem az alkalmazásokon keresztül minden további nélkül értékesít felhasználói adatokat.

Rengeteg adat, pontos elemzések

A rizikót jelenleg az csökkenti, hogy feldolgozhatatlanul sok adat jön létre folyamatosan, az adatokat rendesen használni és azokkal visszaélni is igen nehéz jelenleg. A Facebook platform ráadásul még mindig sebes tempóban növekszik, csak a csatlakoztatott alkalmazásokból naponta egy milliárd  szignál érkezik, azaz átlagosan minden felhasználóról napi egy új információ. Az eloszlás persze nem egyenletes, az aktív rétegről a szolgáltató tudja, hogy mikor, hol milyen zenét hallgat, milyen helyeket látogat, kikkel találkozik, mit és mennyit sportol, vásárol, olvas.

Machine recruiting: nem biztos, hogy szeretni fogod

Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

Machine recruiting: nem biztos, hogy szeretni fogod Az AI visszafordíthatatlanul beépült a toborzás folyamatába.

A Timeline bevezetése óta 40 milliárd zeneszám meghallgatásról és 40 millió könyv olvasásáról érkezett be jelzés. Mivel az alkalmazások is egyre erőszakosabban biztatják a felhasználókat arra, hogy kössék össze a Facebook-profiljukat és az appot, ezért ezek a számok várhatóan nőni fognak, s az egyetemi kísérletnél a Facebook sokkal pontosabb képet tud majd rajzolni mindenkiről.

Teljesen független ettől, hogy ki hogyan állítja be a posztjainak láthatóságát, a közösségi oldalakon ugyanis ismerőseink egy csoportjától vagy egyes emberektől, a nyilvánosságtól elrejthetjük a posztjainkat, de ettől függetlenül a felhasználói profilunkba ezek az adatok bekerülnek.

Eleged van az eltérő környezetekből és az inkonzisztens build eredményekből? Frusztrál, hogy órákat kell töltened új fejlesztői környezetek beállításával? Többek között erről is szó lesz az AWS hazai online meetup-sorozatának ötödik, december 12-i állomásán.

a címlapról