Néhány emailből leírható a személyiség
Az emailekben megbújó rejtett információk alapján határozták meg az üzenetek küldőinek nemét, érzéseit, sőt személyiségjegyeit a National Research Council Canada kutatói. A szakértők szerint a módszer a depresszió korai szakaszának megállapításában, gazdasági elemzéseknél sőt az online bűncselekmények kutatásánál is működhet.
Ártatlannak tűnő emailjeink jóval többet is elárulhatnak rólunk, mint gondolnánk. Az üzenetek szóhasználatából, illetve bennük megjelenő kifejezésekből nem csak a küldő neme, de érzelmei és személyiségjegyei is kikövetkeztethetők. Erre jött rá Saif Mohammad, a National Reasearch Conuncil Canada vezető kutatója. Mohammad kollégáival érzelemanalízissel vizsgálta az elektronikus levelezések implicit információit, amely mint elmondta, hatékony módszer a levelek íróinak érzéseinek meghatározására, nagy mennyiségű szöveg alapján. Mohammad szerint a pozitív és negatív érzelmek már korábban is számos kutatás tárgyát képezték, ám ennyi adattal az emberi érzések gyakorlatilag teljes skálája vizsgálható.
A nőkkel mindenki kedvesebb
A kutatók egy kiterjedt “érzelmi adatbázist” hoztak létre crowdsourcing módszerrel, melynek során az Amazon Mechanical Turk szolgáltatáson keresztül béreltek fel jelentkezőket, hogy 24200 szót kössenek össze érzelmekkel. A fagylatot például az örömhöz, a kertészkedést pedig a békéhez rendelték. Az itt nyert adatokat mintegy 32045 emaillel vetették össze, amelyek a 2001-es Enron-botrány során kerültek nyilvánosságra. Ez alapján aztán a férfiak és nők közötti érzelmi hangsúlyok változásait vizsgálták.
Az eredmények jelentős különbségeket mutattak a nemek között: a nők hajlamosabbak voltak az örömre vagy szomorúságra utaló szavakat használni, míg a férfiak inkább a félelemmel vagy bizalommal összefüggésbe hozhatókat preferálták. Mindkét nem több vidámabb, inkább a boldogsághoz köthető kifejezést használt mikor nőknek címezte leveleit, a férfiak pedig sokkal inkább várakozást implikáló nyelvezetet használtak mikor az ellenkező neműeknek írtak, olyan szavakkal mint a “remél” vagy “készül”.
Törvényszéki és gazdasági elemzők is hasznát vehetik
Az adott érzések mellett a kutatók személyiségjegyeket is megpróbáltak kinyerni a rendelkezésükre álló érzelmi tartalmakból. Mohammad szerint az érzelmek szoros összefüggésben állnak a személyiséggel, hiszen bár normálisnak mondható, ha az ember példának okáért időről időre mérges lesz, viszont ha folyamatosan az, akkor az már személyisége részét képezi. Ezért csapatával létrehozott egy olyan algoritmust, amely egy újabb, 585 érzelmet tartalmazó adatbázisból és a hozzájuk kapcsolódó, tweetekől és hashtagekből nyert szavak alapján, rövid írott szövegeket elemezve megpróbálta kideríteni, azok szerzője milyen személyiségtípushoz tartozik.
Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.
Az algoritmus “betanítására” több ezer mintát használtak, amelyeket korábban pszichológusok elemeztek, hogy az öt fő személyiségfaktor - extraverzió, barátságosság, lelkiismeretesség, emocionalitás, intellektus - mely jellemzőit tartalmazzák. A programnak azután a különböző érzelmek kombinációit kellett az adott személyiségjegyekhez kötni. Miután a tesztet elvégezték, az algoritmus eredményeinek túlnyomó többsége megegyezett a pszichológusok korábbi elemzésével.
Az egyébként anonim személyek nemének és személyiségjegyeinek ilyen módszerrel történő meghatározásával Muhammad és csapata szerint kimutathatók többek között a depresszió korai jelei, de akár az online bűnesetek törvényszéki elemzésénél is használható lehet. De gazdasági szempontból sem elhanyagolható a jelentősége, a kutatás vezetője példának egy új iPhone megjelenését hozta, amelynek a közösségi médiában megjelent visszhangjainak hasonló elemzésével a gyártó rendkívül részletes betekintést kaphat a vásárlók álláspontjába. Az eredmények széles körű felhasználását azonban további munkának kell megelőznie, és természetesen a jövőben sokkal szélesebb körű mintavételre is szükség lesz, a felhasznált emailek ugyanis jelen esetben egy a kísérleten kívüli felhasználásra alkalmatlan, zárt csoportból származtak.