:

Szerző: Habók Lilla

2017. október 4. 09:32

Gúnynevek és irónia is nehezíti a közösségi oldalak elemzését

Még mindig a Facebook a legnépszerűbb közösségi oldal a magyarok körében, és ez is biztosítja a hirdetők számára a legtöbb információt a felhasználókról. A platformok saját keresője sokszor nem eléggé pontos, de más keresési lehetőségek és elemzési formák is rendelkezésre állnak a cégeknek.

Közösségi oldalak keresési lehetőségeivel, szabályaival és az elemzés nehézségeivel foglalkozott a Magyar Információbrókerek Egyesülete (MIBE) Keresés a közösségi médiában című konferenciája október 3-án - az előadók a Facebook, az Instagram, a LinkedIn és a Pinterest oldalakat is érintették. Az alapvető ismereteken kívül szóba került az álhírek témaköre, és a Direkt36 újságírója gyakorlatban is szemléltette, hogyan szokott politikusok és hírességek profiljáról olyan információkhoz hozzájutni a Facebook Graph segítségével, amelyet alapesetben próbálnak elrejteni előle. A fő hangsúly azonban a keresési technikákra és az elemzést nehezítő körülményekre került.

Rengeteg szinonimára kell szűrni

A releváns információk gépi szűrése nem olyan egyszerű a közösségi médiában, mint Szekeres Péter, a webes véleményanalízissel foglalkozó Neticle ügyvezető igazgatója kifejtette a konferencia kezdő előadásában. Egy témának nagyon sokféle előfordulása lehetséges a szövegekben, ezért minden szinonimát és kivételt külön fel kell mérni a szakértőknek. Az előadó példaként a Magyar Telekomot említette, amelyre a felhasználók a cég jelenlegi nevén kívül szoktak még például T-Mobile-ként, T-Home-ként, Matávként, T-ként utalni vagy gúnynéven Tréhómként hivatkozni - csak ezzel a vállalattal kapcsolatban összesen 150 szinonimát vagyis keresőkifejezést tart számon a cég.

Ezenkívül még további nehézségek is felmerülnek, amelyet az elemzőknek mind figyelembe kell venniük. Úgy mint, hogy egy vállalat saját Facebook oldalán a felhasználók nem írják le deklaráltan milyen céggel és melyik szolgáltatásával elégedettek, ezért ezt a körülményt már a tartalomelemzőknek kell megállapítaniuk - magyarázta az ügyvezető. Továbbá az is akadályozza a cég munkáját, hogy bizonyos esetekben mást jelentenek az ékezetes és ékezetmentes alakok vagy akár a kis és a nagybetűk használata, utóbbira jó példa a "Jobbik" és a "jobbik" szavak különbsége.

Egy megbízás során a szakértők mindezeket a tényezőket figyelembe kell venniük, miközben egy többszörösen összetett keresést lefuttatnak. Szekeres egy konkrét példát is említett a múltból, mikor a legalább két gyerekkel rendelkező édesanyák internetes félelmeit kellett megállapítaniuk. Ehhez a feladathoz szűrni kellett a szakértőknek a közösségi oldalon megtalálható bejegyzések szerzőinek nemét, a kisgyerekre utaló szavakat, majd pedig ezen belül az internetre és a félelemre vonatkozó kifejezéseket. A cég ebben az esetben több ezer véleményt tartalmazó listát kapott, amelyet a továbbiakban tartalomelemzéssel kezdett vizsgálni.

Egy bejegyzéssel kapcsolatban az elemzés során megállapítható például a pozitív vagy a negatív hangvétel, amelyre szintén léteznek automatizálási lehetőségek, de ebben is felmerülnek nehézségek. A Szekeres által hozott adat szerint a hangvétel megállapításánál az emberi pontosság 80-85 százalék, így a Neticle is "közel emberi" pontosságot vállal a felméréseiben. A tökéletesség részben az irónia miatt nem lehet teljes, amely továbbra is a legnagyobb problémát okozza a gépi felismerésben, mint például a "Már 2 napja kib****tt lassú a netünk... Én így szeretlek T-mobil!" véleménynél. A megoldás az automatizált rendszereknél a kontextusfüggetlen kifejezések kiragadása lehet, de a fejlesztéseknek még van merre haladniuk ezen a területen. Továbbá a hangulatfelismerésnél meg kell adni a területspecifikus kivételeket, mivel az energetikai szektorban a "gáz" nem negatív vagy a mezőgazdaságban a "gyökér" a petrezselyem szinonimája. A bejegyzések hangvételeinek követése, illetve változása alapján egy olyan "vélemény-árfolyam" rajzolható fel, amely többek közt a befektetési cégeknél az átvilágításhoz vagy potenciális partnerek elemzéséhez lehet hasznos.

neticle_emlitesgrafAz említésgráf mutatja a téma csomópontjait a pozitív és negatív hangulatokkal (Neticle)

Egyik látványos elemzési módszer az említésgráf, amely megmutatja, hogy melyik témával foglalkoznak éppen a felhasználók a legtöbbet az interneten, valamint hogy ehhez milyen altémák kapcsolódnak - egy cégnek azért lehet fontos a megtekintése, mivel érdemesebb számukra a csomópontokat elemezni a szerteágazó altémák helyett. Egy másik elemzési típus a versenytársfigyelés, amellyel pedig az állapítható meg, hogy melyik márkát mivel vetik össze a legtöbbször a szerzők. A bemutatott példa szerint a Vodafone-t gyakran emlegetik a Telenorral, továbbá a Samsung és a Galaxy kifejezéssel. Ezen belül viszont további elemzésre van ahhoz szükség, hogy miért gyakori a cégek együttes említése, ilyen lehet például ha egy készüléktípus nem érkezett még meg egy szolgáltatóhoz. Továbbá be lehet állítani riasztások figyelését is új cégek megjelenéséről, akár a KKV-knál történt új befektetések (irodát nyitottak, száz embert felvettek) hasznosak lehetnek a befektetési alapoknak vagy a Sportkártya így értesülhet az új sportlétesítményekről.

Végül a Neticle szerint fontos lehet a terület szakértőinek kiszűrése is a közösségi médiában, mivel egy téma legnagyobb ellenzőit és támogatóit is érdemes bevonni a munkába, és az elemző eszközök ebben is segítenek. Megállapítható például, hogy a hozzáértők milyen "hubokon" beszélnek egymással, így egy konkrét esetben egy ingatlanközvetítő be tudott csatlakozni a lakáskeresésről szóló fórumba "a közösség rombolása nélkül". Minden esetben az lehet a legfontosabb a cégek számára, hogy a közösségi média tartalmak segítségével olyan területeket azonosítsanak, ahol a versenytársak még kevésbé aktívak - tette hozzá az előadó.

A top négyből három szolgáltatás a Facebooké

Hogy milyen közösségi oldalakat érdemes a magyar felhasználók aktivitása alapján figyelni? Többek közt ebbe adott betekintést Lévai Richárd, az RG Stúdió marketingigazgatója a MediaQ augusztusi, 6609 főt felmérő adatai alapján. A Facebook továbbra is a legerősebb hazánkban közel 6 millió felhasználóval, amelyet a Messenger követ 4,89 millióval (ennek 76,5 százaléka fiatal), a YouTube áll harmadik helyen valamivel több mint 4 millióval, tipikusan harminc éves kor alatti zenét és videókat néző fiatalokból álló bázisával.

A dobogós helyezések után nagyobb csökkenés figyelhető meg a felhasználói számban, így az Instagramot hazánkból 1,36 millióan használják, rendszerint harminc alatti jómódúak. A Pinterest közönsége legfőképpen a divat és kiegészítők kategóriája iránt érdeklődő 15-35 évesekből áll. A LinkedInt 726 ezren használják a "gazdasági elitből", például közép- és felsővezetők, ambiciózus fiatalok közül. A lista végén pedig a korábbi Twitter helyett már a Snapchat áll 564 ezer felhasználóval, főleg olyan 25 év alatti fiatalokból, akik a Facebookon túli kommunikációs lehetőségeket keresik. "Figyeljük meg, hogy az első négyből három a Facebook tulajdona." - hívta figyelmet az RG Stúdió marketingvezetője is. A szakértő a Snapchattel kapcsolatban hozzátette, hogy sokan a Facebook kihívóját látják benne, de a cégek hozzáállása kettős - mindenki reméli, hogy minél később hozza Magyarországra a hirdetési platformját, mert akkor még egy helyen kellene jelen lenni, miközben a közösség jelenleg nagyon kicsi.

Átlagosan napi 211 percet tölt online egy átlag magyar felhasználó. Ezen belül viszont érdemes a korosztályos bontást is figyelembe venni. A Facebook minden vizsgált korcsoportban az idő nagyjából harmadát veszi el, amelyet az X és a Baby Boom generációnál a web és az email követ. A 35 alatti Y és Z generációnál viszont már egyre erősebben kezd megjelenni a chat és az Instagram, míg az emailezés szinte kiszorul a 4-6 százalékával, de a webes böngészés is jelentősen kevesebb mint a 36 feletti korosztályban.

mediaq-kutatas-online-ido-fokusz-2017q2

(Forrás: Közösségi kalandozások, MediaQ)

CI/CD-vel folytatódik az AWS hazai online meetup-sorozata!

A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.

CI/CD-vel folytatódik az AWS hazai online meetup-sorozata! A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.

Az adatgyűjtési lehetőségek viszont változatos mélységet érhetnek el ezeken az oldalakon. A közösségi platformok saját keresője "szétforgácsolódott", mivel több helyen is lehet keresni, de nem mindig ugyanazzal az eredménnyel a végén. A keresést gyakran befolyásolja a felhasználó személyes kapcsolati hálója, és hogy csak azt a találatot jeleníti meg a rendszer, ami az illető számára nyilvános. Emellett például a Pinterest vagy az Instagram a hashtageket és a mellette beírt tartalmakat használja, de jellemzően nem keres a képi információra. Az ennél mélyebb keresési lehetőségek fizetősek, ahol rendelkezésre áll, mint például LinkedInen. Facebookon pedig csak olyankor érdemes a keresőhöz fordulni "ha valakinek egy konkrét témában van egy emléke arról, hogy az ismerőse mit írt", akár egy konkrét információ vagy vélemény. Azt viszont az algoritmus is befolyásolja, hogy kihez milyen információ jut el a szűrőbuborék miatt - jegyezte meg Lévai.

Egy másik keresési lehetőséget a Google jelent, de ez is inkább általános információk gyűjtését szolgálja ki, mivel csak a nyilvános információk elérhetőek a keresőóriásnak, és nem használja a közösségi oldal saját algoritmusát. Így néha egyszerűbb kezelni a Google kereséseket, de nehéz az adatokat összegezni vele. Rendelkezésre állhatnak scriptek és API-k, amelyekkel többféle adatot és információt lehet gyűjteni, de ezzel kapcsolatban a felhasználói és jogi kérdések problémái is felmerülnek a személyes adatok kiolvasásával például a Facebook adatbázisából, amelyhez a felhasználók külön engedélyére is szükség lehet - a hiQ esete alapján viszont a publikus adatok elérése megengedett a külső rendszereknek.

Ezeket pedig még kiegészíthetik egyéb szolgáltatások, de például a Pinterest vagy a Snapchat nem teszi elérhetővé Magyarországon a hirdetési rendszerét, és ezzel együtt az analitikát sem. A Facebook "árul el a legtöbbet" a hirdetőknek, amellyel például az is felmérhető, hogy a Londonban élő magyarok közül potenciálisan 99 ezer fő érhető el, vagy 2,1 millióan vannak azok, akik 4G-ről szoktak Facebookot használni. Nagyon sok veszélyes célzási lehetőséget is megenged a rendszer, mint ahogy pár héttel ezelőtt az antimszemita szűrések megengedéséről kiderült. A Facebook Audience Insights pedig abba is betekintést ad, hogy például a Telekom iránt érdeklődő 250-300 ezer ember milyen más oldalakat kedvel a Facebookon belül. Az amerikai felhasználóknál ezenkívül le lehet kérdezni, hogy van-e ingatlanja vagy mekkora a háztartásának a költése. Azonban az európai uniós adatvédelem szigorú, sőt Magyarországon még az EU-s országok többségéhez viszonyítva is szigorúbb elvárások érvényesek, mint Lukács Ádám József, a Hinora Marketing Group marketing vezetője hozzátette. Ezért sem megengedett például a háztartások jövedelmének szűrése, pedig a magyar weboldalak ugyanúgy követőkódokkal vannak ellátva, és az adatok rendelkezésre állhatnának.

November 25-26-án 6 alkalmas K8s security és 10 alkalmas, a Go és a cloud native szoftverfejlesztés alapjaiba bevezető képzéseket indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról