Új fegyvert vet be a Gmail a spamek elleni harchoz
Új levélszemét-szűrő rendszerrel bővült a Gmail, amely felülmúlja a hagyományos módszereket a nem kívánt e-mailek azonosításában és blokkolásában. A többnyelvű megoldással hatékonyabban lehet észlelni a vizuális trükköket, amiket a radar alatt maradás érdekében alkalmaznak a csalók.
A Google számára állandó harc a spamek szűrése, és bár az utóbbi évek során a Gmail levelező biztonsági rendszere jelentősen fejlődött, még mindig akadnak technikák, amelyek kifognak a levelező beépített szűrőjén. Az új megoldás 38%-kal javítja a „levélszemét-észlelési arányt", és a keresőcég elmondása alapján a tavalyi belsős körben végzett tesztek után most már valamennyi felhasználó Gmail-fiókjában sikerült aktiválni.
Az elmúlt évek egyik legnagyobb védelmi frissítéseként említi a cég a RETVec (Resilient & Efficient Text Vectorizer) névre keresztelt szövegosztályozási rendszert, ami segít megérteni és felfedezni a manipulált szövegeket, mivel a kéretlen spamek sok esetben tartalmaznak olyan nyelvi jeleket, amelyek alapján felismerhető a csalási szándék, de egy algoritmus számára nehezebben értelmezhetők. A gépi tanulási TensorFlow modell a vizuális hasonlóságokat próbálja észrevenni a szavak jelentésének azonosítására a tényleges karaktertartalom helyett.
CI/CD-vel folytatódik az AWS hazai online meetup-sorozata! A sorozat december 12-i, ötödik állomásán bemutatjuk az AWS CodeCatalyst platformot, és a nyílt forráskódú Daggert is.
A kiberbűnözők és adathalászok számos módszerrel próbálják megkerülni a Gmail szövegbesorolási modelljeit, amelyek képesek automatizált módon, egyes kifejezések alapján felismerni az adathalász támadásokat és más káros tartalmakat. Ilyen megtévesztő technikák például a speciális karakterek, hangulatjelek, a karakterek manipulációjóval kapcsolatos trükkök, homoglifák (kétértelmű karakterek), vagy láthatatlan karakterek alkalmazása.
A RETVec modell az összes UTF-8 karaktert és szót hatékonyan kódolja, így több mint 100 nyelven működik, keresőtáblázat vagy rögzített szókincsméret nélkül. Utóbbinak nagy szerepe van a hatékonyságban, mivel az alternatív megközelítések, amelyek fix szókincsméretet vagy keresőtáblát használnak a homoglifák felismeréséhez, sokkal erőforrásigényesebbek.