Szerző: Dömös Zsuzsanna

2024. július 26. 13:00

Újabb oldalról rúgtak bele a reCAPTCHA-ba

Kaliforniai kutatók szerint a reCAPTCHA haszontalan biztonsági szempontból, ráadásul rengeteg költséggel jár - viszont a Google felhasználói adatokra tehet szert általa.

Az első CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) kódokat több mint 20 éve vetették be először, azóta az internetezők úton-útfélen összefuthatnak a különféle feladványokkal, melyek arra hivatottak, hogy megkülönböztessék egymástól az igazi felhasználókat és a robotokat. A Google 2009-ben vásárolta fel a reCAPTCHA szolgáltatást két évvel a bemutatkozása után, ami azóta számos újabb kiadással finomodott: 2014-ben jelent meg a reCAPTCHA v2, majd 2018-ban a reCAPTCHA v3. Annak ellenére, hogy van már frissebb kiadása, csaknem hárommillió weboldal még a v2 változatot használja védvonalként.

A University of California kutatói szerint az évek óta használt megoldásnak azonban ideje lenne mennie. Andrew Searles, Renascence Tarafder Prapty és Gene Tsudik szerzők azzal érvelnek friss kutatásukban, hogy a felhasználók már egyáltalán nem szeretik a CAPTCHA-t, mivel annak használata időigényes, továbbá a cégek oldaláról is adatközponti-erőforrásokat fogyaszt el. Mindezen felül a teszt már nehezen tölti be eredeti szerepét, azaz hogy hatékonyan szűrje a robotokat.

Független szakértők nemrég publikáltak egy másik tanulmányt is, mely szerint ugyan a CAPTCHA-k nagyjából két évtized alatt sokat fejlődnek kifinomultság és sokféleség szempontjából”, a megkerülésükre szolgáló technikák is sokat javultak. Az AI fejlődésével a robotok pontossága már 85-100 százalék között mozog (a többség 96 százalék felett), ami jelentősen meghaladja az emberek pontossági tartományát. 

recaptcha-featured

Az egyik professzor szerint a reCAPTCHA valódi célja, hogy a Google felhasználói információkat gyűjtsön be a weboldalakon keresztül, valójában egy ingyenes képcímkézést végző munkaerő- és nyomkövető szolgáltatás, ami biztonsági szolgáltatásnak álcázza magát a reklám- és adatnyereség érdekében. A v2-hez hasonlóan a v3 sem egy igazi CAPTCHA, hanem viselkedéselemzésen alapuló módszer, amely értékeléseket rendel a felhasználói viselkedéshez.

A reCAPTCHA műveletek viszont jelentős költségeket vonnak maguk után. A kutatók becslése szerint 13 év alatt közel 819 millió órát töltöttek az emberek a reCAPTCHA feladványok megoldásával, ami legalább 6,1 milliárd dollárnyi munkabérnek felel meg. A reCAPTCHA-ból származó forgalom körülbelül 7,5 millió kWh energiát igényelhetett, ami 7,5 millió font CO2 kibocsátás eredményezhetett. Ezen túlmenően a Google potenciálisan 888 milliárd dollárt profitált a reCAPTCHA-munkamenetek által létrehozott cookie-kból, illetve 8,75–32,3 milliárd dollárt a címkézett adatkészletek eladása után.

A Google szerint a reCAPTCHA felhasználói adatokat csak a szolgáltatás fejlesztésére használják fel, más célokra nem, amit a szolgáltatási feltételek egyértelművé tesznek. A kutatók szerint ez az állítás nem támasztható egyértelműen, sőt a „re” előtag a „reCAPTCHA”-ban arra utal, hogy a CAPTCHA-kból származó adatokat használták újra gépi tanulásos modellek betanításához. A fogalmazás egyébként teret ad arra is, hogy a felhasználói adatok eladását is a szolgáltatás fejlesztéséhez szükséges folyamatnak tekintheti. a cég.

A K8s annyira meghatározó technológia, hogy kis túlzással szinte az összes IT-szakemberre nézve karrier-releváns.

a címlapról