
Image by Marco Verch, from Ccnull
AI Labirintus: A Cloudflare új eszköze mesterséges intelligencia alapú webkeresőket csap be hamis weboldalakkal
A Cloudflare bejelentette az “AI Labyrinth” eszközt, amelyet az AI-alapú weboldalakról adatokat kinyerő, engedély nélküli web scraper-ek elleni küzdelemre terveztek.
Siet? Itt vannak a lényegi tények:
- Az eszköz valósághű, de haszontalan, mesterséges intelligencia által generált tartalmat hoz létre, hogy időt pazaroljon a scraperek számára.
- Az AI Labirintus a robots.txt-t figyelmen kívül hagyó botokat célozza meg, beleértve az Anthropic és a Perplexity AI által használtakat is.
- A következő generációs mézcsapdaként működik, észleli és ujjlenyomatot készít az engedély nélkül működő keresőrobotokról.
Az AI Labirintus nem közvetlenül blokkolja ezeket a botokat, hanem félrevezeti őket egy végtelen, AI által generált oldalakból álló labirintusba, így pazarolva el azok idejét és számítási kapacitását.
“Amikor észlelünk engedély nélküli weboldal-bejárásokat, nem blokkoljuk a kérést, hanem olyan mesterséges intelligencia által generált oldalakhoz linkelünk, amelyek elég meggyőzőek ahhoz, hogy csábítsanak egy bejárót azokon áthaladni” – magyarázta a Cloudflare egy blogbejegyzésben.
“De bár valósnak tűnik, ez a tartalom valójában nem az általunk védett oldal tartalma, ezért a bejáró időt és erőforrásokat pazarol” – tette hozzá a Cloudflare.
Az ArsTechnica szerint az AI (mesterséges intelligencia) scraper-ek problémát jelentenek, mivel gyakran engedély nélkül gyűjtenek óriási mennyiségű adatot a weboldalakról, hogy mesterséges intelligencia modelleket képezzenek. Ez több problémát is felvet: sérti a szellemi tulajdonjogokat, megkerülve azokat a kontrollokat, amelyeket a weboldal tulajdonosai alkalmaznak a hozzáférés szabályozása érdekében.
Ráadásul a scraping elősegítheti az érzékeny vagy sajátos adatok helytelen használatát. A scraping mennyisége drámaian megnövekedett, a Cloudflare több mint 50 milliárd crawler kérést jelent naponta.
Ez a nagymértékű adatkinyerés kimeríti a weboldalak erőforrásait, befolyásolva a weboldal teljesítményét és a privát szférát, miközben hozzájárul az adatok kihasználásával kapcsolatos növekvő aggodalmakhoz az AI fejlesztésben.
Míg a weboldal tulajdonosok hagyományosan a robots.txt fájlra támaszkodnak, hogy megmondják a botoknak, mit érhetnek el és mit nem, számos AI cég – beleértve a nagy szereplőket, mint az Anthropic és a Perplexity AI – vádak alá került, hogy figyelmen kívül hagyják ezeket az utasításokat, ahogy azt a The Verge számolt be róla.
A Cloudflare AI Labirintusa agresszívabb megközelítést kínál a nem kívánt botok kezelésére. Az eszköz “következő generációs méhcsapdaként” működik, mélyebbre vonzza a botokat egy mesterséges tartalomhálóba, amely valódi megjelenésű, de végül haszontalan az AI képzéshez.
A hagyományos méhcsapdákkal ellentétben, amelyeket a botok már képesek azonosítani, az AI Labirintus valóságosnak tűnő, de lényegtelen információkat készít a Cloudflare Workers AI platformja segítségével.
“Egy valódi ember soha nem menne négy link mélységig egy AI által generált nonszensz labirintusban” – jegyezte meg a Cloudflare. “Bármely látogató, aki ezt megteszi, nagyon valószínű, hogy bot, így ez egy vadonatúj eszközt ad a kezünkbe a rossz botok azonosítására és ujjlenyomatának rögzítésére.”
Az AI által generált tartalom tudományosan tényeken alapul, de semmi köze az adott, védelem alatt álló weboldalhoz.
Ez garantálja, hogy az eszköz nem járul hozzá a téves információk terjesztéséhez, miközben továbbra is összezavarja az AI scraper-eket. A félrevezető oldalak láthatatlanok az emberi látogatók számára, és nem befolyásolják a keresőmotorok rangsorolását.
Az AI Labirintus ingyenesen, opcionálisan elérhető valamennyi Cloudflare felhasználó számára. A weboldal adminisztrátorok aktiválhatják a Cloudflare irányítópultjukon a Bot Kezelési beállítások alatt.
A cég ezt csak az AI-alapú ellenintézkedések kezdeteként írja le, a jövőbeni tervek szerint még megtévesztőbb hamis oldalakat készítenek.
A weboldalak és az AI-alapú adatgyűjtők közötti macska-egér játék folytatódik, a Cloudflare innovatív megközelítést alkalmazva védi az online tartalmakat. Azonban kérdések merülnek fel azzal kapcsolatban, hogy milyen gyorsan alkalmazkodnak majd az AI cégek ezekhez a csapdákhoz, és vajon ez a stratégia vezethet-e a webes adatok felett folyó küzdelem kiéleződéséhez.
Írj hozzászólást
Mégse