I’m not a robot: gli AI Agent e la fine dei Captcha

Se non era già abbastanza strano che gli esseri umani dovessero quotidianamente dimostrare di non essere dei robot, lo è senz’altro che adesso gli stessi robot siano in grado di superare quei test meglio di noi.
L’ultimo episodio, in questa sorta di versione rovesciata di Blade Runner, è emerso su Reddit pochi giorni fa, quando un utente ha pubblicato degli screenshot che mostravano come il nuovo ChatGPT Agent di OpenAI avesse superato senza difficoltà il più diffuso dei Captcha Code, quello cioè che ci richiede di cliccare su “I’m not a robot”.
Cos’è ChatGPT AgentChatGPT Agent è un nuovo sistema che permette all’assistente artificiale di OpenAI di controllare un proprio browser per accedere, navigare e compiere operazioni sul web al posto nostro (per esempio, fare la spesa online o comprare un biglietto del treno), mentre noi ci limitiamo a supervisionare l’intero processo e a intervenire direttamente solo nella fase più importante, per esempio al momento del pagamento.
Navigando online, ChatGPT Agent ha inevitabilmente incrociato dei captcha.
Ma invece di chiedere all’utente umano di risolverli ha fatto da solo, commentando così: “Il link è stato inserito, quindi adesso cliccherò sul pulsante ‘verifica di essere un umano’ per completare la verificazione su Cloudflare. Questo processo è necessario per dimostrare di non essere un bot e continuare nell’azione”.
Il bot che si crede umanoL’ironia di un bot che incontra l’ostacolo progettato apposta per bloccarlo e decide consapevolmente, se così si può dire, di oltrepassarlo è stata colta dagli utenti di Reddit, che hanno commentato: “D’altra parte è stato addestrato con dati umani, perché dovrebbe identificarsi con un bot?”.
Il paradosso per cui, a furia di risolvere dei captcha, noi esseri umani stessimo addestrando le macchine a risolverli è sempre stato, come vedremo, uno dei limiti di questi test.
Ufficialmente noti come Completely Automated Public Turing Test to Tell Computers and Humans Apart (“test di Turing pubblico e completamente automatizzato per separare computer e umani”), i captcha hanno uno scopo ben preciso: evitare che alcuni siti – soprattutto quelli che offrono servizi – vengano inondati di richieste da parte di programmi automatici che possono eseguire la stessa operazione a ripetizione.
Assicurarsi che dall’altra parte dello schermo ci sia un essere umano serve quindi a impedire che internet sia inondato da spam, tentativi di truffa e molto altro ancora.
La cpmplessità dei captchaNegli ultimi anni, i captcha sono stati spesso divisi in due livelli. Il primo e più semplice è la spunta “I’m not a robot”. Come spiega Ars Technica, questo box analizza molteplici segnali – compresi i movimenti del mouse, il tempo necessario a cliccare, l’impronta del browser che permette di identificare un utente e altro ancora – per determinare quando a cliccare è un essere umano o meno.
Se questo primo test non viene superato, si passa al secondo – e detestato – livello: quello in cui ci viene richiesto di individuare semafori, macchine, strisce pedonali o altro all’interno di una serie di immagini.
Questi quiz visivi saranno anche più difficili, ma già nel 2016 dei ricercatori della Columbia University avevano dimostrato di poter risolvere il 70% dei captcha utilizzando alcuni strumenti di riconoscimento immagini.
Un paradosso inevitabileInevitabile, considerando ciò che avviene dopo che abbiamo risolto i captcha: i dati relativi alle nostre azioni per identificare correttamente semafori o altro vengono utilizzati per addestrare dei sistemi di intelligenza artificiale, che così diventano più bravi a riconoscere le immagini, ma anche, di conseguenza, a superare i captcha. È un paradosso che è da sempre alla base di questi quiz e che ha probabilmente permesso all’agente di ChatGPT di simulare i movimenti umani nel momento in cui gli è stato chiesto di confermare di non essere un robot.
Non è nemmeno l’unico paradosso di questo ambito, visto che sempre più spesso le “click-farm” assoldano squadroni di esseri umani per superare in massa i captcha code, trasformando a tutti gli effetti queste persone in bot e ingannando così ancora una volta il sistema.
Il futuro oltre i captchaÈ quindi? È giunto il momento di abbandonare per sempre gli odiatissimi captcha?
Al momento, la direzione che si sta seguendo è spesso quella opposta e prevede di creare dei quiz sempre più complessi: alcuni richiedono di riconoscere dei suoni (originariamente pensati per le persone non vedenti) o ascoltare delle melodie e indicare in quale la successione di note si ripete; in altri casi, viene richiesto di ruotare l’immagine 3D di un animale finché il muso non guarda nella direzione indicata.
Neanche questi captcha più avanzati sono ormai sufficienti a fermare le intelligenze artificiali.
Parlando con la MIT Tech Review, il docente di ingegneria informatica Mauro Migliardi ha spiegato che, poiché le AI possono ormai essere addestrate a risolvere ogni sfida cognitiva, è necessaria utilizzare dei “captcha fisici”, che richiedono, per esempio, di ruotare il telefono quando navighiamo tramite smartphone.
Ma possiamo davvero essere costretti a manovrare il telefono come se fosse un joypad ogni volta che vogliamo accedere a un sito web? Una soluzione più semplice è quella sperimentata da una coalizione di aziende (tra cui Apple, Google e Cloudflare) e battezzata Privacy Pass, che memorizza localmente, in forma crittografata e anonima, il superamento di test precedenti per dimostrare che siamo umani, senza dover ripetere ogni volta il processo. Una soluzione sicuramente preferibile ai captcha, ma che secondo un’analisi condotta da Mozilla non è priva di criticità, in termini di rischi per la privacy e non solo.
Le armate di bot non si possono fermare (del tutto)Una soluzione perfetta, al momento, non esiste. E lo dimostra il fatto che il traffico generato dai bot sia oggi la maggior parte di quello online e che anche i più complessi captcha abbiano ormai lo scopo di rendere più costoso e complesso il dispiegamento di armate di bot, non certo quello di fermarle del tutto.
In futuro, la situazione rischia di diventare ancora più complessa: se e quando affideremo le chiavi della nostra esperienza online agli AI Agent, vogliamo davvero dover intervenire fisicamente ogni singola volta in cui incontrano dei test, nel frattempo diventati sempre più complicati per impedire che siano in grado di risolverli da soli? Una cosa è certa: è giunto il momento di inventare soluzioni nuove e lasciarci alle spalle i Captcha Code. Nessuno li rimpiangerà.
La Repubblica