L’intelligenza artificiale è ossessionata da un certo Elias Thorne: la colpa è dei modelli che si copiano tra loro

Se si chiede a un chatbot di inventare una storia, c'è una buona probabilità che tra i protagonisti compaia il nome di Elias Thorne. A volte è un guardiano del faro, altre un orologiaio, un bibliotecario o un esploratore. Cambiano i dettagli, ma il nome ritorna con una frequenza sorprendente in quasi tutti i modelli di IA più noti. Tanto da spingere ricercatori e sviluppatori a interrogarsi su quella che ormai viene definita una vera e propria ossessione narrativa dell'intelligenza artificiale.
Come riporta la testata 404 Media, a scoprire per primo questo strano fenomeno è stato l'ingegnere informatico Daniel May, il quale si è imbattuto in "Elias Thorne" mentre stava analizzando il comportamento di alcuni agenti AI che gli stavano intasando la casella di posta elettronica con annunci spam. May ha anche notato come il nome fosse all'improvviso comparso tra le ricerche di Google Trends.
Ad approfondire la questione ci hanno poi pensato i ricercatori Sil Hamilton e David Mimno della Cornell University. Il loro studio – il cui titolo si può tradurre come: "Ancora Elias nel faro? Diagnosi della poca diversità nelle storie LLM" – ha analizzato circa 20.000 racconti generati da diversi modelli linguistici, tra cui ChatGPT, Claude e Gemini, utilizzando cinque semplici prompt narrativi. I risultati hanno mostrato come ci siano undici parole che ricorrono nell'88% delle storie generate dai vari modelli: professioni come guardiano del faro, orologiaio, bibliotecario, pescatore e direttore d'orchestra, insieme ai nomi Elias, Mara ed Elara. Tra tutte le combinazioni possibili, una domina nettamente sulle altre: Elias Thorne, il guardiano del faro, presente in circa due racconti su tre.
Perché l'IA cita Elias Thorne: non è colpa dell'addestramento dati
Naturalmente la prima ipotesi di Hamilton e Mimno era che il personaggio fosse presente in molti dei testi utilizzati per addestrare i modelli. I Large Language Model, per imparare a elaborare gli input degli utenti, hanno bisogno di essere "nutriti" con milioni e milioni di dati, pertanto era possibile che i libri usati per addestrare i vari modelli IA contenessero molti riferimenti a "Elias Thorne". L'analisi dei ricercatori ha però smentito questa convinzione. Nei dataset di pre-addestramento non c'era alcuna traccia di guardiani del faro o bibliotecari con questo nome. Gli unici vaghi riferimenti erano un orologiaio londinese del XVI secolo, Elias Allen, e uno scienziato pazzo chiamato Elias che compariva in una serie di figurine americane degli anni Ottanta.
Secondo gli autori dell'indagine la spiegazione è da ricercare nel modo in cui i dati appresi durante l'addestramento vengono utilizzati per insegnare ai modelli a interagire con gli esseri umani. Molti modelli moderni vengono infatti addestrati utilizzando dataset derivati da conversazioni tra utenti e chatbot precedenti. Uno dei più importanti è WildChat, una raccolta open source di oltre un milione di dialoghi reali tra utenti in carne e ossa e l'IA come ChatGPT. Alcune di queste conversazioni contengono effettivamente diversi racconti con Elias e ambientazioni simili. Nel tempo, i modelli successivi avrebbero quindi assimilato e riprodotto questi schemi, che sono poi confluiti in nuovi dataset di addestramento. Il paper paragona il fenomeno a un virus che si replica da una generazione di modelli all'altra.
A favorire questa diffusione potrebbe essere anche il cosiddetto allineamento, il processo con cui le aziende cercano di rendere i chatbot più sicuri e meno inclini a generare contenuti problematici. Molte storie presenti nei dataset originali contengono temi violenti, riferimento sessuali o argomenti controversi. I sistemi di sicurezza tendono quindi a privilegiare i racconti che vengono considerati innocui. Elias, con i suoi fari battuti dal vento e le sue atmosfere malinconiche, rappresenta un protagonista ideale: prevedibile, rassicurante e privo di elementi rischiosi.
Il rischio del "mode collapse" che influenza il mondo al di fuori delle chat
Questo fenomeno che porta l'IA a nutrirsi dalla stessa IA viene chiamato dagli esperti "mode collapse". Detto in parole semplici, invece di esplorare la vastità delle alternative possibili, a causa dei dati ripetitivi il sistema converge progressivamente verso poche soluzioni che considera ottimali. Applicato alla narrativa, significa che l'IA dà l'impressione di essere creativa, ma in realtà tende a rifugiarsi sempre negli stessi personaggi, negli stessi nomi e nelle stesse ambientazioni.
In un mondo dove l'intelligenza artificiale si sta insinuando in qualsiasi settore e attività umana, tutto ciò può portare a fenomeni molto curiosi. Prendiamo il boom dei libri scritti con l'IA che vengono autopubblicati su Amazon. Poiché i modelli che scrivono questi testi attingono tutti dallo stesso bacino, ecco che Elias Thorne inizia a comparire anche come autore e scrittore. Non solo. Il nome è presente anche in alcune playlist musicali, diversi contenuti di YouTube e persino siti di notizie automatizzate. Una molteplicità di talento dietro i quali, però, si nasconde solamente una macchina.
