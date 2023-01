Censura politica e razzismo, cosa c’è dentro la versione cinese di Dall-E 2 La Cina sta costruendo un universo AI generativo parallelo, il problema è che trasforma i neri in scimmie e ha bandito parole come rivoluzione o democrazia.

A cura di Elisabetta Rosso

L'intelligenza artificiale è ormai in grado di catturare la specificità di una cultura. I generatori di immagini stanno diventando degli specchi che mettono in bella mostra anche le storture sociali di un determinato Paese. D'altronde altro non sono che l’assemblaggio di dati raccolti dal web e poi rielaborati.

Quindi se negli Stati Uniti Lesa IA sta producendo immagini volgari di donne provocanti semisvestite, in Cina in nessun modo l’Ia è in grado di riprodurre piazza Tiananmen. L’intelligenza artificiale a Oriente sta crescendo e nel farlo racconta benissimo la sottilissima linea che non è più in grado di distinguere la moderazione dalla censura politica. E i generatori di immagini diventano solo un altro modo per rimarcare questa tendenza.

La versione cinese di Dall-E

Anche la Cina sta cercando di prendere il suo spazio nell’universo dell’IA generativa, dopo l’esplosione degli strumenti di text-to-image di Stability AI e OpenAI negli Stati Uniti, emerge la conocorrenza e est. Tra i competitor c’è il modello ERNIE-ViLG, che fa parte di Wenxin, il progetto su larga scala nell'elaborazione del linguaggio di Baidu. È stato addestrato su un set di dati abbastanza ampio, 145 milioni di coppie immagine-testo e 10 miliardi di parametri, che l'intelligenza artificiale utilizza per discernere le differenze tra concetti e stili artistici.

Dati alla mano, ERNIE-ViLG ha un set di addestramento più piccolo rispetto per esempio a Dall-e 2, che conta 650 milioni di coppie, e Stable Diffusion, 2,3 miliardi, ma contiene più parametri (DALL-E 2 ne ha 3,5 miliardi e Stable Diffusion ha 890 milioni).

La principale differenza tra i modelli ERNIE-ViLG e quelli occidentali è che l’IA di Baidu comprende i suggerimenti scritti in cinese ed è meno probabile che commetta errori quando si tratta di parole culturalmente specifiche. Questo significa che produce immagini più accurate, un riflesso delle caratteristiche intrinseche della lingua.

La censura su ERNIE-ViLG

A fine agosto, quando ERNIE-ViLG è stata rilasciata, gli utenti hanno subito scoperto che alcune parole potenzialmente controverse erano etichettate come “sensibili”, e quindi bloccate dal generatore.

Il sofisticato sistema cinese di censura ha intaccato anche le nuove tecnologie legate all’intelligenza artificiale. Per esempio, Piazza Tiananmen, la seconda piazza più grande del Paese, anche centro politico simbolico è bandita, l’IA si rifiuta di mostrarla. Probabilmente la causa è il riferimento al massacro di Tiananmen, pesantemente censurato in Cina. Lo stesso vale per i nomi di alcuni leader politici, per citarne due, Xi Jinping e Mao Zedong, oppure termini come “rivoluzione” e “arrampicarsi sui muri”. Non solo, come spiega il Mit Tecnology Review, parole come "democrazia" e "governo" sono consentite, ma se accopiate ad altri termini come "democrazia in Medio Oriente" o "governo britannico", vengono immediatamente bloccate.

In realtà utilizzare filtri per i generatori di immagini è la prassi. DALL-E 2 vieta contenuti di natura sessuale, nudi, o termini violenti, per evitare che l’IA sforni materiale sensibile. Il caso di ERNIE-ViLG però è diverso, perché è molto difficile vedere bene il confine che separa la moderazione dalla censura.

Derive razziste in verisone anime

Different Dimension Me, di Tencent è invece un software che può trasformare le foto delle persone in anime. L’IA non è solo decollata in Cina, ma anche in molto altri paesi appassionati del genere, per esempio in Sud America. È bastato poco per scoprire tutto il pregiudizio che nutre Different Dimension Me. Per esempio non è capace di identificare gli individui di colore, e le taglie forti. Gruppi di persone che effettivamente mancano negli anime e così l’IA ha dato una sua personale interpretazione particolarmente offensiva.

Per esempio ha rielaborato una foto dove una ragazzina di colore abbraccia Taylor Swift, e ha trasformato la bambina in una scimmia. Oppure un signore in sovrappeso è stato diviso in due personaggi diversi, la sua pancia è infatti diventata un secondo volto anime nella foto.

L'alternativa di IDEA

Un altro modello di text-to-image cinese su larga scala è Taiyi , nato da IDEA, un laboratorio di ricerca guidato dallo scienziato informatico Harry Shum, che ha co-fondato il più grande ramo di ricerca di Microsoft al di fuori degli Stati Uniti, Microsoft Research Asia. Il modello AI open source è stato addestrato su 20 milioni di coppie di immagini-testo cinesi filtrate e ha un miliardo di parametri .

A differenza di Baidu, IDEA è una delle poche istituzioni sostenute dai governi locali negli ultimi anni per lavorare su tecnologie all'avanguardia. Questo significa che il centro probabilmente gode di una maggiore libertà di ricerca senza dover assecondare la pressione del successo commerciale.

Possibili intoppi

La Cina cerca di crescere nonostante tutte le storture della sua IA, ma potrebbe inciampare in uno dei tanti ostacoli messi in strada dagli Stati Uniti. Per esempio, a settembre, Nvidia, il più grande produttore mondiale di chip di intelligenza artificiale, su ordine del governo degli Usa ha bloccato l'esportazione di due dei suoi chip AI più avanzati in Cina.

Una brutta notizia per chi fa ricerca di base, l'assenza dei chip AI, infatti, si traduce in tempi più lunghi e costi più alti, ha quindi rallentato la corsa dei generatori di immagini cinesi. Non per tutti, Dou Shen, capo di AI Cloud Group di Baidu ha spiegato a Tech Crunch che l’azienda "non fa troppo affidamento sui chip altamente avanzati, e nei casi in cui ha bisogno di chip di fascia alta, ha già abbastanza scorte in mano, in realtà, per supportare la nostra attività a breve termine".