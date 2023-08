Google vuole che gli autori diano il consenso per addestrare l’IA con le loro opere: forse è una trappola Il copyright sarà uno dei grandi problemi che i sistemi di intelligenza artificiale dovranno affrontare. Ora l’azienda ha proposto di creare un sistema per permettere agli autori di decidere se consentire o meno ai software di usare i loro contenuti.

A cura di Elisabetta Rosso

Attiva le notifiche per ricevere gli aggiornamenti su Intelligenza artificiale (IA) ATTIVA GLI AGGIORNAMENTI

Il problema è sempre lo stesso. L'intelligenza artificiale deve essere addestrata, e per farlo servono milioni di testi e immagini prodotti da altri, contenuti che poi riappaiono in qualche modo nelle riposte generate dall'IA. E questo processo apre un grande interrogativo sul diritto d'autore. A chi appartiene alla fine del prodotto che è finito nel tritacarne delle macchine ed è stato sputato fuori nelle conversazioni con i chatbot?

Google taglia la testa al toro spiegando che la legge sul copyright dovrebbe essere modificata. In poche parole devono essere gli autori a decidere se consentire o meno all'intelligenza artificiale di usare i loro contenuti. La società ha infatti chiesto ai politici australiani di promuovere "sistemi di copyright che consentano un uso appropriato ed equo dei contenuti protetti dal diritto d'autore per consentire la formazione di modelli di intelligenza artificiale in Australia su un'ampia e diversificata gamma di dati, supportando allo stesso tempo la possibilità di disattivare il consenso per chi preferirebbe che i suoi dati non venissero usati per addestrare i sistemi di intelligenza artificiale”.

Un portavoce di Google ha spiegato che la società vorrebbe creare un sistema robots.txt che permetta agli autori di rinunciare o meno ai diritti di determinate opere. Non è però ancora chiaro come funzionerà. E questo potrebbe cambiare le carte in tavola. Per esempio, sarebbe molto più trasparente un sistema dove le opere sono di default coperte dal copyright e se l'autore desidera può dare il consenso all'IA di usarle. Non il contrario. Lo stesso processo per negare il permesso, se difficile o macchinoso, potrebbe disincentivare gli utenti. In questo modo però ci sarebbe un quadro normativo che permette all'IA di raschiare il web per essere addestrata in modo legale.

Leggi anche Perché con l'intelligenza artificiale le donne rischiano di perdere il lavoro più degli uomini

Come funziona l'addestramento dell'IA

La tecnologia funziona attraverso la “diffusione”, vengono raccolti enormi set di dati per addestrare l’IA. Per esempio, dopo aver visto milioni di immagini contrassegnate con la parola “cane”, è in grado di creare attraverso la composizione di pixel l’immagine di un cucciolo molto simile al set di dati che ha ingerito, eppure l'IA inserisce qualcosa di diverso che rende unica la sua riproduzione proposta.

Non solo, tra i suggerimenti inseriti nei generatori di immagini, spesso appare il nome di un artista. Per esempio "disegna un albero nello stile di Van Gogh”, e l’IA ci riesce perché è stata addestrata su miliardi di immagini, compresi i dipinti di Van Gogh, comprese le opere protette da copyright di artisti viventi. Funziona come per il cane, basta sostituire il nome di un artista ed ecco che il generatore di immagini sputa fuori un'opera che sembra essere stata creata proprio dal pittore di riferiemento. Toby Murray, professore presso la scuola di informatica dell'Università di Melbourne, ha spiegato che la proposta di Google imporrebbe agli autori di specificare se i sistemi di intelligenza artificiale potranno o meno usare le loro opere.

A pagare il prezzo più alto sono gli autori più piccoli

Kayleen Manwaring, docente presso l'UNSW Law and Justice, ha dichiarato a Guardian Australia che il copyright sarà uno dei grandi problemi che i sistemi di intelligenza artificiale dovranno affrontare. "Servono milioni di dati per essere in grado di produrre risultati efficienti, ed è probabile che compaiano copie, e così avviene la violazione del diritto d'autore di moltissime di persone". Per Manwaring serve un quadro normativo, altrimenti a pagare il prezzo più alto saranno scrittori, pittori o illustratori minori. "Al momento è molto probabile che gli autori più piccoli subiscano la violazione del loro copyright a destra e a sinistra, se i sospetti di molte persone sono corretti e i set di addestramento IA utilizzano molto materiale da Internet."

Il caso Greg Rutkowski è emblematico. Lui è un concept artist celebre per le sue opere in stile fantasy, ed è stato menzionato centinaia di migliaia di volte nei prompt su Midjourney. Secondo il sito Lexica, che tiene traccia di oltre 10 milioni di immagini e suggerimenti generati da Stable Diffusion, il nome di Rutkowski è stato utilizzato come 93.000 volte.

Le cause contro l'intelligenza artificiale

Il 13 gennaio tre artiste, Sarah Andersen di Portland, Kelly McKeran di Nashville, e Karla Ortiz di San Francisco hanno avviato una causa legale negli Stati Uniti “per rappresentare una categoria di migliaia di colleghi colpiti dall'intelligenza artificiale generativa”. L’accusa è di sfruttare le opere degli artisti, senza il loro permesso e senza riconoscere una percentuale di guadagno, per addestrare i generatori di immagini.

Anche Getty Images, la più grande azienda statunitense di illustrazioni, foto e filmati, “ha avviato un procedimento legale presso l’Alta Corte di giustizia di Londra contro Stability Ai", si legge nella nota pubblicata da Getty Images, sostenendo che l’azienda ha violato alcuni diritti d’autore "su contenuti di proprietà di, o rappresentato da, Getty Images”. L’IA avrebbe infatti copiato ed elaborato illegalmente “milioni di immagini protette da diritto d’autore”, senza alcuna licenza e a danno dei creatori dei contenuti. “Ha scelto di ignorare le opzioni di licenza praticabili e le protezioni legali di lunga data nel perseguimento dei propri interessi commerciali autonomi”.