video suggerito
video suggerito

Da Bocelli ad Al Bano, l’AI si è addestrata sulla musica italiana senza permessi, l’avvocato: “Servono nuove regole”

Da Pavarotti a Bocelli: l’AI generativa ha usato 12 milioni di brani protetti da copyright per addestrarsi e ci sono anche molti italiani. L’avvocato Ferdinando Tozzi spiega a Fanpage come artisti e fan possono tutelarsi e quali sono le insidie.
Bocelli, Pavarotti e Al Bano Carrisi, 2026
Bocelli, Pavarotti e Al Bano Carrisi, 2026

C'è un mondo della musica generata attraverso l'AI che guarda al repertorio italiano, invadendolo e permeandolo in nuove vesti, in nuovi suoni, ma non proprio in nuove voci. L'inchiesta condotta dalla rivista The Atlantic, con il giornalista Alex Reisner, ha sicuramente aperto uno squarcio sull'esistenza di database di tracce musicali protette da diritto d'autore, che sono state però utilizzate senza alcun consenso per alimentare le architetture di applicativi come Suno e Udio. Entrambe sono piattaforme di intelligenza artificiale generativa in grado di creare brani musicali completi, ovvero con strumenti e voce, partendo da semplici descrizioni testuali. Alcuni prompt, generati da Suno, hanno portato in testa alle classifiche statunitensi brani rock come "Walk my walk" dei Breaking Rust.

Il dataset che ha raccolto 12 milioni di brani e 91 anni di musica

Anche in Italia abbiamo avuto esempi di musica generata attraverso applicativi AI come il "collettivo" Cantoscena. Ciò che ha svelato l'inchiesta è l'esistenza di quattro database, contenenti oltre 21 milioni di tracce musicali. E tra le quattro, la più importante e ricca di brani, anche italiani, è il dataset LAION-DISCO-12M. Come? Questo dataset non solo rappresenterebbe la spina dorsale per l'addestramento dei modelli generativi, ma avrebbe anche delegato a software terzi il lavoro di scraping. Ovvero avrebbero fornito uno script, un'istruzione, per poter accedere a piattaforme di streaming, come YouTube, aggirando gli accessi, le pubblicità e i meccanismi che potrebbero garantire guadagni sia agli artisti, sia alle etichette che pubblicano e distribuiscono la loro musica. LAION, secondo The Atlantic, avrebbe raccolto 91 anni di musica, dopo aver ricevuto finanziamenti da Emad Mostaque, co-fondatore ed ex CEO di Hugging Face e Stability AI.

Cosa si trova nel dataset e perché permette l'addestramento di piattaforme di creazione musicale generativa

Questo avrebbe permesso di contenere all'interno del dataset non il file audio, che avrebbe poi trasformato l'azione in un'appropriazione industriale su vasta scala. Infatti, all'interno del dataset, è possibile trovare i metadati associati al file, che avrebbero permesso da una parte di fornire le sequenze ritmiche, il timbro della voce e le frequenze del brano, dall'altra parte anche una struttura semantica che insegnasse all'applicativo AI la correlazione di alcune parole da utilizzare per generi musicali, o con determinate progressioni sonore. A ogni traccia viene dato un ID di riconoscimento e un URL per arrivare al brano. Tra questi brani, c'è un grande comparto della musica italiana, dalla classica al moderno, da Pavarotti a Elisa, passando per Bocelli, Al Bano Carrisi e Mina.

Da Pavarotti ad Al Bano, passando per Salmo e Marracash

Solo nel dataset LAION-DISCO-12M, che, come ricordiamo, contiene oltre 12 milioni di brani, è stato possibile trovare 639 esibizioni di Luciano Pavarotti. Il tenore italiano è senza dubbio l'artista più "studiato" dall'AI generativa, e non sarebbe complicato evidenziarne i motivi. Dalla grande estensione vocale alla perpendicolarità del suo timbro, Pavarotti rappresenta uno dei tenori più importanti della storia, ma soprattutto uno degli interpreti musicali italiani più riprodotti e riconosciuti nel mondo. Sotto di lui, Andrea Bocelli, che sembra ricalcarne le caratteristiche, mentre dietro di loro c'è Al Bano Carrisi.

Il caso Giusy Ferreri e il brevetto della sua voce

Com'è possibile intravedere nel dataset LAION-DISCO-12M fornito da Hugging Face, dietro il terzetto iniziale ci sono Mina con 251 canzoni, Elisa con 237, ma anche Lucio Dalla con 184 e la coppia Salmo e Marracash, rispettivamente a 182 e 180. Un universo musicale variopinto che solo qualche mese fa, dopo la registrazione di Giusy Ferreri della propria voce come marchio sonoro presso l'EUIPO, avevamo toccato con l'avvocato Tozzi. Proprio Tozzi aveva sottolineato come le norme del diritto d'autore avessero incluso anche la voce come tratto inscindibile della propria identità personale, e che il marchio dovesse avvenire tramite la registrazione di due elementi caratterizzanti: "Da una parte c'è sicuramente il file che contiene la voce, che deve essere seguito da un documento descrittivo. Per un artista che ha una voce caratterizzante è opportuno che vengano stabilite alcune caratteristiche, come la sua espansione (per esempio per un tenore), ma anche il suo timbro". Giusy Ferreri rientra nella Top 50 degli artisti italiani che hanno più brani contenuti in questo dataset, al penultimo posto, con 112 canzoni.

Lo strumento dell'opt-out e il sistema di fingerprint audio personale come mezzo per combattere questo fenomeno

Come combattere questo fenomeno? L'avvocato Tozzi suggerisce lo strumento dell'opt-out, "ovvero la riserva esplicita dei diritti e il divieto di utilizzare le proprie prestazioni per l'addestramento o per attività legate all'intelligenza artificiale" nel contratto degli artisti. Ma non solo, anche un sistema di registrazione di un fingerprint audio personale, così che "chiunque la manipolerà lascerà delle tracce che i software specializzati potranno far emergere. Parliamo di tecnologie che esistono già su altri fronti: oggi le registrazioni fonografiche ufficiali sono contrassegnate dal codice ISRC. Essi funzionano esattamente come un microchip sottocutaneo".

L'insidia della locazione della sede e il problema della tutela giurisdizionale

C'è anche un aspetto su cui riflettere, ovvero lo scoglio della sede di queste aziende che raccolgono milioni e milioni di brani: "Per portarli in tribunale, banalmente negli Stati Uniti, non ti basta pagare il nostro classico contributo unificato; servono investimenti in spese legali enormi. Proprio per superare questi ostacoli, recentemente anche il nostro Presidente della Repubblica ha sottolineato l'urgenza di creare regole transnazionali e trasversali sull'IA, altrimenti rischiamo di non avere un effettivo potere di tutela". C'è anche da fare attenzione ai danni non solo economici per gli artisti.

Sì, perché se da una parte, "il mercato si impoverisce a causa della saturazione dovuta ai cloni, danneggiando la monetizzazione legittima per gli artisti", c'è anche la difficoltà, sempre maggiore, nel trovare chi sia disposto a pagare per la musica e per la sua creazione: "Se l'asset immateriale viene usato abusivamente da chiunque, diventerà sempre più difficile trovare chi sia disposto a pagare le licenze". Senza dimenticare il danno morale e d'immagine: "Se un'IA genera una canzone nello stile di un artista, quell'opera potrebbe non rispecchiare i suoi valori o ciò che lui vorrebbe realmente esprimere. Ricordiamoci che l'arte è espressione di un sentimento intimo e personale".

E se negli Stati Uniti, la legge sul copyright, l'US Copyright Act, stabilisce che in caso di violazione intenzionale e deliberata (willful infringement), i danni statutari possono arrivare a un massimo di 150.000 dollari per ogni singola opera copiata, Tozzi registra che non esiste, attualmente, un valore nominale per singola copia in Italia: "La nostra legge non prevede multe fisse o cifre ad hoc prestabilite in questo modo. Da noi il risarcimento è sempre parametrato: viene calcolato in base all'entità dell'utilizzo illecito e, ovviamente, al giro d'affari e alla rilevanza del singolo artista".

Cosa cambia per il pubblico e perché il valore percepito della musica sta svanendo

Sorge invece ancora l'indecisione del pubblico nei confronti della musica generata da AI, ma soprattutto sull'utilizzo di brani del passato per la generazione di nuove canzoni. Tra gli aspetti su cui l'opinione pubblica si sta indirizzando, in maniera molto meno veemente rispetto ai pochi artisti che hanno preso posizione, c'è sicuramente la svalutazione della musica da forma d'arte a contenuto per piattaforma. Un sintomo che il valore percepito della musica in sé sta evolvendo, perdendo la sua capacità d'impatto rispetto alla sua replicabilità, ormai infinita. E in questo rumore di fondo collettivo, anche e soprattutto il silenzio della maggior parte degli artisti e dell'industria discografica tende a far naufragare qualsiasi riflessione sul futuro della musica.

La Top 50 degli artisti italiani con più canzoni presenti sul dataset

  1. Pavarotti: 639
  2. Andrea Bocelli: 360
  3. Albano Carrisi: 253
  4. Mina: 251
  5. Elisa: 237
  6. Lucio Dalla: 184
  7. Salmo: 182
  8. Marracash: 180
  9. Jovanotti: 177
  10. Fabrizio De André: 163
  11. Emma Marrone: 162
  12. Claudio Baglioni: 161
  13. Loredana Bertè: 161
  14. Tiziano Ferro: 159
  15. Max Pezzali: 159
  16. Gabry Ponte: 158
  17. Luca Carboni: 156
  18. Zucchero: 155
  19. Umberto Tozzi: 155
  20. Laura Pausini: 154
  21. Eros Ramazzotti: 153
  22. Fedez: 153
  23. Giorgia: 153
  24. Adriano Celentano: 152
  25. Ligabue: 151
  26. Pooh: 151
  27. Francesco Guccini: 150
  28. Gianna Nannini: 150
  29. Alessandra Amoroso: 149
  30. Carmen Consoli: 148
  31. Cesare Cremonini: 148
  32. Vasco Rossi: 148
  33. Renato Zero: 147
  34. Negramaro: 145
  35. Sfera Ebbasta: 145
  36. Antonello Venditti: 143
  37. Lazza: 143
  38. Geolier: 141
  39. Mia Martini: 139
  40. Roberto Murolo: 138
  41. Marco Mengoni: 133
  42. Patty Pravo: 132
  43. Samuele Bersani: 132
  44. Toto Cutugno: 130
  45. Annalisa: 128
  46. Renato Carosone: 128
  47. Anna Oxa: 118
  48. Ricchi e Poveri: 118
  49. Giusy Ferreri: 112
  50. Arisa: 102
autopromo immagine
Più che un giornale
Il media che racconta il tempo in cui viviamo con occhi moderni
api url views