Imparare dai migliori, a costo zero: il dilemma del diritto d’autore nell’era dell’Intelligenza Artificiale Generativa

«La proprietà intellettuale è protetta», afferma la Carta dei Diritti Fondamentali dell’Unione Europea. Tuttavia, i nuovi e potenti strumenti basati sull’Intelligenza Artificiale stanno determinando profondi cambiamenti nell’industria creativa. Queste parole sono dunque destinate a restare solo un motto?

calendar Nov Tue 11 2025

«Ciao Chat, potresti trasformare questa immagine in uno stile ispirato allo Studio Ghibli?».

Tutti ricordiamo il risultato: scene soffuse, eteree e dalle tonalità pastello hanno invaso i nostri social media, straordinariamente simili alle opere del celebre artista giapponese Hayao Miyazaki. Come molti trend online, anche questo è svanito nel giro di pochi mesi, ma è durato abbastanza a lungo da sollevare interrogativi molto seri sul diritto d’autore nell’era dell’intelligenza artificiale.

L’azienda di Altman ha davvero violato la legge? Si può parlare di una violazione del diritto d’autore? Il modello di IA sarebbe stato addestrato sulle opere protette di Miyazaki, senza previo consenso, riconoscimento né compenso?[1]

Queste domande si estendono a tutti i modelli linguistici di grandi dimensioni (LLM) e ai sistemi di Intelligenza Artificiale generativa, noti per essere addestrati su vaste banche dati contenenti testi, immagini e altri materiali (presumibilmente) pubblici disponibili online o forniti dagli utenti.

Poco prima che i ritratti in stile Ghibli diventassero virali, un altro scandalo è esploso. Nel gennaio 2025, un gruppo di autori ha intentato una causa per violazione del diritto d’autore contro Meta negli Stati Uniti[2]. I querelanti hanno accusato l’azienda guidata da Zuckerberg di aver copiato il database di LibGen – un noto archivio di libri pirata – per addestrare il proprio modello di IA[3]. Ovviamente, senza alcun riconoscimento.

Il nostro obiettivo non è valutare l'ammissibilità delle prove nelle cause citate, bensì di riflettere su una tendenza più ampia che esse rivelano: ogni progresso nello sviluppo dell’IA comporta nuove e più profonde sfide per il diritto e l’etica.

Il nodo del diritto d’autore e del data mining.

I modelli di Intelligenza Artificiale per finalità generali (GPAI) si basano su tecniche di apprendimento profondo che necessitano di ingenti quantità di dati, sia strutturati che non strutturati, oltre che su tecniche di scraping o estrazione automatica di informazioni dal web e su strumenti di data mining, utile al fine di analizzare tali informazioni[4].

Per comprendere meglio le implicazioni giuridiche, è necessario guardare al diritto d’autore dell’UE e alle sfide inedite poste dai modelli di GPAI e dalla loro fame di dati.

La Direttiva sul Mercato Unico Digitale (CDSM, Direttiva (UE) 2019/790)[5] mira ad armonizzare il diritto d’autore e i diritti connessi all’interno del mercato comunitario, introducendo alcune eccezioni per scopi di Text and Data Mining (TDM).

L’articolo 3 riguarda il TDM per finalità scientifiche[6]. L’articolo 4 consente la riproduzione e l’estrazione di opere ai fini dell'estrazione di testo e dei dati, anche da parte di entità commerciali, a condizione che siano soddisfatti due requisiti[7]: le opere devono essere legalmente accessibili e i titolari dei diritti non devono aver espressamente riservato i propri diritti. Un punto di forte controversia, tuttavia, riguarda l’ambiguità relativa al carattere di lecita accessibilità dei materiali.

In base all’articolo 4(3) della Direttiva, i titolari dei diritti possono “escludere” il TDM attraverso strumenti che consentono la lettura automatizzata in caso di contenuti disponibili online. Tuttavia, l’assenza di uno standard tecnico armonizzato per questo meccanismo di opt-out genera un notevole margine di incertezza in merito alle opere effettivamente escluse. Questa lacuna applicativa rischia di compromettere, anziché garantire, il controllo esercitato dai titolari dei diritti sui propri contenuti. Inoltre, la Direttiva non impone agli sviluppatori di sistemi di IA di addestrare ex novo i modelli o cancellare il materiale già acquisito[8], con la conseguenza che i dataset di addestramento degli LLM includono frequentemente opere protette da diritto d'autore[9].

Ulteriori obblighi emergono dall’AI Act europeo, in particolare negli articoli 53(1)(c) e (d). La lettera (c) impone ai fornitori di modelli di IA a uso generale di rispettare il diritto d’autore dell’UE, mentre la lettera (d) richiede di redigere e rendere pubblicamente disponibile un riassunto sufficientemente dettagliato dei contenuti utilizzati per l’addestramento del modello di Intelligenza Artificiale generativa, secondo il protocollo fornito dall’Ufficio per l’IA[10]. Sebbene il recente Codice di Condotta per i GPAI miri a guidare la conformità a tale quadro, le sue linee guida restano al momento non vincolanti.

In conclusione, sebbene vi sia un consenso generale sulla necessità per gli sviluppatori di IA di rispettare il diritto d’autore europeo, permangono significative incertezze giuridiche, in particolare in relazione alle eccezioni per finalità di Text and Data Mining. Anche qualora l’inclusione di opere protette nei dataset di addestramento risulti ammissibile in determinate circostanze, l’atto stesso di addestramento potrebbe configurare una riproduzione non autorizzata, esponendo gli sviluppatori a potenziali responsabilità per violazione del diritto d’autore[11].

La proprietà intellettuale come diritto fondamentale.

Il confine tra stile e sostanza rappresenta un altro nodo cruciale.

In un articolo dedicato al cosiddetto caso Ghibli[12], l’Agenzia Esecutiva del Consiglio europeo per l’Innovazione e delle PMI (EISMEA) si è interrogata sull'opportunità che le imprese operanti nel settore dell'IA ottengano licenze o riconoscano un compenso ai creatori le cui opere sono state usate come materiale di addestramento. Pur non essendo lo stile tutelato dal diritto di proprietà intellettuale, l’opera rappresentata lo è, invece, pienamente.

La capacità dell’IA di replicare le opere di un artista pone diverse sfide per i titolari dei diritti.

Secondo uno studio della Commissione Europea su diritto d’autore e le nuove tecnologie[13], una significativa quota dei titolari dei diritti intervistati (47%) ritiene che le copie generate dall’IA possano arrecare un danno maggiore rispetto alle imitazioni umane, a causa dell’estrema precisione e rapidità degli strumenti generativi. Inoltre, il 77% degli intervistati concorda fortemente sul fatto che tale fenomeno potrebbe indurre alcuni artisti ad uscire dal mercato.

Il rischio implicito è che l’intero settore creativo venga progressivamente sfruttato. Scrittori, designer, illustratori, attori, registi e ogni categoria di titolare di diritti – in particolare creators e freelance – trovano oggi tra la concorrenza strumenti generativi iperveloci e accessibili, in grado di replicare le loro opere senza consenso, attribuzione o compenso. L’intelligenza artificiale è in grado di produrre risultati comparabili, talvolta persino superiori, perché ha imparato dai migliori. Aumentando la produttività a costo zero.

Gli artisti privati del proprio stile non possono dunque fare affidamento sul diritto d’autore, poiché lo stile non rientra nell’ambito di protezione. In un sistema giuridico improntato principalmente sulla compensazione economica, è legittimo domandarsi se sia possibile esercitare i diritti morali per opporsi all’utilizzo delle proprie opere ai fini dell'addestramento di modelli di Intelligenza Artificiale.

In uno degli scenari di policy dell’UE[14], il 67% dei partecipanti concorda sul fatto che i titolari dei diritti dovrebbero poter opporsi all’elaborazione delle proprie opere per l’addestramento dell’IA. Tuttavia, estendere il diritto d’autore per coprire lo stile non è considerata la soluzione migliore (41%)[15]. Molti partecipanti suggeriscono invece di ricorrere alla normativa relativa alle pratiche commerciali scorrette nel caso in cui lo stile di un artista venga imitato o copiato dall’IA.

La difficoltà di attribuire uno stile a un autore specifico, unita alla mancanza di armonizzazione a livello comunitario e all'applicazione disomogenea dell’art. 4 della CDSM, di fatto ha consentito l’addestramento su larga scala dell’IA basato su opere protette, in assenza di autorizzazione e compenso, generando un vuoto normativo che favorisce le aziende operanti nel settore dell'IA mentre erode i diritti e il potere contrattuale dei creatori.

«La proprietà intellettuale è protetta»[16]. Queste parole sono destinate a restare solo un motto?

Conclusione.

A distanza di mesi dall’episodio dello Studio Ghibli, il Codice di Condotta sull’IA ha introdotto nuovi impegni per affrontare questi rischi. Aderendo alle linee guida, i firmatari si impegnano ad implementare misure tecniche appropriate e proporzionate per impedire che i modelli di Intelligenza Artificiai sviluppati producano copie illecite dei contenuti protetti dal diritto d’autore e dai diritti connessi dell’Unione[17].

Tuttavia, poiché le linee guida non hanno carattere vincolante, il rispetto delle regole dipende alla discrezionalità delle aziende – e queste hanno tutto l’interesse a sfruttare su larga scala opere protette per alimentare i loro modelli di IA.

L'addestramento dei sistemi di Intelligenza Artificiale avviene generalmente senza previa autorizzazione né remunerazione per i creatori, che possono contare solo su un meccanismo di opt-out complesso e ambiguo. Anche sul versante dell'output, i contenuti generati dall’IA spesso replicano o imitano opere originali, combinando elementi tratti da materiali protetti, senza che alcuna forma di tutela sia garantita ai titolari dei diritti.

L'organizzazione di un’infrastruttura di licenze collettive di successo dovrebbe pertanto basarsi su alcuni principi-chiave, come proposto dal Dipartimento di Politiche IUST del Parlamento Europeo: trasparenza, per chiarire quale utilizzo venga fatto delle opere protette; equità, per assicurare che i diritti e i proventi siano condivisi con i titolari legittimi; e attuabilità, per designare quale sia l'organo europeo incaricato di stabilire e supervisionare la corretta applicazione del quadro legislativo.

Colmare l’attuale vuoto normativo implica una transizione dal modello di opt-out a uno di opt-in, così che le opere protette da copyright siano automaticamente escluse dall'addestramento dell'IA, salvo previa autorizzazione. In tal modo, verrebbe ripristinato di default il controllo degli autori sulle proprie opere.

Per riequilibrare l’asimmetria di potere tra creatori umani e grandi sviluppatori di sistemi di Intelligenza Artificiale IA, e per garantire il rispetto del principio di remunerazione adeguata e proporzionata (art. 18 della Direttiva CDMS)[18], la remunerazione equa dovrebbe essere obbligatoria ogni volta che un’opera viene utilizzata senza esplicita autorizzazione.

Infine, dovrebbero essere introdotte misure tecniche e di sicurezza per rendere le opere creative tracciabili e ridurre il rischio di violazione del diritto d’autore.

Di Priscilla Colaci

[1] OECD (2025), “Intellectual property issues in artificial intelligence trained on scraped data”, OECD Artificial Intelligence Papers, No. 33, OECD Publishing, Paris, https://doi.org/10.1787/d5241a23-en

[2] Creamer, E. (2025, April 3). ‘Meta has stolen books’: authors to protest in London against AI trained using ‘shadow library.’ The Guardian. https://www.theguardian.com/books/2025/apr/03/meta-has-stolen-books-authors-to-protest-in-london-against-ai-trained-using-shadow-library

[3] Team, S. P. (2025, April 8). The SoA’s message to Meta: don’t steal our books. The Society of Authors. https://societyofauthors.org/2025/04/04/the-soas-message-to-meta-dont-steal-our-books/; Team, S. P. (2025a, April 4). UK authors stage protest at Meta HQ against Zuckerberg’s #bookthieves. The Society of Authors. https://societyofauthors.org/2025/04/03/uk-authors-stage-protest-at-meta-hq-against-zuckerbergs-bookthieves/

[4] OECD (2025), “Intellectual property issues in artificial intelligence trained on scraped data”, OECD Artificial Intelligence Papers, No. 33, OECD Publishing, Paris, https://doi.org/10.1787/d5241a23-en

[5] Directive - 2019/790 - EN - dsm - EUR-Lex. (n.d.). https://eur-lex.europa.eu/eli/dir/2019/790/oj

[6] Ibidem.

[7] Questo aspetto viene formalmente citato nell'AI Code of Practice (Copyright), (n.d.). Shaping Europe’s Digital Future. https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai, dove si specifica che “Signatories commit to take appropriate measures to enable affected rightsholders to obtain information about the web crawlers employed, their robots.txt features and other measures that a Signatory adopts to identify and comply with rights reservations expressed pursuant to Article 4(3) of Directive (EU) 2019/790 at the time of crawling by making public such information and by providing a means for affected rightsholders to be automatically notified when such information is updated (such as by syndicating a web feed) without prejudice to the right of information provided for in Article 8 of Directive 2004/48/EC”. Tuttavia, il Codice non è vincolante e la sua applicazione non garantita.

[8] Policy Department for Justice, Civil Liberties and Institutional Affairs Directorate-General for Citizens’ Rights, Justice and Institutional Affairs PE 774.095. (2025). Generative AI and copyright. Training, creation, regulation. In https://www.europarl.europa.eu/thinktank/en/home.

[9] Gervais, Daniel J. and Shemtov, Noam and Marmanis, Haralambos and Zaller Rowland, Catherine, The Heart of the Matter: Copyright, AI Training, and LLMs (September 21, 2024). Available at SSRN: https://ssrn.com/abstract=4963711 or http://dx.doi.org/10.2139/ssrn.4963711  

[10] Article 53: Obligations for providers of General-Purpose AI models | EU Artificial Intelligence Act. (n.d.). https://artificialintelligenceact.eu/article/53/

[11] Gervais, D., Marmanis, H., Shemtov, N., & Zaller Rowland, C. (N.D.). The Heart Of The Matter: Copyright, Ai Training, And Llms. Ssrn.

[12] Studio Ghibli vs AI: tribute or copyright infringement? (2025, April 15). IP Helpdesk. https://intellectual-property-helpdesk.ec.europa.eu/news-events/news/studio-ghibli-vs-ai-tribute-or-copyright-infringement-2025-04-15_en.

[13] Study on copyright and new technologies – Copyright data management and artificial intelligence, Publications Office of the European Union, 2022, p. 151, https://data.europa.eu/doi/10.2759/570559.

[14] Ibidem, p. 227. Di seguito, i quattro scenari presentati: “Status quo. The moral rights are regulated at Member states’ level. […] Legal clarification that moral rights can be invoked against the processing of the work of performance for AI training. […] Legal clarification that moral rights cannot be invoked against the processing of the work for AI training if TDM exception is allowe. […] Legal clarification that moral rights cannot be invoked against the processing of the work for AI training, if the work or perfomance is not recognisable in the optout.”.

[15] Ibidem, p. 248.

[16] La protezione della proprietà intellettuale, come esplicitamente riconosciuto nell'Art. 17 della Carta dei diritti fondamentali dell'Unione europea, dovrebbe essere garantita attraverso l'applicazione delle garanzie previste dal paragrafo (1) degli stessi articoli, il quale recita: “Ogni persona ha il diritto di godere della proprietà dei beni che ha acquisito legalmente, di usarli, di disporne e di lasciarli in eredità. Nessuna persona può essere privata della proprietà se non per causa di pubblico interesse, ei casi e nei modi previsti dalla legge e contro il pagamento in tempo utile di una giusta indennità per la perdita della stessa. L'uso dei beni può essere regolato dalla legge nei limiti imposti dall'interesse generale". Articolo 17 - Diritto di proprietà (2025, July 03). European Agency for Fundamental Rightshttps://fra.europa.eu/en/eu-charter/article/17-right-property

[17] The General-Purpose AI Code of practice. (n.d.)., Shaping Europe’s Digital Future. https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai.

[18] Art. 18 - Principle of appropriate and proportionate remuneration (17 April 2019). DIRECTIVE (EU) 2019/790 OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC. https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32019L0790. Secondo l'Art. 18(1), “Member States shall ensure that where authors and performers license or transfer their exclusive rights for the exploitation of their works or other subject matter, they are entitled to receive appropriate and proportionate remuneration”.