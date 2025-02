Lo scorso gennaio, Meta è stata citata in giudizio, con l’accusa di aver addestrato i suoi modelli di intelligenza artificiale su un set di dati di ebook e articoli piratati. Le e-mail desecretate hanno fornito nuove prove contro Meta in un caso di violazione del diritto d'autore intentato dagli autori di libri. Come accennato, gli autori hanno accusato l’azienda di aver addestrato illegalmente i suoi modelli Llama su libri piratati. accuse ora ulteriormente corroborate dalle comunicazioni trapelate. Le e-mail mostrano che la società ha ammesso di aver scaricato tramite torrent un controverso dataset di grandi dimensioni noto come LibGen. Quest’ultimo include decine di milioni di libri piratati.

Secondo la documentazione depositata in tribunale, Meta ha scaricato tramite torrent almeno 81,7 terabyte di dati su più librerie ombra tramite il sito Anna's Archive. Ciò include almeno 35,7 terabyte di dati da Z-Library e LibGen. Inoltre, la società aveva precedentemente scaricato tramite torrent 80,6 terabyte di dati da LibGen.

Meta: dipendenti consapevoli dei rischi legali

L’accusa ha descritto l'entità del sistema di torrenting illegale di Meta come sorprendente, osservando che "atti di pirateria dei dati molto più piccoli, solo lo 0,008 percento della quantità di opere protette da copyright che Meta ha piratato, hanno portato i giudici a deferire la condotta all'ufficio del procuratore degli Stati Uniti per indagini penali". Le e-mail mostrano che i dipendenti dell’azienda erano anche consapevoli dei rischi legali delle loro azioni. Nell'aprile 2023, ha scritto che "il torrenting da un laptop aziendale non sembra giusto". Nel settembre 2023, Nikolay Bashlykov, un ingegnere di ricerca di Meta, aveva intensificato le sue proteste e si era consultato con il team legale. Come riportato da Ars Technica, secondo Bashlykov: "Usare torrent significherebbe 'seminare' i file, ovvero condividere il contenuto all'esterno. Questo potrebbe non essere legalmente accettabile".

Nonostante questi avvertimenti, gli autori sostengono che l’azienda di Mark Zuckerberg abbia deciso di nascondere le sue attività di seeding. Ciò avveniva modificando le impostazioni in modo che si verificasse la minima quantità di seeding possibile. La società avrebbe anche cercato di evitare il rischio che chiunque potesse "rintracciare il seeder/downloader" dai server dell’azienda scaricando il set di dati su server esterni. Le nuove e-mail sembrano non lasciare il minimo dubbio sulla colpevolezza di Meta. Bisognerà capire come questa storia si evolverà nel prossimo futuro.