L’uso non autorizzato di dati per l’addestramento dei modelli di linguaggio è un argomento al centro di numerose polemiche. Questi vengono addestrati su svariati tipi di dati, compresi i contenuti dei siti web. Proprio per questo Google ha deciso di far scegliere a chiunque abbia un sito web se concedere o no l’autorizzazione per utilizzare i propri dati per addestrare l’AI di Google Bard. Come riportato sul blog ufficiale dell’azienda: “Oggi annunciamo Google-Extended, un nuovo metodo di controllo che gli editor web possono utilizzare per indicare se i loro siti possono essere usati per aiutare a migliorare le API generative AI di Bard e Vertex, comprese le future generazioni di modelli che alimentano tali prodotti. Utilizzando Google-Extended per controllare l'accesso ai contenuti di un sito, l'amministratore di un sito web può scegliere se aiutare questi modelli di intelligenza artificiale a diventare più accurati e capaci nel tempo”.

Google Bard: come negare l’accesso all’utilizzo dei dati di un sito web

Negare il consenso a Google-Extended per accedere a tutti contenuti del proprio sito web è molto semplice. Per bloccare tutto basta inserire questa stringa al file Robots.txt:

User-agent: Google-Extended

Disallow: /

Fatto ciò, l’azienda di Mountain View non potrà utilizzare i dati presenti nel sito web per addestrare la sua AI. Bisogna ricordare però che Google Bard è già attivo. Fino ad oggi Big G ha infatti utilizzato anche i contenuti dei siti web indicizzati sul motore di ricerca per l’addestramento del modello di linguaggio. Tuttavia, l’arrivo di Google Extended sembra un grande passo avanti per gli utenti. La scelta di Google – si legge sempre nel comunicato - nasce dopo un confronto dell’azienda con alcuni editor, i quali chiedevano una maggiore scelta e controllo in merito a come i propri contenuti vengono utilizzati per addestrare l’intelligenza artificiale. Questa nuova opzione di Google si fonda su ragioni etiche o serve ad evitare possibili cause per violazione di copyright come accaduto con OpenAI?