Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

AI Bias: conoscere i rischi dell'intelligenza artificiale

Usare tecniche di intelligenza artificiale e machine learning può causare bias di tipo algoritmico, tecnico ed emergente: scopriamone i rischi.
AI Bias: conoscere i rischi dell'intelligenza artificiale
Usare tecniche di intelligenza artificiale e machine learning può causare bias di tipo algoritmico, tecnico ed emergente: scopriamone i rischi.
Link copiato negli appunti

Le moderne tecnologie si affidano sempre più spesso all'intelligenza artificiale. In particolare, è frequente imbattersi in software che utilizzino, anche solo per poche funzionalità (magari secondarie), moduli basati su tecniche di machine learning, cioè algoritmi il cui funzionamento dipende fortemente dall'insieme di dati utilizzati in una cosiddetta fase di addestramento.

La maggior parte degli algoritmi di machine learning, infatti, sfrutta tecniche che hanno una origine teorica statistica. Queste tecniche tendono a far sì che il comportamento dell'algoritmo venga iterativamente migliorato, in modo da seguire l'andamento dettato dai dati forniti come training set. Ci sono moltissime evidenze che mostrano come tale processo sia notevolmente efficace nell'ottica di risolvere problemi quali il riconoscimento automatico di immagini, la classificazione automatica di dati (anche eterogenei), e molto altro.

Tuttavia, recentemente si è parlato molto di come l'uso non oculato del machine learning possa causare diversi problemi derivanti da dati non opportunamente selezionati. Per capire meglio i rischi, utilizziamo un noto esempio in cui l'uso scorretto del machine learning ha finito per causare non pochi guai.

Alcuni anni fa, diversi giudici americani furono dotati di un sistema automatico denominato COMPAS, che avrebbe dovuto aiutarli nella quantificazione della pena da infliggere ai condannati. In molti casi, infatti, le pene previste non prevedono un numero di anni di reclusione esatto, quanto piuttosto una "forbice", un intervallo tra un minimo ed un massimo numero di anni. Per poter decidere in modo opportuno, i giudici sono tenuti a valutare, tra le altre cose, il rischio di recidiva dei condannati. COMPAS era stato pensato proprio per risolvere questo problema: automatizzare l'analisi del rischio di recidiva. Dopo un periodo in cui tale sistema fu utilizzato, venne fuori che COMPAS assegnava un rischio di recidiva più elevato ai condannati di etnia afro-americana. Il motivo risiedeva nel dataset utilizzato per la fase di addestramento, che non era stato opportunamente bilanciato con dati relativi ad altre etnie.

Quello appena descritto è un classico esempio di bias algoritmico, un tipico problema che può potenzialmente affliggere qualsiasi sistema basato sul machine learning. Riconoscere tale bias non è affatto semplice, e diversi studi sono in atto per cercare modalità efficaci per ridurne l'occorrenza.

Vi sono poi altri tipi di bias che potrebbero compromettere il funzionamento di un sistema di machine learning. Tra questi, vi è il cosiddetto bias tecnico, dovuto ad errori di programmazione o difetti dovuto all'errata implementazione del sistema. Un'ulteriore tipologia è il bias emergente, ovvero quello causato dal verificarsi di comportamenti anomali dovuti all'uso dell'algoritmo su dati non inclusi nel dataset originario. Tale problema è tipico dei casi in cui l'algoritmo di machine learning soffre del cosiddetto problema dell'overfitting: può capitare, infatti, che gli algoritmi di addestramento finiscano per far sì che il sistema risultante si comporti in modo adeguato per dati molto simili a quelli inclusi nel training set, ma finisca per comportarsi in maniera pressoché imprevedibile per dati che si discostano molto da quelli analizzati in fase di addestramento.

Molte delle ricerche attuali, mirate ad identificare agevolmente i suddetti bias, sembrano aprire verso metodi di analisi discorsiva, in cui gruppi di utenti, sviluppatori e designer valutano il comportamento di un algoritmo utilizzando la loro creatività per sottoporre casi estremi in input ai sistemi di intelligenza artificiale. In attesa che l'efficacia di queste metodologie venga dimostrata, è cruciale che gli sviluppatori facciano molta attenzione ai dati utilizzati per il machine learning, analizzandoli in modo opportuno e facendo sì che essi risultino opportunamente variegati e bilanciati.

Ti consigliamo anche