Agenti AI

Link copiato negli appunti

Da quando l'Intelligenza Artificiale Generativa ha totalmente catalizzato l'attenzione del mondo, i modelli linguistici di grandi dimensioni (gli LLM) si sono dimostrati non solo elementi estremamente interessanti ma anche, come in parte abbiamo visto in questa guida, facili da integrare nelle nostre applicazioni. In effetti, per la prima volta ci si è trovati di fronte a modelli non solo addestrati ma anche in grado di "parlare" molto bene, dimostrando una grande abilità a sostituirsi all'Essere Umano.

Tutto il resto della logica e delle azioni da intraprendere rimanevano, in prima battuta, in mano al programmatore che doveva costruire il software in modo che fosse un comune programma che interpellasse, quando necessario, l'LLM.

Di fronte a questa capacità oratoria ma non di azione degli LLM, hanno acquisito in breve grande centralità gli agenti che, come dice il nome stesso, sono in grado di agire. Dopo aver studiato LLM, chatbot e RAG è il momento di proiettare definitivamente questa guida nel panorama attuale imparando a creare i nostri agenti.

Cosa compone gli agenti AI

Nell'introduzione abbiamo citato quella che può essere considerata la differenza principale tra lavorare solo con un LLM e lavorare con gli agenti: l'LLM parla e basta, l'agente agisce. Ma come fa un agente ad entrare in azione? Dispone di tool, strumenti che può azionare al momento giusto.

Se consideriamo quindi la struttura base di un agente potremmo indicare una formula come AGENTE = LLM + un insieme di Tool. Cosa faranno i tool e quando l'LLM capirà che è il momento di farli entrare in azione, come di consueto, sarà compito nostro e della configurazione che sapremo attuare.

Inoltre, si consideri che i Tool possono svolgere qualsiasi azione nel senso che sono funzioni scritte in un linguaggio di programmazione (Python nella nostra guida) che in base a librerie e framework che includeremo potranno svolgere qualsiasi azione, non solo a livello di recupero dati ed elaborazioni ma anche invio di messaggi, salvataggio dati, trasformazioni di contenuti e qualsiasi altra cosa potrebbe servirci. Insomma possiamo vedere un agente come un LLM immerso in una rete di tool che potranno attivarsi ed essere attivati in base al flusso di lavoro. Tutto questo è anche un modo per dare centralità all'LLM che non diventa più solo una sorta di "elemento parlante" da interrogare quando serve ma una specie di regista che coordina un intero team di strumenti.

Per rafforzare la comprensione di quest'ultimo punto possiamo dire che con gli agenti si passa da un modello imperativo in cui l'LLM riceve i nostri ordini ad un modello delegato in cui essendo l'LLM dotato di suoi strumenti (i tool) riceve da noi libertà di azione nel dirigere un flusso di lavoro.

Esempio di workflow

Inizieremo presto a sviluppare con agenti e già averne uno a disposizione con il suo LLM e i tool porta dei buoni vantaggi. Stiamo però andando verso scenari molto articolati e quindi è necessario immaginare agenti in grado di fare più cose dove ogni tool rappresenta un'azione.

Ad esempio, supponiamo che abbiamo una RAG popolata con documentazione di un certo argomento, diciamo leggi riguardanti uno specifico settore. L'utente che usa il nostro sistema vorrebbe sapere se una certa norma che abbiamo nella RAG è aggiornata pertanto desidererebbe che scaricassimo l'ultima versione della norma, la confrontassimo con quella presente in RAG, predisponessimo una sorta di grafica o tabella con il confronto e inviassimo una mail a chi gestisce la RAG per informarlo sull'esito.

Sono tutte azioni ed ognuna di esse potrebbe diventare un tool in modo che, alla richiesta dell'utente, l'agente fosse in grado di:

attivare lo scaricamento da web;
recuperare dalla RAG la medesima norma;
confrontare le due norme;
predisporre una grafica di confronto;
inviare la mail secondo istruzioni.

L'agente per ognuno di questi tool, codificato con una propria funzione, saprebbe quale attivare (in base alla descrizione fornita per ognuno di essi) e gestire il flusso di lavoro tra l'uno e l'altro portando il task a completamento.

Cosa è cambiato rispetto alla programmazione tradizionale? Che il workflow non viene comandato tanto dagli if e i cicli che imposta il programmatore ma dalla capacità dell'LLM di invocare il tool giusto al momento giusto. In questa fase, la nostra capacità di scrivere descrizioni appropriate e non solo buon codice sarà fondamentale.

Questa era la premessa teorica di cui avevamo bisogno per capire cosa dobbiamo aspettarci dagli agenti e soprattutto perché esistono: ora è il momento di imparare a costruirli!

Se vuoi aggiornamenti su Agenti AI inserisci la tua email nel box qui sotto:

Lezione precedente Indice lezioni

Creare App con l'AI

Agenti AI

Cosa compone gli agenti AI

Esempio di workflow

Ti consigliamo anche

Windsurf: programmare con l'AI e il coding agent Cascade

Vibe coding con Firebase Studio

Claude AI: sviluppare applicazioni pratiche

Creare, testare e distribuire workflow agentici con Sim