Meta ha introdotto un modello di intelligenza artificiale generativa chiamato Llama, il quale si distingue dagli altri modelli principali per essere "open", ovvero disponibile per il download e l'uso da parte degli sviluppatori, pur con alcune limitazioni. Questo aspetto lo differenzia da modelli come GPT-4 di OpenAI, Claude di Anthropic e Gemini di Google, che sono accessibili solo tramite API.

Meta ha anche collaborato con vari fornitori di servizi cloud, tra cui AWS, Google Cloud e Microsoft Azure, per rendere Llama disponibile in versione ospitata nel cloud. Inoltre, ha rilasciato strumenti che consentono di personalizzare e ottimizzare il modello, rendendolo più accessibile agli sviluppatori.

Llama non è un singolo modello, ma una famiglia di modelli che include Llama 8B, Llama 70B e Llama 405B, con le ultime versioni rilasciate nel luglio 2024: Llama 3.1 8B, Llama 3.1 70B e Llama 3.1 405B. Questi modelli sono stati addestrati su un ampio spettro di contenuti web, codice pubblico e dati sintetici generati da altri modelli di AI.

Llama 3.1 8B e Llama 3.1 70B sono versioni più leggere, adatte a dispositivi come laptop e server, mentre Llama 3.1 405B richiede un'infrastruttura hardware più potente, solitamente disponibile nei data center. Nonostante le versioni più leggere siano meno potenti, sono più veloci e hanno un ingombro minore.

Tratti distintivi, potenzialità future e rischi

Uno dei tratti distintivi di Llama è la sua finestra di contesto da 128.000 token, che corrisponde a circa 100.000 parole o 300 pagine, permettendo al modello di "ricordare" contenuti recenti e di rimanere più coerente durante l’elaborazione di lunghi documenti. Questo aspetto è particolarmente utile per evitare che il modello perda il filo del discorso o generi risposte incoerenti. Le capacità di Llama sono molteplici e spaziano da attività di assistenza come il coding, alla risoluzione di problemi matematici, fino alla sintesi di documenti in più lingue

Anche se Llama non è in grado di elaborare o generare immagini, in futuro questa funzionalità potrebbe essere integrata. I modelli Llama possono essere configurati per interagire con app e API esterne, utilizzando strumenti come Brave Search per rispondere a domande su eventi recenti o Wolfram Alpha per query legate a scienza e matematica.

Gli utenti possono interagire con Llama tramite piattaforme come Facebook Messenger, WhatsApp, Instagram e Oculus, o attraverso il sito Meta.ai. Gli sviluppatori, invece, possono scaricare il modello, utilizzarlo e adattarlo per le loro necessità, sfruttando l'infrastruttura cloud di oltre 25 partner, inclusi Nvidia, Databricks e Dell.

Meta offre inoltre strumenti di sicurezza per facilitare l'uso di Llama, tra cui Llama Guard, un sistema per moderare contenuti problematici come attività illegali o incitamento all'odio, e Prompt Guard, che protegge il modello da attacchi malevoli come tentativi di eludere i filtri di sicurezza. Tuttavia, Llama presenta alcune limitazioni e rischi. Non è chiaro se i dati utilizzati per addestrare il modello includano contenuti protetti da copyright, il che potrebbe esporre gli utenti a violazioni involontarie.