La startup francese Mistral ha recentemente lanciato il suo primo modello multimodale, Pixtral 12B, in grado di gestire sia immagini che testo. Con una struttura di 12 miliardi di parametri e una dimensione di circa 24GB, questo modello promette di migliorare le capacità di risoluzione dei problemi rispetto a modelli con meno parametri, come spesso accade nell’ambito dell'intelligenza artificiale.

Costruito a partire dal modello testuale Nemo 12B, Pixtral 12B permette di rispondere a domande relative a immagini di qualsiasi dimensione, che possono essere fornite tramite URL o codificate in base64, un formato di codifica binario-testo.

Simile a modelli multimodali di altre aziende, come Claude di Anthropic o GPT-4 di OpenAI, Pixtral 12B è progettato per compiti come la creazione di didascalie per immagini o il conteggio di oggetti in una foto. Il modello è accessibile attraverso un link torrent su GitHub e sulla piattaforma Hugging Face, permettendo agli utenti di scaricarlo, personalizzarlo e utilizzarlo senza restrizioni, grazie alla licenza Apache 2.0. Un portavoce di Mistral ha confermato ufficialmente questo tipo di licenza, differenziandosi dalla licenza standard dell'azienda che spesso limita l'uso commerciale dei modelli.

Pixtral 12B arriva dopo un finanziamento da 645 milioni di dollari

Al momento del rilascio, non erano ancora disponibili demo pubbliche del modello, ma secondo Sophia Yang, responsabile delle relazioni con gli sviluppatori di Mistral, Pixtral 12B sarà presto accessibile per test su piattaforme come Le Chat e Le Plateforme, sviluppate dalla stessa Mistral per chatbot e API.

Non è ancora chiaro su quali set di dati visivi Mistral abbia addestrato Pixtral 12B. Tuttavia, molti modelli generativi simili sono formati utilizzando grandi quantità di dati pubblici, spesso protetti da copyright, sollevando preoccupazioni legali.

Alcuni detentori di copyright hanno già intentato azioni legali contro fornitori di IA, come OpenAI e Midjourney, per fermare l'uso non autorizzato dei loro contenuti. L'introduzione di Pixtral 12B arriva dopo un importante round di finanziamento da 645 milioni di dollari, che ha portato la valutazione di Mistral a 6 miliardi di dollari.