xAI, l'azienda guidata da Elon Musk creatrice di Grok ha rilasciato una nuova API unica nel suo genere. Si tratta infatti del primo strumento per sviluppatori che supporta la generazione di immagini. L'azienda si è recentemente concentrata sugli sviluppatori e ha rilasciato ben cinque API da quando la prima è arrivata a novembre 2024. Si dice che il prezzo sia leggermente più alto e l'azienda al momento non consente agli utenti di personalizzare l'output. Prima dell'ultima aggiunta, xAI offriva quattro modelli di AI personalizzati come API. Due erano basati sulla prima iterazione del modello di linguaggio di grandi dimensioni (LLM) di Grok e due erano basati su Grok 2. Mentre l'azienda offriva la funzione di comprensione delle immagini, non c'era modo di generare immagini utilizzando l'API. Ciò era probabilmente dovuto al fatto che xAI stava esternalizzando la capacità di generazione di immagini disponibile tramite la sua piattaforma di chat.

xAI: fino a 10 immagini con una singola richiesta

Fino all'anno scorso, la generazione di immagini su Grok era gestita dalla startup AI Black Forest Labs. Tuttavia, a dicembre, l'azienda di intelligenza artificiale ha annunciato il rilascio di Aurora, un modello di generazione di immagini basato sulla rete di esperti (MoE). Sembra che l'azienda stia ora espandendo il modello anche agli sviluppatori. Sul proprio sito ufficiale, xAI elenca ora un nuovo modello API denominato "grok-2-image-1212" che include la capacità di generazione di immagini. La funzionalità è semplice. Una volta inviato un prompt di testo, un modello di chat prende l'istruzione e rivede il prompt per una maggiore chiarezza. Il prompt rivisto viene condiviso con il modello di generazione di immagini e viene generato l'output.

Attualmente, gli sviluppatori possono generare fino a 10 immagini con una singola richiesta modificando il parametro. Tuttavia, c’è un limite di cinque richieste al secondo, superando il quale verrà restituito un messaggio di errore. Le immagini vengono condivise in formato JPEG. Secondo il sito TechCrunch, xAI addebiterà 0,07 dollari per immagine. Il prezzo colloca il servizio nella fascia alta, dato che Flux API di Black Forest Labs costa 0,05 dollari per immagine e Imagen 3 di Google costa 0,03 dollari per immagine. Tuttavia, Ideogram è ancora più costoso: 0,08 dollari per immagine.