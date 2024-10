All'inizio di quest'anno, Google ha introdotto Imagen 3, il suo modello text-to-image di qualità più elevata. Questa nuova iterazione presenta diversi miglioramenti alla qualità e alla fedeltà delle immagini che crea. Google afferma che questo modello può creare immagini con un incredibile livello di dettaglio. Il modello produce infatti immagini fotorealistiche e realistiche con meno artefatti visivi distraenti rispetto a Imagen 2. Big G ha recentemente distribuito il suo modello Imagen 3 a tutti gli utenti Gemini in tutto il mondo. Con questa disponibilità, sia gli utenti Gemini che Gemini Advanced possono semplicemente descrivere le immagini che desiderano creare e Gemini risponderà con l'immagine creata dall'intelligenza artificiale. Tuttavia, solo gli utenti Gemini Advanced possono creare immagini che ritraggono persone.

Imagen 3: modello migliorato anche nel rendering del testo

Gli utenti che creano un’immagine e non sono soddisfatti del risultato possono perfezionarla ulteriormente aggiungendo altri dettagli al prompt. Più dettagli si inseriscono nel prompt, più Gemini sarà in grado di generare un’immagine fedele a ciò che l’utente ha in mente. Questo perché Imagen 3 comprende meglio il linguaggio naturale e l'intento dietro il prompt. Il nuovo modello può persino incorporare piccoli dettagli da prompt più lunghi. Imagen 3 è anche bravo nel rendering del testo, che è stato una sfida per la maggior parte dei modelli di generazione di immagini attuali. Ciò consente agli utenti di creare messaggi di compleanno personalizzati, luoghi con bacheche dei nomi e altro ancora.

Il nuovo modello di Google è disponibile anche su Vertex AI per gli sviluppatori. Quest’ultimi possono scegliere tra il normale Imagen 3 e Imagen 3 Fast, offrendo loro la flessibilità di ottimizzare la qualità o la latenza, a seconda dei requisiti della loro applicazione. Il modello può creare immagini di alta qualità con illuminazione naturale e fotorealismo aumentato. Imagen 3 Fast è invece adatto per creare immagini più luminose con contrasto più elevato. Google afferma che gli sviluppatori possono vedere una diminuzione del 40% della latenza con Imagen 3 Fast rispetto a Imagen 2. Inoltre, gli sviluppatori possono configurare il modello per creare immagini in diverse aspect-ratio, tra cui 1:1, 9:16, 16:9, 3:4 e 4:3.