Nelle stesse ore del lancio di Bard con Gemini da parte di Google, Meta ha annunciato l’arrivo la sua nuova esperienza di intelligenza artificiale generativa autonoma, chiamata Imagine with Meta, che consente agli utenti di creare immagini descrivendole in linguaggio naturale. Questo nuovo strumento lavora in modo simile a DALL-E, Midjourney e Stable Diffusion. Imagine with Meta, è infatti basato sul modello di generazione di immagini Emu di Meta, crea immagini ad alta risoluzione da istruzioni di testo. È gratuito (almeno per ora) per gli utenti negli Stati Uniti e genera quattro immagini per richiesta. Come riportato sul blog dell’azienda di Menlo Park, “Ci è piaciuto ascoltare le persone su come utilizzano Imagine, la funzionalità di generazione di testo in immagini di Meta AI, per creare contenuti divertenti e creativi nelle chat. Oggi stiamo espandendo l'accesso a Imagine al di fuori delle chat”.

Imagine With Meta: una filigrana invisibile per aumentare la trasparenza

Per addestrare il suo modello, Meta ha utilizzato 1,1 miliardi di immagini di Facebook e Instagram visibili pubblicamente. Le immagini create con Imagine With Meta sono già dotate di una filigrana visibile, per fare in modo che gli utenti siano possano capire che l’immagine che stanno guardando è stata generata tramite AI. Tuttavia, nelle prossime settimane, l’azienda di Menlo Park dovrebbe includere anche una filigrana invisibile all’occhio umano. Come ricorda ancora Meta: “la filigrana invisibile viene applicata con un modello di deep learning. Sebbene sia impercettibile all'occhio umano, la filigrana invisibile può essere rilevata con un modello corrispondente. È resistente alle comuni manipolazioni delle immagini come ritaglio, cambiamento di colore (luminosità, contrasto, ecc.), di schermate e altro”. In futuro, l’azienda statunitense ha dichiarato di voler includere la filigrana invisibile su molti dei propri prodotti che includono immagini generate dall'intelligenza artificiale.

Imagine With Meta è in grado di generare immagini fotorealistiche con buoni risultati, anche se non ancora livello di Midjourney. Può gestire istruzioni complesse meglio di Stable Diffusion XL, ma forse bene quanto come DALL-E 3. Non sembra eseguire bene il rendering del testo e gestisce diversi output multimediali, come acquerelli, ricami e penna e -inchiostro con risultati contrastanti. Sebbene, come tutti i modelli attuali, abbia ancora bisogno di essere perfezionato, Imagine With Meta può essere già considerato un generatore di immagini decisamente interessante, in grado di competere già da ora con i rivali di OpenAI, Midjourney e Stability AI.