MGIE (MLLM-Guided Image Editing) è un modello basato sull'Intelligenza Artificiale Generativa sviluppato da Apple e distribuito sotto licenza Open Source tramite un repository su GitHub. Può essere utilizzato per la realizzazione di chatbot in grado di modificare immagini sulla base di prompt testuali. L'utente non deve fare altro che caricare un'immagine, formulare il proprio prompt e attendere la produzione dell'output per poi accettarlo o richiedere ulteriori modifiche.

Come funziona MGIE

Tecnicamente parlando MGIE è un MLLM (Multimodal Large Language Model). Si tratta quindi di un modello multimodale, come per esempio Gemini di Google, che può gestire con uguale efficacia contenuti di origine e natura differenti. Con esso si possono arricchire le immagini con effetti artistici, effettuare piccoli interventi correttivi o modificare caratteristiche come per esempio la nitidezza, la luminosità e il livello di contrasto. MGIE agisce direttamente sui singoli pixel, con l'obbiettivo di restituire risultati estremamente accurati.

Apple has released MGIE 🍎 An open source model that uses natural language to edit images! MGIE can crop, resize, rotate, flip, add filters, add and remove objects, change the contrast, brightness, & color of images via text commands 7 cool examples, demo, and code below: pic.twitter.com/eANZDX30bl — Allen T (@Mr_AllenT) February 8, 2024

L'MLLM può modificare le forme e le dimensioni degli elementi presenti in un'immagine ed effettuare le operazioni tipiche delle applicazioni standard per la grafica e il fotoritocco. Come ad esempio l'applicazione di filtri, la color correction, la rimozione o la sostituzione dello sfondo e le fusioni. Si può quindi operare su un'intera immagine o su singoli particolari, anche quelli più marginali.

Ambiti di utilizzo del modello

MGIE è una piattaforma scritta in linguaggio Python. Come spesso accade in questi casi viene proposto come uno strumento in grado di aiutare professionisti e appassionati nel loro lavoro di Editing. Risulta però abbastanza evidente che una rapida evoluzione di tool di questo tipo non potrà che mettere in discussione strumenti da tempo affermati come Photoshop.

Un ambito di utilizzo privilegiato potrebbe essere quello dell'integrazione con gli assistenti digitali. Siri nel caso di Apple. Per cui un utente potrebbe sfruttare MGIE per modificare un'immagine scattata con la fotocamera dello smartphone o scaricata da Internet.