La nuova funzionalità di editing delle immagini integrata nell’app Gemini app, offre agli utenti la possibilità di apportare modifiche utilizzando comandi in linguaggio naturale, mantenendo intatti gli elementi essenziali dell’immagine originale. Un’evoluzione significativa rispetto ai metodi precedenti, che richiedevano la rigenerazione completa di un’immagine per ogni modifica.

Con questa innovazione, gli utenti possono intervenire su specifiche parti dell’immagine, come ad esempio cambiare il colore dello sfondo senza alterare i soggetti principali. Google ha mostrato un esempio pratico in cui l’erba di una scena è stata colorata di blu, mantenendo inalterati gli altri elementi visivi. Questa capacità di personalizzazione avanzata rende l’editing più intuitivo e flessibile.

Gemini editing: watermark e simulazioni

Un’altra novità rilevante è l’introduzione di watermark visibili e digitali per garantire maggiore trasparenza nelle immagini generate dall’intelligenza artificiale. Oltre al watermark digitale SynthID già esistente, ora le immagini includeranno una scritta “AI” nell’angolo inferiore destro. Questo strumento è particolarmente utile per distinguere i contenuti generati artificialmente da quelli autentici.

La tecnologia consente inoltre di simulare modifiche personali, come vedere come apparirebbero i propri capelli con un colore diverso, e supporta l’editing multi-step. Questa funzionalità mantiene il contesto durante la conversazione, permettendo un’interazione fluida tra testo e immagini. Questo è particolarmente utile per la creazione di storie illustrate o contenuti creativi che combinano elementi visivi e narrativi.

Gemini editing: API e motore alla base

Alla base di queste innovazioni c’è il motore Gemini 2.0 Flash, che offre una qualità visiva superiore, una migliore resa del testo e una riduzione significativa dei blocchi di filtro rispetto alle versioni precedenti. Questa tecnologia non solo migliora l’esperienza dell’utente, ma rappresenta anche un’opportunità per gli sviluppatori.

Google ha infatti reso disponibile in anteprima le funzionalità di generazione ed editing di immagini tramite API su Google AI Studio e Vertex AI. Questi strumenti offrono un controllo maggiore sulle capacità di generazione e modifica delle immagini, rendendo l’ecosistema ancora più potente e versatile. Le applicazioni pratiche di questa tecnologia sono molteplici. Gli utenti possono sfruttare queste funzionalità per progetti personali o professionali, migliorando la qualità dei contenuti visivi con un’interfaccia semplice e intuitiva.