A dicembre, Google ha annunciato il modello Gemini 2.0 Flash, che supera il modello 1.5 Pro nei benchmark ed è anche 2 volte più veloce. Gemini 2.0 Flash supporta sia input multimodali come immagini, video e audio, sia output multimodali come testo, immagini e audio. Nelle scorse ore, Google ha annunciato che il modello 2.0 Flash sta diventando il modello predefinito per tutti gli utenti dell'app Gemini sul web e sui dispositivi mobili. Tuttavia, Big G continuerà a offrire i suoi vecchi modelli 1.5 Flash e 1.5 Pro in modo che gli utenti possano continuare le loro conversazioni esistenti. Patrick Kane, membro del team Google ha dichiarato che: “l'app Gemini ora utilizza Gemini 2.0 Flash. Questo modello offre risposte rapide e prestazioni elevate in una serie di benchmark chiave, offrendo un aiuto quotidiano con attività come brainstorming, apprendimento o scrittura”.
Gemini: app includerà anche modello Imagen 3
L'app ora include Imagen 3, il modello di generazione di immagini all'avanguardia di Google, che può creare immagini più accurate basate sull'input di testo con dettagli e texture più ricchi. Com’è noto, gli utenti possono semplicemente descrivere le immagini che vogliono creare utilizzando il testo e Gemini può creare l'immagine creata dall’AI. Tuttavia, gli utenti della versione Advanced possono anche creare immagini che ritraggono persone.
Oltre alla disponibilità del nuovo modello Gemini Flash 2.0, gli utenti Gemini Advanced avranno accesso a una finestra di contesto di 1 milione di token. Ciò consentirà loro di caricare un gran numero di file e di avere accesso prioritario a nuove funzionalità come Deep Research e altro ancora. Gli sviluppatori possono ora accedere al modello Gemini 2.0 Flash tramite AI Studio e Vertex AI. Infine, la nuova API Multimodal Live supporta input audio e video in streaming in tempo reale e la possibilità di utilizzare più strumenti combinati.