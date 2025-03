Durante una live streaming martedì, il CEO di OpenAI, Sam Altman, ha annunciato il primo importante aggiornamento delle capacità di generazione di immagini di ChatGPT in oltre un anno. ChatGPT può ora sfruttare il modello GPT-4o dell'azienda per creare e modificare in modo nativo immagini e foto. GPT-4o ha da tempo supportato la piattaforma di chatbot basata sull'intelligenza artificiale. Tuttavia, fino ad ora il modello era in grado di generare e modificare solo testo, non immagini. Altman ha affermato che la generazione di immagini native GPT-4o è già attiva in ChatGPT e Sora, il prodotto di generazione video AI di OpenAI, per gli abbonati al piano Pro da 200 dollari al mese dell'azienda. OpenAI afferma che la funzionalità verrà presto implementata per gli utenti Plus e gratuiti di ChatGPT. Lo stesso vale per gli sviluppatori che utilizzano il servizio API dell'azienda.

ChatGPT: GPT-4o migliore di DALL-E 3 nella generazione delle immagini

GPT-4o con output di immagini "pensa" un po' più a lungo di DALL-E 3, ovvero il modello di generazione di immagini che sostituisce. In questo modo può creare ciò che OpenAI descrive come immagini più accurate e dettagliate. GPT-4o può modificare immagini esistenti, comprese immagini con persone al loro interno, trasformandole o "dipingendo" dettagli come oggetti in primo piano e sullo sfondo. OpenAI non ha rivelato quali dati di immagine ha utilizzato per abilitare le nuove capacità di generazione di immagini. Molti fornitori di AI generativa considerano i dati di training un vantaggio competitivo e quindi li tengono segreti, insieme a qualsiasi informazione ad essi correlata. Tuttavia, i dettagli dei dati di training sono anche una potenziale fonte di cause legali relative al copyright. Ciò disincentiva le aziende a rivelare molto.

OpenAI offre un modulo di opt-out che consente ai creator di richiedere che i loro lavori vengano rimossi dai suoi set di dati di training. L'azienda afferma di rispettare le richieste di vietare ai suoi bot di web scraping di raccogliere dati di training, comprese le immagini, dai siti web. La funzionalità di generazione di immagini migliorata di ChatGPT segue la scia dell'output di immagini native sperimentali di Google per Gemini 2.0 Flash, uno dei modelli di punta dell'azienda. La potente funzionalità è diventata virale sui social media, ma non necessariamente per le migliori ragioni. Il componente di immagini di Gemini 2.0 Flash si è rivelato avere poche barriere di protezione, consentendo alle persone di rimuovere le filigrane e creare immagini raffiguranti personaggi protetti da copyright.