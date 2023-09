OpenAI è sempre proiettata nel futuro e capace di lanciare in anteprima delle funzionalità che poi verranno studiate anche dai concorrenti. L’azienda fondata da Sam Altman ha recentemente annunciato una novità rivoluzionaria per il suo chatbot. L’intelligenza artificiale generativa di ChatGPT non si fermerà infatti al solo testo, ma presto verrà integrata anche l’elaborazione vocale e la possibilità di comprendere il contenuto di un’immagine inviata durante una conversazione. Come riportato sul blog ufficiale di OpenAI: “Stiamo iniziando a implementare nuove funzionalità vocali e di immagini in ChatGPT. Queste sono dotate di un nuovo tipo di interfaccia più intuitiva consentendoti di avere una conversazione vocale o mostrare a ChatGPT di cosa stai parlando”.

ChatGPT: come funzionano le chat vocali e le immagini

Con il nuovo aggiornamento, ChatGPT diventa un vero e proprio assistente vocale, come Alexa o Google Assistant. OpenAI ha inoltre lavorato con doppiatori professionisti affinché il chatbot fosse in grado di imitare le voci umane in modo realistico. La società ha dichiarato che la funzionalità viene sfruttata da Spotify per il suo progetto di traduzione vocale dei podcast. Naturalmente, spiega sempre OpenAI, questa tecnologia porta a nuovi rischi, come la possibilità che qualche malintenzionato possa utilizzare la voce di personaggi pubblici o commettere truffe. Per questo motivo, l’azienda si concentra su un caso d’uso specifico, ovvero la chat vocale.

L’altra novità introdotta su ChatGPT riguarda le immagini. Gli utenti potranno presto mostrare a ChatGPT una o più immagini e discutere su di esse. Sarà infatti possibile scattare una foto ad un luogo d’interesse durante un viaggio e chiedere maggiori informazioni su di esso, inviare la foto del proprio frigo o della dispensa e chiedere un consiglio su cosa cucinare (con il procedimento della ricetta), ecc. La comprensione delle immagini è alimentata da GPT-3.5 multimodale e GPT-4. OpenAI ha dichiarato che, nelle prossime settimane, queste funzionalità saranno rilasciate su ChatGPT Plus e ChatGPT Enterprise (le versioni a pagamento del chatbot). In futuro, però, verranno distribuite anche ad altri gruppi di utenti, sviluppatori compresi.