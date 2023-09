GPT-4V (GPT-4 with Vision) è un'evoluzione del modello generativo GPT (Generative Pre-trained Transformer) di OpenAI, lo stesso alla base del chatbot ChatGPT recentemente migliorato grazie a funzionalità che gli consentono di supportare le chat vocali e gli output sotto forma di immagini tramite DALL-E 3. Nello specifico GPT-4V è parte del progetto che ha reso GPT-4 un modello multimodale, in grado di riconoscere non soltanto i prompt testuali ma anche quelli basati sulle immagini.

GPT-4V, problemi di sicurezza e privacy

Ad oggi però, nonostante l'annuncio di GPT-4 risalga allo scorso marzo, GPT-4V non è ancora disponibile. Quali sono le ragioni di questo ritardo? La risposta è arrivata dalla stessa organizzazione non profit guidata da Sam Altman che in un documento disponibile pubblicamente ha fatto riferimento ad alcune problematiche legate alla sicurezza e alla tutela della privacy. In sostanza, così come è ora GPT-4V potrebbe essere utilizzato per scopi malevoli o per diffondere contenuti a cui OpenAI non vorrebbe essere associata.

GPT-4V produrrebbe inoltre errori anche grossolani in tema di anatomia, chimica e, in generale, tenderebbe a restituire degli output particolarmente imprecisi quando deve affrontare quesiti legati alla medicina.

GPT-4V per risolvere i CAPTCHA

Per quanto riguarda la sicurezza, il modello potrebbe essere in grado di affrontare da solo un controllo basato sul CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart). L'utilità di quest'ultimo risiede proprio nel fatto di richiedere un'azione che (almeno in teoria) non sarebbe possibile per una macchina. Superarlo dovrebbe certificare il fatto di essere degli utenti in carne ed ossa. Il sistema però non sembrerebbe reggere l'evoluzione delle ultime tecnologie di Intelligenza Artificiale.

GPT-4V e riconoscimento delle immagini

Per quanto riguarda invece la privacy, ma anche i problemi connessi all'hate speech, OpenAI starebbe operando per migliorare il riconoscimento di simboli legati all'odio razziale ed etnico. A ciò si aggiunga che in alcuni casi sarebbero state osservate delle risposte discriminatorie in base al sesso e alle caratteristiche somatiche di una persona.

Tutti questi problemi dovranno essere risolti prima che GPT-4V diventi ufficialmente disponibile per tutti. Per il momento esso è stato integrato parzialmente nell'applicazione Be My Eyes che aiuta i non vedenti e gli ipovedenti nel riconoscimento delle immagini.