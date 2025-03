Alibaba, il gigante tecnologico cinese, ha annunciato un nuovo bot AI Qwen chiamato QVQ-Max, un modello di ragionamento visivo. Ciò che rende questo modello interessante è che può comprendere il contenuto di foto e video e quindi analizzare e ragionare con tali informazioni per fornire soluzioni. Con questo modello, Alibaba afferma di colmare il divario tra i modelli AI basati su testo e le informazioni del mondo reale. Con il ragionamento visivo, l’azienda afferma che il modello può vedere, comprendere e pensare alle cose nel mondo. L'azienda cinese ha affermato che il modello eccelle nell'analisi delle immagini e nell'identificazione degli elementi chiave. Inoltre, è anche abbastanza flessibile nelle sue attività, come la progettazione di illustrazioni, la generazione di script video e il gioco di ruolo.

Alibaba: QVQ-Max verrà ulteriormente migliorato in futuro

Come altri chatbot AI, QVQ-Max può aiutare gli utenti con attività nel campo del lavoro, dell'istruzione o nella quotidianità. Tuttavia, grazie alle sue capacità visive, può aiutare anche con altri compiti in questi ambiti, come problemi di matematica e fisica accompagnati da diagrammi o guidando gli utenti nella preparazione di un piatto in base alle immagini della ricetta. Alibaba ha definito QVQ-Max solo la prima iterazione del modello e ha delineato come intende migliorarlo nelle prossime versioni. Innanzitutto, vuole migliorare la precisione del riconoscimento delle immagini tramite tecniche di validazione. In secondo luogo, vuole migliorare il modello nella gestione di attività multi-step e problemi complessi in modo che possa utilizzare telefoni e computer e giocare. Infine, Alibaba intende espandere il modello da semplici interazioni basate su testo per includere la verifica degli strumenti e la generazione visiva.

Per utilizzare QVQ-Max, basta accedere al sito chat.qwen.ai e cliccare sul menu a discesa del modello in alto a sinistra. In seguito, premere "Espandi altri modelli" e selezionare QVQ-Max. Infine, accedere alla casella della chat e scrivere il proprio prompt. Naturalmente, non bisogna dimenticare di allegare un’immagine per vedere cosa può fare il nuovo modello.