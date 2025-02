OpenAI ha appena annunciato il suo nuovo modello non ragionante, GPT-4.5, ovvero il modello più grande e più informato fino ad oggi. Come suggerisce il nome, GPT-4.5 è basato su GPT-4o, ampliandolo ulteriormente durante il processo di pre-formazione. OpenAI ha confermato che questo non è un modello di frontiera, ma è il loro LLM più grande. Infatti, vanta una maggiore conoscenza del mondo, migliori capacità di scrittura e una personalità raffinata rispetto a GPT-4o. I dati di riferimento indicano che GPT-4.5 è un modesto aggiornamento da GPT-4o. Nel benchmark verificato SWE-bench, GPT-4.5 ha raggiunto il 38%, un aumento del 2-7% rispetto a GPT-4o e del 30% al di sotto della ricerca approfondita basata su o3 di OpenAI. Per fare un confronto, Claude 3.7 Sonnet di Anthropic ha raggiunto una performance all'avanguardia del 62,3% su SWE-bench verificato.

Nel benchmark SimpleQA Accuracy, GPT-4.5 ha ottenuto il 62,5%, rispetto al 38,2% di GPT-4o. Nel benchmark SimpleQA Hallucination Rate, il modello ha ottenuto il punteggio più basso tra tutti i grandi modelli linguistici di OpenAI. Di recente, il team Preparedness di OpenAI ha sviluppato un nuovo benchmark chiamato SWE-Lancer. Questo valuta le prestazioni LLM su attività di ingegneria del software nel mondo reale, tra cui sviluppo di funzionalità, progettazione, correzioni di bug e altro. In questo nuovo benchmark, il modello GPT-4.5 è stato in grado di risolvere il 20% delle attività IC SWE e il 44% delle attività SWE Manager. Si tratta di un leggero miglioramento rispetto al modello o1 di OpenAI.

GPT4.5: presto OpenAI integrerà funzionalità multimodali

Sul fronte della sicurezza, secondo le valutazioni di Preparedness, il Safety Advisory Group di OpenAI ha classificato questo nuovo modello GPT-4.5 come rischio medio complessivo. Ha anche ottenuto un punteggio basso per sicurezza informatica e autonomia del modello. L'anteprima della ricerca del nuovo modello di OpenAI è ora disponibile per gli utenti di ChatGPT Pro tramite il selettore di modelli su web, dispositivi mobili e desktop. Supporta la ricerca, i caricamenti di file e immagini e le funzionalità canvas su ChatGPT. In futuro saranno supportate funzionalità multimodali come Voice Mode, video e condivisione dello schermo. GPT-4.5 sarà disponibile la prossima settimana per gli utenti di ChatGPT Plus e Teams. Il nuovo modello è disponibile anche per tutti gli sviluppatori a pagamento tramite Chat Completions API, Assistants API e Batch API. Supporta funzionalità chiave come chiamata di funzione, Structured Outputs, Streaming e messaggi di sistema.