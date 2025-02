Il mese scorso, il modello di ragionamento open source R1 di DeepSeek ha fatto molto scalpore. Tuttavia, è stato criticato per aver censurato argomenti riguardanti la Cina. Sebbene questo sembri un argomento piuttosto di nicchia, la censura potrebbe avere un impatto su altre richieste relative alla Cina, come chiedere cosa accadrebbe ai prezzi delle azioni Nvidia se la Cina invadesse Taiwan, il che lo rende meno utile per i casi d'uso finanziari. Per risolvere questo problema, Perplexity ha sviluppato una nuova versione open source di R1 chiamata R1 1776. Come riportato sulla pagina dedicata di Huggingface: “R1 1776 è un modello di ragionamento DeepSeek-R1 che è stato post-addestrato da Perplexity AI per rimuovere la censura del Partito Comunista Cinese. Il modello fornisce informazioni imparziali, accurate e fattuali, mantenendo al contempo elevate capacità di ragionamento”.

Perplexity: i dettagli del modello open source DeepSeek non censurato

Il post-training di Perplexity si è concentrato principalmente sulla gestione della censura legata alla Cina. L’azienda ha dichiarato di aver impiegato esperti umani per identificare circa 300 argomenti noti per essere censurati dal PCC. Inoltre, utilizzando questi argomenti, è stato sviluppato un classificatore di censura multilingue. La società ha poi estratto un set eterogeneo di prompt utente che hanno attivato il classificatore con un elevato grado di sicurezza. Infine, si è assicurata di includere solo query per le quali gli utenti avevano esplicitamente dato il permesso di eseguire l'addestramento e ha filtrato le query contenenti informazioni di identificazione personale (PII). Questa procedura ha consentito a Perplexity di compilare un set di dati di 40.000 prompt multilingue.

È interessante notare che sembra esserci una piccola discrepanza tra R1 1776 e R1 nei benchmark attuali. Naturalmente, questa differenza potrebbe assottigliarsi sempre più in futuro, anche se ciò non è garantito. Gli utenti possono ottenere R1 1776, scaricandolo già da subito dal da HuggingFace.