Il 2024 si sta delineando come l'anno dell'intelligenza artificiale open source. Il lancio di DeepSeek R1 LLM, ha dato filo da torcere a o1 di OpenAI e ora Hugging Face sta facendo grandi progressi su un progetto chiamato Open Deep Research. Quest’ultimo mira a replicare la funzionalità della funzionalità Deep Research di ChatGPT, utilizzando strumenti open source. Per chi non ha familiarità con Deep Research di OpenAI, si tratta di uno strumento progettato per condurre ricerche approfondite su un determinato argomento. Inserendo una domanda o un tema, il sistema raccoglie informazioni dal web e genera un rapporto dettagliato, basato su fonti attendibili e corredato di citazioni. Secondo HuggingFace, Deep Research include un ampio modello linguistico e un framework agentico che guida l'LLM nell'utilizzo di strumenti come la ricerca web e nell'organizzazione delle sue azioni in fasi.
Hugging Face: in arrivo agente browser per Open Deep Research
Per mantenere competitivi i modelli di linguaggio open source, Hugging Face ha condotto una "missione" di 24 ore per provare a replicare la Deep Research di OpenAI e ha prodotto diversi risultati. La comunità ha creato Open Deep Research, che funziona in modo abbastanza competitivo con Deep Research. Tuttavia, c'è ancora molto lavoro da fare. Nei set di convalida GAIA, il progetto Open Deep Research ha ottenuto un punteggio del 55,15%. Deep Research di OpenAI ha invece ottenuto un punteggio più impressionante del 67,36%. È interessante notare che Hugging Face ha ottenuto le migliori prestazioni quando ha utilizzato un agente di codifica rispetto a un agente normale che utilizza JSON. Quando ha utilizzato l'agente standard, il punteggio nel test GAIA è sceso a solo il 33%.
Hugging Face sospetta che Deep Research di OpenAI stia ottenendo un aumento delle prestazioni da Operator. Quest’ultimo è un agente annunciato di recente che può navigare sul Web e interagire con le pagine web come un essere umano. Per cercare di colmare questa lacuna, Hugging Face vuole creare il proprio agente browser. Inoltre, ha affermato che assumerà un ingegnere a tempo pieno per aiutare a risolvere questo problema. L’azienda ha inoltre invitato chiunque sia interessato a collaborare volontariamente al progetto.