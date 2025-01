L’ascesa di DeepSeek AI sta scuotendo il settore dell’intelligenza artificiale, mettendo sotto pressione giganti come Meta e Nvidia. La startup cinese ha rapidamente guadagnato popolarità, superando ChatGPT come applicazione gratuita più scaricata e influenzando il mercato al punto da far calare il valore azionario di Nvidia. Il lancio di Janus-Pro 7B, un modello avanzato per la generazione di immagini, ha ulteriormente consolidato la sua posizione, dimostrando prestazioni superiori rispetto a soluzioni come DALL-E e Stable Diffusion in diversi test comparativi.

Meta, preoccupata da questa rapida evoluzione, ha formato quattro unità di analisi interne, soprannominate “war rooms”, con il compito di comprendere il segreto del successo di DeepSeek. L'azienda intende esaminare le strategie impiegate dalla startup cinese, sostenuta finanziariamente da High-Flyer Capital Management, per sviluppare sistemi di AI avanzati con un budget molto inferiore rispetto ai suoi concorrenti.

Quanto ha investito DeepSeek nell'addestramento del suo modello AI?

Uno dei fattori chiave che ha attirato l’attenzione di Meta è il chatbot R1 di DeepSeek, che ha superato ChatGPT in termini di prestazioni e popolarità. Sorprendentemente, l’azienda ha dichiarato di aver investito meno di 6 milioni di dollari nell’addestramento del suo modello, una cifra nettamente inferiore ai più di 100 milioni spesi da OpenAI per sviluppare ChatGPT.

Le squadre di analisi di Meta si stanno concentrando su diversi aspetti strategici:

Ottimizzazione dei costi : esamineranno i metodi utilizzati da DeepSeek per ridurre le spese operative e applicarli allo sviluppo del modello Llama.

: esamineranno i metodi utilizzati da DeepSeek per ridurre le spese operative e applicarli allo sviluppo del modello Llama. Dati di addestramento : cercheranno di comprendere quali dataset hanno permesso a DeepSeek di ottenere risultati così impressionanti.

: cercheranno di comprendere quali dataset hanno permesso a DeepSeek di ottenere risultati così impressionanti. Architettura di Llama: valuteranno modifiche strutturali per rendere il modello più competitivo.

Un portavoce di Meta ha sottolineato che l’azienda analizza regolarmente i modelli emergenti per migliorare le proprie tecnologie, evidenziando il ruolo fondamentale di Llama nell’ecosistema open-source. Tuttavia, la preoccupazione rimane alta: il direttore dell’infrastruttura di Meta AI ha avvertito che DeepSeek potrebbe superare persino la prossima generazione di Llama, attesa per l’inizio del 2025. Anche Sam Altman, CEO di OpenAI, ha riconosciuto la rapidità con cui DeepSeek sta rivoluzionando il mercato dell’IA.