La startup cinese DeepSeek sta accelerando il lancio del suo nuovo modello R2, dopo il successo ottenuto con il modello R1 rilasciato a gennaio. Il modello R1 ha superato numerosi concorrenti statunitensi, offrendo prestazioni eccezionali a un costo significativamente inferiore, suscitando un'ondata di vendite sui titoli tecnologici che ha toccato un valore di oltre 1 trilione di dollari. Originariamente previsto per maggio, il rilascio di R2 è stato anticipato per soddisfare la crescente domanda, con l’azienda che punta a renderlo disponibile "il prima possibile", come riportato da Reuters.
Il nuovo modello R2 di DeepSeek promette miglioramenti nelle capacità di codifica e un ragionamento più avanzato in diverse lingue oltre all'inglese, aumentando ulteriormente le potenzialità delle soluzioni AI dell'azienda. Un elemento chiave del vantaggio competitivo di DeepSeek risiede nel forte investimento della sua società madre, High-Flyer, nella potenza di calcolo.
High-Flyer ha acquisito due cluster di supercalcolo prima che scattassero i divieti statunitensi sulle esportazioni di chip Nvidia avanzati. Il secondo di questi, denominato Fire-Flyer II, include circa 10.000 chip Nvidia A100, fornendo una capacità di calcolo che consente a DeepSeek di sviluppare modelli di intelligenza artificiale altamente performanti a costi ridotti.
Delle scelte architettoniche innovative
Grazie a scelte architettoniche innovative come la Mixture-of-Experts (MoE) e la multihead latent attention (MLA), DeepSeek ha ottenuto una grande efficienza nei costi. Secondo gli analisti di Bernstein, i prezzi di DeepSeek sono 20-40 volte inferiori rispetto ai modelli equivalenti prodotti da OpenAI, costringendo quest'ultima a ridurre i propri prezzi e a rilasciare una versione ridimensionata del suo modello.
Allo stesso modo, anche Google, con il suo modello Gemini, ha dovuto applicare livelli di accesso scontati per competere. La velocità con cui DeepSeek è riuscita a portare sul mercato modelli AI potenti e a basso costo sta scuotendo profondamente il settore, mettendo in discussione i modelli di business tradizionali e forzando i concorrenti a rivedere le proprie strategie.
La combinazione di una potenza di calcolo significativa e scelte tecniche intelligenti ha permesso a DeepSeek di offrire soluzioni competitive a un prezzo accessibile, democratizzando l'accesso all'intelligenza artificiale e aprendo nuove possibilità per aziende e sviluppatori in tutto il mondo.
Se vuoi aggiornamenti su su questo argomento inserisci la tua email nel box qui sotto:
Compilando il presente form acconsento a ricevere le informazioni relative ai servizi di cui alla presente pagina ai sensi dell'informativa sulla privacy.