Introduzione al problema
Nelle ultime 48 ore, il settore dell’intelligenza artificiale è stato scosso dal lancio di DeepSeek R1, un modello open source che promette avanzamenti significativi nel reasoning e una drastica riduzione dei costi. La startup cinese DeepSeek afferma di aver sviluppato questo modello in soli due mesi, con una spesa inferiore ai 6 milioni di dollari, una cifra sorprendentemente bassa rispetto agli investimenti delle grandi aziende americane. Tuttavia, emergono dubbi sulla veridicità di queste affermazioni e sulla reale portata dell’innovazione introdotta.
Le perplessità di Alexandr Wang e il sostegno di Elon Musk
Dopo l’entusiasmo iniziale, diverse figure di spicco nel settore hanno espresso scetticismo riguardo alle dichiarazioni di DeepSeek. Alexandr Wang, CEO di Scale AI, ha suggerito che la startup potrebbe disporre di circa 50.000 GPU NVIDIA H100, un numero non dichiarato ufficialmente per evitare possibili violazioni dei controlli sulle esportazioni imposti dagli Stati Uniti. Elon Musk ha condiviso le osservazioni di Wang, aggiungendo peso alle preoccupazioni sollevate. Dal canto suo, DeepSeek sostiene di aver utilizzato solo 2.048 chip NVIDIA H800 datati, implementando tecniche alternative per contenere i costi.
Dubbi sui costi dichiarati e sulle tecniche utilizzate
Un ulteriore punto di discussione riguarda l’affermazione di DeepSeek di aver sviluppato il modello R1 con un budget inferiore ai 6 milioni di dollari, una frazione di quanto speso da aziende come OpenAI per modelli comparabili. Martin Vechev, direttore dell’INSAIT bulgaro, ha definito “fuorviante” questa cifra, suggerendo che potrebbe riferirsi solo a una singola operazione di training. In realtà, lo sviluppo di un modello come R1 richiederebbe molteplici sessioni di training, oltre ai costi associati alla raccolta dei dati e ad altri processi necessari. Inoltre, il valore delle 2.048 GPU menzionate da DeepSeek si aggirerebbe tra i 50 e i 100 milioni di dollari, sollevando ulteriori interrogativi sulla trasparenza delle informazioni fornite.
Il ruolo del fondo di investimento High-Flyer
Dietro DeepSeek si cela il fondo di investimento cinese High-Flyer, co-fondato da Liang Wenfeng, che potrebbe aver fornito supporto significativo durante la fase di training del modello. Questo legame suggerisce che DeepSeek potrebbe aver avuto accesso a risorse aggiuntive non dichiarate ufficialmente, alimentando ulteriormente le speculazioni sulla reale portata dell’innovazione introdotta. Nel frattempo, si vocifera che le grandi aziende americane siano già al lavoro su modelli di IA più avanzati, pronti a essere lanciati nel prossimo futuro, aumentando la competizione nel settore.
Riconoscimenti e prospettive future
Nonostante le controversie, Sam Altman, CEO di OpenAI, si è complimentato con DeepSeek, riconoscendo la validità della documentazione tecnica presentata. Questo potrebbe rappresentare un ulteriore punto di svolta nel settore dell’IA, stimolando ulteriori innovazioni e sviluppi. Tuttavia, restano dubbi sull’effettiva scalabilità del progetto e sulla capacità di DeepSeek di mantenere il proprio vantaggio competitivo nel tempo, soprattutto considerando le imminenti mosse dei concorrenti americani.