
DeepSeek è una piattaforma di Intelligenza Artificiale sviluppata in Cina, che sta attirando l’attenzione globale sia per la rapida ascesa ai vertici delle classifiche degli app store, sia per il modello economico di sviluppo che la caratterizza. L’arrivo di DeepSeek sul mercato ha scosso le fondamenta del settore dell’Intelligenza Artificiale, fino ad oggi dominato da colossi americani come OpenAI, Meta e Microsoft. Con un approccio innovativo e risorse hardware limitate, la startup cinese, fino a poco tempo fa sconosciuta al grande pubblico, ha lanciato un modello di linguaggio avanzato che eguaglia, anzi, sembra addirittura superare, le performance di sistemi già affermati come GPT-4 e Llama 3.1. Il tutto con costi hardware nettamente inferiori.
DeepSeek è pronta a rivoluzionare l'IA?
DeepSeek, l’assistente virtuale basato sull’Intelligenza Artificiale, sviluppato da una startup cinese quasi sconosciuta, nel giro di pochi giorni ha rapidamente conquistato la prima posizione tra le app gratuite più scaricate in molti Paesi, inclusi gli Stati Uniti e l’Italia. Secondo i primi report, l’app DeepSeek è alimentata dal motore IA DeepSeek-V3, capace di fornire risultati impressionanti. Il modello, secondo i suoi creatori, offre prestazioni comparabili, se non superiori, a quelle delle più note piattaforme di OpenAI e Meta. Il modello di DeepSeek è stato sviluppato utilizzando tecniche avanzate di apprendimento per rinforzo e ha dimostrato di offrire prestazioni paragonabili ai principali modelli di punta di OpenAI in ambiti specifici quali la matematica e la programmazione. L'IA cinese si distingue sia per le sue capacità di ragionamento esplicito che per la capacità di integrare ricerche web in tempo reale, consentendo risposte aggiornate e contestualizzate per gli utenti.
Ciò che sorprende di più è il costo relativamente basso per l’addestramento di DeepSeek-V3. Le GPU NVIDIA H800, ritenute ormai obsolete, sono il cuore dell’infrastruttura della startup cinese che ha speso un budget inferiore a 6 milioni di dollari per costruire il proprio sistema, un risultato unico se paragonato ai miliardi di dollari investiti dai giganti statunitensi in data center basati su GPU di ultima generazione, come le H100. A causa delle restrizioni imposte dagli Stati Uniti sull’esportazione di tecnologie avanzate, DeepSeek si è affidata a GPU Nvidia H800, meno potenti rispetto alle alternative più avanzate. DeepSeek ha dichiarato di aver completato l’addestramento del modello composto da 671 miliardi di parametri in soli 55 giorni, un risultato reso possibile grazie a due fattori principali: l'utilizzo di hardware meno performante e l'ottimizzazione software. Inoltre, l’azienda ha compensato le limitazioni hardware sviluppando soluzioni software capaci di massimizzare l’efficienza nell’addestramento.
La tecnologia di DeepSeek dimostra che con un approccio diverso si possono ottenere prestazioni equivalenti o persino superiori senza le enormi spese infrastrutturali sostenute dagli attuali leader di mercato. E' evidente che DeepSeek sta destabilizzando le aziende del settore, e al contempo ha il potenziale di ridisegnare l’intero ecosistema dell’IA. Il suo rilascio non è passato inosservato nemmeno sui mercati finanziari, al punto che l’indice Nasdaq ha registrato un calo impressionante, con le azioni di NVIDIA in discesa del 15%, seguite da perdite per TSMC (-10%), Microsoft (-7%) ed altri importanti attori del settore tecnologico. La motivazione alla base di ciò è che gli investitori stanno riconsiderando il valore delle aziende legate al modello hardware/software tradizionale per l’Intelligenza Artificiale. Se le prestazioni dichiarate da DeepSeek venissero confermate, la domanda per i costosi chip di NVIDIA potrebbe subire un drastico ridimensionamento, minacciando l’intero ecosistema delle infrastrutture IA. Un elemento chiave del successo di DeepSeek risiede nella sua accessibilità: l’app è infatti completamente open source e gratuita, un approccio che ha portato ad un boom di download su scala globale superando addirittura le cifre raggiunte da ChatGPT nei primi giorni dal lancio. Tuttavia, il sistema sembra già mostrare i primi segni di saturazione, con difficoltà nel gestire il volume di registrazioni da parte di milioni di utenti, un fenomeno che non è soltanto riflesso della curiosità per la nuova tecnologia, ma evidenzia anche un crescente interesse per alternative più economiche ed efficienti nel campo dell’Intelligenza Artificiale.

Figura 1: Logo di DeepSeek
DeepSeek nel panorama globale
Un aspetto da non trascurare è quello del contesto geopolitico che rende ancora più interessante e controverso il successo di DeepSeek. Il risultato raggiunto in meno di due settimane dal lancio ha infatti sollevato numerosi interrogativi, sia per le sue presunte capacità tecniche sia per le implicazioni economiche e geopolitiche che potrebbe comportare. Il suo rilascio arriva poco dopo l’annuncio dell’iniziativa Stargate da parte dell’amministrazione Trump, un progetto da ben 500 miliardi di dollari che mira a creare una nuova infrastruttura IA negli Stati Uniti. Stargate è sostenuta da aziende come OpenAI, SoftBank e Oracle e rappresenta uno sforzo strategico per mantenere il dominio americano nel settore tecnologico. Tuttavia, la rapidità con cui DeepSeek ha guadagnato terreno dimostra quanto possa essere fragile questa supremazia tecnologica. Alcuni analisti minimizzano l’impatto di DeepSeek, sottolineando i rischi di sicurezza legati all’utilizzo di tecnologie cinesi, la possibilità che il modello possa essere manipolato per scopi politici o economici solleva dubbi sulla sua adozione al di fuori della Cina. Paesi come gli Stati Uniti potrebbero addirittura vietarne l’utilizzo, come avvenuto in passato con TikTok. Tuttavia, la questione della sicurezza non sembra aver rallentato l’entusiasmo iniziale, e la tecnologia continua a guadagnare popolarità a livello globale. Nel frattempo però le prestazioni di DeepSeek hanno sollevato interrogativi sulla validità del modello tradizionale di sviluppo IA. La domanda posta da molti è stata la seguente:
Come può una startup con risorse hardware così modeste competere con giganti del settore che investono miliardi di dollari?
La risposta potrebbe essere più semplice di quel che sembra e risiedere proprio nell’ottimizzazione software e nell’architettura del modello. Se confermata, questa innovazione metterebbe in discussione l’attuale paradigma che lega strettamente le prestazioni IA alla potenza ed al costo dell’hardware, aprendo la strada ad un futuro più sostenibile e accessibile per lo sviluppo tecnologico.

Figura 2: Microchip e supremazia tecnologica (Fonte: Adobe Stock)
Dietro DeepSeek c’è Liang Wenfeng, co-fondatore del fondo speculativo High Flying, che ha fornito il supporto finanziario necessario per lo sviluppo della tecnologia. L’azienda sembra avere forti legami con il governo cinese, e il suo successo potrebbe avere implicazioni geopolitiche di rilievo. Il 20 gennaio, Wenfeng ha partecipato ad un incontro con il premier cinese Li Qiang e altri uomini d’affari di alto livello, un chiaro segnale dell’interesse strategico della Cina per questa tecnologia. Tuttavia, non mancano le controversie; Alexander Wang, CEO di Scale AI, ha infatti dichiarato che
DeepSeek avrebbe utilizzato circa 50.000 chip NVIDIA, in violazione delle norme statunitensi sull’esportazione di tecnologie.
La startup non ha ancora risposto a queste accuse, ma la vicenda potrebbe aggiungere un ulteriore livello di complessità al confronto tra Stati Uniti e Cina nel campo dell’Intelligenza Artificiale. L’impatto di DeepSeek potrebbe andare ben oltre il settore tecnologico, influenzando equilibri economici e politici a livello globale. In tal senso, la Cina sta dimostrando di poter competere ad armi pari con gli Stati Uniti nell’ambito dell’IA, e il successo di DeepSeek rappresenta un monito per le aziende occidentali.
Le alternative a DeepSeek nel mercato dell'IA
Il mercato dell’Intelligenza Artificiale è dominato da numerosi attori globali, ognuno con soluzioni che competono in settori specifici. OpenAI, con il suo modello GPT-4, rappresenta una delle principali alternative a DeepSeek, grazie ad una piattaforma nota per la potenza di calcolo e la capacità di generare testi complessi, utilizzata soprattutto in applicazioni che spaziano dalla scrittura creativa alla programmazione. Meta, invece, ha introdotto la sua linea di modelli LLaMA (Large Language Model Meta AI), sviluppati per essere altamente efficienti e adattabili a diverse esigenze industriali. I modelli LLaMA si concentrano sull’offrire soluzioni IA competitive, pur riducendo i costi di addestramento e implementazione. Google, con il suo modello Bard (oggi Gemini) basato sulla tecnologia LaMDA, si distingue per la capacità di elaborare query complesse e generare risposte naturali. L’ecosistema di Google integra Gemini con i suoi servizi cloud, il che lo rende una scelta popolare per aziende e sviluppatori. Google ha introdotto un'applicazione dedicata per dispositivi Android con l'intenzione di estendere la disponibilità anche ad iOS e ad altri prodotti in futuro. Gemini rappresenta l'evoluzione delle capacità IA di Google, offrendo agli utenti un assistente virtuale potenziato per una varietà di applicazioni. All'elenco si aggiunge anche Microsoft, partner chiave di OpenAI, che fornisce accesso alle tecnologie GPT attraverso Azure OpenAI Service, combinando prestazioni avanzate con una profonda integrazione nei flussi di lavoro aziendali. Le diverse piattaforme citate offrono soluzioni differenti in termini di capacità, costi e target, garantendo alle applicazioni di Intelligenza Artificiale un panorama diversificato e competitivo.
Considerazioni conclusive
Con la sua combinazione di prestazioni elevate, costi ridotti e accessibilità, DeepSeek potrebbe inaugurare una nuova era per l’Intelligenza Artificiale, in cui l’innovazione non è più esclusiva dei grandi investimenti ma diventa alla portata di un numero sempre maggiore di attori. Il successo di DeepSeek pone anche una sfida al modello economico e tecnologico delle grandi aziende occidentali. NVIDIA, che ha costruito il suo ruolo di rilievo sullo sviluppo di chip IA avanzati potrebbe vedere ridimensionata la propria posizione. Se infatti un modello di IA di alto livello può essere addestrato con hardware meno sofisticato, la percezione di una necessità assoluta di microchip all’avanguardia potrebbe diminuire. Inoltre, un modello AI meno costoso da addestrare può essere offerto ad un prezzo inferiore per aziende e sviluppatori che desiderano integrarlo nei loro prodotti, e ciò potrebbe garantire a DeepSeek un vantaggio competitivo in termini di equilibrio tra costi e benefici, obiettivo ancora lontano per molti colossi americani, ad eccezione di quelli con risorse finanziarie enormi come Google. Tuttavia, nonostante il successo, DeepSeek solleva interrogativi etici e di sicurezza legati alla gestione dei dati condivisi dagli utenti e alle limitazioni imposte dalla censura governativa cinese. L'applicazione è diventata rapidamente anche un obiettivo per attacchi malware che cercano di sfruttarne le capacità o carpire informazioni sensibili. Al netto delle controversie, l’ascesa di DeepSeek segna un momento di svolta per il settore dell’Intelligenza Artificiale globale, spingendo a ripensare i modelli consolidati e le strategie future. Anche se, almeno per il momento, il futuro di DeepSeek rimane ancora incerto, una cosa è chiara: il suo impatto sul mercato e sulla geopolitica dell’IA non può essere ignorato. OpenAI e gli altri colossi del settore hanno di fronte una sfida senza precedenti, la loro risposta determinerà non solo il destino del settore tecnologico ma anche gli equilibri globali nei prossimi anni a venire.
