DeepSeek: Perché il mondo intero sta impazzendo? Cosa succede sullo sfondo?
DeepSeek è un nome che ha incuteto timore nelle ossa delle più grandi aziende americane. Non è stata solo OpenAI a dare il via alla mania dell'intelligenza artificiale (IA) generativa, ma anche Google, Microsoft, Anthropic, Meta, Amazon e tutti gli altri che erroneamente pensavano di poter dominare ancora per un po' e di attrarre miliardi di investimenti si sono spaventati.
Quando il mese scorso l'azienda cinese DeepSeek ha presentato il suo modello di intelligenza artificiale, ha scosso le fondamenta americane con il messaggio che il suo modello era equivalente, o per certi versi persino migliore, di quelli americani, e a una frazione del prezzo. Secondo quanto riferito, il modello DeepSeek-V3 richiede solo 6 milioni di dollari di potenza di calcolo per l'addestramento, cifra che non include "precedenti ricerche ed esperimenti di ablazione su architetture, algoritmi o dati".
Subito dopo il suo lancio, DeepSeek ha superato ChatGPT in termini di valutazioni nell'Apple Mobile Store e anche il numero di download è in costante crescita.
Le conseguenze furono enormi. Negli Stati Uniti si chiedono se gli enormi investimenti nell'intelligenza artificiale fossero davvero necessari se i loro colleghi cinesi sono riusciti a ottenere lo stesso risultato con investimenti modesti. Le azioni delle aziende, tra cui Nvidia, crollarono e tornò a sorgere la domanda se fosse giunto il momento in cui la bolla dell'intelligenza artificiale sarebbe scoppiata.
D'altro canto, molti si chiedono se DeepSeek sia davvero così rivoluzionario come afferma l'azienda. Stanno nascondendo qualcosa? Cosa hanno utilizzato per addestrare il loro modello?
Che cos'è DeepSeek?
DeepSeek è il nome di una startup, di un modello linguistico su larga scala e di un chatbot che funziona in modo simile a ChatGPT, Gemini e Copilot. L'aspetto, il metodo di utilizzo e anche il metodo di comunicazione sono pressoché identici alle soluzioni americane, quindi la transizione è stata molto semplice per gli utenti e l'utilizzo era già familiare.
Quanto è potente ed è davvero migliore di ChatGPT e degli altri? L'azienda afferma che è potente quanto il modello o1 di OpenAI, rilasciato alla fine dell'anno scorso, per attività come la matematica e la codifica. OpenAI ha recentemente introdotto un nuovo modello, o3, che si dice sia più potente di tutti i modelli testati, ma non è ancora disponibile al pubblico per i test.
L'ultimo modello R1 (DeepSeek) è un modello di linguaggio di ragionamento. Uguale al modello o1 di OpenAI. Questi modelli generano risposte gradualmente e simulano il modo in cui le persone pensano ai problemi o alle idee.
Lo shock più grande è stato il fatto che sono stati spesi solo 6 milioni di dollari per addestrare il modello V3 che alimenta il chatbot. Per fare un paragone, OpenAI ha speso più di 100 milioni di dollari per lo sviluppo del modello GPT-4, mentre Meta ne ha spesi circa 60 milioni per Llama. Ci sono riusciti nonostante le restrizioni commerciali che hanno impedito alla Cina di avere ufficialmente accesso ai chip più recenti per un certo periodo.
Si dice che il fondatore di DeepSeek abbia accumulato chip Nvidia A100, la cui esportazione in Cina è vietata da settembre 2022. Alcuni esperti ritengono che abbia combinato questi chip con altri più economici e meno sofisticati, ottenendo un processo molto più efficiente. DeepSeek utilizza anche meno memoria rispetto ai suoi concorrenti, il che in ultima analisi riduce i costi di esecuzione delle attività per gli utenti.
Si vocifera anche che l'azienda stia effettivamente utilizzando gli ultimi chip Nvidia H100, ma non ci sono prove concrete e l'azienda non ha ancora commentato le "accuse".
Una nuova ricerca indipendente di SemiAnalysis afferma che hanno speso circa 500 milioni di dollari in hardware. Anche il ritmo fulmineo con cui sviluppano modelli di intelligenza artificiale equivalenti è sotto esame da parte di OpenAI, che sospetta che l'azienda cinese abbia "distillato i propri modelli".
Poco dopo il lancio e il raggiungimento della popolarità nell'Apple Store, DeepSeek ha iniziato a riscontrare delle interruzioni. Per molto tempo il chatbot non è stato disponibile e le aziende e gli sviluppatori non avevano accesso alla sua API. L'azienda ha annunciato di essere stata presa di mira da attacchi dannosi, che hanno rallentato le operazioni e limitato temporaneamente le registrazioni.
Chi sta guidando la rivoluzione dell'intelligenza artificiale in Cina?
DeepSeek non è nata da un giorno all'altro, ma fino al mese scorso non aveva attirato molta attenzione da parte dei media, nonostante fosse noto il suo impegno nello sviluppo di modelli di intelligenza artificiale. La startup è detenuta per la maggior parte da Liang Wenfeng, che è anche co-fondatore del fondo di investimento High-Flyer. Quest'ultimo ha annunciato nel marzo 2023 che avrebbe avviato un nuovo progetto e fondato un "nuovo gruppo di ricerca indipendente per esplorare l'essenza dell'intelligenza artificiale generale". Pochi mesi dopo abbiamo acquisito la società DeepSeek. Attraevano talenti giovani ed esperti soprattutto con la promessa di stipendi elevati e dell'opportunità di lavorare su progetti di ricerca unici.
Non è chiaro quanto High-Flyer abbia investito in DeepSeek. High-Flyer ha un ufficio nello stesso edificio di DeepSeek e, secondo i dati dei registri aziendali cinesi, detiene anche brevetti relativi ai chip utilizzati per addestrare modelli di intelligenza artificiale.
Come procedere?
DeepSeek ha descritto nella ricerca come addestra i suoi modelli. Poiché la società ufficiale non ha accesso agli stessi chip dei suoi concorrenti americani, ha dovuto trovare un altro modo.
I principali sistemi di intelligenza artificiale apprendono le proprie competenze individuando schemi in grandi quantità di dati, tra cui testo, immagini e suoni. DeepSeek ha descritto un modo per distribuire l'analisi dei dati su più modelli di intelligenza artificiale specializzati, riducendo al minimo il tempo sprecato nel trasferimento dei dati da un luogo all'altro.
Altri hanno già utilizzato metodi simili, ma lo spostamento dei dati tra modelli ha solitamente ridotto l'efficienza. DeepSeek ha fatto tutto questo in un modo che gli ha consentito di utilizzare meno potenza di calcolo.
Il costo e il metodo di addestramento non sono le uniche differenze rispetto ad altri modelli di intelligenza artificiale. DeepSeek è anche open source, il che significa che può essere scaricato, utilizzato e aggiornato praticamente da chiunque.
Al contrario, i modelli di Meta e Google, sebbene accessibili a chiunque, non sono considerati veramente open source, in quanto il modo in cui gli utenti utilizzano i modelli è limitato dalle licenze e i set di dati di addestramento non sono disponibili al pubblico, oltre a essere stati oggetto di numerose cause legali. Ad esempio, Facebook, o Meta, è impegnata in una battaglia legale con autori che accusano l'azienda di utilizzare copie pirata dei loro libri per scopi didattici. Il New York Times ha intentato causa contro Microsoft e OpenAI per aver presumibilmente utilizzato i loro contenuti a fini didattici senza autorizzazione.
Uno dei motivi per cui i modelli di interfaccia utente americani non sono open source è la maggiore possibilità di diffusione di false informazioni, incitamento all'odio e simili, ma il motivo principale è sicuramente il profitto e le maggiori opportunità di monetizzare i modelli di interfaccia utente.
Secondo gli esperti, i modelli open source cinesi potrebbero democratizzare l'intelligenza artificiale, il che potrebbe indebolire notevolmente la strategia delle aziende americane. Il timore è che anche le aziende e gli scienziati americani inizino a utilizzare DeepSeek per sviluppare e realizzare le proprie soluzioni.
In Cina, l'ultimo modello è già stato utilizzato dalle aziende di telecomunicazioni e Geely è la prima tra le aziende automobilistiche a integrare il modello DeepSeek nei sistemi intelligenti delle sue auto.
Nel frattempo, in altre parti del mondo, si sta già valutando un possibile blocco. Italia, Irlanda, Belgio, Paesi Bassi e Francia sono i paesi che hanno già avviato un'indagine sulle modalità con cui DeepSeek utilizza e archivia i dati e su eventuali violazioni delle normative europee sui dati. DeepSeek è preventivamente bloccato in Italia e il suo utilizzo è vietato anche in Corea del Sud e in Australia.
DeepSeek afferma di aver adottato tutte le misure di sicurezza per proteggere i dati archiviati in Cina. Ma non passò molto tempo prima che gli esperti scoprissero che l'azienda aveva accidentalmente lasciato milioni di linee di dati non protette, tra cui chiavi software, registri, chat e altro ancora.
Cisco ha analizzato l'ultimo attore dell'intelligenza artificiale e ha scoperto che "DeepSeek R1 non dispone di solide misure di sicurezza, il che lo rende altamente suscettibile a innovazioni algoritmiche e potenziali abusi".
Si è aperto un nuovo fronte
Nel gennaio 2025, gli Stati Uniti erano l'unico cavallo in gara e i cavalieri americani non avevano più bisogno di rivolgersi a nessuno nell'entroterra. Ora la Cina sta loro con il fiato sul collo. Da tempo tra Stati Uniti e Cina è aperto un fronte commerciale e tecnologico e DeepSeek ha aperto un nuovo fronte su cui verrà deciso il destino dell'intelligenza artificiale.