DeepSeek suggerisce che l'ultimo modello sarà supportato dai chip di intelligenza artificiale di "prossima generazione" sviluppati internamente dalla Cina

La startup cinese di intelligenza artificiale DeepSeek ha lasciato intendere che la Cina avrà presto chip di "nuova generazione" sviluppati internamente per supportare i suoi modelli di intelligenza artificiale, annunciando al contempo un aggiornamento di uno dei suoi principali modelli linguistici.
In un commento sotto un post sul suo account WeChat ufficiale , DeepSeek ha affermato che il formato di precisione "UE8M0 FP8" del suo modello V3.1 appena rilasciato è pensato su misura per i chip di prossima generazione prodotti a livello nazionale che saranno lanciati a breve.
FP8, o virgola mobile a 8 bit, è un formato di elaborazione dati in grado di aumentare l'efficienza computazionale per l'addestramento e l'inferenza di grandi modelli di deep learning.
Il riferimento di DeepSeek ai chip di nuova generazione della Cina potrebbe segnalare l'intenzione di collaborare più strettamente con l'ecosistema emergente di chip per l'intelligenza artificiale della Cina, di fronte alle restrizioni avanzate all'esportazione di semiconduttori imposte da Washington e alla spinta di Pechino verso l'autosufficienza in materia di chip.
I commenti arrivano circa due settimane dopo che Pechino avrebbe esortato gli sviluppatori cinesi di intelligenza artificiale a utilizzare alternative nazionali alle unità di elaborazione grafica di Nvidia utilizzate nell'addestramento dell'intelligenza artificiale. Mentre gli analisti affermano che i produttori cinesi di chip per l'intelligenza artificiale sono in ritardo rispetto a Nvidia in termini di progresso tecnologico e dimensioni, attori come Huawei hanno fatto progressi .
Nel suo post di giovedì, DeepSeek non ha rivelato i chip utilizzati per addestrare la V3.1, né con quali chip locali potrebbe essere compatibile l'UE8M0 FP8.
DeepSeek ha scosso il mondo della tecnologia all'inizio di quest'anno dopo aver rilasciato il suo modello di ragionamento R1, che ha dimostrato capacità paragonabili a quelle dei concorrenti occidentali come OpenAI, nonostante i controlli sulle esportazioni degli Stati Uniti ne impediscano l'utilizzo dei chip di addestramento AI più avanzati di Nvidia.
In precedenza, a dicembre, l'azienda aveva rilasciato il suo modello V3, che, a suo dire, era stato addestrato su circa 2.000 chip meno avanzati di Nvidia.
In seguito alle innovazioni del modello DeepSeek, ad aprile gli Stati Uniti hanno ulteriormente inasprito le restrizioni all'esportazione, vietando di fatto i chip H20 di Nvidia, che erano stati appositamente progettati per soddisfare le precedenti restrizioni all'esportazione imposte dalla Cina.
Il mese scorso, i funzionari dell'amministrazione Trump hanno dichiarato di voler consentire a Nvidia di riprendere le spedizioni dei chip in Cina. Tuttavia, gli H20 sono ora sottoposti a un attento esame in Cina, con le autorità di regolamentazione che avrebbero imposto alle aziende di non acquistare i chip fino al completamento di una verifica di sicurezza nazionale.
Gli analisti di chip hanno dichiarato alla CNBC che aziende come Huawei , che hanno cercato di creare un ecosistema alternativo di chip AI in Cina, potrebbero trarre vantaggio dalla mancanza di H20 di Nvidia sul mercato.
DeepSeek ha dichiarato giovedì che la sua versione V3.1 è stata introdotta con "importanti modifiche", tra cui tempi di risposta più rapidi e un'architettura di ragionamento ibrida che consente al modello di supportare sia la modalità di ragionamento che quella di non ragionamento. I modelli di ragionamento possono eseguire compiti più complessi attraverso un processo di pensiero logico graduale.
A partire dal 6 settembre, l'azienda modificherà anche i prezzi per l'utilizzo dell'API del modello, che consente agli sviluppatori di altre app e prodotti web di integrare DeepSeek sulle loro piattaforme.
CNBC