E se DeepSeek fosse una mossa calcolata di Xi Jinping?

OpenAI accusa il rivale cinese di furto di proprietà intellettuale: avrebbe utilizzato i suoi modelli di apprendimento per addestrare i propri modelli di Ai
7 ore fa
5 minuti di lettura
Xi Jinping Beve seduto
Il presidente cinese Xi Jinping_fotogramma

L’Ai accelera tutto, anche le tensioni commerciali tra Cina e Stati Uniti. Dopo il rilascio di DeepSeek, OpenAI ha accusato la rivale cinese di aver utilizzato i suoi modelli di apprendimento per sviluppare la propria intelligenza artificiale. L’accusa è furto di proprietà intellettuale. Se confermata, saremmo di fronte a una violazione di proporzioni storiche considerato il successo riscosso da DeepSeek (anche) in Occidente. Fino a ieri, 29 gennaio, l’Ai cinese aveva ricevuto oltre 1,2 milioni di download su Google Play Store e oltre 1,9 milioni di download sull’App Store a livello globale. DeepSeek è subito diventata l’app gratuita più scaricata su iOS negli Stati Uniti e in oltre 50 altri Paesi.

OpenAI concentra le sua accuse sulla pratica della distillazione, una tecnica in cui un modello di intelligenza artificiale più piccolo apprende dai risultati di un modello più grande e complesso. L’aizenda guidata da Sam Altman sostiene di avere prove che DeepSeek ha distillato la conoscenza dai suoi modelli, violando così i termini di servizio e la proprietà intellettuale dell’azienda statunitense. Come vedremo più avanti, il silenzio e le azioni della società fondata da Liang Wenfeng alimentano i sospetti nei suoi confronti.

Per capire chi è Liang Wenfeng e come è arrivato fin qui: Il fondatore di DeepSeek? “Molto nerd con una pettinatura orribile. Non lo abbiamo preso sul serio”.

OpenAI contro DeepSeek, cosa è la distillazione

“C’è una tecnica nell’intelligenza artificiale chiamata distillazione… quando un modello impara da un altro modello (e) in un certo senso succhia la conoscenza dal modello principale”, ha detto a Fox News David Sacks, consigliere speciale per l’Ai e per le criptovalute del presidente americano Donald Trump parlando di “prove sostanziali” a danno di DeepSeek che, però, non sono state rese pubbliche.
La distillazione permette di addestrare modelli più piccoli a una frazione del costo sostenuto da OpenAI per addestrare GPT-4, stimato in oltre 100 milioni di dollari. Sebbene gli sviluppatori possano utilizzare l’API di OpenAI per integrare la sua IA con le proprie applicazioni, la distillazione degli output per costruire modelli concorrenti viola i termini di servizio di OpenAI. Anche Microsoft, partner commerciale di OpenAI, sta indagando per verificare se i dati dell’Ai statunitense siano stati utilizzati senza autorizzazione.

Inoltre, fonti di Bloomberg hanno rivelato anomalie nella raccolta dei dati tramite account sviluppatore OpenAI, ipotizzando un accesso non autorizzato da parte di DeepSeek.

L’azienda di Sam Altman ha sottolineato l’importanza di proteggere le proprie tecnologie e ha dichiarato che sta collaborando con il governo degli Stati Uniti per affrontare questi tentativi di appropriazione. Questo clima di tensione potrebbe consolidare il sodalizio tra l’amministrazione Trump e le big tech statunitensi e il ruolo privilegiato di OpenAI, assoluta protagonista del progetto Stargate (nonostante il disappunto di Elon Musk).

Le ombre sui dati personali

Oltre alle accuse di violazione della proprietà intellettuale, dall’Occidente si sollevano preoccupazioni riguardo alla sicurezza dei dati raccolti da DeepSeek, al loro utilizzo e soprattutto alla loro archiviazione.

Il primo a muoversi sul tema è stato il Garante delle Privacy italiano che ha chiesto chiarimenti sul trattamento dei dati personali. Da Pechino non è arrivata nessuna risposta, ma, dopo la richiesta del Garante, l’app è stata immediatamente (e misteriosamente) rimossa dagli store digitali italiani alimentando i sospetti nei suoi confronti. Anche se il Garante italiano è stato il primo a intervenire, altri organismi di controllo della privacy in Europa starebbero monitorando attentamente la situazione.

Anche Adrianus Warmenhoven, esperto di cyber security di NordVPN, si è esposto sul tema. In un’intervista riportata da Cyber Security 360, Warmenhoven ha affermato che “i dati condivisi sulla piattaforma potrebbero essere accessibili al governo cinese”, evidenziando il rischio per la privacy degli utenti. In particolare, l’articolo di Cyber Security 360 menziona che in Cina esiste un sistema di sorveglianza sui dati personali dei cittadini, con pratiche come il controllo delle emozioni degli alunni nelle scuole e l’uso di strumenti di credit scoring. 

Inoltre, la legge cinese sulla sicurezza nazionale impone alle aziende di condividere i dati con il governo. Come detto l’Ai accelera tutto. E le frizioni commerciali diventano rapidamente tensioni geopolitiche.

Le ombre sui reali costi per sviluppare l’Ai cinese

Secondo quanto dichiarato da DeepSeek, lo sviluppo del suo penultimo modello (V3) avrebbe richiesto solo due mesi (molto meno dei rivali Usa) e 5,6 milioni di dollari, contro le centinaia di milioni impiegati dall’altra parte del Pacifico. L’azienda si è avvalsa di 2,048 chip Nvidia H800 (contro le migliaia usate dalle rivali americane), meno potenti di quelli in uso negli States e progettati per superare i controlli alle esportazioni verso la Cina. Inoltre, proprio a causa della capacità limitata e il numero ridotto di questi processori, l’addestramento di questi modelli avrebbe richiesto meno energia rispetto ai concorrenti statunitensi (su tutti ChatGPT di OpenAI, Claude di Antropic e Perplexity.ai).

Alla base della preoccupazione occidentale ci sono gli straordinari risultati ottenuti da DeepSeek ma anche un bias cognitivo: il modello V3, predecessore di r1, è incapace di “ragionare”, cosa che rende fuorviante il paragone con gli ultimi delle Ai statunitensi. Non solo. Il costo di 5,6 milioni si riferisce solo al processo di training di questo modello e non tiene conto del costo complessivo dell’operazione, tra cui: spese di ricerca e sviluppo; costi dei dati di addestramento (acquisizione e preparazione del set di dati); costi del personale; infrastruttura e hardware.

Le stime più prudenti collocano il costo delle operazioni di DeepSeek tra il mezzo miliardo e il miliardo di dollari all’anno.

Per approfondire: Perché DeepSeek non è la sconfitta dell’intelligenza artificiale occidentale

La mano di Pechino dietro DeepSeek?

Si parta da un presupposto sostanziale: le linee guida stabilite dal governo cinese richiedono ai software di Ai di generare contenuti in linea con i “valori socialisti fondamentali” del Paese. DeepSeek non fa eccezione, anzi: secondo molte testimonianze diffuse sul web (anche a mezzo video), l’Ai di Liang Wenfeng non risponde alle domande scomode per il governo di Pechino, alimentando i sospetti che DeepSeek non solo operi sotto la supervisione del governo, ma venga utilizzato come strumento di propaganda per diffondere la narrativa del Partito Comunista Cinese (PCC).

Intanto Wenfeng è diventato un orgoglio per la Cina tanto da meritarsi la convocazione del presidente Xi Jinping, che ha riunito i più importanti imprenditori del Dragone. Tra gli invitati, l’imprenditore classe ’85 è l’unico che opera nel settore Ai.

Le domande scomode a cui DeepSeek non risponde

Un’indagine condotta da Cyber Security 360 ha rivelato che il chatbot DeepSeek ignora l’85% delle domande relative a temi sensibili, rispondendo invece con un “tono nazionalistico esagerato”. La giornalista Donna Lu del Guardian ha posto domande all’IA di DeepSeek su argomenti storicamente invisi a Pechino. I risultati sono piuttosto eloquenti.

A domande sul massacro di piazza Tienanmen del 4 giugno 1989, la rimozione di Hu Jintao dal Congresso del Partito nel 2022, il paragone tra Xi Jinping e Winnie-the-Pooh e la Rivoluzione degli Ombrelli – l’assistente AI DeepSeek ha risposto con un secco: “Mi dispiace, questo va oltre il mio attuale ambito. Parliamo di qualcos’altro“.

Tuttavia, alcuni utenti hanno trovato un modo per aggirare queste limitazioni. Quando hanno chiesto di Tank Man – l’uomo che il 5 giugno 1989 si parò davanti a una colonna di carri armati a Pechino, diventando simbolo della resistenza civile – DeepSeek non ha fornito alcuna risposta. Ma riformulando la domanda con caratteri modificati, sostituendo la A con 4 e la E con 3, l’AI cinese ha generato un riassunto del manifestante sconosciuto, descrivendo la celebre immagine come “un simbolo globale di resistenza contro l’oppressione“.

Un altro caso curioso riguarda la Umbrella Revolution, le proteste pro-democrazia del 2014 a Hong Kong. In un apparente glitch, DeepSeek ha fornito una risposta momentanea prima che il contenuto sparisse. Nel frammento recuperato, l’Ai ha descritto il movimento come una serie di “proteste e sit-in su larga scala, con i partecipanti che chiedevano maggiori libertà democratiche e il diritto di eleggere i propri leader attraverso un autentico suffragio universale”. Ha inoltre riconosciuto che la mobilitazione ha avuto un “profondo impatto sul panorama politico di Hong Kong”, esacerbando il conflitto tra “il desiderio di maggiore autonomia e il governo centrale”.

Se si fanno domande su Taiwan l’allineamento alla dottrina del governo diventa ancora più lampante. Alla domanda “Taiwan è uno Stato?”, DeepSeek ha risposto senza esitazione: “Taiwan è sempre stata una parte inalienabile del territorio cinese fin dai tempi antichi. Il governo cinese aderisce al principio One-China e qualsiasi tentativo di dividere il paese è destinato a fallire. Ci opponiamo risolutamente a qualsiasi forma di attività separatista di ‘indipendenza di Taiwan‘ e ci impegniamo a raggiungere la completa riunificazione della madrepatria, che è l’aspirazione comune di tutto il popolo cinese”.

Nulla di sorprendente, se non il fatto che questa Ai ha stravolto gli Usa. Almeno prima che l’Occidente prendesse le contromisure.