Molto più di un semplice “chatbot o flusso di lavoro”, il nuovo “paradigma di collaborazione uomo-macchina”, “lo strumento di intelligenza artificiale più impressionante che abbia mai provato”. Nelle ultime ore, la cinese Manus Ai ha fatto molto clamore. Forse più del dovuto.
Il server Discord ufficiale per Manus ha superato i 138.000 membri in pochi giorni e i codici di invito per Manus vengono venduti a migliaia di dollari sull’app cinese per rivenditori Xianyu. La strategia di distribuzione limitata, con pochi codici d’invito disponibili, ha ulteriormente accresciuto l’interesse, tanto che in Cina questi codici sono arrivati a essere venduti per migliaia di euro.
Manus Ai e la promessa di una “intelligenza artificiale completamente autonoma”
Dietro questo software c’è la startup cinese Butterfly Effect che sul suo sito fa sognare gli appassionati di questa tecnologia. Fonti cinesi rivelano che il team ha precedentemente lavorato su Monica AI, un assistente virtuale molto in voga.
Secondo gli sviluppatori, Manus Ai può portare a termine attività che sono ancora molto lontane per le sue rivali, dall’acquisto di immobili alla programmazione di videogiochi, dall’analisi di documenti finanziari alla prenotazione di viaggi completi, dalla scrittura di mail all’analisi dei documenti, fino alla scrittura di codice funzionante (funzione già svolta da ChatGPT, Claude e altri software).
A differenza dei competitor, dicono gli sviluppatori, Manus Ai è un collaboratore virtuale capace di completare interi processi di lavoro in modo indipendente, senza che l’essere umano debba continuamente correggere o indirizzare gli output. Una sorta di collaboratore invisibile capace di prendere decisioni autonome.
L’interesse attorno a Manus è esploso dopo la pubblicazione di un video dimostrativo che in poche ore ha raccolto centinaia di migliaia di visualizzazioni.
Con queste premesse, secondo alcuni esperti, Manus Ai sarebbe persino il primo strumento ad aver raggiunto l’Agi (artificial general intelligence), un tipo di intelligenza artificiale in grado di emulare il ragionamento umano, caratterizzato dalla capacità decisionale. “La prima intelligenza artificiale completamente autonoma” dicono da Pechino.
I test fatti da alcuni giornalisti e da alcuni utenti, però, smentiscono fortemente le premesse/promesse della startup cinese.
I test deludenti e il ruolo di Pechino
I giornalisti della testata specializzata Tech Crunch hanno messo alla prova Manus trovandovi molti intoppi. Manus Ai avrebbe avuto grosse difficoltà nel prenotare voli aerei, tavoli al ristorante e un panino dal fast food. I collegamenti si sono interrotti all’improvviso o il linguaggio ha generato un output sbagliato. Alexander Doria, il co-fondatore della startup di intelligenza artificiale Pleias, sul proprio account X ha lamentato messaggi d’errore e loop infiniti durante l’utilizzo di Manus, mentre altri hanno lamentato evidenti errori con le risposte. Interpellata da Tech Crunch sulle criticità emerse, l’azienda ha risposto che questa fase sperimentale serve proprio a individuare i punti deboli della piattaforma, aggiungendo che sono in corso interventi per rafforzare le infrastrutture tecniche.
Nel frattempo, però, l’app cinese ha conquistato i canali social, dove la curiosità su Manus Ai è cresciuta rapidamente soprattutto grazie a dei video che mostravano funzionalità avanzate senza precedenti. Dopo il grande hype, i tanti like e le tante ricondivisioni, gli stessi sviluppatori dell’app hanno dovuto smentire i video che giravano sui social.
Non ci sono solo promesse disattese: l’entusiasmo ha contagiato diversi esperti del settore tra cui Victor Mustar di Hugging Face, che ha descritto Manus Ai come “lo strumento di Ai più impressionante mai provato”. Su X il ricercatore di policy sull’intelligenza artificiale Dean Ball ha definito Manus Ai “il computer più sofisticato che utilizza l’intelligenza artificiale”. Insomma, la nuova intelligenza artificiale cinese sembra essere molto competitiva, ma le promesse si sono spinte troppo oltre.
Diversi quotidiani cinesi hanno dedicato ampio spazio alla nuova piattaforma definendola un “orgoglio della produzione nazionale” (testata QQ News). L’impressione è che Pechino speri in un DeepSeek 2.0, e, quindi, in un nuovo scossone per le aziende di intelligenza artificiali made in Usa e i mercati finanziari occidentali. Il 27 gennaio, il titolo di Nvidia ha perso il 17% dopo che Liang Wenfeng e soci avevano promesso di poter abbattere i costi di produzione, la quantità e la qualità dei chip richiesti. Secondo quanto dichiarato da DeepSeek, lo sviluppo del modello V3 avrebbe richiesto solo due mesi (molto meno dei rivali Usa) e 5,6 milioni di dollari, contro le centinaia di milioni impiegati dall’altra parte del Pacifico.
Dopo la paura, però, è arrivato il momento della lucidità.
Il modello V3, predecessore di r1, è incapace di “ragionare”, cosa che rende fuorviante il paragone con gli ultimi delle Ai statunitensi. Inoltre, il costo di 5,6 milioni si riferisce solo al processo di training di questo modello e non tiene conto del costo complessivo dell’operazione, tra cui: spese di ricerca e sviluppo; costi dei dati di addestramento (acquisizione e preparazione del set di dati); costi del personale; infrastruttura e hardware.
Le stime più prudenti collocano il costo delle operazioni di DeepSeek tra il mezzo miliardo e il miliardo di dollari all’anno. Per approfondire: Perché DeepSeek non è la sconfitta dell’intelligenza artificiale occidentale
Forse è anche grazie a questo precedente, se l’entusiasmo su Manus Ai è stato ridimensionato nel giro di poche ore.
Manus Ai superiore alle Ai occidentali?
Yichao “Peak” Ji, il ricercatore a capo del progetto, sostiene che Manus Ai sia superiore ai concorrenti occidentali. In particolare, in un video diventato virale su X, Ji ha lasciato intendere che la piattaforma abbia superato la ricerca approfondita di OpenAI e Operator nel test Gaia, che misura la capacità dei sistemi di intelligenza artificiale di navigare sul web e utilizzare software come farebbe un essere umano.
La narrazione mette in contrapposizione la nuova Ai cinese e quelle americane già esistenti, in particolare ChatGPT e Claude. Il tema è che, come riportato dalla stessa Butterfly Effect, la piattaforma utilizza un mix di modello di linguaggi già esistenti, tra cui Claude di Anthropic e Qwen di Alibaba per svolgere attività le proprie attività di ricerca e analisi.
Manus Ai può rappresentare uno step cruciale nel percorso degli agenti, che sono il presente e il futuro dell’Ai. La capacità di interagire in tempo reale con l’ambiente digitale e di navigare autonomamente sul web rendono l’Ai cinese una soluzione innovativa e intrigante, ma i test svolti finora hanno dimostrato che l’app ha ancora molte lacune. E da questa parte dell’Oceano abbiamo imparato a respingere i facili entusiasmi.