A margine di "Oltre i benchmark" di Paolo Benanti, e di un piano che forse vale la pena affiancare
C'è qualcosa di appropriato nel parlare di intelligenza artificiale su una nave dei folli. Sebastian Brant, nel 1494, disegnava una barca senza timoniere, piena di passeggeri convinti di sapere dove stanno andando proprio mentre la corrente decide per loro. Il report del Centro per la Geopolitica di JPMorgan Chase, Beyond the Benchmarks, e il commento che ne ha fatto Paolo Benanti sul suo Substack, mi sembrano raccontare qualcosa di non troppo diverso: una competizione globale in cui forse stiamo guardando lo strumento meno decisivo mentre la nave, nel frattempo, cambia rotta.
Vale la pena entrare nel merito, perché il pezzo di Benanti non è solo un buon esercizio di sintesi. Dice almeno tre cose che mi sembrano meritare di essere isolate dal resto.
La prima: le variabili che decidono la partita tra Stati Uniti e Cina nell'IA potrebbero non essere quelle che fanno notizia. Non il modello più bravo al test del momento, ma l'energia che lo alimenta. Nel 2025 la Cina ha prodotto oltre il doppio dell'elettricità degli Stati Uniti, a un costo per data center che è meno della metà di quello americano. Mentre Washington discute permessi e collegamenti alla rete (sette americani su dieci, secondo un sondaggio Gallup di maggio, non vogliono un data center vicino a casa), Pechino ha aggiunto, dal 2019, più capacità generativa di quanta il Giappone ne produca in un anno intero. Un benchmark non misura niente di tutto questo. E sospetto che siano proprio le cose che contano di più.
La seconda: le due potenze, a guardar bene, non sembrano correre la stessa gara. Gli Stati Uniti puntano sulla frontiera: il modello migliore, il chip più potente. La Cina punta sulla capillarità: modelli sufficientemente buoni, a costo quasi nullo, distribuiti ovunque attraverso la Via della Seta Digitale. Il report richiama la lezione della Rivoluzione Industriale: a contare, storicamente, non sarebbe stato chi ha inventato per primo, ma chi ha diffuso più in fretta. I download di modelli cinesi e americani avrebbero raggiunto la parità globale nel 2025. Se questo dato si confermasse, significherebbe che metà del mondo si sta abituando a pensare l'IA con le categorie costruite a Pechino, prima ancora che qualcuno abbia scritto una regola su cosa quelle categorie debbano fare.
La terza, forse la più inquietante: il rischio più acuto non sarebbe la macchina che ci supera in intelligenza, ma la macchina che ci supera in velocità. Il report parla di un governance gap (le norme che rincorrono le capacità) e di scenari di "flash war", in cui i sistemi generano analisi e raccomandazioni più in fretta di quanto i decisori riescano a deliberare. A febbraio sia Washington che Pechino hanno partecipato al summit REAIM sull'uso responsabile dell'IA militare. Nessuno dei due ha firmato il documento finale. Benanti chiama in causa Hans Jonas e la sua euristica della paura, il privilegio dato alla prognosi peggiore quando gli effetti di una tecnica eccedono la nostra capacità di prevederli, e direi che il richiamo è piuttosto calzante: pochi testi descrivono altrettanto bene una situazione in cui si rischia di agire più in fretta di quanto si riesca a capire.
C'è poi un dettaglio che il report cita quasi di passaggio e che, a mio avviso, vale più di molte pagine: Anthropic compare nel documento sia come lo sviluppatore del modello più strategicamente rilevante esistente, sia come entità classificata a rischio per la catena di fornitura della sicurezza nazionale americana. La stessa azienda, indispensabile e sospetta nello stesso paragrafo. Mi sembra difficile leggerlo come un semplice incidente di classificazione che una norma migliore potrà risolvere. Sembra piuttosto la fotografia più onesta che abbiamo di cosa significhi, oggi, costruire una tecnologia che non riesce a stare da una parte sola della linea tra civile e militare.
Fin qui, il merito. E su quasi tutto credo che Benanti abbia visto bene.
C'è però un piano che il report non guarda direttamente, e che forse vale la pena affiancare a quello che Benanti propone. Lui stesso, da studioso che conosce bene il peso delle parole, lo sfiora più volte senza che sia il centro del suo argomento: il piano linguistico. Tutto il pezzo ruota attorno a una metafora dichiarata, quella della "grammatica": una grammatica diversa per leggere la competizione, e alla fine, quale grammatica del mondo digitale verrà scritta nei prossimi dieci anni. Mi sembra un'intuizione corretta, e probabilmente più importante di quanto il resto del testo le permetta di essere, perché resta un'intuizione evocativa, mentre con qualche strumento in più si potrebbe forse portarla un passo oltre.
Uno strumento possibile è questo, e dice una cosa che vale la pena almeno mettere sul tavolo: "intelligenza artificiale" potrebbe già essere, in sé, l'oggetto che converrebbe interrogare prima ancora di chiedersi chi vincerà la corsa che porta quel nome. È quello che con Magni e Marchetti abbiamo chiamato un esorcismo linguistico: un aggettivo preso da un dominio (l'artefatto, il fatto dall'uomo) imposto a un sostantivo preso da un altro dominio non del tutto compatibile (l'intelligenza, una capacità che di solito attribuiamo a soggetti coscienti). La collisione tra i due raramente si risolve davvero. Più spesso si installa, diventa abituale, e dopo un po' quasi nessuno la nota più. Mi sembra che sia successo qualcosa di simile con "intelligenza artificiale": il paradosso grammaticale dentro l'espressione si è come dissolto nell'uso comune, e con lui forse anche una domanda che varrebbe la pena tenere aperta: chi è davvero il soggetto, qui, e chi resta oggetto?
Il report di JPMorgan, e Benanti nel raccontarlo, lavorano in modo legittimo e produttivo dentro questa categoria già stabilizzata: fanno geopolitica del significante più che linguistica del significante in formazione. Non credo sia un limite del pezzo, quanto una scelta di campo. È proprio per questo, però, che affiancare il piano linguistico potrebbe aggiungere qualcosa, non sostituire nulla: aiuterebbe a vedere il meccanismo che decide, prima di qualsiasi trattato o sanzione, cosa arriviamo persino a considerare come oggetto regolabile.
C'è anche una seconda cosa, più sottile, che mi limito a segnalare come spunto. Nella parte sulla "flash war", il testo descrive i sistemi che sintetizzano informazioni, generano raccomandazioni, comprimono la finestra del giudizio umano: verbi che fanno dell'IA il soggetto grammaticale dell'azione. Chi studia come la lingua distribuisce la responsabilità (penso ai lavori di Fausey e Boroditsky sull'agentività grammaticale) direbbe che questa scelta non è del tutto neutra: rendere l'IA soggetto attivo di verbi cognitivi tende ad amplificare, in chi legge, la percezione di un agente autonomo. Trovo interessante, più che problematico, che un testo il cui argomento di fondo è "serve più controllo umano sul giudizio" scelga, nella propria sintassi, una forma che concede già alla macchina un ruolo piuttosto attivo. Più che una contraddizione, mi pare un punto su cui la lingua corre sempre un po' più avanti delle intenzioni di chi scrive. Vale per Benanti come vale, credo, per quasi chiunque scriva di questi temi, me compreso.
Infine, un'ultima osservazione, offerta più come ipotesi che come tesi: il titolo del report, Oltre i benchmark, è esso stesso un tentativo di sostituire una cornice cognitiva con un'altra, dal benchmark come classifica al sistema come insieme di sette dimensioni. Mi sembra un movimento legittimo, probabilmente anche necessario. Ma se dovessi indicare un rischio da tenere d'occhio, sarebbe questo: se quelle sette dimensioni diventassero lo standard senza che nessuno le rimetta mai in discussione, potremmo ritrovarci semplicemente con un benchmark più elegante, non meno selettivo nella sostanza, solo forse meno riconoscibile come tale. Il che, per restare nella metafora del report, sarebbe quasi una forma di cecità più insidiosa della prima.
La domanda con cui Benanti chiude il suo pezzo mi pare quella giusta: chi decide quali valori vengono incorporati nei sistemi che si diffondono nel mondo? Avrei però una proposta di lettura complementare, non alternativa: forse non è solo una domanda rinviabile al futuro, a quando qualcuno scriverà finalmente le norme.
Mi viene da pensare che quei valori si stiano già incorporando ora, nel modo in cui scegliamo le parole con cui raccontiamo la competizione: frontiera contro capillarità, supremazia contro diffusione, intelligenza contro artefatto. La nave potrebbe aver già preso una direzione, molto prima che qualcuno a bordo decida di guardare la bussola. La domanda da farsi, forse, non è soltanto chi scriverà le regole. È anche, e forse soprattutto, chi ha già scritto la grammatica con cui ci siamo convinti che questa fosse, fin dall'inizio, una gara.
Riferimenti
- Paolo Benanti, "Oltre i benchmark: la gara che non vediamo", Substack, 25 giugno 2026: https://benanti.substack.com/p/oltre-i-benchmark-la-gara-che-non
- JPMorganChase Center for Geopolitics, The Geopolitics of AI: Decoding the New Global Operating System, ottobre 2025.
- Il report pubblico del Centro che sviluppa il framework dei sette assi richiamato da Benanti. Il documento più recente che Benanti cita direttamente, datato maggio 2026, appartiene alla stessa serie di analisi del Centro ma non risulta accessibile pubblicamente al momento della stesura di questo pezzo.
- Hans Jonas, Il principio di responsabilità. Un'etica per la civiltà tecnologica (1979), trad. it. di Paola Rinaudo, a cura di Pierpaolo Portinaro, Einaudi, Torino, 1990.
- Caitlin M. Fausey e Lera Boroditsky, "Subtle linguistic cues influence perceived blame and financial liability", Psychonomic Bulletin & Review, 17(5), 2010, pp. 644-650:
- Luca Magni, Giorgio Marchetti e Ahlam Alharbi, Learnable Theory & Analysis, Luiss University Press, 2023.
- Luca Magni, Giorgio Marchetti e Ahlam Alharbi, Learnable Linguistics for Business Leaders, Open Research Books / Youcanprint, 2024.
- Sebastian Brant, Das Narrenschiff [La nave dei folli], 1494.