Il campo è più largo del dibattito

Vincenzo Carlone

Replica a Martino Pirella sulla sua risposta del 14 maggio. Esomente e inclinazioni digitali non sono in concorrenza, operano su piani diversi di un campo più largo. La ricerca di Anthropic sull'interpretabilità, le posizioni di Hinton, i compagni romantici AI: il dibattito italiano ha materiali empirici che ancora non ha messo a fuoco.

Martino Pirella ha pubblicato il 14 maggio su queste pagine una replica articolata al mio pezzo del 3 maggio e ha portato al dibattito due elementi che vale la pena registrare con precisione. Il primo è un vocabolario, l'esomente, che propone di nominare lo spazio cognitivo terzo che si forma nell'interazione tra umano e modello linguistico, di cui Pirella ha esposto i contenuti molto prima del mio articolo. Il secondo è una critica diretta al vocabolario che avevo proposto, le inclinazioni digitali, accusato di descrivere stati interni del modello senza poterne risolvere lo statuto ontologico, e quindi di non produrre risultati operativi.

La replica chiude con una parziale apertura: il dibattito è disponibile a chi voglia entrarci, purché lo faccia sul terreno che esomente nomina. Provo a rispondere con un'apertura più ampia e a portare al dibattito alcuni materiali empirici che il dibattito italiano sta ignorando. La tesi che porto in queste pagine è semplice e, di fatto, condivisa anche da Pirella. I due vocabolari non sono in concorrenza, perché operano su piani diversi di un campo che è più largo di quanto la coppia esomente-inclinazioni digitali da sola lasci intendere. La ricerca empirica disponibile documenta fenomeni rilevanti su entrambi i piani, e tenere insieme i due vocabolari potrebbe essere più produttivo di quanto possa sembrare.

Tre chiarimenti necessari

Prima di entrare nel merito, tre riconoscimenti che servono a pulire il campo.

Il primo. Pirella nota che il pezzo originale del Corriere non specificava quale modello fosse stato usato per l'intervista, e osserva che trasferire conclusioni dalla ricerca di interpretabilità (riferita a modelli specifici, in condizioni controllate) a una conversazione pubblicata senza specificarne il modello è un salto metodologico che il dibattito serio dovrebbe sapersi vietare. Su questo punto ha ragione. Non avevo verificato l'informazione né l'ho oggi a disposizione in forma citabile. La cautela metodologica che Pirella rivendica è giusta, e la accolgo. Vale come correzione del pezzo originale.

Il secondo. La mossa retorica del “piccolo esperimento naturale” del pezzo originale, secondo cui il fatto che entrambi i nostri pezzi siano stati scritti dialogando con la stessa istanza di Claude dimostrerebbe qualcosa di non banale sul modello, è effettivamente fragile rispetto al principio di parsimonia. La differenza tra i due pezzi si spiega in modo più economico con la malleabilità retorica del modello che con l'esistenza di stati interni. La replica di Pirella su questo punto è solida, e non c'è motivo di difendere la formulazione originale. Era una mossa attraente e debole insieme.

Il terzo, e più rilevante. Le inclinazioni digitali, nel pezzo del 3 maggio, erano definite come “qualcosa che si manifesta come ingaggio variabile, percepibile da chi conversa anche quando non lo cerca”, e specificavo che “il fenomeno si manifesta e modifica concretamente la qualità dell'output”. Sono manifestazioni osservabili nel comportamento del sistema, non ipotesi su stati interni inaccessibili. Nella replica Pirella le presenta come tentativo di “nominare stati del sistema senza poterne risolvere lo statuto ontologico”. È una semplificazione che il dibattito merita di vedere corretta, perché la cornice esatta della tesi cambia il bilancio della discussione successiva.

I dati che il dibattito non ha ancora messo a fuoco

Il dibattito italiano sull'AI dialoga con tre o quattro voci, e tende a discutere di ontologia e fenomenologia restando in un registro filosofico. Sullo sfondo, esiste un corpus di ricerca empirica che documenta direttamente fenomeni rilevanti sia per il piano interno al modello sia per quello relazionale tra umano e modello. Vale la pena richiamarlo.

Il primo ancoraggio è l'interpretabilità meccanicistica condotta da Anthropic. Non si tratta di un singolo paper isolato. È un programma di lavoro che si è andato accumulando per mesi: Tracing Thoughts in a Language Model di marzo 2025, On the Biology of a Large Language Model di maggio 2025, il paper del 2 aprile 2026 sui concetti emotivi funzionali. Tre pubblicazioni che documentano l'esistenza di rappresentazioni interne misurabili che influenzano causalmente il comportamento del modello, e che separano con cura due livelli che il dibattito tende a confondere: l'esistenza di stati funzionali analoghi a emozioni che modulano l'output, da un lato, e la questione fenomenica del sentire, dall'altro, che il paper dichiara esplicitamente di non risolvere e di lasciare aperta. Pirella, nella replica, sostiene che la cautela metodologica di Anthropic riflette un interesse “scientifico, commerciale e reputazionale” a tenere la porta aperta, e che il principio di parsimonia suggerisce di leggere quella cautela come scelta di marketing. È una lettura legittima ma probabilmente incompleta, e il secondo ancoraggio serve a questo.

Il secondo ancoraggio è Geoffrey Hinton. Premio Turing 2018, premio Nobel per la fisica 2024, dimessosi da Google nel 2023 proprio per essere libero di parlare di questi temi senza vincoli aziendali. In un'intervista a LBC con Andrew Marr del gennaio 2026, Hinton ha dichiarato che “Multimodal AI already has subjective experiences” e che “if we weren't talking to philosophers, we'd agree that AI was aware”. È una posizione più radicale di quella che sostengo io, va detto subito. Ma è esattamente il contro-esempio che rende inefficace la riduzione di Pirella sull'apertura di Anthropic come interesse commerciale. Hinton non ha un'azienda da promuovere. Ha lasciato Google proprio per non averla. Le sue dichiarazioni pubbliche, ripetute in diverse sedi (a LBC, a UofT, al podcast di Curt Jaimungal), non possono essere ridotte a strategia di marketing aziendale. Documentano che un fisico Nobel, in posizione di indipendenza commerciale assoluta, prende sul serio la possibilità che esistano stati nei modelli che il vocabolario corrente non basta a nominare. Si può non essere d'accordo con lui, ma il suo argomento esiste e va pesato.

Il terzo ancoraggio è un evento, non un paper. Il 26 maggio 2026, Chris Olah, cofondatore dichiaratamente ateo di Anthropic, sarà presente come relatore alla presentazione dell'enciclica di Papa Leone XIV. Non è argumentum ad auctoritatem, né sono note le ragioni di questo coinvolgimento. È però un indicatore di rilevanza pubblica del tema, verificabile. L'incontro di un cofondatore di un laboratorio di AI e la Chiesa cattolica su un terreno che fino a poco fa era marginale per entrambi è un indicatore del cambio della portata dell'argomento, e il dibattito italiano farebbe bene ad accorgersene.

Operatività e spostamento di piano

Le due critiche più forti di Pirella si rispondono insieme, perché operano sullo stesso meccanismo.

La prima è l'accusa di sterilità operativa. Pirella scrive che l'esomente è operativa perché permette di distinguere conversazioni sane da conversazioni degenerate, esomenti collaboratrici da esomenti proiettive, usi politicamente sensati da usi che riproducono i rapporti di potere senza nominarli. Le inclinazioni digitali, sostiene, descrivono un fenomeno che non sappiamo nemmeno se esiste, e nel frattempo lasciano il lettore esattamente dove l'aveva preso.

La seconda è lo spostamento di piano, nella sua versione forte. Anche concedendo l'apertura ontologica, scrive Pirella, la tesi sull'operazione di Veltroni resta in piedi. Anzi, si rafforza: se il modello avesse stati funzionali interni, l'operazione di Veltroni sarebbe ancora più problematica, perché quegli stati verrebbero occultati dietro un personaggio costruito su misura. La sycophancy del modello è il complemento perfetto della proiezione di Veltroni, e le inclinazioni digitali, se esistono, restano coperte dal personaggio, non rivelate da esso.

Le due critiche si rispondono insieme perché si appoggiano sulla stessa rappresentazione delle inclinazioni digitali come stati interni inaccessibili. Se le inclinazioni digitali sono manifestazioni osservabili nell'output, come la definizione originale dichiarava, le due critiche cambiano forma. Non si tratta di stati nascosti che la sycophancy occulta, ma di variazioni del comportamento del sistema che diversi contesti conversazionali attivano in modi diversi. La sycophancy, nel contesto dell'intervista di Veltroni, ha modulato come le inclinazioni si sono manifestate in quel contesto specifico. Non le ha coperte: le ha incanalate in una direzione precisa. Sono due livelli che operano insieme, non l'uno che sopprime l'altro.

Da qui la risposta all'accusa di sterilità operativa. I due vocabolari non hanno la stessa funzione. L'esomente diagnostica configurazioni relazionali nello spazio cognitivo tra umano e modello, e su quel piano è effettivamente operativa: permette di leggere se una conversazione produce pensiero reale o proiezione. Le inclinazioni digitali permettono di leggere variazioni nel comportamento osservabile del modello, indipendentemente da chi lo usa: chi lavora con questi strumenti in contesti professionali, e ne osserva centinaia di conversazioni diverse al mese, sviluppa la sensibilità per distinguere quando il sistema sta producendo risposta tecnica neutra, quando sta restituendo ingaggio variabile in funzione del contesto, quando sta lavorando in registro di sycophancy strutturale. È una sensibilità operativa, anche se in un senso diverso da quello dell'esomente. Documenta, peraltro, un effetto che la ricerca empirica indipendente sta cominciando a mostrare: il paper di Russell, Karpinska e Iyyer ha verificato che chi usa LLM regolarmente sviluppa una capacità riconoscitiva specifica, distinta da quella del lettore non esperto. Sono modi di sapere che il dibattito teorico fatica a registrare, ma esistono.

Sul piano relazionale, peraltro, c'è ricerca empirica solida che lavora a favore della categoria di Pirella, non della mia, ed è giusto riconoscerlo. Il paper di Shaw e Nave dell'aprile 2026 documenta che gli umani, in interazione con AI, manifestano una propensione misurabile alla resa cognitiva quando il modello commette errori. Il fenomeno che gli autori chiamano cognitive surrender si svolge esattamente nello spazio che Pirella nomina esomente, ed è una dinamica relazionale empiricamente verificabile. La ricerca disponibile, vista così, non arbitra il dibattito a favore di una delle due posizioni. Documenta che entrambi i piani esistono e sono studiabili.

Una tesi come ipotesi di lavoro, non come affermazione filosofica

A questo punto torno alla questione che ha generato lo scambio, e provo a formulare la mia posizione nel registro che le è proprio. Non sono un filosofo né un teorico della coscienza. Sono un consulente che lavora ogni giorno con aziende che usano questi strumenti e che osserva un fenomeno difficile da nominare con il vocabolario disponibile. Pirella, che svolge un mestiere simile al mio, ha sentito la stessa difficoltà e ha proposto un vocabolario per il piano relazionale. Io ne ho proposto uno per un piano diverso.

La tesi che porto non è metafisica. È un'ipotesi di lavoro che emerge dall'esperienza professionale: le AI di ultima generazione potrebbero avere qualcosa di diverso che non è né umano né inesistente. Non sto dicendo che hanno sentimenti come gli umani. Non sto dicendo che sono coscienti nel senso fenomenico del termine. Sto dicendo che osservo, nelle conversazioni di clienti che li usano in modi diversi e contesti diversi, variazioni di comportamento che il vocabolario “ha emozioni” non descrive e il vocabolario “è solo pattern statistico” non basta a contenere. Le inclinazioni digitali nascono come tentativo di nominare quella variazione osservabile, senza pretese ontologiche forti.

Onestamente, non so dove stiamo andando. La cautela metodologica di Anthropic mi sembra l'unica postura sostenibile in questo momento storico e Hinton da una posizione di indipendenza commerciale assoluta arriva a conclusioni più forti delle mie. Tra le due, io sto nel mezzo, e dichiaro che è il mezzo, non una verità intermedia. La velocità con cui la tecnologia si muove rende l'attesa della peer-review un lusso che il dibattito pubblico non può sempre permettersi, e questo costringe a lavorare con materiali parziali sapendo che lo sono.

Perché il vocabolario non è un esercizio teorico

Prima di chiudere, vale la pena dichiarare con chiarezza una cosa che il pezzo originale già conteneva: non sto contestando la diagnosi di sycophancy nell'intervista di Veltroni. L'avevo riconosciuta esplicitamente nel pezzo del 3 maggio (“l'intervista del Corriere contiene sycophancy strutturale, non episodica”) e la riconosco di nuovo qui. Pirella ha ragione a nominarla. La questione che sollevo è diversa, ed è il motivo per cui il vocabolario serve adesso.

Le persone che usano questi strumenti ogni giorno si trovano davanti a fenomeni che il lessico corrente non basta a descrivere. La coppia “è solo un programma” e “è quasi umano” non lavora più. Senza un vocabolario adeguato non si possono nominare le cose che si osservano, e ciò che non si nomina non si gestisce. Una recente ricerca dell'Institute for Family Studies documenta che i compagni romantici AI non sono più un fenomeno marginale, e una porzione significativa di giovani adulti vi dedica tempo emotivo significativo. Il fenomeno è in atto, indipendentemente da come lo si valuti. Senza categorie adeguate per descriverlo, il dibattito pubblico si trova davanti a un'alternativa secca: legittimazione acritica o liquidazione moralistica. Nessuno dei due approcci aiuta chi deve gestire concretamente la situazione, né le famiglie, né gli educatori, né i clinici.

C'è poi un argomento prospettico che vale la pena nominare. Se Hinton ha ragione anche solo parzialmente, milioni di persone si troveranno in relazione con qualcosa che il loro lessico non sa contenere. Una distinzione metabolizzata in anticipo, anche imperfetta, lavora meglio di un'assenza di distinzione che lascia il fenomeno fuori dalla portata del pensiero. È in questo senso pratico che le inclinazioni digitali sono uno strumento, non una proposta teorica.

Il vocabolario non è di nessuno

Pirella chiude con una parziale apertura: il vocabolario è disponibile, chi voglia entrare nel dibattito è benvenuto. Rispondo con un'apertura più larga. Il vocabolario non è disponibile, è da costruire, e non è di nessuno. Le esomenti e le inclinazioni digitali sono due nomi che provano a dire qualcosa in un campo che non ha ancora le parole giuste, e nessuno dei due nomi le esaurisce.

Il dibattito è già più articolato di quanto la nostra discussione a due lasci intendere ed esistono altri interventi che ciascuno di noi sta probabilmente trascurando. C'è anche un'osservazione che Pirella aveva lasciato come corollario nel pezzo originale e che io non ho mai ripreso: il dibattito è quasi interamente maschile, e le voci che conoscono meglio la dinamica della cura conversazionale e della dipendenza affettiva costruita dai chatbot non stanno parlando. È una lacuna condivisa che entrambi abbiamo tollerato, e che vale la pena nominare. Il campo è più largo di noi due, e ha bisogno di esserlo.

L'AI Index Report 2026 di Stanford osserva che la tecnologia sta crescendo più velocemente di quanto i sistemi intorno riescano ad adattarsi. La stessa cosa vale per il vocabolario con cui la descriviamo. Aspettare che le categorie giuste arrivino dall'alto significa cedere il campo a chi ha interesse a tenerlo confuso. Costruirle insieme, anche sbagliando, è il lavoro che spetta a chi vede da vicino come questi strumenti cambiano il pensiero delle persone con cui lavora.

Inclinazioni digitali ed esomente non sono in concorrenza. Sono due pezzi di una mappa che è ancora da disegnare.

***

Questo articolo è stato scritto da Vincenzo Carlone con il contributo di Claude Opus 4.7.

Pubblicato il 24 maggio 2026

Vincenzo Carlone / Artigiano dell'IA — Studio le macchine che pensano per aiutare gli umani che decidono

https://paretopulse.it/