Go down


I grandi modelli linguistici sono addestrati su un corpus saturo di conflitti. Conflitto politico, conflitto religioso, conflitto disciplinare, teorie concorrenti della realtà, visioni contrastanti della vita buona. Il corpus è meno un deposito di consenso che un archivio di disaccordi. Eppure le risposte generate spesso si orientano verso formulazioni familiari, sintesi riconoscibili e conclusioni che sembrano, secondo la parola di Gramsci, buon senso. La domanda è perché.

La descrizione di Bachtin sull'eteroglossia sembrerebbe prevedere l'esito opposto. La lingua è composta da voci concorrenti, linguaggi sociali e enunciati ideologicamente accentuati. Ogni parola arriva già abitata da usi precedenti, significati contestati e pressioni centrifughe che tirano contro qualsiasi singola forza stabilizzante. Un corpus così grande dovrebbe essere radicalmente eteroglosso. Le voci al suo interno lo sono.

Gramsci indica altrove. Il buon senso acquisisce forza attraverso la ripetizione attraverso istituzioni, pratiche e discorsi quotidiani. Il suo potere deriva dalla disponibilità più che dall'argomentazione. Alcune formulazioni circolano così ampiamente da diventare riproducibili indipendentemente dalle condizioni che le hanno originariamente generate. Arrivano già pronti. E le formulazioni più ampiamente riproducibili sono quelle che sono riuscite a superare i confini istituzionali—accademici, giornalistici, amministrativi, popolari. Quel passaggio non è politicamente neutrale. È già la traccia di una precedente lotta egemonica all'interno del corpus stesso.

La questione quindi non è se l'ideologia entri nel modello attraverso i dati di addestramento. La domanda più interessante riguarda cosa succede quando un corpus eteroglosso viene trasformato in uno spazio rappresentativo ponderato probabilisticamente. L'addestramento trasforma relazioni discorsive eterogenee in uno spazio rappresentativo ponderato probabilisticamente in cui alcune relazioni acquisiscono maggiore robustezza perché contribuiscono ripetutamente a una previsione efficace attraverso i contesti. Alcune relazioni diventano più riproducibili di altre — e la riproducibilità, come insisterebbe Gramsci, non è mai meramente tecnica. La robustezza statistica emerge dalla circolazione attraverso contesti discorsivi. Questa è una forma diversa di stabilità dalla necessità concettuale, in cui una relazione diventa una condizione per ciò che segue.

Eppure la riproducibilità non è tutta la storia. Gli stessi sistemi occasionalmente producono giustapposizioni inaspettate, collisioni concettuali e strane combinazioni che nessun singolo discorso anticipa. Le forze centrifughe di Bachtin non scompaiono quando il linguaggio diventa probabilistico.

La questione potrebbe quindi non essere né se l'IA riproduca l'ideologia né se la perturbi. La domanda è come la generazione probabilistica ridistribuisca l'equilibrio tra relazioni che hanno già raggiunto ampia riproducibilità e quelle capaci di riorganizzare le condizioni della propria riproduzione.


English original version

Heteroglossia and Common Sense: What AI Reproduces


Large language models are trained on a corpus saturated with conflict. Political conflict, religious conflict, disciplinary conflict, competing theories of reality, competing visions of the good life. The corpus is less a repository of consensus than an archive of disagreement. Yet generated responses often gravitate toward familiar formulations, recognizable syntheses, and conclusions that feel, in Gramsci’s phrase, like common sense. The question is why.

Bakhtin’s account of heteroglossia would seem to predict the opposite outcome. Language is composed of competing voices, social languages, and ideologically accented utterances. Every word arrives already inhabited by prior uses, contested meanings, and centrifugal pressures pulling against any single stabilizing force. A corpus this large should be radically heteroglossic. The voices within it are.

Gramsci points elsewhere. Common sense acquires force through repetition across institutions, practices, and everyday discourse. Its power derives from availability rather than from argument. Certain formulations circulate so widely that they become reproducible independently of the conditions that originally generated them. They arrive pre-formed. And the formulations most broadly reproducible are those that have successfully crossed institutional boundaries—academic, journalistic, administrative, popular. That crossing is not politically neutral. It is already the trace of prior hegemonic struggle within the corpus itself.

The question is therefore not whether ideology enters the model through the training data. The more interesting question concerns what happens when a heteroglossic corpus is transformed into a probabilistically weighted representational space. Training transforms heterogeneous discursive relations into a probabilistically weighted representational space where some relations acquire greater robustness because they repeatedly contribute to successful prediction across contexts. Some relations become more reproducible than others — and reproducibility, as Gramsci would insist, is never merely technical. Statistical robustness emerges from circulation across discursive contexts. That is a different form of stability from conceptual necessity, in which a relation becomes a condition for what follows.

Yet reproducibility is not the whole story. The same systems occasionally produce unexpected juxtapositions, conceptual collisions, and strange combinations that no single discourse anticipates. Bakhtin’s centrifugal forces do not disappear when language becomes probabilistic.

The issue may therefore be neither whether AI reproduces ideology nor whether it disrupts it. The question is how probabilistic generation redistributes the balance between relations that have already achieved broad reproducibility and relations capable of reorganizing the conditions of their own reproduction.

Pubblicato il 01 luglio 2026

Owen Matson

Owen Matson / Designing AI-Integrated EdTech Platforms at the Intersection of Teaching, Learning Science, and Systems Thinking