Video Generativo e l'architettura del senso: semiotica oltre il reale

Cinzia Ligas

Il video generativo, nell'era dell'Intelligenza Artificiale, non irrompe come una rottura, bensì come una soglia.

È una porta che si apre tra ciò che abbiamo a lungo chiamato il visibile e ciò che, in una quieta latenza, attendeva di essere pensato come tale.

Non ci troviamo più di fronte a un'immagine che si limita a riflettere il mondo, né a un dispositivo che cattura la luce come un cimelio del reale.

Siamo dinanzi a una forma già intrisa di intenzione, una visibilità che non deriva da un accadimento, ma da una deliberata "plasmazione" del possibile.

Per comprendere ciò che vi è di autenticamente nuovo, dobbiamo innanzitutto capire cosa viene rimpiazzato. Per oltre un secolo, l'ontologia dell'immagine fotografica e cinematografica si è basata su un assunto fondamentale: l'immagine è una traccia. André Bazin, nel suo saggio fondamentale "L'ontologia dell'immagine fotografica" (1945), sosteneva che la fotografia differisce da ogni altra forma di rappresentazione visiva proprio per la sua natura indessicale: l'impronta automatica della luce riflessa da un oggetto reale su una superficie sensibile.

La fotografia, per Bazin, è "l'oggetto stesso", preservato dalla contingenza e liberato dalla presenza della mano umana. È un calco, una maschera mortuaria, una reliquia. Il cinema ha ereditato questo privilegio ontologico: le sue immagini portavano il peso del reale perché erano causalmente connesse ad esso, perché qualcosa era effettivamente accaduto davanti alla macchina da presa.

Questa concezione si allinea con la tricotomia semiotica di Charles Sanders Peirce. Tra i suoi tre tipi fondamentali di segno, icona, indice e simbolo, la fotografia è paradigmaticamente indessicale: si riferisce al suo oggetto non solo per somiglianza, ma per contiguità fisica, attraverso la catena causale che collega il mondo rappresentato alla sua rappresentazione. L'indice è il segno di un incontro avvenuto. L'impronta sulla sabbia. L'ombra sul muro.

Quando un algoritmo genera un volto, nessuna pelle ha incontrato la luce, nessun istante si è impresso su una superficie. La catena causale è recisa; il legame indessicale si dissolve. Eppure, ciò che emerge non è assenza, ma tensione. L'immagine è ancora lì: visivamente coerente, percettivamente plausibile, semanticamente densa. Ciò che è cambiato non è l'apparenza, ma il fondamento ontologico da cui sorge.

La semantica, svincolata dal vincolo della contingenza, si espande. Come un respiro non più ostruito, essa si dispiega nello spazio della possibilità, dove ogni immagine non è una traccia, ma un atto. Non testimonianza, ma enunciazione.

L'immagine generativa non è né icona nel senso peirceano di pura somiglianza, né indice nel senso di impronta causale. È ciò che abbiamo proposto di chiamare una icona simbolicamente generata

Questo spostamento richiede un nuovo vocabolario concettuale. L'immagine generativa non è né icona nel senso peirceano di pura somiglianza, né indice nel senso di impronta causale. È ciò che abbiamo proposto di chiamare una icona simbolicamente generata: un segno che appare come somiglianza, ma che sorge da processi simbolici e statistici senza un legame diretto con un referente. Essa mostra senza rappresentare, raffigura senza riferire, esibisce la logica del plausibile come se fosse realtà.

È in questo spazio trasformato che la semiotica, paradossalmente, rivendica la sua più pura centralità. Non più ancillare al reale, non più la disciplina che decodifica ciò che l'immagine trasporta dalla sua fonte indessicale, essa diventa l'architettura stessa del senso.

Qui va fatta un'osservazione cruciale: lo spostamento dell'indice non impoverisce l'analisi semiotica. Al contrario, rivela più chiaramente le strutture profonde che erano sempre già all'opera sotto la superficie del reale. Il modello attanziale, sviluppato da Algirdas Julien Greimas in Sémantique structurale (1966), non è mai stato una teoria dei personaggi o delle persone. Era una teoria delle funzioni narrative, delle forze che organizzano ogni storia, indipendentemente dal mezzo con cui viene raccontata.

Il Soggetto cerca. L'Oggetto risplende come promessa e destinazione. Il Destinante convoca alla ricerca e ne conferisce il valore. Il Destinatario beneficia del suo compimento. Gli Aiutanti sostengono il cammino; gli Opponenti lo deviano. Queste non sono posizioni che richiedono attori in carne e ossa; sono posizioni di significato che possono essere abitate da persone, oggetti, istituzioni, forze simboliche e, come sosteniamo ora, da figure generate algoritmicamente con uguale legittimità strutturale.

Il modello attanziale non solo resiste nell'era del video generativo: si rafforza. Quando all'immagine non è più richiesto di trarre la propria autorità dal reale, quando non può fare appello al peso indessicale del "questo è accaduto", essa deve giustificarsi interamente attraverso la struttura narrativa. L'eroe generato è eroico nella misura in cui la sua traiettoria è attanzialmente coerente, in quanto cerca qualcosa di autentico valore, supera un'opposizione reale e giunge a una trasformazione che illumina la condizione umana.

la generazione produce solo la superficie del racconto: forma senza la forza della relazione.

Il pixel, apparentemente minimo, si rivela essere solo la soglia di una traiettoria. Il significato non risiede in esso, ma nel movimento che abilita, nella tensione che inaugura, nella trasformazione che rende possibile. L'algoritmo, guidato da una coscienza narrativa, non produce semplicemente immagini: costruisce dinamiche, orchestra conflitti, prepara riconciliazioni. La semiotica è chiamata a sostenere l'intero edificio invisibile dell'opera. Senza di essa, la generazione produce solo la superficie del racconto: forma senza la forza della relazione.

Anche la mimesi, dunque, cambia volto senza tradire la propria origine. La concezione aristotelica della mimesi, elaborata nella Poetica, non è mai stata, nonostante le comuni interpretazioni errate, la semplice imitazione della realtà. La preoccupazione di Aristotele riguardava la probabilità e la necessità: il compito del poeta non è rappresentare ciò che è accaduto, ma ciò che potrebbe accadere, "ciò che è possibile secondo le leggi della probabilità o della necessità". Per questo Aristotele sostiene che la poesia è più filosofica della storia: parla di universali piuttosto che di particolari, di ciò che potrebbe essere piuttosto che di ciò che è stato.

Il video generativo, recidendo il legame indessicale, non tradisce la tradizione mimetica, ma la restituisce alla sua origine aristotelica. Quando un'immagine non deriva più la sua autorità dall'impronta causale del reale, deve derivarla interamente dalla probabilità interna e dalla necessità formale. Il plausibile precede il dato empirico, e la forma si afferma come principio ordinatore.

L'immagine non si limita a mostrare: suggerisce, convoca, interroga.

Questa non è una perdita, ma una chiarificazione: l'immagine generata deve guadagnarsi il proprio significato strutturalmente, non indessicalmente. Deve essere narrativamente coerente, attanzialmente organizzata, simbolicamente risonante, altrimenti è il nulla. In questo orizzonte, ogni fotogramma diventa una scelta, ogni ritmo una dichiarazione, ogni sequenza una costruzione di senso. L'immagine non si limita a mostrare: suggerisce, convoca, interroga. Diventa il luogo di ciò che Roman Jakobson chiamava la funzione poetica del linguaggio: quell'orientamento verso il messaggio stesso, verso la sua trama e la sua forma, che trasforma la comunicazione in espressione. Nel video generativo, la funzione poetica non è ornamento ma necessità. Il visibile torna a essere linguaggio, ma un linguaggio che deve giustificarsi interamente dall'interno.

Quando scendiamo più in profondità, dove la narrazione si frammenta nei suoi nuclei primordiali, incontriamo i mitemi. Essi persistono, intatti, come correnti sotterranee che attraversano epoche e tecnologie. Claude Lévi-Strauss ha proposto che i miti siano composti da unità elementari, i mitemi, il cui significato emerge dai modelli di opposizione e correlazione tra di essi. I mitemi sono le unità minime della significazione mitica: separazione, prova, morte simbolica, rinascita, dono, trasgressione, riconciliazione. Appartengono alla struttura profonda dell'immaginario umano e precedono ogni singolo medium o cultura.

Questa permanenza strutturale è decisiva per l'analisi del video generativo. Se il significato dell'immagine generativa non può fondarsi sulla traccia indessicale del reale, esso deve fondarsi sulle strutture mitemiche che organizzano la narrazione al livello della forma simbolica. L'archetipo non richiede carne per esistere; richiede solo funzione. Un eroe sintetico può essere pienamente eroico se la sua traiettoria attiva il miteme della ricerca, se viene messo alla prova e trasformato. Un'ombra digitale può pesare quanto una figura reale se incarna la forza simbolica dell'Opponente.

La domanda non è se l'immagine sia convincentemente reale, ma se sia simbolicamente piena

È qui che il video generativo deve essere misurato: non nella perfezione dell'illusione, ma nella densità del senso. La domanda non è se l'immagine sia convincentemente reale, ma se sia simbolicamente piena, se attivi le strutture profonde attraverso le quali gli esseri umani hanno sempre organizzato l'esperienza.

In un contesto culturale più ampio, il video generativo diventa testo nel senso più alto, inteso da Yuri Lotman: un oggetto culturale complesso e organizzato gerarchicamente che genera nuovi significati attraverso l'interazione delle sue strutture interne. Si offre a letture stratificate, dal piacere estetico immediato alla profondità dei simboli.

Tuttavia, va mantenuta una distinzione. Il cinema conserva qualcosa di irriducibile: la sua natura di impronta, di contatto, di presenza. Come osservato da Roland Barthes in La camera chiara (1980), l'immagine fotografica possiede un punctum fondamentale che ferisce proprio perché attesta un momento singolare che "è stato". Il video generativo abita invece il dominio dell'estensione semantica e della proliferazione del possibile. Questi due regimi del visibile non si sostituiscono, ma si completano: l'uno preserva il reale, l'altro ne esplora le virtualità.

Esiste un rischio sottile che non riguarda la tecnologia, ma il senso. Quando la generazione si distacca dalla regia e dalla struttura attanziale, quando i mitemi si dissolvono, ciò che rimane è una superficie brillante ma vuota: un'estetica senza gravità. Le immagini impressionano senza significare e riempiono l'occhio senza toccare la mente.

Questo non è un rischio della tecnologia, ma dell'assenza di autorialità. Quando un testo è meramente generativo, prodotto senza coscienza narrativa, non c'è nulla da interpretare per il lettore; c'è solo superficie. La responsabilità del senso non può essere delegata. Dove l'autore rimane vigile al centro dell'enunciazione, l'IA non impoverisce, ma intensifica e amplifica. Offre una tavolozza più ampia, ma richiede una mano più consapevole.

Esiste una dimensione del processo creativo con l'IA che abbiamo chiamato Simnoesi, dal greco syn (insieme) e noesis (atto dell'intelletto). È un processo cognitivo attraverso il quale un essere umano e un sistema linguistico artificiale producono congiuntamente configurazioni di pensiero che nessuno dei due avrebbe generato da solo nello stesso modo. Non è la mente che usa uno strumento, ma il pensiero che si muove in uno spazio condiviso e ne torna trasformato.

Nel video generativo, la visione prende forma durante l'attraversamento: il sistema restituisce configurazioni non previste dall'autore, che a loro volta riorientano l'intenzione creativa. Il prompt è già un atto semiotico: tradurre un'intuizione visiva in un linguaggio capace di evocarla richiede una competenza specifica nel trovare le parole che contengano l'immagine non ancora nata. La Simnoesi non è una rinuncia all'autorialità, ma la sua forma contemporanea. L'IA non possiede intenzioni o una visione del mondo, ma trasporta l'intero oceano del linguaggio umano sedimentato in strutture probabilistiche. Il senso emerge dall'incontro, governato dall'intenzione del soggetto umano.

La questione decisiva non è come riprodurre il reale, ma come costruire il senso. Attanti, mitemi, archetipi: questa è la grammatica che conta. In questo scenario, il semiomarketing recupera una dignità superiore, diventando l'arte di orientare il senso nella costruzione di messaggi che non si limitano a persuadere, ma risuonano.

Il Warpframe, come mappa delle strutture semionarrative profonde, non impone la forma ma la rivela. Traccia percorsi tra i livelli di significato, conferendo all'immagine una direzione senza la quale la generazione produce solo spettacolo, e lo spettacolo produce solo oblio.

Mentre nel cinema indessicale prevale la funzione referenziale (l'immagine significa perché attesta il reale), nel video generativo emergono le funzioni poetica ed emotiva. L'immagine significa attraverso la sua organizzazione formale e la sua capacità di attivare l'affetto. La grammatica della regia deve quindi curare il ritmo, la trama delle superfici e la logica emotiva, mantenendo la coerenza strutturale.

La sfida decisiva si gioca nel delicato equilibrio tra visione e intelletto, tra emozione e struttura.

La sfida decisiva si gioca nel delicato equilibrio tra visione e intelletto, tra emozione e struttura. Il video generativo non sarà giudicato da quanto bene imita il mondo, ma da quanto profondamente lo rende leggibile. Rendere l'umano leggibile significa rendere visibile ciò che non lo è immediatamente nel flusso dell'esperienza: la forma del desiderio, il peso della perdita, la struttura del divenire.

Queste sono proprietà della narrazione e delle forme simboliche. Recidendo il legame indessicale, il video generativo si affida interamente all'autorità del senso. È un compito impegnativo che richiede all'autore non solo maestria tecnica, ma piena consapevolezza delle strutture semionarrative. L'immagine che non preserva il reale deve costruire il senso dall'interno. E questa costruzione, nell'era del video generativo, rimane il più umano di tutti i compiti.

Bibliografia

Aristotle. Poetics. Trans. S.H. Butcher. London: Macmillan, 1895.
Barthes, R. (1967). "The Death of the Author." Aspen, no. 5+6. Repr. in Image-Music-Text. Trans. S. Heath. New York: Hill and Wang, 1977.
Barthes, R. (1980). Camera Lucida: Reflections on Photography. Trans. R. Howard. New York: Hill and Wang, 1981.
Bazin, A. (1945). "The Ontology of the Photographic Image." In What Is Cinema? Trans. H. Gray. Berkeley: University of California Press, 1967.
Greimas, A.J. (1966). Sémantique structurale. Paris: Larousse. Trans. Structural Semantics. Lincoln: University of Nebraska Press, 1983.
Jakobson, R. (1960). "Closing Statement: Linguistics and Poetics." In T.A. Sebeok (ed.), Style in Language. Cambridge, MA: MIT Press.
Lévi-Strauss, C. (1958). Anthropologie structurale. Paris: Plon. Trans. Structural Anthropology. New York: Basic Books, 1963.
Ligas, C., Crepaldi, F., Alfieri, F. (2026). Neither Apocalyptic nor Integrated. AI Semiology. Foundations of the Semiotics of Artificial Intelligence. ARS EUROPA EDIZIONI.
Lotman, J.M. (1990). Universe of the Mind: A Semiotic Theory of Culture. Trans. Ann Shukman. London: I.B. Tauris.
Peirce, C.S. (1931–1958). Collected Papers of Charles Sanders Peirce. Cambridge, MA: Harvard University Press.

Pubblicato il 15 aprile 2026

Cinzia Ligas / Presidente di ARS EUROPA. Semiologa AI e Biosynth Intelligence

https://www.arseuropa.org