Go down

Un breve racconto pre natalizio nato da una riflessione sul tema della trasparenza dei dati di addestramento dei LLM commerciali. Come si sa, oggi come oggi, nessuno sa con esattezza che dati abbiano usato OpenAi per addestrare ChatGPT, Anthropic per Claude, Google per Gemini. Che importa, si dirà. Importa, importa. Quei dati, la loro composizione, culturale, linguistica, epidemica, condizionano il modo in cui i LLM ci parlano, rispondono, costruiscono "opinione" spacciandola per conoscenza.
Conoscere la composizione dei dati di addestramento è quindi questione di democrazia.

Buona lettura.


Nel 2023 arriva sul mercato europeo QuantumSnack, un biscotto rivoluzionario prodotto da una multinazionale californiana. Il prodotto spopola: costa poco, è disponibile ovunque, ha un sapore che sembra "capire" esattamente cosa desideri in quel momento. Le aziende lo inseriscono nelle mense, gli ospedali lo offrono ai pazienti, le scuole lo mettono nelle macchinette.

Sull'etichetta c'è scritto: "Contiene ingredienti alimentari provenienti da fonti pubbliche e fornitori terzi selezionati. Processo produttivo brevettato."

Maria lavora in una grande azienda e deve scegliere gli snack per la mensa. Vuole essere sicura che non ci siano allergeni nascosti, tracce di arachidi, glutine o lattosio non dichiarati. Chiede al fornitore la lista completa degli ingredienti. Risposta: "Segreto industriale. Se riveliamo la ricetta esatta, i concorrenti ci copiano. Fidatevi: abbiamo i migliori data scientist del settore che hanno ottimizzato ogni componente."

Il medico dell'ospedale pediatrico nota che alcuni bambini hanno reazioni anomale dopo aver mangiato QuantumSnack. Vuole sapere se contiene derivati del latte, tracce di soia o coloranti specifici. Stessa risposta: "Non possiamo rivelare i dettagli. Il nostro processo trasforma gli ingredienti base in modo così sofisticato che il prodotto finale non 'contiene' più gli originali, ma solo pattern nutrizionali ottimizzati."

Nell'agosto 2025 entra in vigore una nuova normativa europea: tutti i prodotti alimentari industriali devono pubblicare un "riassunto sufficientemente dettagliato" degli ingredienti entro agosto 2027. I produttori possono continuare a vendere con l'etichetta vaga per altri due anni.

Nel frattempo le mense aziendali devono fare "valutazioni di rischio nutrizionale" senza sapere cosa c'è dentro, gli ospedali devono garantire la sicurezza dei pazienti allergici senza accesso alla composizione, le scuole devono rispettare policy dietetiche (no carne di maiale, no latticini per intolleranti) ma non sanno se QuantumSnack le rispetta.

Ad agosto 2027 arriva finalmente il nuovo riassunto obbligatorio di QuantumSnack:

"Ingredienti: derivati da cereali (varie specie), grassi vegetali e animali (fonti multiple), proteine (origine vegetale e animale), zuccheri e dolcificanti (naturali e sintetici), additivi conformi a normativa UE. Processo: raccolta materie prime da fornitori globali, trasformazione mediante tecnologia proprietaria brevettata, ottimizzazione nutrizionale tramite algoritmi predittivi."

Come prima, ma con più parole.

Il bambino allergico continua a non sapere se può mangiare quel biscotto. L'azienda continua a non poter verificare se rispetta le sue policy etiche. Il medico continua a non poter correlare le reazioni ai componenti specifici.

E QuantumSnack continua a essere il prodotto più venduto del mercato, perché funziona benissimo. Almeno finché non serve sapere perché, o per chi non funziona affatto.

Pubblicato il 06 dicembre 2025

Martino Pirella

Martino Pirella / Consulente e formatore AI