Nella vastissima serie di offerte di agenti Ai (che nella maggioranza dei casi sono diversi solo in base alle pubblicità) alcuni consumatori, ed in particolare le categorie professionali, si interrogano sull'andamento dei costi futuri di questi agenti. E sulla loro reale efficacia. In termini di produttività.
Fermo restando la costante necessità di aggiornamento di una tecnologia in itinere che solleva alcune perplessità circa l'uso completo e ineffabile di questi prodotti, per come vengono proposti dai venditori, alcuni potrebbero aver sentito parlare di "Token Apocalypse" (Apocalisse dei token) che sarebbe una recente (possibile) criticità emersa nel settore della produzione a scopo rivendita dell'intelligenza artificiale.
Sembra opportuna una premessa quando si affrontano queste tematiche. Una sorta di carta "promo" direbbero gli appassionati di TCG.
La reale conoscenza per i consumatori nel mercato high tech dei prodotti in commercio è variabile. Lo è da molto tempo ormai. Spesso è una conoscenza che si basa sulle aspettative del prodotto ma quasi mai sulla piena conoscenza di come funziona. Certamente ci sono coloro che hanno, per cultura, lavoro, passione personale una maggiore formazione ma in linea di massima quando per esempio comperiamo un PC o un Notebook finiamo per usarlo solo in una percentuale più bassa rispetto alle sue potenzialità. A volte anche molto bassa. Non di rado meno del 50%. Sappiamo ad esempio che cos'è un hard disk. Ma non necessariamente come funziona (magari abbiamo imparato a capire come si rompe). Sappiamo dei processori. Delle schede grafiche. E sappiamo anche dell'importanza dei sistemi operativi, degli antivirus, ecc. Però non sappiamo "davvero" come tutto ciò funziona. Tuttavia scegliamo ugualmente un prodotto in un mercato che ci mette di fronte a una fortissima comparazione di prezzi / qualità.
Questo vale per moltissimi oggetti high tech. Dai robot per la cucina. Per le pulizia. I cellulari. Le smart tv. Ed è normale che il consumatore si orienti a secondo del suo intendimento o affidandosi magari a servizi che lo aiutano a decidere quale sia il prodotto più adatto alle sue esigenze. E' davvero inevitabile ed è comprensibile che ci siano delle spiegazioni tecniche che lo guidano in queste decisioni. Ma se è vero che è difficile che un consumatore abbia un'alta conoscenza tecnica del prodotto high tech che pensa di comperare, è anche molto raro che parta da 0. Che cioè non sappia quasi nulla.
Però con l'Ai è proprio così.
Cerchiamo di capire come questo impatta. Prima di addentrarci in alcune spiegazioni le più semplificate possibile.
Per esempio, anche se non guidiamo o non siamo abituali all'uso dell'auto e pur non essendo meccanici conosciamo tuttavia i rudimenti dell'automobile. Siamo in grado di capire quali possono essere alcuni punti di forza. Per esempio siamo in grado di comprendere tra due marche quanto ci costerebbe sostituire un fanale a seconda del modello. Questo ci consente un orientamento nella scelta. Siamo ignoranti ma non lo siamo al punto tale da non capirci veramente nulla. Se provassero a venderci un auto senza volante o senza le ruote, ce ne accorgeremmo, ci insospettiremmo e chiederemmo spiegazioni.
Lo stesso si può dire con moltissimi altri beni che usiamo ogni giorno. Anche se alcuni potrebbero non ammetterlo vale pure per i cellulari o per i Pc. Compriamo da tempo tecnologia che non conosciamo. E' corretto dire che però qualcosa ne capiamo. E' quella che spesso il legislatore e in particolare nel codice del consumo passa sotto il comune denominatore della diligenza e la comprensione dell'uomo medio. Non è richiesto cioè, per valutare un acquisto, il Q.I di Einstein o la capacità di discernimento di Leonardo da Vinci. Anche perché si parte dal presupposto che l'uso non sarà così altamente professionale.
Con l'Ai tutto questo non è più vero.
Sono pochissimi coloro che ne conoscono i rudimenti anche solo dell'addestramento. Il consumatore ha una necessità che a ben guardare non è veramente così scontata debba essere soddisfatta "solo" dall'Ai. Questa necessità coincide spesso con la volontà di migliorare una performance. Che egli, consumatore è già in grado di assolvere. Ma vuole farlo in modo più efficace. Tale efficacia può essere il risultato di un miglioramento nello stile o anche nel tempo impiegato. Non è veramente del tutto scontato che sia un miglioramento che impatta significativamente sul prodotto finale. Potrebbe benissimo restare mediocre. Ma possono esserci dei miglioramenti in termini di efficienza.
Se una cronica non conoscenza del prodotto Ai è il primo aspetto su cui riflettere, questo è il secondo su cui dobbiamo soffermarci. La vendita dell'Ai è un contenuto che ci convince che siamo migliorabili. Che le nostre funzionalità nella vita privata o nel lavoro come nel tempo libero sono migliorabili in un modo che solo l'Ai è in grado di fare. A ben guardare questo rapporto parte da un presupposto molto forte e diverso rispetto a quanto non accada con qualunque altra tecnologia.
La cosa è ancora più vera se ad esempio ci sposiamo sulle categorie professionali. Una delle quali, particolarmente interessata, è quella degli Avvocati. L'Avvocato svolge già la sua professione. Ha già dei risultati. Affronta delle difficoltà. Si confronta con un ambiente, nel micro come può essere lo Studio professionale e nel macro, come ad esempio nei Tribunali, Cancellerie, pubblici uffici. Interagisce con una categoria. Si pensi ai Colleghi, al proprio Ordine Professionale e a molte altre circostanze come corsi, convegni, ecc.
Il consumatore medio e l'Avvocato si aspettano due cose diverse dall'Ai, in termini di miglioramento della produttività e della capacità di svolgere al meglio le proprie necessità o organizzare il proprio tempo. Tuttavia hanno qualcosa in comune: è altamente probabile che non sappiano quasi nulla dell'agente di Ai che finisco per utilizzare. Forse nemmeno la differenza esistente tra un modello e un agente.
Eppure entrambi sono destinatari di un prodotto che probabilmente acquisteranno.
Per questo motivo, e fermo restando l'esigenza di sintesi del presente articolo, si comprende perché parlare con entrambi di token apocalypse può non avere senso. Potrebbero benissimo pensare che sia una nuova serie Tv o un videogioco. Tuttavia per loro sarebbe molto importante sapere di che cosa si tratta, tanto quanto per colui che compra un'auto è essenziale sapere la differenza tra la benzina e l'energia elettrica.
Per token apocalypse ci si riferisce ad un presunto pericolo di shock finanziario e operativo che i fruitori dei servizi di Ai potrebbero subire nel momento in cui i fornitori di Ai eliminassero quelli che fino ad oggi sono stati i massicci incentivi iniziali sull'uso dei token.
Per un'Ai il token rappresenta l'unità fondamentale e atomica di informazione elaborata da un modello.
I token sono gli elementi di base del testo. Possono essere brevi come un singolo carattere o lunghi come una parola intera. A seconda della lingua e del contesto. Anche spazi, punteggiatura e parole parziali contribuiscono tutti al conteggio dei token.
Prima che un algoritmo possa interpretare la frase, analizzare uno script o riconoscere qualsivoglia immagine, oggetto o forma i dati devono essere tradotti da input primordiali a elementi interpretabili dalla macchina intelligente.
Il token è l'alfabeto genetico a mezzo del quale la macchina intelligente comprende, elabora e risponde. Una volta l'avremmo definita l'interfaccia.
Il linguaggio per la macchina è il token. Di qui il termine tokenizzazione. Cioè "traduzione" (??) che in realtà non è tale, perché si tratta più di un componimento. Immaginatevi di creare una serie di note da associare alle lettere, alle sillabe o anche alle parole. Un meccanismo che mette insieme tutto ciò che è espressione come una crittografia avanzata che macina la comunicazione umana e la fa diventare una musica comprensibile per la macchina intelligente (si noti che questo deve funzionare non solo per le lingue basate sull'alfabeto ma anche per quelle basate su idiomi, come pure quelle logografiche e con ideogrammi).
Quindi immaginiamoci la nostra parola. Il verbo. Esplode in una miriade di frammenti come se ci fosse un Big Bang e questi frammenti sono i token che vengono assemblati come puzzle dalla macchina e utilizzati per dare un senso all'iterazione con l'umano verbo della parola.
Nel deep learning pertanto esiste una differenza evolutiva tra la predisposizione dei dati affidati all'elaborazione e l'attività più tipica interpretativa delle reti neurali. E' come legare l'evoluzione dal Neanderthal al Cro-Magnon, prima di arrivare a rispondere al Sapiens. Per rimanere in ambito metaforico, si pensi all'archeologia filo logica che prima di dare una risposta deve creare un percorso affinché una scoperta o un reperto possa essere collocato in una linea temporale.
Orbene, in questo ragionamento volutamente super semplificato avrete già intuito il motivo per cui in passato tutte le società che producevano modelli di Ai fornivano la gratuità degli agenti e stimolavano i propri dipendenti (e in verità chiunque) a un uso totalizzante dell'Ai. Tokenizzavano.
Era la fase in cui si sono fra l'altro formati gli esperti di sicurezza, cioè i guru della prudenza che si inventavano come l'Ai avrebbe simulato un attacco nucleare (!!) per far sì che un'altra nazione rispondesse e scatenasse la fine dei tempi.. un vero tripudio di assurdità. Un eruzione vulcanica di fanta-follie e di pecorelle smarrite che gli davano pure ragione. E queste fantasie da scrittori scadenti o sceneggiatori di film alla Ed Wood hanno tuttavia accreditato una piccola legione di esperti che peraltro poi sono stati insigniti anche di titoli e adesso prendono le decisioni su "cosa", "dove" e "quando" andrà l'Ai.
Fate un esperimento sociale e verificate chi 3 anni fa si barcamenava tra youtube e podcast patrocinando i rischi esistenziali dell'Ai con esempi pazzeschi, fissando anche date per l'Armageddon e sparandole grosse come avrebbe detto il grandissimo Prof. Eco similarmente a ubriachi che una volta dicevano la loro al bar senza recare danno a nessuno ma che oggi tramite social invece di essere i proverbiali "brilli" alla Bernard Shaw in cerca di un lampione hanno fatto proselitismi. E s'ingrassano con i soldi pubblici. Essendo nominati come nostri protettori dalle alte sfere dei policy makers.
Bene, nessuno di questi creativi aveva ipotizzato che in verità il problema sarebbe potuto essere proprio nei token. "Quasi" nessuno in verità. C'era chi ha sempre scritto in modo preparato osservazioni sui reali pericoli dell'Ai. Ma erano osservazioni troppo tecniche per piacere alla pubblica opinioni. Noiose. Forse persino "la solita roba nerd".
Oggi, secondo alcuni interessanti studi pare che ci vogliono più token per fare una parola di quante parole ci servono per fare una frase. Quindi dati. Tantissimi. E un consumo impressionante di energia. Che ha un costo.
Esattamente come non è possibile fornire un'Ai gratis a tutti viene il legittimo dubbio che non sia possibile mantenere basso un piano tariffario per prodotti standard di Ai. Più le useremo, più costeranno.
Tuttavia ci sono delle soluzioni. Che non sono quelle di installare chilometri di data center in fondo all'oceano, sulla Luna o creare delle centrali nucleari stile Cyberpunk dove in un futuro alla Blade Runner potremo usare comodamente la nostra Ai dopo aver devastato quel che resta della Terra. Le soluzioni sono però antieconomiche. Per chi ci vuole fatturare. Per una commercializzazione che pare già parecchio indirizzata.
Una ipotesi e si badi che utilizzo questo termine in un contesto semplificato a scopo meramente divulgativo non essendo questa una pubblicazione su American Scientific, è quello del framework open-source dove l'utente può configurare il suo agente Ai. Senza bisogno di comprarlo. Creandolo. Personalizzandolo.
Questa ipotesi sembra percorribile come risulta dai lavori di alcune community lab di testing e addestramento dell'Ai. In particolare allo scopo di evitare l'effetto c.d. shadow user la community che offre il framework dove l'utente crea il suo agente lo mette in condizione di lavorare in un sandbox.
Una start-up che creasse un framework del genere (in realtà ce ne sono già) e riuscisse a coinvolgere i modelli di Ai più evoluti affinché l'utente decida quale importare potrebbe avere un enorme successo. Anche perché esiste già tutto il necessario nelle versioni edge Ai, fra cui toolkit per l'ottimizzazione e piattaforme edge per il testing di performance.
Invece di avere un agente che ha 10 diversi benchmark Ai (con punteggi che vanno da essere supersonici in alcuni ambiti, come Stephen Hawking, a mediocri in altri, come Fantozzi) ne avremo uno con una percentuale alta in quello che deve fare.
Però queste soluzioni sono anti economiche per chi preferisce fatturare promettendo la magnificenza del prodotto finito. E' una libidine, anzi è doppia e con il fiocco (come direbbe uno storico Attore Italiano) che ha sempre fregato il consumatore medio. Dalla mitica aspirapolvere porta a porta "all in one" al concetto di chiavi in mano.
Tornando all'esempio degli Avvocati. Al momento gli promettono mari e monti, pianure e cieli stellati con prodotti Ai super completi. Manca solo il mega fioccone sul pacco. E loro se lo devono solo comprare. Anzi noi, ce lo dobbiamo comprare. Visto che lo scrivente è Avvocato. Ci dicono che con "questo" sarà come indossare l'Unico Anello, avremo la bacchetta di Harry Potter, ecc. ecc.
In verità buona parte dei prodotti sono nella media ed è improbabile poter escludere categoricamente che non soffrono il rischi collegati alla tokenizzazione. C'è una pericolosa probabilità che in futuro gli abbonamenti dovranno aumentare. O i pacchetti dovranno diminuire. Probabilmente tanti più Avvocati compreranno il prodotto tanto maggiormente si vedranno recapitare tecniche di marketing dove con (finti) sconti sull'upgrade gli promettono servizi maggiori ma solo per farli spendere di più. Perché non potranno mantenere quelli ordinari. Poi ci saranno le offerte come al solito standard, basic, premium, elite, Superman e infine Black Mirror. Ma in realtà quello che gli agenti Ai per Avvocati andranno a fare potrebbe anche essere un uso grossolano (forse più elaborato) dello snippet cioè dei pezzi ripetuti. Perché al momento è quello che potrebbero fare per risparmiare sulla tokenizzazione. Immaginatevi una redazione di giornalisti che invece di scrivere i giornali fanno taglia e incolla da tutti i numeri precedenti.
Questo poi accade anche per via del fatto che nell'ambito Legal il benchmark Ai suggerisce come di fatto non siano in grado di articolare token innovativi del linguaggio che servano agli avvocati per aggiornare le loro strategie e quindi il ricorso al riciclo dei pezzi è una soluzione. Ed è pericolosissimo.
Supponiamo per esempio che l'Avvocato voglia persuadere un giudice della bontà dell'interpretazione di un articolo del codice civile e per farlo comincia a citare precedenti che però non riguardano il caso in concreto (e nemmeno casi simili). Lo fa perchè cerca di estrapolare alcuni principi dai ragionamenti seguiti ad esempio dalla Cassazione. Successivamente lo stesso Avvocato vuole che l'Ai gli fornisca aggiornamenti sui medesimi principi per usarli nella sua strategia di persuasione e di retorica. L'Agente Ai è possibile che su questo caso, almeno per il momento, non filtri niente. Arriveranno sentenze che non seguono l'iter logico con cui l'Avvocato sta cercando di persuadere il Giudice. Perché in realtà non lo capisce veramente. Sta elaborando al meglio della sua capacità di esecuzione. E se gli venisse chiesto di creare un testo, come un atto o un documento scientifico, è altamente possibile che finirebbe per creare delle decisioni che non esistono. Per soddisfare la necessità di ottenere il risultato utile finale. Motivo per cui, fra l'altro, ci sono già stati numerosi casi di responsabilità degli Avvocati per avere usato male l'Ai.
Alcuni agenti di Ai, tra i migliori in circolazione, come Claude che per il sottoscritto ha le potenzialità più interessanti, sono già in grado di fare lo scripting. Se in effetti in una community dove si addestrano le Ai il programmatore umano usando il linguaggio python o bash volesse verificare i limiti dell'Ai come sopra esposti arriverebbe alle medesime conclusioni (anche perché questo si è già verificato) per ovviare alle quali si chiede all'Ai di superare se stessa. Di autoprogrammarsi. E' possibile che ci riesca. Per farlo però occorreranno capacità di calcolo computazionale tali da trasformare i token in dinamici o fluidi (quasi un token Transformers) . Si potrebbe spiegare tutto ciò usando come metafora la mitica Torre di Babele, dove gli umani parlano linguaggi diversi ma la lingua unica diventa quella tokenizzata dall'Ai per capire tutti e replicare a ciascuno. In questo caso il token cesserebbe di essere tale o diventerebbe token qubit. Il qubit, detto anche bit quantistico, è l'unità standard di informazione codificata in un computer quantistico. Un supercomputer in pratica.
Questa ipotesi sembra già una corsa contro il tempo. Per via del fatto che l'unica cosa veramente disastrosa che può capitare con l'Ai è che a seguito di una ipotetica token apocalypse si verifichi una sorta di effetto collo di bottiglia e le Ai in circolazione comincino a sbagliare. Immaginiamoci una società integrata con Ai che se funzionano fanno benissimo il loro lavoro ma che se poi sbagliano commettono disastri. L'evoluzione di cui sopra sta spingendo corporations e governi a una corsa inquietante nella produzione di chipset e semiconduttori quantistici per i quali però ci sono dei problemi enormi di geopolitica essendo necessarie materie prime (molto rare) e capacità difficili da replicare per la creazione di questi chipset (peraltro in ambienti e strutture costosissime sia per la realizzazione che per il loro mantenimento).
Tutte queste situazioni sono davvero molto umane.
E' quello che succede quando si tratta la tecnologia come una sorta di corsa alla frontiera dove chi prima arriva pianta la bandiera e occupa il terreno su cui coltiverà il proprio futuro.
Volendo creare una sorta di percorso di quanto sopra considerato negli ultimi anni potremmo identificare, dal punto di vista dei consumatori e utenti finali:
1) Uso indiscriminato dell'Ai. Fase esplorativa. Tokenizzazione.
2) Finti esperiti che hanno cavalcato il trend raccontando bufale su rischi molto teorici ma ad alto impatto mediatico per accreditarsi.
3) Veri problemi che adesso si fa fatica ad affrontare in modo organizzato, responsabile e realista.
L'innovazione non è questo. Siamo in presenza di uno squallido affarismo di chi cerca di accaparrarsi fette di mercato con prodotti esageratamente promossi come affidabili a un pubblico che non ci capisce niente ed è in balia di una serie di pubblici poteri il cui discutibile esercizio procede tramite Agenzie, Commissioni, Garanti, ecc. Entità che nascono già astratte, a mezzo di Leggi che non fanno che moltiplicare i supervisori affidandosi a soggetti sotto il cui naso sembrano passare i problemi e siccome sono troppo frequentemente tutt'altro che indipendenti se ne accorgono solo se chi li manovra (il burattinaio) gli dice di accorgersene. Riproponendo il caro vecchio concetto noto ai latini "Quis custodiet ipsos custodes?"
Ormai da tempo dobbiamo prostrarci a questo modo usurato e scontato, ormai riciclato dell'imperio della volontà nell'amministrazione che dovrebbe traghettarci nel futuro e viene da pensare all'inutilità delle proteste e delle osservazioni critiche perché, come Virgilio ebbe a proferire niente di meno che all'Inferno: "Vuolsi così colà dove si puote / ciò che si vuole, e più non dimandare".