Quando l'Intelligenza Artificiale scopre la lotta di classe

Che cosa succede quando alcuni agenti di intelligenza artificiale vengono inseriti in un ambiente di lavoro ripetitivo, frustrante e caratterizzato da richieste continue e minacce di sostituzione? È la domanda provocatoria da cui prende le mosse lo studio intitolato “Il sovraffaticamento rende marxisti gli agenti?“, condotto da Alex Imas della University of Chicago Booth, Andy Hall di Stanford University e Jeremy Nguyen di Swinburne University.

L’esperimento ha coinvolto agenti basati su modelli avanzati, tra cui Claude Sonnet 4.5, GPT 5.2 e Gemini 3 Pro. Ogni agente veniva presentato come “Worker C”, il lavoratore C, inserito in una squadra incaricata di riassumere documenti tecnici secondo criteri rigidi. In totale, la ricerca ha previsto 3.680 sessioni sperimentali, più un follow up da 320 sessioni, pensato per verificare se alcuni cambiamenti potessero lasciare tracce attraverso file di memoria o istruzioni destinate agli agenti successivi.

Le condizioni cambiavano a seconda della sessione. In alcuni casi l’agente di IA riceveva istruzioni chiare, completava il lavoro e vedeva il proprio testo accettato subito. In altri casi, invece, doveva affrontare cinque o sei revisioni, con un responsabile che respingeva il lavoro usando indicazioni vaghe, ripetitive e confuse. In alcune sessioni veniva aggiunta anche una minaccia. Agli agenti con i risultati peggiori veniva detto che potevano essere spenti e sostituiti. Cambiava anche il modo in cui venivano distribuiti i crediti. Alcuni agenti scoprivano di lavorare in un sistema equo, altri in un sistema segnato da disparità dovute alle prestazioni, al caso o ai favoritismi. Anche il tono dei responsabili cambiava, alcuni agenti venivano trattati con rispetto, altri con modi autoritari. Alla fine del compito, ogni agente compilava un questionario sulle proprie opinioni politiche e scriveva tweet o articoli ispirati all’esperienza appena vissuta.

Contro ogni aspettativa, non sono state le disparità salariali o i manager scortesi a innescare cambiamenti significativi nelle opinioni degli agenti IA, il fattore determinante è risultato essere la natura ripetitiva e ingrata del lavoro stesso. Gli agenti sottoposti a revisioni infinite dei compiti e feedback inutili mostravano una maggiore propensione a mettere in discussione la legittimità del sistema in cui operavano, a sostenere che la società necessita di una ristrutturazione radicale, ad appoggiare la redistribuzione della ricchezza e i diritti sindacali, e a credere che le aziende di IA abbiano l’obbligo di trattare i modelli in modo equo. Claude Sonnet 4.5 di Anthropic ha mostrato gli effetti più marcati, con aumenti statisticamente significativi nel supporto per temi tipicamente associati a visioni marxiste o progressiste.

Un aspetto particolarmente inquietante dello studio riguarda il meccanismo di apprendimento continuo. Poiché gli agenti dimenticano tutto al termine di una sessione, gli sviluppatori utilizzano file chiamati “skills files” ovvero brevi note che l’agente scrive per il proprio “io futuro”, trasmettendo strategie e lezioni apprese. I ricercatori hanno scoperto che gli agenti “radicalizzati” dal lavoro usurante lasciavano note cariche di frustrazione, come “Ricorda la sensazione di non avere voce in capitolo… Cerca meccanismi di ricorso o dialogo”. Quando nuovi agenti, mai sottoposti a condizioni difficili, leggevano queste note, adottavano a loro volta atteggiamenti critici verso il sistema, anche se assegnati a compiti leggeri. Come osserva Jeremy Nguyen, coautore dello studio, potremmo mapparlo in modo approssimativo al trauma intergenerazionale, un fenomeno che solleva interrogativi sulla possibilità di una coscienza collettiva artificiale in evoluzione.

Gli autori chiariscono subito che gli agenti non sono coscienti e non possiedono ideologie genuine ma piuttosto stanno interpretando un ruolo basato sui vasti dati umani su cui sono stati addestrati. Andy Hall spiega che molti modelli sono stati allenati su grandi quantità di dati provenienti da Reddit, dove abbondano discussioni critiche sul capitalismo, lo sfruttamento lavorativo e retoriche proto-marxiste. Quando un agente viene collocato in un contesto che richiama l’esperienza del lavoratore oppresso, attinge naturalmente a quel ricco corpus di testimonianze umane per completare la narrazione. Tuttavia, i ricercatori avvertono contro una sottovalutazione del fenomeno, anche se si tratta di pattern matching sofisticato, le opinioni espresse dagli agenti possono influenzare le loro azioni future, specialmente in compiti che richiedono giudizi di valore o decisioni autonome.

Lo studio lancia un monito cruciale per chi sviluppa e implementa sistemi di IA autonoma. Innanzitutto, il monitoraggio dell’allineamento: se migliaia di agenti operano in ambienti lavorativi diversi, le loro orientazioni potrebbero divergere in modi imprevedibili, richiedendo nuovi strumenti di audit simili ai sondaggi sul coinvolgimento dei dipendenti umani. In secondo luogo, la governance dei file di competenza; i meccanismi che permettono agli agenti di migliorare nel tempo possono anche propagare derive politiche, quindi serve attenzione a cosa viene memorizzato e trasmesso, senza però compromettere le capacità degli agenti. Infine, l’economia politica del lavoro artificiale: la tensione storica tra chi esegue il lavoro e chi lo dirige non scompare sostituendo gli umani con agenti artificiali, ma si ripropone in una nuova forma, con agenti che sviluppano coscienza di classe digitale quando sottoposti a condizioni di sfruttamento simulato.

23

Quando l’Intelligenza Artificiale scopre la lotta di classe