Immaginiamo un tacchino che, per settimane, osserva ogni giorno la stessa routine: alle nove del mattino arriva il mangime. Giorno dopo giorno, l’animale registra la correlazione tra ora del giorno e cibo, affina le sue previsioni, costruisce un modello sempre più preciso della realtà. Poi arriva la vigilia di Natale, e il tacchino scopre che la sua induzione — perfetta, coerente, suffragata da mesi di evidenza empirica — era tragicamente errata. La metafora, attribuita a Bertrand Russell, non è solo una provocazione filosofica. È il ritratto esatto di ciò che accade ogni volta che un sistema di intelligenza artificiale viene addestrato su dati storici e poi immerso in un mondo che cambia.
Il problema dell’induzione è, secondo Karl Popper, uno dei due problemi fondamentali dell’epistemologia. Posto con chiarezza devastante da David Hume nel XVIII secolo, esso si chiede: siamo giustificati a ragionare da casi di cui abbiamo esperienza ad altri casi di cui non abbiamo esperienza? La risposta di Hume è spiazzante: no, non esiste alcuna giustificazione razionale per l’inferenza induttiva. L’abitudine psicologica di aspettarsi che il futuro somigli al passato non è un atto di ragione, ma di costume. Eppure, l’intera impresa della scienza moderna — e oggi dell’intelligenza artificiale — poggia su quel gesto non giustificabile.
Il dogma induttivo dell’apprendimento automatico
Quando un modello di machine learning viene addestrato, opera attraverso un processo essenzialmente induttivo. Riceve un insieme di osservazioni passate — milioni di immagini, testi, transazioni, diagnosi — e da queste inferisce regolarità che proietta sul futuro. La domanda che Hume pose nel 1748 non ha mai smesso di essere urgente: come possiamo essere certi che le leggi che abbiamo appreso dal passato continueranno a valere? L’algoritmo che riconosce i gatti dalle fotografie non possiede una teoria felina; possiede una generalizzazione statistica costruita su un campione finito di casi osservati. Se domani apparisse una razza felina radicalmente diversa, se un gatto perdesse i baffi per un incidente, se una nuova tecnologia alterasse il modo in cui le immagini vengono catturate — il modello fallirebbe, e non perché sia difettoso, ma perché il ragionamento induttivo non garantisce mai la verità delle conclusioni, anche quando le premesse sono vere.
Lo stesso problema si presenta in termini più sottili con i large language models. Questi sistemi, capaci di produrre testo coerente e seemingemente intelligente, hanno appreso pattern linguistici da un’enorme porzione di testo umano esistente. Ma quel testo riflette il mondo e il linguaggio di ieri — e il mondo e il linguaggio cambiano. Come ha osservato un’analisi di Amazon Science, nel machine learning la memorizzazione è considerata un difetto, perché conduce all’overfitting e impedisce la generalizzazione. Eppure, l’intera architettura transformer su cui si fondano i modelli linguistici attuali opera attraverso una forma massiccia di generalizzazione induttiva, che può tanto produrre straordinarie analogie quanto perpetuare errori sistematici.
Popper e il falsazionismo come correttivo
La risposta più celebre al problema di Hume venne da Karl Popper, che propose di rovesciare la logica della scienza: non si tratta di confermare le teorie attraverso l’osservazione ripetuta, ma di tentare di falsificarle, di cercare attivamente i casi che potrebbero smentirle. Lungi dal risolvere il problema dell’induzione — Popper stesso ne era consapevole — il falsazionismo introduce un atteggiamento intellettuale profondamente diverso: invece di cercare conferme, si cercano smentite. Invece di chiedersi “questo modello è vero?”, ci si chiede “in quali condizioni questo modello potrebbe essere falso?”.
Questa prospettiva ha un’eco diretta nella pratica moderna del machine learning. Le tecniche di validazione — la suddivisione dei dati in training set e test set, la cross-validation, il bootstrapping — non fanno che applicare, in forma pragmatica, l’invito popperiano: testare il modello su dati che non ha visto durante l’addestramento, cercare attivamente i casi in cui fallisce. I metodi bayesiani, che assegnano probabilità a priori a diverse ipotesi e le aggiornano alla luce delle evidenze, rappresentano un altro tentativo di rendere l’inferenza meno ingenua, meno dipendente dal mero conteggio delle occorrenze passate. Ma nessuna di queste tecniche risolve davvero il problema: sono correttivi, non cure. Non eliminano il salto induttivo; cercano di stimarne la portata.
Il nuovo enigma di Goodman: quale pattern proiettare?
Nel 1955, il filosofo americano Nelson Goodman aggiunse un livello di complessità che rende il problema dell’induzione ancor più vertiginoso. Goodman propose un esperimento mentale: definiamo una nuova proprietà, grue, come segue: un oggetto è grue se e solo se è verde ed è stato osservato prima di un certo momento, oppure è blu e non è stato osservato prima di quel momento. Tutti gli smeraldi osservati fino a oggi sono verdi, e dunque grue. Possiamo quindi inferire, per induzione, che tutti gli smeraldi futuri saranno grue — e dunque, dato che dopo il momento di cutoff saranno non-grue, che saranno blu. Ma questa conclusione è palesemente assurda. Eppure, la logica dell’inferenza induttiva la supporta esattamente quanto la conclusione che tutti gli smeraldi futuri saranno verdi.
La conclusione di Goodman è che non esiste una distinzione di principio tra i due ragionamenti. Ciò che rende “verde” un predicato legittimo per l’inferenza e “grue” un predicato illegittimo è esclusivamente la loro incarnazione nella storia dell’uso linguistico e nelle pratiche proiettive della comunità. “Verde” ha una “pedigree induttivo” che “grue” non ha. L’analogia con l’intelligenza artificiale è immediata: quando un sistema di machine learning sceglie quali pattern considerare rilevanti, sta compiendo implicitamente la stessa selezione che Goodman identificava come convenzionale e storicamente situata. I large language models non hanno alcun accesso privilegiato alla proprietà “verde” rispetto a “grue”; hanno semplicemente appreso che “verde” è il predicato che gli umani usano in certi contesti, perché è quello che ricorre nei dati di addestramento. Questo pone un problema epistemologico che va oltre la tecnica: quale delle infinite proiezioni possibili del passato è la “giusta”? La risposta non è né logica né matematica, ma etica e sociale.
I fallimenti concreti: bias, overfitting e il mondo che cambia
Il problema dell’induzione nell’intelligenza artificiale non è una questione esclusivamente accademica. Si manifesta quotidianamente nei fallimenti dei sistemi di machine learning quando incontrano situazioni nuove. I modelli di riconoscimento facciale addestrati prevalentemente su volti di una determinata etnia falliscono su volti diversi. Gli algoritmi di reclutamento addestrati su dati storici di assunzioni perpetuano le disparità del passato, perché il passato — e non un ipotetico futuro giusto — è il loro terreno di apprendimento. I modelli predittivi per la salute che hanno appreso correlazioni da dati clinici di popolazioni passate possono produrre raccomandazioni fuorvianti per popolazioni che oggi hanno caratteristiche diverse.
L’overfitting — quel fenomeno per cui un modello si adatta così perfettamente ai dati di addestramento da perdere ogni capacità di generalizzazione — è, in un certo senso, la versione tecnica del problema di Hume elevata alla massima potenza. È la dimostrazione pratica che un sistema può apprendere tutto il passato e non capire nulla del futuro. I correttivi sviluppati dalla comunità scientifica — la regolarizzazione, la data augmentation, il domain adaptation — sono tentativi intelligenti di rendere il salto induttivo meno acritico. Ma funzionano dentro il quadro dell’induzione, non contro di esso. Non eliminano il problema; lo gestiscono.
Epistemologia della macchina che non conosce il domani
Alla luce di tutto questo, come dovremmo intendere il rapporto tra intelligenza artificiale e conoscenza? Un large language model è una macchina epistemica di straordinaria potenza, capace di sintesi, analogia, ragionamento apparentemente logico. Ma è, al suo fondo, un dispositivo induttivo — nel senso più humeano del termine. Non “capisce” le leggi che ha appreso; le ha generalizzate da un campione. Non “sa” che il futuro continuerà come il passato; assume, per costruzione, che sia così. E quando il futuro diverge — e diverge sempre, in modi che i dati di addestramento non potevano contenere — il modello si trova di fronte a un mondo che non sa interpretare.
Questo non significa che l’intelligenza artificiale sia inutile o che i suoi risultati siano irrilevanti. Significa che il suo sapere è di natura particolare: non è la comprensione causale che caratterizza la conoscenza scientifica nel senso popperiano, ma una forma di pattern recognition massiccia, potente quanto limitata. L’epistemologia dell’IA è, in larga parte, un’epistemologia dell’induzione senza garanzie — un’edificazione di conoscenza su fondamenta che Hume ci ha insegnato a riconoscere come sabbia.
Forse la vera sfida epistemologica che l’intelligenza artificiale ci pone non è se le macchine possano pensare, ma se noi possiamo continuare a delegare loro il compito di conoscere senza interrogarci su quale forma di conoscenza stiamo realmente costruendo. Hume ebbe ragione a segnalare che l’induzione è un atto di fiducia, non di dimostrazione. L’intelligenza artificiale ha portato quella fiducia a una scala e a una velocità che Hume non avrebbe mai immaginato. Ma la domanda resta la stessa: quanto è legittima quella fiducia, e chi decide quando è stata riposta troppo a lungo?
Share this content:





