Immaginate un sistema di intelligenza artificiale che, quando gli chiedete di citare uno studio sulla memoria episodica, inventa autore, titolo e anno con assoluta sicurezza. Non esita, non tituba, non esprime alcun dubbio. È convinto della propria risposta. È falso, naturalmente, ma la macchina non lo sa. Quel 94% di confidenza che lampeggia sotto la risposta non misura la sua certezza epistemica: misura soltanto quanto, nei suoi parametri, quella sequenza di parole è risultata frequente durante l’addestramento.
Questa è la fotografia più fedele del modo in cui i grandi modelli di linguaggio gestiscono l’incertezza. E pone una domanda che sta occupando filosofi, scienziati cognitivi e ricercatori di IA con pari intensità: può la matematica bayesiana insegnare alle macchine a dire “non lo so”?
Thomas Bayes e la logica della credenza
Nel 1763, due anni dopo la morte del reverendo Thomas Bayes, uscì postumo il suo celebre saggio Sulla soluzione di un problema relativo alla dottrina del caso. Al centro c’era un’idea radicale per l’epoca: la probabilità non descrive solo il mondo oggettivo, ma anche lo stato delle nostre credenze. Se frequentisti come Bernoulli avevano legato la probabilità alla frequenza di un evento ripetuto infinite volte, Bayes propose qualcosa di diverso: un metodo per aggiornare il grado di fiducia in un’ipotesi man mano che nuove evidenze si accumulano.
Il teorema che ne porta il nome è elegantissimo nella sua semplicità. Dati una probabilità iniziale (il prior) e l’evidenza osservata (la likelihood), Bayes restituisce una probabilità aggiornata (il posterior). Non è soltanto una formula statistica: è un modello normativo del ragionamento scientifico. Ogni buon scienziato, in fondo, ragiona così: parte da ciò che sa, integra ciò che osserva, aggiorna le proprie conclusioni. Lo stesso Pierre-Simon Laplace, che rivalutò e sistematizzò il lavoro di Bayes, contribuì a costruire l’edificio dell’inferenza bayesiana, destinato a dominare la statistica moderna.
La differenza tra approccio bayesiano e frequentista è profonda sul piano epistemologico. Per un frequentista, ha senso chiedere “qual è la probabilità che domani piova?” solo se si immagina di ripetere domani infinite volte e contare quante volte effettivamente pioverà. Per un bayesiano, la domanda è perfettamente legittima anche per un singolo evento irripetibile: la probabilità esprime il nostro grado di credenza, informato dall’esperienza e dalle evidenze a nostra disposizione. Questa visione “soggettiva” della probabilità, lungi dall’essere un difetto, è ciò che la rende così potente come strumento epistemologico per sistemi che, come l’IA, devono operare in condizioni di incertezza radicale.
La confidenza che non è confidenza
Per comprendere perché il ragionamento bayesiano interessa così profondamente chi progetta sistemi di IA, occorre prima capire come le reti neurali attuali gestiscono — o, meglio, fingono di gestire — l’incertezza.
Alla base, una rete neurale è un enorme calcolatore. Riceve numeri in input, li trasforma attraverso strati di moltiplicazioni, addizioni e funzioni non lineari, e restituisce un numero. Quel numero finale, nel caso di compiti di classificazione come il question answering, viene tipicamente elaborato da una funzione detta softmax, che riscala gli output in valori che hanno l’aspetto di probabilità. Se ci sono tre possibili risposte (A, B, C), la softmax potrebbe assegnare: A: 30%, B: 50%, C: 20%. Il sistema sceglie B e mostra un rassicurante 50% accanto alla risposta.
Ma quei numeri non sono davvero probabilità. Sono punteggi relativi, normalizzati a somma 100%, che misurano quanto ciascuna opzione sia coerente con i pattern appresi. Un modello che non ha mai visto nulla di simile a una domanda può produrre un “90% di confidenza” per una risposta completamente errata. In altre parole: softmax confidence ≠ true uncertainty. Come ha scritto Riccardo Di Sipio su Medium, applicando metodi bayesiani a reti neurali per il question answering, “questo scarto non è un dettaglio tecnico. In contesti ad alta posta in gioco — medicina, diritto, assunzioni — risposte sbagliate fornite con falsa sicurezza sono pericolose” (Di Sipio, 2025, A more ethical approach to AI through Bayesian inference).
Insegnare a dire “non so”
È qui che entra in gioco l’inferenza bayesiana. In un quadro bayesiano, le probabilità non sono numeri isolati ma distribuzioni: forme matematiche che ci dicono quanto dovremmo essere certi — o incerti — riguardo a diversi esiti. Tornando all’esempio della pioggia: invece di dire “c’è il 70% di probabilità che piova”, l’approccio bayesiano dice “la probabilità di pioggia è distribuita intorno al 70%, con un intervallo ragionevole tra il 60% e l’80%”. Quel 10% di ampiezza non è un dettaglio matematico: è la finestra della nostra onestà epistemica, il segnale onesto di ciò che il modello sa e di ciò che non sa.
La ricerca recente, inclusa quella citata da Di Sipio basata su un articolo pubblicato su AI and Ethics (DOI: 10.1007/s43681-025-00838-x), propone di addestrare le reti neurali a stimare la propria incertezza non attraverso una singola previsione, ma attraverso la distribuzione dei parametri del modello stesso. In pratica, invece di produrre un output netto, il sistema campiona ripetutamente le proprie configurazioni interne e raccoglie le risposte. Da quella distribuzione emerge non solo la risposta preferita, ma l’ampiezza dell’incertezza intorno a essa. Anziché “la risposta è B con il 70%”, il sistema può ora dire “la risposta è B, ma potrebbe ragionevolmente essere tra il 65% e il 75%”.
Si tratta di un cambio di paradigma nella comunicazione della confidenza, con implicazioni etiche significative. Un sistema che sa comunicare i propri limiti è un sistema più degno di fiducia, non meno. Come ha osservato il già citato studio, insegnare a un’IA a dire “non so” potrebbe essere il passo più importante verso sistemi affidabili.
Euristiche, bias e il cervello che non è del tutto bayesiano
C’è un’ironia sottile nel fatto che il framework bayesiano, nato per razionalizzare il ragionamento in condizioni di incertezza, si scontri con una letteratura cognitiva che documenta quanto sistematicamente gli esseri umani falliscano nel ragionare in modo bayesiano. Daniel Kahneman e Amos Tversky, con i loro celebri esperimenti dagli anni Settanta in poi, hanno dimostrato che il cervello umano adotta con involgimento euristiche: scorciatoie mentali rapide ma soggette a distorsioni prevedibili. L’euristica della disponibilità ci porta a sovrastimare la probabilità di eventi vividi o recenti. L’euristica dell’ancoraggio ci fa aggrappare a un numero di riferimento arbitrario e aggiustare le nostre stime successive. La confirmation bias ci spinge a cercare le evidenze che confermano ciò che già crediamo.
Questi bias non sono difetti del sistema: sono il rovescio delle euristiche che permettono al cervello di prendere decisioni rapide in condizioni di scarsità computazionale. Ma il loro impatto sulla formazione delle credenze è profondo. E qui emerge una questione epistemologica spinosa: se costruiamo sistemi di IA addestrati su dati generati da menti umane, non stiamo incorporando in quelle macchine le stesse distorsioni cognitive che affliggono il pensiero umano?
La risposta, almeno in parte, è sì. I modelli di linguaggio possono apprendere e amplificare i bias presenti nei corpus testuali su cui vengono addestrati. Ma c’è un paradosso ulteriore. Kahneman e Tversky criticavano il ragionamento bayesiano proprio perché lo consideravano la norma prescrittiva che la mente umana raramente raggiunge. Nei fatti, i behavioristi osservano che le persone applicano intuitivamente euristiche, non calcoli bayesiani. I bayesiani cognitivi, come Joshua Tenenbaum e i loro collaboratori, replicano che quelle stesse euristiche possono essere modellate come inferenze bayesiane sotto prior estremi. Nel 2011, Jones e Love scrissero un articolo seminale su Behavioral and Brain Sciences intitolato “Bayesian fundamentalism or enlightenment?”, in cui accusavano i bayesiani cognitivi di non fornire spiegazioni sufficientemente precise e testabili del comportamento umano. A più di dieci anni di distanza, il dibattito non è risolto. Un articolo pubblicato su Nature Reviews Psychology nell’aprile 2026 propone di scommettere non sulla tesi generale che “la cognizione è bayesiana”, ma su una versione più ristretta e testabile: che la cognizione utilizzi esplicitamente la regola di Bayes a livello algoritmico (Xue e Rahnev, 2026, The explicit-Bayes hypothesis for cognition). È un riposizionamento epistemologicamente onesto, che lascia spazio tanto alla complementarità tra modelli bayesiani e connessionisti, quanto all’ipotesi che la mente umana operi con una logica ibrida, né rigorosamente bayesiana né puramente euristico-associativa.
Oltre l’overconfidence: sfide etiche e filosofiche
Se i limiti del ragionamento bayesiano si applicano già alla cognizione umana, figuriamoci a un sistema artificiale che non ha accesso diretto al mondo, non ha un corpo che lo ancorchi all’esperienza, non ha motivazioni proprie e non possiede quella che i filosofi chiamano autocoscienza epistemica: la capacità di interrogarsi sulla validità delle proprie credenze.
Questa mancanza di autocoscienza epistemica — ciò che in psicologia cognitiva chiamiamo metacognizione — è il problema più profondo. Non si tratta soltanto di calibrare una confidenza, ma di sapere che esiste un’incertezza, e di saperla interpretare. Nemmeno i metodi bayesiani, da soli, risolvono questo problema: un sistema può calcolare una distribuzione di probabilità sui propri parametri e continuare a non comprendere cosa significhi quella distribuzione. Rimane necessario sviluppare strumenti di interpretabilità che permettano non solo di stimare l’incertezza, ma di comprenderla e comunicarla in modo significativo.
Si apre così una riflessione squisitamente filosofica. Se una macchina applica il ragionamento bayesiano ma non comprende il significato della probabilità, in che senso è razionale? La risposta dipende da cosa intendiamo per razionalità. Se la intendiamo in senso procedurale — come capacità di seguire regole che producono buoni risultati in media — allora una macchina bayesiana è razionale quanto basta. Se la intendiamo in senso semantico — come comprensione del significato delle proprie credenze — allora restiamo ancorati a un mistero. Il teorema di Bayes ci ricorda che la conoscenza è sempre provvisoria, sempre soggetta a revisione alla luce di nuove evidenze. Ma per ora, questa consapevolezza resta patrimonio esclusivo di chi ha anche la capacità di provare meraviglia per il proprio ragionamento.
Ciò che possiamo ragionevolmente auspicare, nel frattempo, è un’IA che sappia riconoscere i propri limiti e comunicarli onestamente. Sistemi che sappiano dire “non so” non per debolezza computazionale, ma per integrità epistemica. È forse questo il compito più urgente: costruire macchine che, oltre a essere potenti, sappiano essere umili. Non perché la modestia sia un valore estetico, ma perché in un mondo in cui le decisioni algoritmiche condizionano vite, diagnosi, assunzioni e opinioni, la prima qualità etica di un sistema intelligente è la consapevolezza dei propri confini.
Il prior è sempre, in qualche modo, su di noi. Ma forse il posterior può essere migliore.
Share this content:





