Quando interagiamo con sistemi come ChatGPT o Claude, tendiamo a parlarne come se possedessero conoscenza del mondo. Questi strumenti rispondono a domande, producono testi e sintetizzano informazioni con una fluidità che imita la comprensione umana. Eppure, dietro questa superficie di competenza, si nasconde una questione epistemologica di fondo: cosa significa per una macchina conoscere? Questa domanda ci spinge a indagare i confini tra correlazione e causalità, tra riconoscimento di pattern ed elaborazione di modelli concettuali della realtà.
Nel 2019, un articolo apparso su Forbes richiamava l’attenzione su un aspetto spesso sottovalutato: il machine learning, al suo cuore, si occupa di correlazioni, non di causalità. I modelli identificano pattern nei dati e tentano di proiettarli su situazioni nuove. Questo approccio si è rivelato straordinariamente efficace per compiti predittivi: dalla prevenzione delle frodi alla modellazione meteorologica, dalla diagnosi medica al processamento del linguaggio naturale.
Tuttavia, l’identificazione di pattern non implica la comprensione delle cause. L’esempio classico ricorre negli studi epidemiologici: le popolazioni che consumano vino con moderazione sembrano avere un riscolo cardiovascolare inferiore. Ma la correlazione non stabilisce una relazione causale: chi consuma vino moderatamente appartiene spesso a classi socioeconomiche superiori con migliore accesso alle cure e stili di vita più sani. Il vino è correlato con la salute, ma non ne è necessariamente la causa.
La sfida epistemologica dei modelli di linguaggio
Questa limitazione assume un rilievo particolare nell’era dei large language models. Un LLM viene addestrato su miliardi di esempi testuali e ha imparato a riprodurre correlazioni tra parole, frasi e contesti. Può generare testi plausibili, rispondere a domande e persino produrre ragionamenti che appaiono coerenti. Eppure la sua “conoscenza” rimane fondamentalmente statistica.
Come ha argomentato il filosofo Jerry Fodor nella sua critica alle teorie computazionali della mente, la sintassi non è la semantica: la manipolazione di simboli formali non si traduce automaticamente in comprensione del significato. Un sistema che processa correlazioni statistiche tra parole non possiede necessariamente una rappresentazione del mondo a cui quelle parole si riferiscono.
John McCarthy, uno dei fondatori dell’intelligenza artificiale, dedicò riflessioni significative ai problemi epistemologici dell’AI. In un lavoro seminale del 1977, osservava che l’AI deve confrontarsi con domande che i filosofi dibattono da secoli: cosa è conoscibile con le capacità osservative e computazionali disponibili? Come dovrebbe essere rappresentata la conoscenza per essere utilizzabile? Quali sono i rapporti tra conoscenza, credenza e azione?
Conoscenza implicita ed estrazione statistica
McCarthy approccio, basato sulla logica formale, ha incontrato difficoltà crescenti. Il mondo reale è irriducibilmente complesso, dinamico e incerto. Qualsiasi formalizzazione comporta astrazioni che rischiano di perdere informazioni cruciali. Inoltre, il problema della qualificazione — la difficoltà di specificare tutte le condizioni in cui una regola è valida — presenta un ostacolo pratico e teorico.
Gli approcci contemporanei, basati su reti neurali profonde, hanno affrontato alcune di queste limitazioni da una direzione opposta. Invece di codificare esplicitamente la conoscenza, questi sistemi la estraggono implicitamente dai dati. Ma questa soluzione genera il proprio problema epistemologico: l’opacità dei modelli. Quando una rete neurale prende una decisione, è spesso difficile o impossibile ricostruire il ragionamento che ha portato a quella conclusione. Si ha un risultato senza una giustificazione, una predizione senza una spiegazione.
La ricerca recente sui large language models ha riaperto il dibattito su se questi sistemi possiedano “modelli del mondo” — rappresentazioni interne della realtà che permettono di fare predizioni oltre i dati di addestramento. Alcuni studi suggeriscono che gli LLM sviluppino modelli impliciti della realtà fisica e sociale: sembrano sapere che gli oggetti non supportati cadono, che le persone hanno intenzioni, che le cause precedono gli effetti.
Il problema dell’antropomorfismo cognitivo
Tuttavia, questa interpretazione è contestata. Il filosofo Murray Shanahan argomenta che l’inquadramento antropomorfo delle capacità degli LLM incoraggia ricercatori e utenti ad attribuire processi cognitivi a sistemi che operano attraverso completamento di pattern statistici. Quando parliamo di “allucinazioni” nell’AI, stiamo usando un termine preso in prestito dalla psicologia umana che può offuscare piuttosto che chiarire ciò che sta effettivamente accadendo.
La domanda fondamentale è se questi sistemi possiedano una comprensione genuina o la simulino semplicemente. La distinzione importa non solo filosoficamente ma praticamente. Un sistema che manca di comprensione genuina può essere inaffidabile in situazioni al di fuori della distribuzione di addestramento. Può riprodurre pregiudizi presenti nei dati senza essere in grado di riconoscerli come tali. Può generare risposte plausibili ma false con la stessa sicurezza di quelle vere.
Dennis Müller ha proposto di inquadrare l’AI come una “tecnologia epistemica” — uno strumento progettato e utilizzato principalmente in contesti epistemici come l’indagine scientifica. A differenza di altre tecnologie che trasformano il mondo materiale, l’AI manipola contenuti epistemici: dati, predizioni, rivendicazioni di conoscenza. Come tecnologia epistemica, l’AI dovrebbe essere valutata non solo per le sue prestazioni tecniche ma anche per la sua affidabilità epistemica.
Conoscenza situata ed epistemologia femminista
La ricerca di Boaz Miller e altri ha evidenziato come la comunità dell’AI operi spesso con una concezione implicita di conoscenza come oggettiva e neutrale rispetto ai valori. Questa assumzione offusca la realtà che le pratiche conoscitive sono sempre situate — incorporate in contesti specifici, governate da norme sociali, impregnate di valori. L’idea di un conoscitore universale disincarnato non solo è irrealistica ma potenzialmente pericolosa, poiché può mascherare i bias e le limitazioni che contaminano ogni produzione di conoscenza.
Riconoscere i limiti epistemologici dell’AI non significa negarne l’utilità. L’apprendimento statistico è uno strumento potente per identificare pattern troppo complessi per la mente umana. Il problema sorge quando confondiamo questa capacità con una comprensione genuina o quando delegiamo alle macchine decisioni che richiedono giudizio etico.
Ciò che serve è un'”umiltà epistemica” riguardo alle capacità dell’AI. Questo significa riconoscere che la correlazione non è causalità, che la predizione non è spiegazione, che il riconoscimento di pattern non è comprensione. Significa sviluppare metodi di valutazione che indaghino non solo la correttezza dei risultati ma anche la robustezza e l’affidabilità dei modelli.
Conclusione: verso un’epistemologia dell’intelligenza artificiale
La filosofia della scienza può offrire risorse per questo compito. La distinzione tra leggi fenomenologiche (che descrivono correlazioni) e leggi fondamentali (che spiegano meccanismi) aiuta a posizionare l’AI: i sistemi attuali sono fenomenologici per eccellenza. Il concetto di “robustezza” sviluppato da fisici e filosofi aiuta a definire quando un modello può essere considerato attendibile al di fuori delle condizioni di addestramento.
A lungo termine, l’epistemologia dell’AI potrebbe diventare un ponte tra filosofia della scienza e filosofia della mente. Entrambi i campi devono confrontarsi con la questione di come processi computazionali possano connettersi con il mondo per produrre conoscenza. Le risposte che daremo a queste domande plasmeranno non solo la tecnologia ma anche la nostra autocomprensione come esseri conoscenti.
Le fonti per questo articolo includono il lavoro epistemologico di John McCarthy dal 1977, le ricerche di Dennis Müller sulla natura epistemica dell’AI, e gli studi di Murray Shanahan sull’antropomorfismo nei sistemi di linguaggio. Il tema della conoscenza situata è stato sviluppato in particolare dalla tradizione dell’epistemologia femminista. Il concetto di correlazione versus causalità nell’AI trova un’esaustiva trattazione nella letteratura di machine learning e data science.
Share this content:





