• Non ci sono risultati.

Capitolo 2: I successi del modello bayesiano nel rendere ragione della razionalità scientifica

N/A
N/A
Protected

Academic year: 2021

Condividi "Capitolo 2: I successi del modello bayesiano nel rendere ragione della razionalità scientifica"

Copied!
47
0
0

Testo completo

(1)

Capitolo 2: I successi del modello bayesiano nel rendere ragione della razionalità scientifica

In questo capitolo prenderemo in considerazione i successi del modello di conferma bayesiano. Questi si dividono in due differenti categorie, la prima delle quali è molto ampia. Anzitutto vedremo che il Bayesianesimo è in grado di fornire un'interpretazione, ovvero una spiegazione bayesiana, di alcune idee considerate centrali al fine della conferma delle ipotesi scientifiche. Esso inoltre può derivare ulteriori caratteristiche e risolvere problemi e paradossi riguardanti la conferma delle stesse. L'altra categoria consiste nella capacità del modello bayesiano di rispondere ad una serie di obiezioni che sono state rivolte contro di esso. Nella prima parte del capitolo verrà presa in considerazione la prima categoria di successo mentre successivamente presenteremo la seconda. Infine verrà analizzata la “zona grigia” del Bayesianesimo in cui è incerto se esso guadagna meriti oppure demeriti.

2.1 – Il concetto bayesiano di conferma

Prima di presentare i successi del modello bayesiano, occorre prendere in considerazione la spiegazione che esso dà del concetto base di questo lavoro, ovvero quello della conferma delle teorie scientifiche alla luce dell'evidenza. Come abbiamo detto, l'idea portante di questo concetto è che l'evidenza, derivante dall'osservazione di fenomeni presenti in natura oppure più comunemente da esperimenti deliberatamente studiati, può supportare o minare una teoria scientifica oppure essere neutrale nei confronti di essa. Il modello bayesiano è in grado interpretare questa caratteristica considerata fondamentale dell'inferenza scientifica. Per vedere come questo accade, prendiamo in considerazione la seguente forma del teorema di Bayes:

P(H/E K) = P(H/K)P(E/H K)/P(E/K). (1)⋀ ⋀ Posto che P(H/K) misura, data la conoscenza di fondo K, il nostro grado di credenza in un'ipotesi prima di aver ricevuto l'informazione E e che P(H/E⋀K) misura, data la conoscenza di fondo K, il nostro grado di credenza dopo aver ricevuto l'informazione E, otteniamo le seguenti relazioni:

E supporta H quando P(H/E K⋀ ) > P(H/K); E mina H quando P(H/E K⋀ ) < P(H/K);

E è neutrale rispetto ad H quando P(H/E K⋀ ) = P(H/K).

É possibile assumere la differenza P(H/E K⋀ ) – P(H/K) come misura del supporto che l'evidenza E dà all'ipotesi H.

(2)

P(H/K), P(H/E K⋀ ), P(E/K), ci permette già da subito di spiegare in modo bayesiano tre caratteristiche del ragionamento scientifico relative alla conferma.

Anzitutto, posto che tutti gli altri fattori rimangano costanti, l'estensione in cui un'evidenza E conferma un'ipotesi H aumenta con la verosimiglianza di E su H K⋀ , ovvero con P(E/H K⋀ ). Questa circostanza si verifica in quanto il teorema di Bayes ci dice che la probabilità a posteriori dell'ipotesi H alla luce di E è direttamente proporzionale alla verosimiglianza dell'evidenza relativamente all'ipotesi, e inversamente proporzionale alla probabilità dell'evidenza. I due estremi sono quelli in cui o E rifiuta (H⋀K) e quindi P(E/H K⋀ ) = 0 o quello in cui (H K)⋀ comporta logicamente E e quindi P(E/H K⋀ ) = 1. Nel primo caso la confutazione è massima: il denominatore nel teorema di Bayes assume valore nullo e conseguentemente tutta la frazione che è espressione della probabilità a posteriori. Nel secondo caso invece la conferma, posto, come abbiamo detto, che tutti gli altri fattori rimangono costanti, raggiunge il grado massimo possibile. Quest'ultima circostanza si verifica unicamente per le ipotesi deterministiche, le cui istanze di conferma, come abbiamo detto, sono dedotte delle ipotesi stesse.

In secondo luogo, la dipendenza, espressa dal teorema di Bayes, della probabilità a posteriori su quella a priori si può riscontrare nell'attitudine degli scienziati nel discriminare tra teorie che considerano più o meno credibili prima di fare qualsiasi sperimentazione, basandosi su determinate caratteristiche che si ritiene che le ipotesi scientifiche debbano avere, come ad esempio quella della semplicità.

Il fatto che il teorema di Bayes riconosca che il potere di E nel confermare H dipende da P(E/K), si può riscontrare nell'intuizione scientifica che più sorprendente è l'evidenza, maggiore è il suo potere di conferma. Infatti più inaspettata e sorprendente è l'evidenza e minore è la sua probabilità, quindi maggiore è la probabilità a posteriori, la quale, come abbiamo visto poc'anzi, è inversamente proporzionale alla probabilità dell'evidenza. Quest'ultimo punto verrà preso in considerazione più diffusamente in seguito.

2.2 – La prima categoria di successo bayesiano: capacità del modello bayesiano di rendere ragione di alcune delle caratteristiche dell'inferenza scientifica considerate adeguate

2.2.1 – L'interpretazione bayesiana del metodo di conferma HD e le conseguenze derivanti da

questa sulla conferma delle ipotesi deterministiche

Concentriamoci in primo luogo sulla prima categoria di successo bayesiano ed iniziamo con il prendere in considerazione il modo in cui la razionalità bayesiana interpreta uno dei metodi

(3)

standard di conferma delle ipotesi deterministiche, quello ipotetico – deduttivo, detto anche metodo H – D.

Ripetiamo schematicamente il procedimento di conferma di questo metodo: dall'ipotesi che vogliamo confermare H e da determinate conoscenze di fondo K, deduciamo una conseguenza E che può essere controllata o mediante l'osservazione o mediante l'esperimento. Se E accade, allora H viene detta essere HD – confermata, se invece E non accade, H viene detta essere HD – confutata.

Il Bayesianesimo è in grado di spiegare perché e sotto quali condizioni una teoria è confermata dalle sue conseguenze logiche, e quindi è in grado di evidenziare un nucleo di validità all'interno del metodo H – D, il quale è stato fortemente criticato. Di seguito viene mostrato secondo quale procedimento questo avviene. Dal momento che l'osservazione E viene dedotta dall'ipotesi H e dalla conoscenza di fondo K, ovvero vale la condizione (a) {H, K} => E, il termine della verosimiglianza dell'osservazione rispetto all'ipotesi e la conoscenza di fondo, assume come valore l'unità, ovvero P(E/H K⋀ ) = 1. Il teorema di Bayes, come indicato nell'espressione (1), assume allora la seguente forma:

P(H/E K) = P(H/K)/P(E/K). (2)⋀ Da (2) otteniamo che P(H/E K) > P(H/K), quando vengono rispettate le seguenti condizioni: ⋀ 0 < P(H/K) < 1;

0 < P(E/K) < 1.

Il teorema di Bayes allora ci dice che E supporta H quando sia la probabilità a priori di H sia la verosimiglianza a priori dell'evidenza E non sono né sicuramente certe né sicuramente false.

John Earman (1992, pag. 64) ci fa presente l'obiezione mossa da Carl Gustav Hempel (1945), secondo cui il requisito fondamentale del metodo HD non è (a), ma piuttosto la condizione che lo studioso ha chiamato “criterio di predizione” della conferma, ovvero (a'): E è logicamente equivalente a E1⋀E2, {H, K, E1} => E2, ma {H, K} ⇏E2. Questo significa che la

condizione (a) del metodo HD è soddisfatta rispetto alla condizione di predizione E1 → E2,

anche se l'evidenza totale consiste di E1⋀E2. Applichiamo ora il teorema di Bayes avendo in

mente questa condizione, otteniamo allora:

P(H/E1⋀E2⋀K) = P(H/E1⋀K)/P(E2/E1⋀K). (3)

Esso ci dice che l'evidenza totale E1⋀E2 supporta H se P(E2/E1⋀K) < 1 e se P(H/E1⋀K) =

P(H/K). Queste due condizioni sono entrambe soddisfatte nei casi tipici della conferma HD. Per esempio, supponiamo che H sia la teoria del moto planetario di Newton e che E1 sia

l'affermazione che il telescopio sarà puntato in questa o quest'altra direzione domani alla 3 del pomeriggio e E2 è l'affermazione che Marte verrà visto attraverso il telescopio.

(4)

Presumibilmente E1 è probabilisticamente irrilevante rispetto alla teoria H e E2 non è certa

sulla base di E1 e K.

Il teorema di Bayes riesce anche a risolvere il problema della congiunzione irrilevante, uno degli aspetti più irritanti del metodo HD. Secondo esso se {H, K} => E, allora anche {H, K, I} => E, dove I è qualsiasi cosa vogliamo, inclusa un'affermazione che nei confronti di E è, intuitivamente parlando, irrilevante. Secondo la metodologia HD tuttavia E supporta H I.⋀ L'approccio bayesiano in una certa misura concorda con questa analisi, in quanto, come abbiamo visto, se P(H I/K) > 0, allora segue che E supporta H I. Da (2) deriva tuttavia che la⋀ ⋀ quantità di supporto che H e H I ricevono è direttamente proporzionale alle loro probabilità a⋀ priori:

P(H/E K) – P(H/K) = P(H/K)[(1/P(E/K)) – 1]; (4)⋀ P(H I/E K) – P(H I/K) = P(H I/K)[(1/P(E/K)) – 1]. (5)⋀ ⋀ Dal momento che in generale, a causa dell'aggiunta di I, P(H I/K) < P(H/K), otteniamo che l'aggiunta della congiunzione irrilevante I ad H diminuisce il supporto dato da E.

Consideriamo ora il caso della confutazione HD. Se {H, K} => E e se ¬E accade, allora la metodologia HD ci dice che H è HD – confutata. É bene notare che la confutazione HD è il modello caratteristico dell'inferenza scientifica per rifiutare una teoria. L'approccio bayesiano è in grado di fornire una spiegazione di questo fenomeno. Vediamo come quest'ultima si struttura. Se, relativamente alla conoscenza di background K, un'ipotesi H comporta una conseguenza E, allora P(¬E/H K) =0. In base a quanto detto nel paragrafo ⋀ 2.1, l'ipotesi H,

alla luce dell'evidenza ¬E e della conoscenza di fondo K, è massimamente confutata. L'approccio bayesiano è anche in grado di spiegare, come ci si dovrebbe aspettare, perché una volta che una teoria viene rifiutata, nessuna ulteriore evidenza la può confermare, a meno che l'evidenza o qualche parte dell'informazione di background K non siano revocate. Questo fatto è dimostrabile nel seguente modo:

• se {H, K} => E, allora (H K ¬E) è una contraddizione, quindi P(H K ¬E) = 0 e⋀ ⋀ ⋀ ⋀ conseguentemente, secondo l'assioma della probabilità condizionale, anche P(H/K ¬E); ⋀

• se F è qualche ulteriore dato, (H K ¬E F), secondo la tavola di verità della⋀ ⋀ ⋀ congiunzione, è ancora una contraddizione;

• Secondo il medesimo ragionamento fatto sopra otteniamo che P(H/¬E F K) = 0. ⋀ ⋀ Dall'interpretazione bayesiana del metodo HD segue un'altra caratteristica delle conferma delle ipotesi deterministiche mediante il suddetto metodo interpretato in modo bayesiano, ovvero il fatto che le conseguenze deducibili da una teoria che la confermano devono eventualmente diminuire in forza in quanto ogni teoria ha un limite superiore di probabilità

(5)

oltre il quale nessuna evidenza può spingerla. Inoltre più una teoria diventa probabile mediante un accumulo di evidenze dedotte da questa e più le ulteriori conseguenze della teoria acquistano una maggiore verosimiglianza di essere vere e quindi un potere più basso di conferma. Come abbiamo detto, questi risultati seguono direttamente dal teorema di Bayes. Vediamo in che modo. Supponiamo che l'evidenza E sia equivalente a E1⋀E2⋀E3⋀ ⋀… En,dove

gli Ei, con i che va da uno ad n, sono le conseguenze della teoria H che sono state viste essere

vere e che quindi la confermano. Applichiamo a questo punto il teorema di Bayes secondo la seguente forma:

P(H/E K) = P(H/K)/P(E⋀ 1⋀E2⋀E3⋀ ⋀… En⋀K), (6)

dove, dal momento che E1, E2, E3, …, En sono le conseguenze dedotte della teoria, P(E1, E2,

E3, …, En/H K) = 1. ⋀

In base alla definizione di probabilità condizionale possiamo scrivere il denominatore della frazione in (6) nel seguente modo:

P(E1⋀E2⋀E3⋀ ⋀… En⋀K) = P(E1/K) P(E2⋀E3⋀ ⋀… En⋀.../E1⋀K). (7)

Il secondo termine alla destra dell'ultima uguaglianza in (7) può a sua volta essere riscritto come segue:

P(E2⋀E3⋀ ⋀… En/E1⋀K) = P(E2/E1⋀K)P(E3⋀ ⋀… En/E1⋀E2⋀K). (8)

Questo accade in quanto se sviluppiamo le due probabilità condizionali alla destra dell'uguaglianza, otteniamo [P(E2⋀E1⋀K)/P(E1⋀K)] x [P(E1⋀E2⋀E3⋀ ⋀… En⋀K)/P(E1⋀E2⋀K)]. I

due termini uguali a numeratore e denominatore P(E2⋀E1⋀K) si eliminano e quindi otteniamo,

in base alla formula della probabilità condizionale, il lato sinistro di (8), ovvero P(E2⋀E3⋀…

E

⋀ n/E1⋀K).

Questo medesimo procedimento lo possiamo applicare al secondo termine alla destra dell'uguale in (8), che diventa equivalente a

P(E3/E1⋀E2⋀K)P(E4⋀ ⋀... En⋀K). (9)

Possiamo andare avanti ed applicare il medesimo procedimento al secondo termine di (9), P(E4⋀ ⋀... En⋀K), e così via per tutte le evidenze che abbiamo detto dalla teoria e che la

confermano.

Questo è il procedimento che ci permette di riscrivere l'uguaglianza (6) in questo modo: P(H/E K) = P(H/K)/ P(E⋀ 1/K)P(E2/E1⋀K) … P(En/E1⋀ ⋀... En – 1⋀K). (10)

Howson e Urbach (1989, pag. 82) ci dicono che a questo punto subentra una proprietà mostrata da Jeffreys (1961, pagg. 43 – 44), ovvero che posto che P(H/K) > 0, il termine P(En/E1⋀ ⋀... En – 1⋀K) → 1 quando n aumenta sempre più. Se questo non avviene allora si

dimostra che la probabilità a posteriori di H ad un certo punto eccede 1 violando uno degli assiomi della probabilità.

(6)

Questo stesso risultato ci spiega anche perché è inutile sottoporre a prova un'ipotesi deterministica secondo la metodologia HD interpretata in modo bayesiano all'infinito. Dopo una certa soglia infatti il termine P(En/E1⋀ ⋀... En – 1⋀K) tende ad 1 e quindi lascia invariata la

probabilità della verosimiglianza delle evidenze dedotte dalla teoria e che la confermano, secondo l'ovvietà matematica che moltiplicare per l'unità lascia invariato il risultato della moltiplicazione. Questo risultato comporta che, posto che gli altri fattori rimangano costanti, la probabilità a posteriori dell'ipotesi rimane invariata. Senza informazioni dettagliate circa la struttura di credenza dell'individuo, soprattutto relativamente al valore di P(En/E1⋀ ⋀... En – 1⋀K), non è tuttavia possibile predire il momento preciso in cui fermarsi nella

sperimentazione.

Dall'interpretazione bayesiana della conferma delle ipotesi deterministiche mediante la metodologia HD segue un'ulteriore caratteristica relativa alla conferma di queste, ovvero il fatto che alcune specifiche categorie di conseguenza di una teoria hanno una capacità ristretta di conferma.

Supponiamo che H sia la teoria di cui stiamo discutendo e che Hr sia una restrizione di questa.

Una restrizione sostanziale della teoria di Newton, per esempio, è l'idea che i corpi in caduta libera vicino alla terra cadono con un'accelerazione costante.

Dal momento che {H, K} => {Hr, K}, otteniamo, secondo un teorema noto del calcolo della

probabilità, P(H/K) ≤ P(Hr/K)1.

Consideriamo ora una serie di predizioni (E1⋀E2⋀E3⋀ ⋀… En) dedotte da H, le quali tuttavia

derivano anche da Hr, che confermano entrambe le teorie. Applichiamo il teorema ad

entrambe le teorie:

P(H/K E⋀ 1⋀E2⋀E3⋀ ⋀… En⋀K) = P(H/K)/P(E1⋀E2⋀E3⋀ ⋀… En⋀K); (11)

P(Hr/E1⋀E2⋀E3⋀ ⋀… En⋀K) = P(Hr/K)/P(E1⋀E2⋀E3⋀ ⋀… En⋀K). (12)

A questo punto confrontiamo, mettendole matematicamente in rapporto, le espressioni (11) e (12):

P(H/E1⋀E2⋀E3⋀ ⋀… En⋀K)/P(Hr/E1⋀E2⋀E3⋀ ⋀… En⋀K) = [P(H/K)/P(E1⋀E2⋀E3⋀ ⋀… En⋀K)]/

[P(Hr/K)/P(E1⋀E2⋀E3⋀ ⋀… En⋀K)]. (13)

Svolgendo le semplificazioni e le relazioni di uguaglianza otteniamo che:

P(H/E1⋀E2⋀E3⋀ ⋀… En⋀K) = [P(H/K)/P(Hr/K)] x P(Hr/E1⋀E2⋀E3⋀ ⋀… En⋀K). (14)

Dal momento che il valore massimo del secondo termine alla destra dell'uguale in (14) è 1, segue che a prescindere da quante predizioni di Hr si siano verificate, la teoria principale H

non può mai raggiungere una probabilità a posteriori che eccede P(H/K)/P(Hr/K). Questo

spiega perché l'insieme di evidenze che derivano da Hr hanno una capacità limitata di

1 Il teorema in questione ci dice appunto che se a => b, allora P(a) ≤ P(b). Per una dimostrazione del teorema si veda Howson e Urbach (ibid., pag. 24).

(7)

confermare H.

2.2.2 – La soluzione bayesiana del paradosso dei corvi

Dall'interpretazione bayesiana dell'idea di conferma (si veda il paragrafo 2.1) deriva una soluzione del cosiddetto “paradosso della conferma”, conosciuto anche come “paradosso dei corvi”. Si parla di paradosso in quanto le premesse che sorreggono il ragionamento sono considerate estremamente plausibili, mentre le sue implicazioni sono controintuitive o, in alcune versioni, contraddittorie. Il riferimento a questo come “paradosso dei corvi” deriva dall'ipotesi che viene solitamente utilizzata per esporlo, ovvero l'ipotesi “tutti i corvi sono neri”, in formula ( x)(Rx ∀ → Bx), dove R, dall'inglese raven, corvo, indica il predicato “essere un corvo” e B, dall'inglese black, nero, indica il predicato “essere nero”. Vediamo in primo luogo da dove deriva il paradosso e successivamente qual è la soluzione che il Bayesianesimo propone. Il paradosso segue dall'applicazione alla medesima ipotesi di due condizioni relative alla conferma ritenute accettabili, ovvero la condizione di Nicod (dal filosofo Jean Nicod) e la cosiddetta “condizione di equivalenza”. Vediamo in cosa consistono e perché la loro applicazione alla medesima ipotesi conduce ad un risultato paradossale. Secondo la condizione di Nicod le ipotesi della forma ( x)(Rx ∀ → Bx) sono confermate da un'evidenza del tipo Ra Ba. Per esempio l'ipotesi “tutti i corvi sono neri” è confermata da un corvo nero.⋀ La condizione di equivalenza invece ci dice che le ipotesi logicamente equivalenti sono confermate dalla medesima evidenza. L'ipotesi “tutti gli R sono B” è confermata, ad esempio, dall'evidenza di qualcosa che non è né R né B in quanto questa ipotesi è equivalente a quella “tutti i non – B sono non – R”, la quale è confermata dall'evidenza di qualcosa che non è né R né B. Se applichiamo entrambe queste condizioni all'ipotesi dei corvi ( x)(Rx ∀ → Bx) otteniamo che essa è confermata sia dall'evidenza Ra Ba, sia dall'evidenza ¬Rb ¬Bb.⋀ ⋀ Una tale conclusione comporta delle conseguenze paradossali; infatti se un qualcosa che non è né nero né corvo supporta l'ipotesi dei corvi, allora questo sembra implicare che sia possibile confermare questa ed altre generalizzazioni della medesima forma mettendo sul medesimo piano l'osservazione di un'evidenza che non ha nulla a che fare con il contenuto dell'ipotesi e un'evidenza che invece si riferisce ad esso.

Un tale risultato paradossale può trovare una soluzione nell'interpretazione bayesiana della conferma. Secondo quest'ultima, anche se sia Ra Ba che ¬Rb ¬Bb possono confermare⋀ ⋀ l'ipotesi in questione, non deriva tuttavia che lo fanno con uguale intensità. Una volta che si riconosce che la conferma è una questione di grado, la conclusione a cui siamo arrivati prima non è poi così paradossale. È infatti possibile che ¬Rb ¬Bb confermi l'ipotesi ( x)(Rx → Bx), ma lo fa ad un grado così basso da essere trascurabile. Il ragionamento che ci conduce a

(8)

questa conclusione è il seguente: la classe degli oggetti che non sono né neri né corvi è una classe molto più grande rispetto a quella degli oggetti che sono sia corvi sia neri. Questo significa che è quasi certo che se noi scegliamo un oggetto a caso al riguardo del quale non sappiamo nulla, questo si rivelerà essere non nero e non corvo. La probabilità dell'evidenza ¬Rb ¬Bb allora è quasi vicino alla certezza, mentre quella di Ra Ba è molto bassa. Quando⋀ ⋀ andiamo ad applicare il teorema di Bayes otteniamo che P(H/¬Rb ¬Bb), dove H è l'ipotesi⋀ ( x)(Rx ∀ → Bx), è molto bassa, in quanto inversamente proporzionale a P(¬Rb ¬Bb) che,⋀ come abbiamo detto, è quasi vicina alla certezza. In conclusione, per un bayesiano, entrambi i tipi di evidenze possono confermare l'ipotesi ( x)(Rx ∀ → Bx), ma ¬Rb ¬Bb lo fa in modo⋀ così poco esteso da essere quasi insignificante.

Sebbene le condizioni di Nicod e quella di equivalenza non siano minate dalle loro implicazioni che l'ipotesi ( x)(Rx → Bx) è confermata anche da ¬Rb ¬Bb, ci sono tuttavia buone ragioni per contestare la condizione di Nicod, mentre quella di equivalenza sembra essere incontestabile. È stato messo in luce che non solo l'ipotesi ( x)(Rx → Bx) non è necessariamente confermata da Ra Ba, ma che può anche essere confutata da questa istanza.⋀ Per esempio, consideriamo l'ipotesi “tutte le cavallette si trovano al di là dello Yorkshire”. Vedere una cavalletta sul bordo del confine è un'istanza di questa generalizzazione e quindi, secondo la condizione di Nicod, dovrebbe confermare l'ipotesi in questione. Potrebbe tuttavia essere più ragionevole dire che, dal momento che non ci sono controlli di frontiera che limitano il movimento delle cavallette, l'osservazione di una di queste sul bordo della contea aumenta la probabilità che altre cavallette siano realmente entrate e quindi mina l'ipotesi. In termini bayesiani questo è il caso in cui la probabilità di qualche dato è diminuita da un'ipotesi, ovvero P(E/H K) < P(E/K), da cui deriva che l'ipotesi è confutata, ⋀ ovvero P(H/E K) < P(H/K). ⋀

Possiamo quindi concludere dicendo che le conseguenze paradossali delle condizioni di Nicod e di quella di equivalenza non sono problematiche e che ci sono diverse ragioni, che si conformano al modello bayesiano, per rifiutare la condizione di Nicod.

2.2.3 – L'interpretazione bayesiana del truismo della metodologia scientifica secondo cui la

varietà dell'evidenza è più importante della quantità dell'evidenza

Il Bayesianesimo è in grado di spiegare il truismo della metodologia scientifica secondo cui la varietà dell'evidenza conferma in misura maggiore una medesima ipotesi rispetto ad una determinata quantità di evidenza uniforme. Vediamo in che senso. Nel sottoparagrafo 2.2.1 abbiamo visto che dall'interpretazione bayesiana della conferma delle ipotesi deterministiche mediante la metodologia HD segue un'ulteriore caratteristica relativa alla conferma di queste,

(9)

ovvero il fatto che alcune specifiche categorie di conseguenza di una teoria hanno una capacità ristretta di conferma. Quest'ultima considerazione e la spiegazione bayesiana che ne abbiamo dato riesce anche a spiegare il fenomeno secondo cui la ripetizione di un unico tipo di esperimento spesso conferma una teoria generale unicamente fino ad una estensione limitata, in quanto le predizioni verificate mediate i mezzi di un dato tipo di esperimento seguono normalmente da e confermano una versione molto ristretta della teoria che predice. Quando la capacità di un esperimento di generare evidenze che confermano la teoria è stata esaurita conviene allora adoperare esperimenti differenti per supportare questa ulteriormente. Occorre tuttavia spiegare che cosa si intende quando si parla di esperimenti differenti. Di questi abbiamo una nozione intuitiva. Per esempio, misurare il punto di fusione dell'ossigeno il martedì e il lunedì significa fare il medesimo esperimento, mentre determinare il tasso in cui ossigeno ed idrogeno formano l'acqua è un esperimento differente dal primo; indagare questa trasformazione sotto differenti temperature, condizioni di pressione, ecc..., significa fare esperimenti ancora differenti. C'è un modo formale per rendere conto della similarità degli esperimenti che può rendere ragione di queste intuizioni. Possiamo dire che E ed E' costituiscono due esperimenti differenti quando dato un certo numero di ripetizioni di E, la probabilità di ottenere un esito ulteriore di quell'esperimento è più grande della probabilità di ogni esito di E', date quelle stesse ripetizioni di E. In formule abbiamo che:

P(Em + 1/E1⋀E2⋀ ⋀… Em) > P(E'i/E1⋀E2⋀ ⋀… Em) (15)

Earman (ibid., pagg. 77 – 79) dà una differente spiegazione bayesiana di questo fenomeno. Per presentarla, prendiamo nuovamente in considerazione il caso delle conferma delle ipotesi deterministiche mediante la metodologia HD interpretata in chiave bayesiana. Supponiamo quindi che {H, K} ⇒ E e che l'evidenza E sia pari a E1⋀E2⋀ ⋀... En, dove gli Ei rappresentano o

gli esiti di uno stesso esperimento fatto più volte oppure gli esiti di una serie di esperimenti differenti. La forma più utile del teorema di Bayes da prendere in considerazione è quella della formula (10):

P(H/E K) = P(H/K)/P(E⋀ 1/K)P(E2/E1⋀K)... P(En/E1⋀ ⋀... En – 1⋀K)

Come è stato detto, vale la proprietà che se P(H/K) > 0, allora il fattore P(En/E1⋀ ⋀... En – 1⋀K)

→ 1, quando n cresce senza nessun limite. Questo fattore ci dà la probabilità del prossimo esito predetto da H condizionale all'informazione di background K e a quella che le precedenti predizioni sono accadute. Più lentamente questa probabilità si approccia ad 1, più piccolo è il denominatore (per un dato n) e più grande è la probabilità a posteriori di H (per un dato n). Qui è dove entra in gioco il concetto di varietà dell'evidenza, in quanto più vario è l'esperimento e più lentamente ci si aspetta che la probabilità del prossimo esito, condizionale agli esiti già ottenuti e alla conoscenza di fondo, si approccia alla certezza. Ad un estremo c'è

(10)

il caso dove gli Ei sono gli esiti ottenuti dalla ripetizione di un medesimo esperimento che

potrebbe consistere, per esempio, nel misurare ancora ed ancora una quantità che si ritiene avere un valore stabile. In quest'ultimo caso, date determinate assunzioni K circa l'affidabilità dell'apparato di misura, occorrono solo poche ripetizioni per approcciarsi alla certezza della prossima istanza, e l'accumulo di un grande numero di ulteriori istanze comporta, come è stato detto, un piccolo guadagno per la probabilità a posteriori di H. Quest'ultima considerazione è inoltre un'ulteriore spiegazione del perché è inutile, oltre un certo limite, accumulare evidenza del medesimo tipo per confermare una data ipotesi. All'estremo opposto c'è il caso in cui gli Ei

sono gli esiti di esperimenti che non unicamente sono differenti, ma che sembrano abbastanza non correlati. In questo caso, nuove istanze comportano un maggiore guadagno per quanto riguarda la probabilità a posteriori di H.

Earman (ibid.) per sostanziare quanto detto fino ad ora prende in considerazione una diversa nozione di varietà dell'evidenza rispetto a quella sopra esposta, la cui definizione si basa sul fattore precedentemente usato, P(En/E1⋀ ⋀... En – 1⋀K). La nozione di varietà dell'evidenza

infatti può essere rappresentata dalla velocità con cui il termine in questione si approccia all'unità, posto che n cresce senza limiti: minore è la velocità, maggiore è la varietà dell'evidenza. Un'analisi basata su questo fattore ha due generi di conseguenze: la prima è che la nozione di varietà dell'evidenza deve essere relativizzata alle assunzioni di fondo K. Questa relativizzazione appartiene al senso comune scientifico; per esempio, prima della rivoluzione, i moti dei corpi celesti sembravano appartenere ad una differente varietà rispetto ai moti dei corpi terresti, mentre dopo Newton c'è stata un'unificazione di questi moti. La conseguenza meno ovvia è che l'induzione, o comunque una condizione necessaria per essa, presuppone una limitata varietà della natura. Vediamo in che senso. La condizione necessaria per uno studio probabilistico di H è che la sua probabilità a priori alla luce della conoscenza di sfondo sia maggiore di zero. Come abbiamo visto tuttavia, proprio la condizione P(H/K) > 0 implica che P(En/E1⋀ ⋀... En – 1⋀K) tende ad uno, quando n tende ad infinito. Questo significa che, dal

punto di vista dell'analisi della varietà della natura che abbiamo scelto, non importa quanto la natura sia varia, e quindi quanto lentamente il termine in questione si approccia ad uno quando n cresce, la condizione stessa che ci permette di studiare in termini probabilistici un'ipotesi H, P(H/K) > 0, ci dice che prima o poi questo termine tenderà ad uno e quindi che En eventualmente non potrà essere considerato tanto vario rispetto a E1⋀ ⋀... En – 1,

contrariamente a quanto le nostre intuizioni ci suggeriscono. Proprio il fatto che gli Ei sono

unificati nel senso minimale di essere comportati da H, alla quale assegniamo una probabilità a priori diversa da 0, ci costringe eventualmente a vederli come non vari.

(11)

2.2.4 – Il problema di Duhem e Quine

In questo sottoparagrafo prenderemo in considerazione il cosiddetto “problema di Duhem e Quine”. Si tratta di un problema che si pone in rifermento alla confutazione delle ipotesi deterministiche mediante il modello HD. Vediamo in che cosa consiste. Come abbiamo visto, una tale confutazione avviene quando da un'ipotesi H e da una conoscenza di fondo K, deduciamo un'osservazione E che non si verifica. In questo caso diciamo che l'ipotesi è HD – confutata. La confutazione HD, come abbiamo visto, può essere considerata equivalente alla falsificazione: quando un'ipotesi viene HD – confutata, essa può essere considerata falsa e quindi rifiutata, a meno che successivamente l'ipotesi stessa o comunque le assunzioni di fondo non vengano modificate. Questa identificazione tra falsificazione dell'ipotesi e confutazione HD è stata messa in dubbio dal problema che stiamo ora considerando. Duhem e Quine infatti hanno messo in luce che per le ipotesi di alto livello scientifico la deduzione delle potenziali istanze di conferma avviene mediante l'aiuto di ipotesi ausiliare. Quando la predizione che deve essere poi controllata empiricamente non avviene, tutto ciò che possiamo concludere basandoci sulla solo logica deduttiva è che o l'ipotesi principale è falsa oppure che lo è l'ipotesi ausiliaria. Questo significa che se la metodologia HD fosse tutto ciò che abbiamo a disposizione per il ragionamento induttivo, allora non c'è nessun modo per spartire la colpa della falsa predizione tra ipotesi ausiliaria e ipotesi principale. Si parla di colpa in quanto, se la predizione non avviene e se dobbiamo stabilire quale delle due ipotesi in questione viene falsificata da questa mancata predizione, allora si tratta di stabilire quale tra esse è stata responsabile di quella predizione che eventualmente si è rivelata falsa. La conseguenza preoccupante di questa conclusione è che l'ipotesi principale non risulta mai falsificata da nessuna predizione contraria e quindi essa può essere mantenuta a prescindere da quanto la Natura ci dice. Questo ragionamento comporta una certa forma di olismo, dal momento che appare che le teorie scientifiche si confrontino con l'esperienza come un tutto unico con le loro ipotesi ausiliare. Nella pratica tuttavia gli scienziati non agiscono come se fossero incerti su come distribuire la colpa di una falsa predizione. Questo non significa che c'è un unico modo corretto di compiere la distribuzione della colpa, ma che tuttavia nella maggior parte dei casi ci sono ferme intuizioni che ci suggeriscono che questa si riferisce ad una o l'altra delle componenti della teoria e che si riferisce in misura maggiore ad una componente piuttosto che ad un'altra. Quest'ultimo è un fatto della pratica scientifica che necessita di essere spiegato e il Bayesianesimo si propone come modello di spiegazione di questo. Il primo passo da compiere è capire come le probabilità delle differenti teorie sono alterate quando queste, come un tutto unico, vengono rifiutate. Supponiamo di avere una teoria H, un'ipotesi ausiliaria A e una conoscenza di fondo K. Supponiamo che queste tre componenti insieme ci consentono di

(12)

dedurre una predizione E', la quale risulta essere falsificata dall'osservazione E. Assumiamo che mentre la combinazione (H A K) è rifiutata da E, le due componenti prese⋀ ⋀ separatamente non lo sono. Quello che vogliamo andare a studiare sono gli effetti che l'evidenza negativa E ha sulle probabilità di H ed A prese separatamente. Questi possono essere espressi mediante valori probabilistici mediante l'applicazione del teorema di Bayes alle due teorie considerate separatamente nel seguente modo:

P(H/E K) = P(H/K)P(E/H K)/P(E/K); (16)⋀ ⋀ P(A/E K) = P(A/K)P(E/A K)/P(E/K). (17)⋀ ⋀ Per determinare i valori di queste probabilità occorre stabilire i valori dei termini che le costituiscono. Prima di ciò tuttavia è bene notare che le espressioni sopra considerate non ci danno ragione per ritenere che il rifiuto congiunto di (H A K) avrà un effetto simmetrico⋀ ⋀ sulle probabilità separate di H ed A né nessuna ragione per ritenere che il grado di asimmetria non potrebbe essere in alcuni casi molto grande. Le due espressioni inoltre ci consento di capire quali sono i fattori che determinano quale delle due ipotesi soffre maggiormente del rifiuto. In particolare otterremo che la probabilità di H cambia molto poco se il valore P(E/H K) è molto simile a quello di P(E/K), mentre quella di A viene ridotta sostanzialmente⋀ nel caso in cui P(E/A K) < P(E/K). Quando si verificano entrambe queste circostanze⋀ possiamo affermare che la colpa della falsa predizione ricade maggiormente sull'ipotesi ausiliaria che sull'ipotesi principale.

Un esempio storico che ci permette di capire come il modello bayesiano sia in grado di spiegare come solitamente gli scienziati si comportano dinnanzi al problema di Duhem e Quine è il seguente. Nel 1815, il chimico e medico, William Prout, avanzò l'ipotesi H che i pesi atomici di tutti gli elementi erano numeri interi multipli del peso atomico dell'idrogeno. Questa ipotesi si basava sulla conoscenza di fondo K che tutta la materia era costituita da differenti combinazioni del medesimo elemento e Prout credeva che l'idrogeno fosse questo elemento fondamentale. I pesi atomici raccolti al tempo (l'evidenza E), sebbene fossero vicini ad essere numeri interi quando espressi come multipli del peso atomico dell'idrogeno, non si conformavano esattamente all'ipotesi di Prout. Questa deviazione da un perfetto accordo con l'esperienza non convinse lo scienziato che la sua ipotesi fosse sbagliata. Egli infatti riteneva che l'errore della falsa predizione fosse dovuto dai metodi utilizzati per misurare i pesi degli atomi. Prout, convinto dell'esattezza della sua idea, arrivò ad aggiustare e modificare i pesi atomici degli altri elementi fino ad allora raccolti per fare in modo che si conformassero con la sua ipotesi. Egli aggiustò, per esempio,il peso atomico della clorina da 35.83 a 36. L'atteggiamento dello scienziato nei confronti dell'evidenza contraria E può essere spiegato in chiave bayesiana come segue.

(13)

La teoria H di W. Prout insieme con l'ipotesi ausiliaria A, la quale stabiliva l'accuratezza delle tecniche di misura, la purezza delle sostanze chimiche utilizzate, ecc..., implicavano l'osservazione E' che il peso atomico della clorina, una volta misurato, si rivelasse essere un numero intero rispetto all'idrogeno.

Assumiamo, come era il caso nel 1815, che il peso atomico della clorina, una volta misurato, era 35.83 e chiamiamo questa evidenza E, la quale contraddice l'evidenza dedotta dalla teoria E'.

Sembra che i chimici del tempo, come Proust, fossero abbastanza certi della verità di H, ma meno di quella di A, sebbene pensassero che quest'ultima fosse più vera che falsa. Queste considerazioni sono confermate dalle fonti del tempo, le quali ci dicono che l'ipotesi di Prout in Inghilterra era quasi generalmente accettata. Più difficile è accettare quanto Proust e i suoi contemporanei fossero confidenti in A. Sembra improbabile che questa confidenza fosse molto grande dal momento che erano note sia le molte fonti di errore sia le varie circostanze in cui misurazioni indipendenti non producevano solitamente risultati identici. I chimici del tempo tuttavia dovevano ritenere che i loro metodi di misurazione dei pesi atomici dovessero essere più accurati che non, altrimenti non li avrebbero usati. Per tutte queste ragioni potremmo impostare P(A/K) = 0.6, mentre P(H/K) = 0.9.

Per valutare P(H/E K) e P(A/E K) occorre fissare i valori di P(E/H K ), di P(E/A K) e di⋀ ⋀ ⋀ ⋀ P(E/K). È possibile assegnare valori numerici a questi termini utilizzando il teorema della probabilità totale come segue:

P(E/K) = P(E H/K) + P(E ¬H/K). ⋀ ⋀ (18) Applicando poi la definizione di probabilità condizionale ai due termini alla destra dell'uguale, (18) diventa:

P(E/K) = P(E/H K)P(H/K) + P(E/¬H K)P(¬H/K); (19)⋀ ⋀ P(E/H K) ⋀ = P(E A/H K) + P(E ¬A/H K). (20)⋀ ⋀ ⋀ ⋀ Applicando la definizione di probabilità condizionale, l'espressione (20) diventa:

P(E/H K) = P(E/H K A)P(A/H K) + P(E/H K ¬A)P(¬A/H K). (21)⋀ ⋀ ⋀ ⋀ ⋀ ⋀ ⋀ Concentriamoci ora sull'espressione alla destra dell'uguale in (21), P(E/H K A)P(A/H K) +⋀ ⋀ ⋀ P(E/H K ¬A)P(¬A/H K). A ed H sono due teorie indipendenti e così pure H e ¬A, quindi⋀ ⋀ ⋀ P(A/H K) = P(A/K) e P(¬A/H K) = P(¬A/K). Questa assunzione d'indipendenza viene⋀ ⋀ adottata in quanto sembra accordarsi con molti fatti storici e sembra essere vera in questa circostanza.

Sempre nell'espressione (21) dobbiamo considerare che, dato che la combinazione (H A) è rifiutata da E, P(E/T A K) = 0. ⋀ ⋀

(14)

P(E/H K) =⋀ P(E/H K ¬A)P(¬A/K). ⋀ ⋀ (22) Applicando il medesimo ragionamento di cui sopra otteniamo che:

P(E/A K) = P(E/A K ¬H)P(¬H/K). ⋀ ⋀ ⋀ (23) Applicando nuovamente il teorema della probabilità totale e la definizione di probabilità condizionale, otteniamo che:

P(E/¬H K) = P(E/¬H A K)P(A/K) + P(E/¬H ¬A K)P(¬A/K). (24)⋀ ⋀ ⋀ ⋀ ⋀ Dobbiamo assegnare un numero a questi termini partendo dalle loro componenti.

Iniziamo con l'assegnare un valore di probabilità al termine P(E/¬H A K). Quest'ultimo⋀ ⋀ indica la probabilità che l'evidenza E accada (quindi che il peso atomico della clorina sia 35.83) dato che l'ipotesi di Prout non sia vera (e vale quindi una teoria alternativa a questa) e che il metodo di misura dei pesi atomici sia accurato. Questo tipo di probabilità era realmente considerato dai chimici del tempo che assumevano una teoria dell'assegnamento casuale del peso atomico come alternativa all'ipotesi di Proust. Supponiamo che sia stato stabilito con sicurezza che il peso atomico della clorina giaccia tra 35 e 36. La teoria dell'assegnamento casuale assegna uguali probabilità al peso atomico di un elemento di giacere in ogni intervallo ampio 0.01. Posto allora che A sia vera, ma H falsa, la probabilità che il peso atomico della clorina giaccia nell'intervallo 35.825 – 35.835 è 0.01, ovvero P(E/¬H A K) = 0.01. ⋀ ⋀

Poniamo anche P(E/¬H ¬A K) = 0.01, in quanto assumendo che A sia falsa perché magari⋀ ⋀ qualche sostanza chimica è impura o le tecniche di misura non perfettamente accurate, non ci aspettiamo che il peso nell'intervallo sia orientato verso nessuno dei due estremi rappresentati dai numeri interi.

P(E/H ¬A K) invece la poniamo pari a 0.02. Si tratta di un valore maggiore di quelli⋀ ⋀ assegnati prima. La ragione è che, sebbene la presenza di qualche impurità nelle sostanze chimiche e qualche grado di inesattezza dei metodi di misurazione del tempo erano estremamente probabili, comunque i chimici del tempo non pensavano che i loro metodi di misurazione fossero interamente inadeguati. Se l'ipotesi di Prout fosse vera, ma se i metodi di misurazione fossero imperfetti, allora è probabile che i pesi atomici degli elementi misurati devierebbero in qualche misura dai valori interi. Maggiore è la deviazione che ci si aspetta e minore è la confidenza che l'ipotesi di Prout sia vera. Questo significa allora che la probabilità di un peso atomico di giacere in un intervallo di 35 – 36 non può essere distribuita uniformemente nell'intervallo, ma deve essere concentrata soprattutto intorno ai numeri interi. A questo punto possiamo assegnare le misure alle probabilità di cui abbiamo bisogno quindi: P(E/¬H K) = 0.01 x 0.6 + 0.01 x 0.4 = 0.01;

P(E/H K) = 0.02 x 0.4 = 0.008; P(E/A K) = 0.01 x 0.1 = 0.001;⋀

(15)

P(E/K) = 0.008 x 0.9 + 0.01 x 0.1 = 0.0082.

Finalmente possiamo derivare le probabilità a posteriori con il teorema di Bayes: P(H/E K) = 0.878 (ricordiamo che P(H/K) = 0.9); ⋀

P(A/E K) = 0.073 (ricordiamo che P(a) = 0.6). ⋀

Da questi risultati vediamo che alla luce dell'evidenza contraria, l'ipotesi che più è stata colpita negativamente è quella ausiliaria. Il modello bayesiano allora è stato in grado di spiegarci perché i chimici del tempo come Proust si sentivano legittimati a non abbandonare la loro teoria, ma piuttosto a modificare le loro osservazioni alla luce dell'evidenza.

Howson e Urbach (ibid., pag. 101) fanno notare che i risultati appena ottenuti non dipendono molto dai valori che vengono assegnati alle probabilità in questione, quindi l'accuratezza di quest'ultimi non è vitale per la spiegazione bayesiana del comportamento degli scienziati in quei casi dove vale il problema di Duhem e Quine. Per esempio se P(H/K) fosse stata posta pari a 0.7 e non 0.9, posto che tutto il resto fosse rimasto uguale, avremmo ottenuto che P(H/E K) = 0.65 e P(A/E K) = 0.21. Come prima allora, nonostante il cambiamento di assunzioni iniziali, l'ipotesi più danneggiata dalla predizione falsa è l'ipotesi ausiliaria, la quale è ancora più probabile che sia falsa piuttosto che vera, e non quella principale, che è ancora più probabile che sia vera che falsa.

Un fatto che emerge quando valori leggermente differenti vengono assegnati alle varie probabilità nell'esempio dell'ipotesi di Prout è che o l'ipotesi principale o quella ausiliaria possono effettivamente diventare più probabili una volta che la congiunzione H A viene⋀ rifiutata. Per esempio, posto che tutti gli altri valori rimangano i medesimi, se P(E/H ¬A K)⋀ ⋀ = 0.05, la probabilità a posteriori di P(H/E K) diventa 0.91 e quindi eccede la probabilità a⋀ priori assegnata all'ipotesi. Questo può sembrare bizzarro, ma non lo è se consideriamo che l'evidenza che rifiuta normalmente contiene molta più informazione di quanto è richiesta per confutare H A e che questa informazione in più può confermare la teoria H. ⋀

In generale la conferma dell'ipotesi H da parte dell'evidenza che confuta la congiunzione H A⋀ avviene quando P(E/K) < P(E/H K). Quest'ultima espressione è equivalente ad affermare che⋀ P(E/H K) > P(E/¬H K)⋀ ⋀ 2. Questo significa che quando un'evidenza si spiega più facilmente

quando un'ipotesi è vera piuttosto che falsa, allora quella teoria è confermata dall'evidenza in questione.

Supponendo quindi che la ricostruzione dei gradi di credenza sopra utilizzati sia storicamente corretta, il Bayesianesimo è stato allora in grado di spiegare l'attitudine e il comportamento

2 Questo avviene in quanto, dire che P(E/K) < P(E/H K) significa dire che l'ipotesi H è confermata dall'evidenza

E, ovvero che P(H/K) < P(H/E K). Il fatto che l'ipotesi H sia confermata dall'evidenza E implica che la sua negazione non è confermata dall'evidenza E e quindi che P(¬H/K) < P(¬H/E K), ovvero P(E/K) > P(¬E/H K). Era stato stabilito tuttavia che P(E/H K) > P(E/K), per la proprietà transitiva allora otteniamo che P(E/H K) > P(¬E/H K).

(16)

mostrato dagli scienziati durante un importante problema del diciannovesimo secolo. Earman (ibid., pag. 84) fa notare tuttavia che ancora non abbiamo trovato una soluzione al problema di Duhem e Quine, non se per soluzione intendiamo dimostrare che un modo di spartire la colpa è giustificato mentre gli altri non lo sono. È infatti perfettamente compatibile con il personalismo bayesiano il poter assegnare alle probabilità coinvolte nel calcolo, valori che rendono H colpevole invece di A. Questa problematicità rientra all'interno della più grande questione dell'oggettività dell'inferenza scientifica.

Nemmeno l'osservazione di Howson e Urbach riportata sopra può risolvere questo problema. Nell'esempio dei due studiosi otteniamo sempre il medesimo risultato secondo cui l'evidenza contraria mina maggiormente l'ipotesi principale rispetto a quella ausiliaria nonostante un cambiamento nelle assunzioni dei valori iniziali, unicamente nella misura in cui questi ultimi sono impostati in modo tale da darci quel medesimo risultato. Rimane il fatto che all'interno del modello bayesiano è perfettamente coerente assegnare valori ai termini in gioco che comportano un risultato differente da quello appena ottenuto. Infatti posto che i valori soggettivi che assegniamo alle probabilità in questione non violano gli assiomi delle probabilità, possiamo assegnare a queste ultime, senza contraddizione, valori differenti rispetto a quelli suggeriti dai documenti storici, i quali ci possono condurre a risultati differenti circa la soluzione del Problema di Duhem e Quine.

Alla luce di questa considerazione possiamo allora concludere che l'apparato bayesiano riesce a dare una rappresentazione illuminante del problema di Duhem e Quine, ma tuttavia una soluzione soddisfacente deve inserirsi all'interno della soluzione del problema più generale dell'obiettività che verrà preso in considerazione nel terzo capitolo.

2.2.5 – Dati buoni, dati cattivi, dati troppo buoni per essere veri

Andiamo ora a considerare altre caratteristiche relative alla conferma che il modello bayesiano è in grado spiegare.

Il Bayesianesimo anzitutto può rendere conto del fatto che, mentre, come abbiamo visto nell'esempio considerato nel sottoparagrafo 2.2.4, un'anomalia può avere un'influenza marginale su una teoria, una conferma ha un effetto positivamente drammatico su di essa. Consideriamo nuovamente l'esempio di Prout e supponiamo che l'osservazione E del peso atomico della clorina fosse stata un numero intero così come l'ipotesi dello scienziato prevedeva. Questo significa che P(E/H A K) sarebbe stata 1 e non 0. Se le altre probabilità⋀ ⋀ fossero state mantenute identiche, allora la probabilità a posteriori dell'ipotesi sarebbe stata pari a 0.998, a fronte di una probabilità a priori pari a 0.9. Inoltre, ancora più drammaticamente, se la probabilità a priori di H fosse stata 0.7, la sua probabilità a posteriori,

(17)

posto che tutti gli altri valori fossero rimasti costanti, sarebbe arrivata a 0.99.

Un altro fatto interessante che emerge dall'analisi bayesiana della conferma è che una predizione di successo derivata dalla combinazione di due teorie, per esempio (H A), non⋀ sempre contribuisce alla verità di H anche se la probabilità a priori dell'evidenza è piccola. Può addirittura accadere che la predizione mini la teoria. Consideriamo ancora l'esempio di Prout. Supponiamo che il peso atomico della clorina sia “misurato” non nel modo usuale utilizzato dai chimici, ma in un nuovo modo, il quale consiste nel concentrarsi fortemente sull'elemento in questione e scegliere un numero in modo casuale da un determinato range. Assumiamo inoltre che questo metodo assegni un valore numerico intero al peso atomico della clorina. Questo è quanto ci si aspetterebbe dall'ipotesi di Prout se le tecniche esotiche di misura fossero affidabili. Tuttavia il problema è che l'affidabilità del nuovo metodo non è molto probabile e come risultato la misurazione del peso atomico della clorina ottenuta mediante di esso non aggiunge nulla alla probabilità dell'ipotesi di Prout. Questa intuizione è spiegata dal modello bayesiano facendo dei semplici calcoli basati sulle formule sopra considerate. Poniamo, per ragioni simili a quelle di prima, P(E/H ¬A K) = P(E/¬H A K) =⋀ ⋀ ⋀ ⋀ P(E/¬H ¬A K) = 0.01 e poniamo P(A/K) essere molto piccola, per esempio 0.0001. Da⋀ ⋀ questo segue che P(H/K) e P(H/E K) assumono valori pari a due posti decimali. Questa⋀ constatazione è anche in grado di spiegarci lo scetticismo generale del mondo scientifico nei confronti delle varie predizioni sensazionali che il sociologo e psicologo Immanuel Velikovsky derivò dalla sua discussa teoria dei mondi in collisione, nonostante il fatto che alcune di queste si rivelarono essere vere. Per esempio, la predizione di Velikovsky dell'esistenza di ampie quantità di petrolio su Venere si basava non unicamente sulla sua teoria principale che i vari disastri naturali nel passato erano stati causati dalla collisione tra la terra e una cometa, ma anche su un certo numero di ipotesi ausiliare non dimostrate e molto poco plausibili, come quella che la cometa in questione, la quale dopo l'impatto si trasformò nel pianeta Venere, trasportava in origine idrogeno e carbonio e che questi due elementi furono convertiti in petrolio dalle scariche elettriche presumibilmente createsi nel violento impatto che la cometa ha avuto con la terra.

Il Bayesianesimo è anche in grado di spiegarci quelle circostanze in cui i dati sono detti “troppo buoni per essere veri”. Queste si verificano quando i dati si adeguano troppo perfettamente ad un'ipotesi, almeno più di quanto è ragionevole aspettarsi. Per esempio, se al tempo di Prout tutti i pesi atomici raccolti dallo scienziato fossero risultati essere numeri interi, questo risultato sarebbe stato considerato come studiato per impressionare e proprio per questa ragione non adeguato per confermare l'ipotesi. Come abbiamo detto, tali circostanze possono essere spiegate mediante il modello bayesiano. Vediamo come. Chiamiamo E

(18)

l'evidenza di, poniamo, 20 misurazioni del peso atomico di 20 elementi diversi, ognuna delle quali risulta essere un numero intero. Nessuno al tempo avrebbe considerato misurazioni così precise veritiere dal momento che si riteneva che queste fossero soggette all'errore sperimentale e quindi che avrebbero condotto a risultati in una certa misura differenti dal valore che l'ipotesi stabiliva. Chiamiamo A' l'ipotesi ausiliaria secondo cui i metodi di misurazione del tempo sono soggetti ad errori sperimentali. Data quest'ultima, è estremamente improbabile che le misurazione dei vari pesi atomici avrebbero tutte prodotto numeri interi, anche se l'ipotesi di Prout fosse stata vera. Su questa base abbiamo allora che P(E/H A' K) è⋀ ⋀ molto bassa e che nemmeno P(E/¬H A' K) può essere di molto più grande. Ora A' ha molte⋀ ⋀ possibili alternative, una delle quali è che gli esperimenti siano stati deliberatamente impostati in favore dell'ipotesi di Prout. Se questa fosse l'unica alternativa significante e in quanto tale equivalente ad ¬A', allora P(E/H ¬A' K) sarebbe molto alta e così anche P(E/¬H ¬A' K).⋀ ⋀ ⋀ ⋀ Andiamo ora a vedere come l'evidenza E si relaziona con l'ipotesi principale H considerata da sola.

Riprendiamo a questo punto la formula (21) secondo cui:

P(E/H K) = P(E/H K A)P(A/H K) + P(E/H K ¬A)P(¬A/H K).⋀ ⋀ ⋀ ⋀ ⋀ ⋀ ⋀

Come è stato detto precedentemente, le teorie A e H possono essere considerate indipendenti, da cui deriva che P(A/H K) = P(A/K) e P(¬A/H K) = P(¬A/K). Abbiamo inoltre specificato⋀ ⋀ poc'anzi che P(E/H K ¬A) ha un valore molto piccolo, vicino allo zero, cosicché il secondo⋀ ⋀ prodotto alla destra dell'uguale in (21) può essere trascurato. Da queste considerazioni otteniamo che l'espressione (21) diventa:

P(E/H K) = P(E/H ¬A' K)P(¬A'/K). (25)⋀ ⋀ ⋀ In base al medesimo ragionamento, l'espressione (24) diventa:

P(E/¬H K) = P(E/¬H ¬A' K)P(¬A'/K). (26)⋀ ⋀ ⋀ Riprendiamo ora la formula (19) secondo cui:

P(E/K) = P(E/H K)P(H/K) + P(E/¬H K)P(¬H/K),⋀ ⋀

sostituendo ai termini alla destra dell'uguale le espressioni (25) e (26) otteniamo:

P(E/K) = P(E/H ¬A' K)P(¬A'/K)P(H/K) + P(E/¬H ¬A' K)P(¬A'/K)P(¬H/K). (27)⋀ ⋀ ⋀ ⋀ La strumentazione che produce in modo deliberato i numeri falsamente interi, lo farebbe a prescindere se H fosse vera o falsa. Questo significa che P(E/H ¬A' K) = P(E/¬H ¬A' K),⋀ ⋀ ⋀ ⋀ da cui otteniamo che l'espressione (27) diventa:

P(E/K) = P(E/H ¬A' K)P(¬A'/K)[P(H/K) + P(¬H/K)]. (28)⋀ ⋀ L'addizione all'interno della parentesi quadra ci dà un risultato pari ad 1, quindi (28) diventa:

P(E/K) = P(E/H ¬A' K)P(¬A'/K). (29)⋀ ⋀ A questo punto applicando il teorema di Bayes per capire quanto grande è la probabilità della

(19)

teoria di Prout alla luce di E e compiendo le dovute sostituzioni, otteniamo l'espressione (30): P(H/E K) = ⋀

P(E/H K)P(H/K)/P(E/K) = P(E/H ¬A' K)P(¬A'/K)P(H/K)/P(E/H ¬A' K)P(¬A'/K).⋀ ⋀ ⋀ ⋀ ⋀ Compiendo le dovute semplificazioni nell'espressione (30) otteniamo:

P(H/E K) = P(H/K). ⋀

Il teorema di Bayes allora è in grado di spiegarci perché E non conferma in modo significativo la teoria anche se l'evidenza si conforma perfettamente ad essa.

Un calcolo simile a quello fatto precedentemente ci mostra che la probabilità di A' alla luce di E diminuisce e che quindi la probabilità della sua ipotesi alternativa, ¬A', alla luce di E, aumenta, ovvero aumenta la probabilità che i dati sperimentali siano stati fabbricati.

Un caso famoso di dati considerati troppo buoni per essere veri è quello dei risultati che Mendel ottenne nei suoi esperimenti sulla riproduzione delle piante. Vediamo come si struttura questa critica. La teoria genetica dell'eredità formulata dal monaco agostiniano ci permette di calcolare la probabilità con cui certe piante producono certi tipi di prole. Per esempio, sotto certe circostanze, la probabilità che piante di piselli di un particolare tipo possano produrre rispettivamente semi rotondi e rugosi è del 0.75 e 0.25. Mendel nei suoi esperimenti ottenne frequenze che si adattavano molto bene alle probabilità stimate, ricavandone quindi un grande supporto per la sua teoria. Howson e Urbach (ibid., pag. 105) ci dicono che proprio per questa ragione lo statistico britannico R. A. Fisher sollevò delle perplessità sugli esperimenti dello scienziato. Questi tuttavia, ci dicono i due autori, non riteneva che Mendel avesse modificato i suoi dati affinché questi fossero in accordo con la sua teoria – dal momento che una tale supposizione avrebbe significato mettere interamente in dubbio il peso dell'evidenza fornita in dettaglio dai suoi scritti – ma tuttavia considerava una possibilità tra le altre il fatto che lo studioso potesse essere stato ingannato da qualche suo assistente che conosceva molto bene le sue aspettative. Howson e Urbach ritengono che la posizione dello statistico non sia adeguata, appellandosi al principio generale secondo cui i dati possono essere considerati troppo buoni per essere veri in relazione ad una data ipotesi, unicamente nella misura in cui questi stessi possono essere spiegati in modo migliore da un'ipotesi ausiliaria alternativa secondo cui questi sono stati truccati. Questa spiegazione si conforma all'esempio esposto poc'anzi. In quella circostanza avevamo visto che le misurazioni che ci danno numeri interi troppo perfetti per esprimere i pesi atomici, non supportano la teoria di Prout dal momento che è possibile trovare un'ipotesi alternativa ausiliaria ¬A' la quale spiega i dati in modo migliore. I due studiosi ritengono che un tale principio si accordi con l'intuizione, in quanto se le tecniche per calcolare il peso atomico degli elementi fossero state stabilite come accurate e se attente precauzioni fossero state prese contro i pregiudizi

(20)

dello sperimentatore, allora tutte le alternative naturali all'ipotesi di Prout sarebbero state eliminate e i dati non sarebbero apparsi più sospettosamente buoni, ma piuttosto veritieri. I due osservano che Fisher invece non si è basato su questo principio, almeno non esplicitamente. Egli infatti riteneva che i risultati di Mendel si pronunciassero contro la teoria genetica dello stesso a prescindere dalle spiegazioni alternative che questi potessero suggerire. 2.2.6 – La spiegazione bayesiana di un esperimento ben progettato

Come abbiamo detto all'inizio di questo lavoro le ipotesi scientifiche possono essere confermate o mediante esperimenti deliberatamente studiati oppure mediante l'osservazione di fenomeni naturali. Se un dato modello, come quello bayesiano, vuole rendere ragione della teoria della conferma deve quindi spiegare quelle considerazioni intuitive secondo cui un esperimento è ben progettato, le quali ci permettono quindi di capire se vale la pena farlo. Una tale conoscenza è fondamentale soprattutto se si considera la grande spesa economica che comporta il fare esperimenti, che, se questi non fossero ben progettati, andrebbe persa. Il modello bayesiano di conferma è in grado di rendere ragione di queste considerazioni intuitive. Vediamo in cosa queste consistono e come il Bayesianesimo ce le spiega. Intuitivamente si ritiene che un esperimento sia ben progettato quando esso ci dà buone possibilità di produrre un risultato (quasi) decisivo, ovvero un risultato che ci permetta di dire che l'ipotesi che stiamo indagando è (quasi) certamente vera oppure che riesca ad escludere le altre ipotesi iniziali, quindi a rivelare che queste sono (quasi) certamente false.

Vediamo come il modello bayesiano riesce a rendere conto di queste intuizioni. Supponiamo di aver a disposizione n ipotesi rivali (H1, …, Hn), le quali sono in concorrenza per la

spiegazione di un dato fenomeno e che queste siano le uniche serie contendenti per la verità, nel senso che la loro probabilità totale è 1 o vicina ad 1. Siamo interessati nell'acquisire un'evidenza decisiva E che, per qualche Hi, porti P(Hi/E K) vicino ad uno o che porti la⋀

probabilità del numero maggiore dei termini P(Hj/E K) vicino a 0. Consideriamo ora un⋀

esperimento di cui uno degli esiti è E. Dal modello bayesiano segue che più grande è P(E/K), maggiore è la probabilità di raggiungere un risultato decisivo e quindi migliore è l'esperimento. A questo punto tuttavia emerge una strana situazione, in quanto, come abbiamo visto, per confermare un'ipotesi occorre che P(E/K) < P(E/H K), ma dall'altro lato una⋀ condizione affinché abbia senso fare un esperimento è che P(E/K) sia mediamente alta. Sono queste due separate condizioni allora che ci dicono quanto bene un esperimento è strutturato e si tratta di condizioni che solitamente ci conducono in due direzioni diverse. Altri tre fattori da prendere in considerazioni per decidere se fare oppure no un esperimento sono: il costo dell'esperimento, la moralità nello svolgerlo, il valore (sia teoretico che pratico) dell'ipotesi in

(21)

cui si è interessati; fattori su cui il modello bayesiano non ci dice, e non può dirci, nulla. 2.2.7 – La spiegazione standard e la spiegazione bayesiana dell'adeguatezza delle ipotesi ad

hoc

In questo sottoparagrafo metteremo a confronto la trattazione bayesiana e quella standard dell'adeguatezza delle ipotesi ad hoc. Anzitutto spiegheremo in che cosa consiste questo genere di ipotesi e successivamente come si struttura la spiegazione classica e quella bayesiana della loro adeguatezza. Come abbiamo visto, il modello bayesiano è stato in grado di spiegarci il comportamento degli scienziati nei casi in cui vale il problema di Duhem e Quine. Nell'esempio preso in considerazione precedentemente, il Bayesianesimo ci ha spiegato perché Prout e altri scienziati del suo tempo si sentivano giustificati a credere nell'ipotesi relativa ai pesi atomici nonostante l'evidenza contraria. Come abbiamo visto infatti, in base ad una ricostruzione storica dei gradi di credenza del tempo, l'evidenza contraria lasciava illesa l'ipotesi principale, mentre discreditava fortemente quella ausiliaria. Quando un'insieme di ipotesi ausiliare viene discreditato da un'evidenza contraria, gli scienziati introducono frequentemente nuove ipotesi ausiliarie che combinate con la teoria principale ci spiegano i dati anomali precedentemente ottenuti. Nel caso di Prout la nuova ipotesi ausiliaria che combinata con l'ipotesi principale ci permetteva di spiegare le anomalie ottenute era quella secondo cui i metodi di misurazione del tempo non erano accurati. A volte tuttavia sembra che le nuove assunzioni ausiliarie introdotte siano costruite con il solo scopo di salvare l'ipotesi principale. Recentemente è stato adottato il termine “ipotesi ad hoc” per questo tipo di assunzioni, probabilmente perché si tratta di ipotesi che non sarebbero mai state introdotte se non ci fosse stato il bisogno di accordare teoria ed evidenza. Questo termine viene generalmente utilizzato in modo dispregiativo e le ipotesi che cadono nella categoria “ad hoc” sono molto spesso respinte come ipotesi più o meno indegne. Vedremo tuttavia, con l'aiuto di alcuni esempi, che non tutte le ipotesi ad hoc possono essere condannate così velocemente. Proprio per questo motivo il pensiero filosofico ha cercato dei criteri per valutare l'adeguatezza di questo genere di ipotesi. Come abbiamo accennato, metteremo a confronto sia l'analisi classica sia quella bayesiana a questo riguardo.

Prima di entrare nello specifico della questione, vediamo alcuni esempi di ipotesi ad hoc. Il primo esempio che considereremo è la teoria dell'amnesia collettiva del già citato Immanuel Velikovsky. Questi nella sua opera Mondi in collisione (1950) avanzò una teoria secondo cui la terra era stata soggetta durante vari stadi della sua storia a disastri cosmici prodotti da passaggi di comete massicce vicino alla terra. Una di queste comete, che poi si rivelò essere il pianeta Venere, sarebbe passata vicino alla terra durante la cattività di Israele in Egitto e

(22)

avrebbe causato i noti eventi ad essa connessi, come le dieci piaghe e la divisione del Mar Rosso. Una delle predizioni della teoria era che ogni gruppo di persone nel mondo ricordava questi tremendi accadimenti e che, se avessero avuto modo di tenerne traccia scritta, lo avrebbero fatto. Tuttavia molte comunità non riportarono nulla al di fuori dell'ordinario nei loro scritti. Nonostante questo, Velikovsky rimase convinto della verità della sua teoria e per rendere conto dell'evidenza negativa, introdusse l'ipotesi ad hoc dell'amnesia collettiva. Secondo questa ipotesi i cataclismi furono così orribili che la totalità delle persone agiva come se avessero dimenticato quegli eventi. Lo studioso riteneva che riportare alla luce tali memorie non fosse un compito molto diverso da quello di superare l'amnesia in una singola persona. L'amnesia individuale viene presa in considerazione nel prossimo esempio di ipotesi

ad hoc relativo alla teoria della Dianetics.

Secondo la Dianetics la causa dell'insanità e dello stress mentale è l'immagazzinamento di informazioni in aree inappropriate del cervello. Secondo la teoria, mediante un riordinando di queste informazioni, la sanità mentale viene riacquistata e la compostezza e la memoria migliorate. Essendo la teoria molto costosa, poche persone si sono approcciate ad essa. Un apparente tentativo di successo fu quello di una studentessa che l'inventore della Dianetics, L. Ron Hubbard, esibì ad un pubblico molto vasto dicendo che ella aveva un perfetto ricordo di ogni momento della sua vita. Le domande del pubblico purtroppo mostrarono che la povera ragazza aveva una memoria molto imperfetta. Hubbard spiegò questo fatto mediante la seguente ipotesi ad hoc: quando la ragazza fece la sua apparizione sul palco all'inizio, le venne chiesto di farsi avanti “ora”; questa parola la bloccò nel momento presente e paralizzò la sua capacità di ricordare il passato.

Il terzo esempio di ipotesi ad hoc che proponiamo è il seguente. Alcune ricerche sulla distribuzione del QI hanno mostrato che differenti gruppi di persone variano nei loro livelli medi di intelligenza. Un gruppo di cosiddetti “ambientalisti” ha assegnato un livello medio molto basso di QI a coloro che vivono in condizioni sociali povere. Questa spiegazione tuttavia ha incontrato un'evidenza contraria in un largo gruppo di eschimesi che conducevano un'esistenza povera da ubriachi inefficienti, i quali tuttavia avevano dei livelli di QI molto alti. Per spiegare questa evidenza contrastante, venne avanzata un'ipotesi ad hoc secondo cui crescere all'interno di un iglù ha dato un giusto grado di agio, sicurezza e contatto reciproco per condurre una buona performance nei test di intelligenza.

In tutti quanti i tre casi esposti, le teorie ausiliarie avanzate sembrano insoddisfacenti. Il motivo è che probabilmente esse non sarebbero mai state introdotte se non in risposta a qualche anomalia empirica particolare. Questo ci spiega perché tali teorie sono dispregiatamene chiamate ad hoc. Il termine infatti sta ad indicare che queste sono state

(23)

avanzate per evadere specifiche difficoltà. Ci sono tuttavia, come abbiamo detto, alcune teorie di questo tipo che non possono essere condannate così velocemente. Un esempio è quello di un'ipotesi ad hoc che ha salvato la teoria di Newton da una specifica difficoltà e che ha condotto alla scoperta di un pianeta. Vediamo nello specifico di che cosa si tratta. I newtoniani cercarono a lungo e senza successo di spiegare il movimento del pianeta Urano, ma la differenza tra le predizioni della teoria e le osservazioni sperimentali eccedeva i limiti previsti dall'errore sperimentale. Due astronomi, John Couch Adams e Urbain Jean Joseph Le Verrier, lavorando indipendentemente avanzarono una teoria che postulava l'esistenza di un pianeta e quindi di una nuova fonte di attrazione gravitazionale su Urano. Questa teoria venne successivamente confermata con osservazioni telescopiche molto attente e studi di vecchie mappe, le quali rilevarono la presenza di un nuovo pianeta con le caratteristiche anticipate, Nettuno.

Per spiegare la differenza tra quest'ultimo esempio e gli altri, i filosofi hanno proposto due criteri di accettabilità per le ipotesi ad hoc: il primo è che (H A'), dove H è l'ipotesi principale e A' è l'ipotesi ausiliaria rivista, deve avere delle implicazioni indipendenti dall'evidenza che ha condotto al rifiuto di (H A), dove A è l'ipotesi ausiliaria originaria; il secondo è quello⋀ secondo cui alcune di queste implicazioni indipendenti devono essere verificate. Questi criteri di adeguatezza ci spiegano perché i primi tre esempi sembrano essere sviluppi scientifici insoddisfacenti, mentre il quarto non lo è, dal momento che la teoria del nuovo pianeta è supportata da un'evidenza differente rispetto a quella che ha condotto al rifiuto originario. I bayesiani tuttavia ritengono che il modello di adeguatezza delle ipotesi ad hoc appena presentato manca della caratteristica fondamentale che ci permette di dire quali ipotesi di questo genere debbano essere considerate adeguate oppure no, ovvero la probabilità a posteriori dell'ipotesi in questione. Questa è la caratteristica che dovrebbe influenzare in generale l'accettabilità di qualsiasi ipotesi scientifica. Essi nello specifico sostengono che affinché un'ipotesi, sia essa ad hoc oppure no, sia accettabile, la sua probabilità a posteriori dovrebbe eccedere lo 0.5. Una tale soglia numerica viene scelta in quanto si ritiene che se una teoria è più probabile di 0.5, allora è più probabile che essa sia vera piuttosto che falsa. In base a questo modello di interpretazione, l'ipotesi ad hoc A' non sarà adeguata nella misura in cui P(A'/E' K)≤0.5, dove E' è l'evidenza che ha condotto al rifiuto della precedente (H A K).⋀ ⋀ ⋀ Non c'è quindi alcuna ragione per cui A' debba essere supportata da un'evidenza indipendente da E'; tutto ciò che si richiede è che la teoria in questione sia credibile. Secondo i bayesiani un tale criterio riflette anche il comportamento degli scienziati i quali sono interessati soprattutto nel capire se H, alla presenza di A', ci fornisce una spiegazione ammissibile dell'anomalia E' e questo accade appunto quando H A' è una teoria sufficientemente credibile. Dal momento⋀

(24)

tuttavia che P(H A/E' K)≤P(A/E' K), (H A) è sufficientemente credibile alla luce di E'⋀ ⋀ ⋀ ⋀ unicamente nella misura in cui A è un'ipotesi ad hoc adeguata alla luce di E'.

Howson e Urbach (ibid., pagg.111 – 112) vogliono dimostrare, sia mediante controesempi sia mediante un argomento più generale, che il modello standard di valutazione dell'adeguatezza delle ipotesi ad hoc è sbagliato. Iniziamo con il prendere in considerazione i controesempi da loro proposti. Nel primo i due ci chiedono di prendere in considerazione un'ipotesi secondo cui una determinata urna contiene unicamente dei gettoni rossi e di immaginare di effettuare un esperimento che consiste nell'estrarre i gettoni, con riemissione, in modo causale. Ci dicono inoltre di immaginare di ripetere questo esperimento, diciamo, 10,000. Il risultato è che 4950 dei gettoni estratti e poi riposizionati dentro l'urna è rosso e il resto dei gettoni è bianco. L'ipotesi iniziale e le varie necessarie assunzioni ausiliari sono rifiutate e la revisione naturale della teoria è che l'urna contiene gettoni rossi e bianchi in una proporzione approssimativamente uguale. Quest'ultima operazione sembra essere perfettamente legittima e l'ipotesi rivisitata sembra essere altamente giustificata dall'evidenza. Non c'è tuttavia in questo esempio nessuna evidenza indipendente per la nuova ipotesi: il suo supporto deriva unicamente dall'evidenza che ha discreditato l'ipotesi precedente.

Un'obiezione che può essere fatta a questo controesempio di Howson e Urbach è che esso prende in considerazione un'ipotesi statistica e non un'ipotesi genuinamente scientifica. I due autori, avendo probabilmente in mente una tale obiezione, ci dicono che sebbene quello dell'urna e dei gettoni sia una forma umile di ricerca, non c'è nessuna ragione di ritenere che queste conclusioni non valgano anche nel caso nelle scienze più alte. Per dimostrarcelo, essi prendono in considerazione un esempio tratto dalla teoria dell'eredità di Mendel. Facciamo l'assunzione secondo cui due caratteristiche di una pianta sono ereditate in accordo ai principi di Mendel e che ognuna di queste sia controllata rispettivamente da due geni specifici posizionati su due differenti cromosomi. I risultati degli esperimenti condotti sulle piante mostrano che entrambe queste due caratteristiche sono presenti in un numero molto ampio di piante. A questo punto l'assunzione originaria che i geni agiscono indipendentemente viene rivista in favore di una teoria che posiziona questi due geni nel medesimo cromosoma. La teoria rivista, anche in questo caso, risulta essere confermata dall'evidenza che ha rifiutato quella originaria e tuttavia essa appare perfettamente accettabile.

Passiamo ora all'obiezione più generale che i due autori rivolgono al modello standard delle ipotesi ad hoc. Essi ci chiedono di immaginarci uno scienziato che esegue un esperimento ed osserva E', che, poiché implica la negazione della predizione E fatta da (H A K), rifiuta la⋀ ⋀ combinazione delle due teorie. Supponiamo che venga introdotta ad hoc una nuova teoria (H A'), la quale, secondo il modello classico, non è adeguata in uno o l'altro dei due sensi⋀

Riferimenti

Documenti correlati

Lo scopo della tesi è indagare la capacità del modello bayesiano di rendere ragione della razionalità scientifica. Per comprendere appieno l'intento del lavoro occorre spiegare

La costruzione delle ipotesi costituisce però un nodo problematico: infatti, diversamente da Sydenham, Baglivi non nega che le ipotesi possano avere un ruolo nella pratica clinica,

Lo stesso vale per la tecnica del gruppo cooperativo, che, prevedendo piccoli gruppi di alunni che lavorano insieme per migliorare il proprio apprendimento, è, insieme

Nel contesto della vita quotidiana della scuola si collocano occasioni, bisogni, esigenze reali che si prestano ad essere trasformati in stimolanti situazioni problematiche che

Seguendo questa scelta si impongono posizioni vincolanti, dato che i lati della stessa lunghezza di un triangolo isoscele devono essere disegnati obbligatoriamente obliqui rispetto

Quel verso donniano- campiano – Campo è stata a sua volta un’eccelsa scrittrice del Novecento (Campo, 1987) – in effetti mi torna alla mente sia quando si dice che la letteratura

L’uso dei connettori senza ago (needle less device) (variabile indipendente) riduce l’incidenza delle infezioni dei CVC (variabile dipendente) nei pazienti sottoposti a

• Fare un gesso con materiale sintetico diminuisce l’incidenza di danni cutanei rispetto a farlo con gesso tradizionale?. • Mettere una maglia a contatto con la pelle diminuisce