• Non ci sono risultati.

Il prigioniero iterato: il punto di vista matematico

Il dilemma del prigioniero iterato: un problema aperto

10. Il prigioniero iterato: il punto di vista matematico

Dalla nostra precedente analisi è risultato che la strategia di (defeziona incon-

dizionatamente) è dominante nelle situazioni tipo prigioniero. È anche risul- tato che molte situazioni sociali significative hanno proprio la struttura del prigioniero. In generale solo in pochi casi il prigioniero diventa un gioco coo- perativo, cioè nel quale è possibile una strategia coordinata. Strategia che a sua volta può essere cercata dai due giocatori mediante una trattativa16. Nella maggior parte delle nostre decisioni che riguardano il bene pubblico ci tro- viamo senza cooperazione confinati all’interno di un dilemma del prigioniero e quindi conviene defezionare. D’altra parte defezionare ci porta spesso al punto di equilibrio D,D che non è un ottimo paretiano.

Sarebbe dunque molto interessante dal punto di vista politico-morale, se si riuscisse a dimostrare che in certe situazioni di interazione sociale la stra- tegia di non sia la migliore.

La prima cosa che viene in mente è quella di due giocatori che giocano il prigioniero più volte. Si potrebbe pensare che in un caso del genere la strate- gia di non sia più dominante. Purtroppo è facile dimostrare il contrario. Met-

tiamo che A e B si incontrino n volte. All’ennesima partita conviene defezionare, perché è l’ultima e quindi è come un prigioniero a un solo giro. A questo punto consideriamo la n-1esima partita. È diventata l’ultima e quindi conviene defezionare, tanto qualsiasi cosa farà l’altro abbiamo già deciso di defezionare nell’ultima. Con questa procedura induttiva a ritroso si arriva a

dimostrare che l’equilibrio per entrambi i giocatori in un prigioniero ripetuto n volte con n finito è sempre di, di.

Tuttavia è importante notare che la scelta della strategia di nel prigioniero

ripetuto si basa su un assunto molto forte, cioè che l’altro si comporti in modo ripetutamente razionale qualsiasi cosa succeda. Il che è molto irrealistico.

Inoltre consideriamo la possibilità che il prigioniero venga reiterato in-

definitamente. Non un numero infinito di volte, che porterebbe a utilità infi-

nite e quindi incomparabili fra loro, ma un numero indefinito di volte. Facciamo l’ipotesi, ad esempio, che ci sia sempre la probabilità p che ci si incontri ancora una volta. Per cui ci sarà una probabilità pn che ci si incontri n volte. E per nessun n la probabilità sarà 0. In questo caso non si può appli- care l’induzione a ritroso17. Inoltre si può dimostrare che esistono altri punti di equilibrio. Ad esempio supponiamo che A adotti la cosiddetta strategia GRIM, che consiste nel cooperare sempre; se però l’altro defeziona da quel momento in poi con lui si defeziona sempre. È facile vedere che se A e B entrambi giocano GRIM a nessuno dei due conviene cambiare, per cui GRIM, GRIM è un punto di equilibrio. Infatti se ad esempio A defeziona alla partita n senza che B abbia defezionato, porterà anche B a defezionare e perderà un’utilità pari a (pn+1+pn+2+…)C rispetto a un guadagno pnO. In molti casi sarà:

(pn+1+pn+2+…)C>pnO

E allora GRIM, GRIM diventa un punto di equilibrio.

Tuttavia è molto più realistico considerare che semplicemente quando giochiamo un prigioniero ignoriamo se incontreremo ancora il nostro avver- sario, cioè in pratica p è sconosciuta. Possiamo assimilare questa situazione a un prigioniero giocato infinite volte. Dobbiamo tuttavia evitare che le utilità vadano all’infinito. Per fare questo si procede nella maniera seguente. Consi- deriamo il solito prigioniero:

Immaginiamo che sia giocato infinite volte da un automa che ha una prima mossa determinata e poi una reazione stereotipata a come l’altro si è compor- tato nei giri precedenti. Ad esempio prima mossa c, poi se l’ultima mossa dell’altro è stata c allora c e se è stata d allora d. Indichiamo questo automa con c, cc, dd. I possibili automi che si basano solo su un giro precedente saranno: c, cc, dd c, cd, dd c, cc, dc c, cd, dc d, cc, dd d, cc, dc d, cd, dd d, cd, dc

Qui abbiamo considerato gli automi finiti che si basano solo su un giro precedente. Ovviamente esistono infiniti automi finiti che possono prendere in considerazione un numero n grande a piacere di round precedenti.

Siccome gli automi sono finiti ogni gioco sarà di fatto un ripetersi infinito di uno stesso ciclo. Indichiamo come utilità attesa di A e B quella media del ciclo corrispondente alle strategie scelte, cioè agli automi designati dai due giocatori. In questo modo si evita che l’utilità vada all’infinito.

Riprendiamo ora in considerazione la figura precedente. Sappiamo che d,d è il punto di equilibrio per entrambi i giocatori. Chiamiamo l’area punteg- giata “regione di cooperazione”. Essa consiste in tutti quei possibili risultati in cui sia A che B hanno almeno il loro maximin. A questo punto possiamo formulare un caso particolare del fondamentale “teorema popolare” (folk

In un dilemma del prigioniero fra due automi finiti ripetuto un numero sufficiente di volte da ottenere la realizzazione di un ciclo, nella regione di cooperazione esistono infiniti punti di equilibrio se l’utilità viene cal- colata facendo la media sul ciclo.

In pratica questo vuol dire che non solo la strategia di, di è in equilibrio,

ma lo è anche la strategia GRIM, GRIM, come abbiamo visto e pure la stra- tegia ci, ci, cioè la cooperazione incondizionata e altre infinite. Come ci sa-

remmo aspettati, nel prigioniero reiterato indefinitamente – che è molto più realistico – la strategia di, di non è l’unico equilibrio.

Si può dimostrare un teorema ancora più forte che ha grande significato politico. Nella regione di cooperazione esistono anche infiniti punti che non solo sono di equilibrio, ma che sono anche di equilibrio per ogni subgioco, cioè per un gioco che si ottiene tagliando una parte lunga quanto si vuole dei primi round. Questo è molto importante, perché quei punti garantiscono che chiunque si allontani dalla strategia di equilibrio venga sempre punito. L’esempio più semplice di questo equilibrio perfetto è la coppia GRIM, GRIM. In pratica i giocatori di questo tipo di gioco si regolano reciproca- mente evitando le deviazioni e facendo un lavoro di reciproco controllo18.