La teoria dei giochi

Spesso, prima di prendere una decisione, il soggetto deve formarsi un’opinione sul modo in cui agiranno gli altri, tenendo conto altresì del fatto che questi faranno lo stesso nei confronti della sua decisione. L’analisi di queste decisioni interdipendenti è nota come teoria dei giochi. Così come la teoria generale della scelta razionale, anche la teoria dei giochi ha finalità in parte prescrittive e in parte predittive. Da un lato essa mira a determinare in che modo esseri razionali, che si attribuiscono reciprocamente comportamenti razionali, agirebbero in situazioni di mutua interdipendenza. Dall’altro lato la teoria dei giochi si propone di spiegare il comportamento reale in base all’assunto della reciproca attribuzione di razionalità. Sebbene il primo obiettivo sia stato realizzato più pienamente, la teoria dei giochi può vantare anche alcuni successi empirici, in particolare nel campo della strategia militare e in quello dell’organizzazione industriale.
I giochi possono essere classificati in vari modi. Da un punto di vista metodologico, la distinzione più importante è quella tra giochi cooperativi e giochi non cooperativi. Poiché la teoria dei giochi cooperativi non si basa sulla teoria della scelta razionale, non la tratteremo in questa sede. Altre importanti distinzioni sono quelle tra giochi tra due persone e giochi tra n-persone; tra giochi con mosse simultanee e giochi con mosse in sequenza; tra giochi a somma costante e giochi a somma variabile; tra giochi giocati una volta sola, o istantanei, e giochi ripetuti. Una classificazione può essere fatta anche in base alla quantità di informazione disponibile ai giocatori, in particolare l’informazione relativa alle preferenze degli altri giocatori e alle scelte da loro effettuate.

Struttura del gioco


Un gioco è definito dai seguenti elementi: 1) il numero dei giocatori; 2) le strategie a disposizione di ciascun giocatore (ognuno dei quali è indicato da un numero). Oltre alle strategie pure che hanno efficacia causale immediata, i giocatori possono scegliere anche strategie miste, ossia una distribuzione delle probabilità sulle strategie pure. Un esempio di strategia mista è quello di un generale che si affida al lancio della moneta per decidere se dirigersi verso nord o verso sud (due strategie pure); 3) per ciascun giocatore e ciascuno stato del mondo, l’utilità cardinale di un dato giocatore in un dato stato del mondo; 4) una tabella che associa a ogni combinazione di n strategie (una strategia per ogni giocatore) uno stato del mondo. Per svariati scopi è conveniente combinare la 3) e la 4) nella 5): una tabella che associa a ogni combinazione di n strategie pure n numeri di utilità. Questa tabella viene spesso chiamata matrice dei guadagni (nella fig. 4 sono riportati alcuni esempi); 6) la quantità di informazione di cui dispone ogni giocatore in ogni fase del gioco. L’informazione pertinente non riguarda solo la matrice di guadagni, ma anche l’informazione in possesso degli altri giocatori. Una caratteristica del gioco è detta conoscenza comune se è nota a tutti, se è noto a tutti che è nota a tutti, e così via ad infinitum.
Lo scopo della teoria dei giochi è quello di determinare la soluzione del gioco. Intuitivamente, una soluzione è un insieme di strategie scelte per ‘parallelismo consapevole’, nel senso che sono previste in anticipo da tutti i giocatori. Una soluzione, se esiste, è una combinazione di n strategie che costituiscono le risposte reciproche ottimali, nel senso che nessun giocatore può conseguire un risultato migliore adottando unilateralmente una strategia diversa. Ogni soluzione di questo tipo è chiamata punto di equilibrio del gioco. A eccezione di alcuni casi marginali, tutti i giochi hanno un punto di equilibrio. Molti, anzi, ne hanno più di uno, e in questo caso il compito consiste nel selezionare un equilibrio che rappresenta l’unico oggetto di tacita convergenza per giocatori che agiscono razionalmente. Se non esiste alcun punto di equilibrio, abbiamo a che fare con giochi senza soluzione. In questi casi la teoria dei giochi non ha alcun valore prescrittivo o predittivo. Essa ha un valore predittivo ridotto quando esiste una soluzione che implica l’uso di strategie miste. Nei giochi di questo tipo ogni giocatore che ha una strategia di equilibrio mista può ottenere un risultato altrettanto buono (ma non migliore) scegliendo un’altra strategia, posto che gli altri giocatori usino le loro strategie equivalenti, quella che dà il migliore tra i risultati peggiori (la sua strategia di sicurezza). Fatta eccezione per i giochi a somma costante, questa non sarà in generale la strategia di equilibrio.

Giochi a somma costante e giochi a somma variabile


Mentre nei giochi a somma costante (definiti anche ‘a somma nulla’) i giocatori hanno interessi direttamente contrapposti, in quelli a somma variabile (detti anche ‘a somma non nulla’) possono avere interessi convergenti o un misto di interessi convergenti e confliggenti. Nel primo tipo rientrano tutti i giochi competitivi (poker, bridge, scacchi, tennis, ecc.) e, almeno in prima approssimazione, i conflitti militari. Nei giochi con interessi totalmente convergenti, o giochi di pura cooperazione, l’unica cosa che conta è la coordinazione rispetto alla stessa politica. Un esempio assai semplice è il gioco seguente: a due individui viene promesso un guadagno di dieci dollari ciascuno se riusciranno a nominare lo stesso numero positivo. Nei giochi misti, i giocatori hanno un interesse comune nell’incrementare il guadagno totale da ripartire e interessi divergenti per quanto riguarda le quote che spettano a ciascuno di essi. Le relazioni tra lavoratori e datori di lavoro, ad esempio, tendono a essere di questo tipo. Da un lato le due parti hanno un interesse comune a massimizzare il reddito globale dell’azienda, in modo da accrescere il totale da ripartire; dall’altro, le strategie di cui dispongono per incrementare le proprie quote tendono spesso a ridurre tale reddito globale. Se i lavoratori scioperano, si avrà un calo della produzione e del reddito; se dal canto loro gli imprenditori decidono di costituire ingenti scorte per rendere l’azienda meno vulnerabile agli effetti dello sciopero, anche in questo caso a risentirne sarà il reddito totale dell’impresa.

Alcuni giochi tra due persone con mosse simultanee


Alcune delle applicazioni più note della teoria dei giochi riguardano giochi misti che comportano sia conflitto che cooperazione. Quattro esempi sono riportati nella fig. 4. In ciascuno di essi vi sono due giocatori, I e II (molte delle osservazioni seguenti possono essere generalizzate a giochi a n persone). Ognuno di essi può scegliere tra due strategie: in tre dei giochi illustrati, queste sono C (cooperazione), e D (defezione). Nella ‘battaglia dei sessi’ le strategie S1 e S2 sono le strategie preferite rispettivamente da I e da II. Per ogni coppia di strategie, lo stato del mondo che ne risulta ha per ciascun giocatore un determinato valore di utilità. In ciascuna casella di ogni gioco, il primo numero indica l’utilità per I, il secondo l’utilità per II. I risultati contrassegnati con un cerchio sono i punti di equilibrio dei giochi, ossia le coppie di strategie che costituiscono le risposte reciproche ottimali.
Il ‘dilemma del prigioniero’ è forse il gioco più famoso, in quanto rappresenta vividamente il possibile conflitto tra la razionalità di ciascun giocatore come individuo e il risultato ottimale per l’insieme dei giocatori come collettività. Dal punto di vista del singolo giocatore, la linea d’azione razionale è la defezione: ognuno otterrà un risultato peggiore di quello che avrebbe ottenuto optando per la cooperazione. L’inquinamento offre un altro esempio. Per il singolo individuo spesso è razionale inquinare, poiché i danni che egli subisce dal proprio contributo all’inquinamento generale sono trascurabili; tuttavia, quando tutti inquinano, ottengono un risultato peggiore di quello che si sarebbe ottenuto se nessuno avesse inquinato. Un altro esempio è la formazione di cartelli. Per una singola impresa in un dato settore industriale, il comportamento non regolato da alcuna restrizione è sempre razionale. Nel caso in cui le altre imprese decidessero di limitare la loro produzione, essa potrà avvantaggiarsi dell’aumento dei prezzi che ne consegue; se invece le altre imprese non si impongono limiti massimi di produzione, essa subirebbe una perdita qualora decidesse di limitare la propria. Tuttavia per le imprese nel loro insieme è più vantaggioso se tutte limitano la produzione che non se nessuna lo fa. In questo caso, l’ottimalità sociale globale coincide con la razionalità individuale: il comportamento competitivo è socialmente utile anche se dannoso per le imprese in quel particolare settore industriale. Nel caso dell’inquinamento, invece, razionalità individuale e ottimalità sociale sono direttamente contrapposte.
Nel ‘dilemma del prigioniero’ il risultato migliore è quello del cosiddetto free rider: defezionare mentre gli altri cooperano. Il risultato peggiore è lo sfruttamento: cooperare mentre gli altri defezionano. Il ‘gioco della garanzia’ ha la seconda caratteristica, ma non la prima. La mutua cooperazione e la mutua defezione sono entrambe punti di equilibrio del gioco. In condizioni di perfetta informazione il primo punto di equilibrio emerge come soluzione, ma se alcuni giocatori hanno informazioni incomplete sulla matrice dei guadagni, si potrebbe realizzare l’equilibrio subottimale. In un dato paese, ad esempio, si avrà un elevato tasso di evasione fiscale se tutti i cittadini hanno le preferenze del ‘gioco della garanzia’, ma ritengono erroneamente che gli altri abbiano le preferenze del ‘gioco del prigioniero’.
Al pari del ‘gioco della garanzia’, il ‘gioco del pollo’ ha due punti di equilibrio, e tuttavia a differenza del primo non è chiaro quale equilibrio si affermerà, anche in condizioni di informazione perfetta. Giochi di questo tipo si possono osservare in molte situazioni in cui entrambi i giocatori hanno un incentivo a determinare un fait accompli. Nel caso di due grandi potenze, ad esempio, se una di esse riesce a occupare un terzo territorio, l’altra potrebbe trovare più conveniente accettare il fatto compiuto anziché impegnarsi in una guerra reciprocamente distruttiva. Vi è però il rischio che le due potenze intraprendano azioni aggressive nello stesso tempo: in questo caso il risultato sarà per entrambe peggiore di quello che avrebbero ottenuto se entrambe si fossero astenute dal farlo.
Al pari del ‘gioco del pollo’, il ‘conflitto dei sessi’ ha due punti di equilibrio e nessuna soluzione. Sebbene siano presenti elementi di cooperazione, non si tratta di un gioco di pura cooperazione. Un esempio può essere l’uso di diversi sistemi metrici nel mondo angloamericano e nell’Europa continentale. Sebbene l’adozione di un sistema comune sia nell’interesse di tutti, ciascun gruppo di paesi sarà interessato a far scegliere il proprio come sistema comune.
Questi schemi strategici possono aiutare a spiegare in che modo si possano produrre risultati collettivamente indesiderabili. Nel ‘dilemma del prigioniero’ la responsabilità va attribuita alla razionalità individuale. Nel ‘gioco della garanzia’ la mancata realizzazione di un equilibrio ottimale è dovuta all’informazione incompleta. Nel ‘conflitto dei sessi’ l’esito negativo dipende dalla pluralità dei punti di equilibrio anziché dalla loro assenza (come accade invece nel ‘dilemma del prigioniero’).

La credibilità nei giochi con mosse in sequenza


In molte interazioni strategiche della vita reale, le strategie sono scelte in successione anziché simultaneamente. Un esempio è il gioco illustrato nella fig. 5.
In questo gioco la prima mossa spetta al giocatore I, che può andare a sinistra – e in questo caso otterrà 1 punto e il giocatore II 3 punti – oppure a destra – e in questo caso la mossa successiva spetterà al giocatore II. Se questi andrà a destra, entrambi i giocatori otterranno 2 punti; se andrà a sinistra, il punteggio di entrambi sarà zero. Potrebbe sembrare che la strategia ottimale di II sia quella di indurre I ad andare a sinistra, dichiarando che se I andrà a destra, egli andrà a sinistra. Ma tale dichiarazione non è credibile, perché I non può non capire che quando la mossa spetterà a II, questi avrà tutto l’interesse ad andare a destra. Si ripropone qui il problema dell’incoerenza temporale, causata questa volta non da una svalutazione iperbolica, ma da un’interazione strategica. Anche in questo caso una soluzione del problema può essere cercata nella prevenzione, come ha messo in luce nella sua analisi classica Thomas Schelling. Tornando al gioco illustrato nella fig. 5, il giocatore II può cercare di eliminare l’alternativa ‘andare a destra’, in modo che la sua dichiarazione di andare a sinistra risulti un avvertimento credibile anziché una minaccia poco credibile. Oppure, può sottoscrivere un contratto vincolante con un terzo in cui si impegna a pagare una penalità di 3 punti se andrà a destra.

Giochi ripetuti


Nel gioco della fig. 5 la minaccia di andare a sinistra del giocatore II può acquistare credibilità se i due giocatori sanno che si incontreranno ancora in interazioni analoghe. In questo caso, il fatto che II vada a sinistra in un gioco può essere interpretato come un modo per indurre I ad andare a sinistra nel gioco successivo. Più in generale, molti giochi hanno soluzioni differenti a seconda che il gioco sia ripetuto oppure istantaneo. Nel ‘dilemma del prigioniero’, ad esempio, una strategia dell”occhio per occhio, dente per dente’, in alcune circostanze potrebbe risultare razionale per il singolo individuo. All’inizio, cioè, il giocatore coopera, e in tutti i giochi successivi dovrebbe usare di volta in volta la stessa strategia messa in atto dall’avversario nel gioco precedente, rispondendo con la cooperazione alla cooperazione e con la defezione alla defezione. Quando il ‘dilemma del prigioniero’ è un gioco a n persone, come nel caso della formazione di un cartello, potrebbe risultare razionale una ‘strategia della risposta riflessa’. Un’impresa del cartello seguirà la politica di cooperare sempre (limitando la produzione), a meno che un’altra impresa non defezioni, nel qual caso reagirà con una defezione immediata. Al pari della prima, anche questa strategia è una risposta ottimale nei confronti di se stessa. Entrambe, quindi, possono sostenere una cooperazione indefinita.