Equilibri di Nash in teoria dei giochi - Tor Vergata

Pagina creata da Antonio Nardi
 
CONTINUA A LEGGERE
Equilibri di Nash in teoria dei giochi - Tor Vergata
Equilibri di Nash in teoria dei giochi

              Alessio Porretta
       Universita’ di Roma Tor Vergata

              A. Porretta   Equilibri di Nash in teoria dei giochi
Equilibri di Nash in teoria dei giochi - Tor Vergata
Gli elementi tipici di un gioco:

-un numero di agenti (o giocatori): 1, . . . , N
-Un insieme di strategie Qi per l’i-esimo agente.
oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure
no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme
numerico di grandezze continue (per esempio, la strategia è una velocità,
una percentuale, etc...)

                              A. Porretta   Equilibri di Nash in teoria dei giochi
Gli elementi tipici di un gioco:

-un numero di agenti (o giocatori): 1, . . . , N
-Un insieme di strategie Qi per l’i-esimo agente.
oss: Qi può essere un insieme discreto (es. la scelta è binaria: si’ oppure
no) ma anche un insieme continuo, es. tutte le volte che Qi è un insieme
numerico di grandezze continue (per esempio, la strategia è una velocità,
una percentuale, etc...)
-una funzione di utilità (cosiddetto pay-off) da ottimizzare, per ciascun
agente:
                                Ji (α1 , . . . , αN )
dipendente dalle strategie αi di tutti gli agenti

                              A. Porretta   Equilibri di Nash in teoria dei giochi
Equilibrio di Nash

  La nozione di equilibrio introdotta da J. Nash (1949):
  un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha
  interesse a cambiare la strategia a meno che non la cambi anche qualcun
  altro

                              A. Porretta   Equilibri di Nash in teoria dei giochi
Equilibrio di Nash

  La nozione di equilibrio introdotta da J. Nash (1949):
  un insieme di strategie è un equilibrio (di Nash) se nessun giocatore ha
  interesse a cambiare la strategia a meno che non la cambi anche qualcun
  altro

  Tradotto in linguaggio matematico:

                       α = (α1 , . . . , αN )       è un equilibrio di Nash se

       Ji (α1 , . . . , αi−1 , αi , αi+1 , . . . , αN ) ≥ Ji (α1 , . . . , αi−1 , β, αi+1 , . . . , αN )
                                     ∀β ∈ Qi ,            ∀i = 1...N

  Ovvero: tenendo ferme le scelte degli altri, nessuno cambierebbe la sua.

                                          A. Porretta     Equilibri di Nash in teoria dei giochi
Il dilemma del prigioniero

                                 Due complici che hanno commesso un crimine
  sono detenuti in celle separate e vengono interrogati simultaneamente. Gli
  investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma
  se uno collabora, denunciando l’altro, avrà dei vantaggi.

                                 A. Porretta   Equilibri di Nash in teoria dei giochi
Il dilemma del prigioniero

                                 Due complici che hanno commesso un crimine
  sono detenuti in celle separate e vengono interrogati simultaneamente. Gli
  investigatori hanno poche prove e possono incriminarli solo per piccoli reati, ma
  se uno collabora, denunciando l’altro, avrà dei vantaggi.
  Ciascun prigioniero fronteggia il seguente dilemma:
  • se denuncia il compare, e l’altro non parla, può essere rilasciato.
  • se entrambi denunciassero l’altro, avranno uno sconto di pena (diciamo 5
  anni l’uno)
  • se entrambi tacciono, avranno un’accusa per piccoli reati (diciamo 1 anno
  ciascuno)
  • se lui tace ma l’altro lo denucia, avra’ l’intera pena di 10 anni.

  Tale situazione si può schematizzare nella seguente matrice:

                                  A. Porretta   Equilibri di Nash in teoria dei giochi
Giocatore 2
                              Denuncia     Non denuncia

Giocatore 1    Denuncia        5,5              0,10
              Non denuncia    10,0              1,1

                                  A. Porretta      Equilibri di Nash in teoria dei giochi
Giocatore 2
                               Denuncia     Non denuncia

Giocatore 1      Denuncia       5,5              0,10
               Non denuncia    10,0              1,1

    In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi
    tradiscono

                                   A. Porretta      Equilibri di Nash in teoria dei giochi
Giocatore 2
                               Denuncia     Non denuncia

Giocatore 1      Denuncia       5,5              0,10
               Non denuncia    10,0              1,1

    In questo gioco c’è un unico equilibrio di Nash: la scelta in cui entrambi
    tradiscono

                              Giocatore 2
                               Denuncia     Non denuncia

Giocatore 1      Denuncia       5,5
               Non denuncia    10,0

                                   A. Porretta      Equilibri di Nash in teoria dei giochi
Giocatore 2
                               Denuncia     Non denuncia

Giocatore 1    Denuncia         5,5            0,10
              Non denuncia     10,0            1,1
    Questo esempio mostra che l’equilibrio di Nash non è necessariamente la
    migliore soluzione possibile né individualmente né collettivamente.

                                     A. Porretta      Equilibri di Nash in teoria dei giochi
Giocatore 2
                                Denuncia     Non denuncia

Giocatore 1     Denuncia         5,5            0,10
               Non denuncia     10,0            1,1
    Questo esempio mostra che l’equilibrio di Nash non è necessariamente la
    migliore soluzione possibile né individualmente né collettivamente.
    Esiste una soluzione migliore per entrambi: quello che gli economisti
    chiamano un (equilibrio) ottimo di Pareto: la strategia migliore per tutti.
    In altri termini: in un equilibrio di Pareto, qualunque giocatore cambi
    strategia ve ne sarà almeno uno che dovrà peggiorare.
    Si parla di equilibrio efficiente; in questo caso la situazione in cui entrambi
    tacciono: (1, 1).

                                      A. Porretta      Equilibri di Nash in teoria dei giochi
The “chicken game”: il gioco del codardo

  Due individui si sfidano per mostrare chi è piu’ coraggioso, guidando a tutta
  velocità verso una scogliera (Gioventù bruciata !!). Mentre il precipizio si
  avvicina, affrontano un atroce dilemma:

  - se uno si butta troppo presto, prima che l’altro lo faccia, sarà bollato come
  codardo
  -se entrambi si buttano insieme, prima del baratro, salvano la pelle. ma non
  possono dire di aver vinto.
  -se entrambi aspettano troppo, può essere tardi: si rischia la morte.

                                  A. Porretta   Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio

  Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
  quando due macchine giungono a un incrocio senza semaforo ?

                                A. Porretta   Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio

  Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
  quando due macchine giungono a un incrocio senza semaforo ?
  Due macchine giungono contemporanamente a un incrocio (senza semaforo,
  senza precedenze... insomma un tipico incrocio a Roma). Può succedere che

                                A. Porretta   Equilibri di Nash in teoria dei giochi
Due macchine all’incrocio

  Vi propongo una variante più frequente nella nostra quotidianità: cosa accade
  quando due macchine giungono a un incrocio senza semaforo ?
  Due macchine giungono contemporanamente a un incrocio (senza semaforo,
  senza precedenze... insomma un tipico incrocio a Roma). Può succedere che

  • uno decide di fermarsi e l’altro decide di passare: uno solo sarà contento,
  diciamo (0, 1) oppure (1, 0).
  • entrambi decidono di passare, e ci sarà un incidente: (−1, −1).
  • entrambi si fermano: niente incidente, ma uno sgradevole stallo, e tempo
  perso...: (0, 0)

  Tale situazione si può schematizzare nella seguente matrice:

                                  A. Porretta   Equilibri di Nash in teoria dei giochi
Giocatore 2
                           passa                 si ferma

Giocatore 1     passa     -1,-1                  1,0
               si ferma   0,1                    0,0

    In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0).
    Entrambi lasciano uno dei due insoddisfatto...

                                   A. Porretta          Equilibri di Nash in teoria dei giochi
Giocatore 2
                           passa                 si ferma

Giocatore 1     passa     -1,-1                  1,0
               si ferma   0,1                    0,0

    In questo gioco ci sono due equilibri di Nash: (0, 1) oppure (1, 0).
    Entrambi lasciano uno dei due insoddisfatto...

                                   A. Porretta          Equilibri di Nash in teoria dei giochi
Riassunto:

    gli equilibri di Nash sono soluzioni che possono crearsi nell’incertezza
    delle decisioni degli altri.
    Mostrano la complessita’ del meccanismo decisionale.
    A volte non sono ottimali per nessuno, dando senso all’importanza
    di fare accordi; a volte non lo sono per qualcuno, mostrando la
    necessita’ di un compromesso; spesso ce ne sono piu’ di uno,
    mostrando la difficolta’ di previsione su quello che accadrà.

                            A. Porretta   Equilibri di Nash in teoria dei giochi
Oss. sugli esempi precedenti:

     Si trattava di situazioni simmetriche: i giocatori erano interscambiabili
     Matematicamente, la trattazione del gioco segue questo iter:
     - definire gli insiemi di strategie possibili del singolo
     - comprendere il valore associato a ogni possibile scelta collettiva
     - dedurre da questo la strategia effettiva dei giocatori

                                 A. Porretta   Equilibri di Nash in teoria dei giochi
Oss. sugli esempi precedenti:

     Si trattava di situazioni simmetriche: i giocatori erano interscambiabili
     Matematicamente, la trattazione del gioco segue questo iter:
     - definire gli insiemi di strategie possibili del singolo
     - comprendere il valore associato a ogni possibile scelta collettiva
     - dedurre da questo la strategia effettiva dei giocatori

     Si osservi due punti chiave:
     (i) dedurre le strategie dalle aspettative future
     (ii) ciascuno ottimizza ipotizzando le scelte degli altri

                                 A. Porretta   Equilibri di Nash in teoria dei giochi
Giochi differenziali

  In molte situazioni,

       la strategia agisce su una dinamica da cui dipendono poi i
       costi/benefici/obiettivi...
       (es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le
       rispettive posizioni)

                                 A. Porretta   Equilibri di Nash in teoria dei giochi
Giochi differenziali

  In molte situazioni,

       la strategia agisce su una dinamica da cui dipendono poi i
       costi/benefici/obiettivi...
       (es. meccanismi preda/cacciatore: si sceglie una velocità che influenza le
       rispettive posizioni)

       gli obiettivi sono definiti non solo all’istante finale ma lungo tutto un arco
       di tempo

                                  A. Porretta   Equilibri di Nash in teoria dei giochi
Es: meccanismi di produzione di risorse esauribili (es. petrolio):
Per ciascun produttore i indichiamo        qi (t) = quantità prodotta ;
Ri (t) = riserva esistente
una dinamica naturale lega queste due quantità :
                               dRi
                                   = −qi (t)
                               dt

                             A. Porretta   Equilibri di Nash in teoria dei giochi
Es: meccanismi di produzione di risorse esauribili (es. petrolio):
Per ciascun produttore i indichiamo             qi (t) = quantità prodotta ;
Ri (t) = riserva esistente
una dinamica naturale lega queste due quantità :
                                    dRi
                                        = −qi (t)
                                    dt
Gli obiettivi possono essere i guadagni nel periodo
                       Z    T
                 max            {p(t, R(t))qi (t) − C (qi (t))} dt
                        0

dove C (q) sono costi di produzione e p l’evoluzione dei prezzi.
Punto chiave: p dipende anche da R(t) = (R1 , . . . , RN ) (i prezzi
dipendono dalle riserve esistenti)

                                  A. Porretta   Equilibri di Nash in teoria dei giochi
Nei giochi differenziali, gli elementi tipici sono dunque:

     Un numero di agenti (o giocatori) i = 1, . . . , N.
     Una dinamica (deterministica o stocastica) che determina lo stato Xti
     dell’i-esimo agente al tempo t. Es:

                                 dXti = αti dt ( + σ dBti )

     Una strategia di scelta individuale αti (una funzione, o una variabile
     aleatoria) che possa influenzare tale dinamica.

                                A. Porretta   Equilibri di Nash in teoria dei giochi
Nei giochi differenziali, gli elementi tipici sono dunque:

     Un numero di agenti (o giocatori) i = 1, . . . , N.
     Una dinamica (deterministica o stocastica) che determina lo stato Xti
     dell’i-esimo agente al tempo t. Es:

                                     dXti = αti dt ( + σ dBti )

     Una strategia di scelta individuale αti (una funzione, o una variabile
     aleatoria) che possa influenzare tale dinamica.

     Una funzione di utilità (da ottimizzare) nel tempo (τ, T ):
                         Z T
               J i (α) =      Li (t, Xti , αti , αt−i , Xt−i )dt + V i (XTi , XT−i )
                              τ

     dove αt−i e Xt−i sono le strategie e gli stati degli altri N − 1 giocatori.

Gli equilibri di Nash sono definiti in modo analogo a prima.

                                    A. Porretta   Equilibri di Nash in teoria dei giochi
Per l’i-esimo giocatore, la funzione valore:

              u i (τ, x) = inf J i (α) , quando Xτi = x
                              
                          α

rappresenta la migliore aspettativa che si ha partendo dalla
condizione x al tempo τ .

                        A. Porretta   Equilibri di Nash in teoria dei giochi
Per l’i-esimo giocatore, la funzione valore:

              u i (τ, x) = inf J i (α) , quando Xτi = x
                              
                          α

rappresenta la migliore aspettativa che si ha partendo dalla
condizione x al tempo τ .

Matematicamente, la funzione valore risolve un’equazione
differenziale. Risolvere tale equazione è fondamentale: infatti la
strategia ottima è deducibile come feedback a partire dalla funzione
valore

                        A. Porretta   Equilibri di Nash in teoria dei giochi
La teoria dei Mean Field Games (2006 –...)
  Pb: Come gestire situazioni di massa ? Ovvero cosa accade con un
  numero molto grande di agenti razionali ?

                             A. Porretta   Equilibri di Nash in teoria dei giochi
Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare
situazioni in cui
(a) si ha un numero molto grande di agenti indistinguibili tra loro
(b) il singolo ha un microscopico impatto sulle strategie degli altri
Ma d’altra parte, le strategie dipendono da quello che fa la massa degli
altri giocatori

                             A. Porretta   Equilibri di Nash in teoria dei giochi
Negli ultimi anni, sono state sviluppate nuove idee e metodi per trattare
situazioni in cui
(a) si ha un numero molto grande di agenti indistinguibili tra loro
(b) il singolo ha un microscopico impatto sulle strategie degli altri
Ma d’altra parte, le strategie dipendono da quello che fa la massa degli
altri giocatori

Applicazioni tipiche:
- economia o finanza (numeri molto elevati di piccoli agenti finanziari)
- dinamiche di consumi di massa (“reti intelligenti”, es. per consumi
elettrici etc...)
- dinamiche sociali (gruppi numerosi di individui razionali, es: meccanismi
di voto, movimenti di una folla, dinamiche di conformismo/antagonismo
in gruppi estesi)

                             A. Porretta   Equilibri di Nash in teoria dei giochi
Microscopico → Macroscopico.

  Nella teoria dei mean field games, viene mutuato un paradigma
  ampiamente usato nella meccanica statistica:
  in sistemi con un numero molto grande di particelle risulta impossibile
  gestire le mutue interazioni (regolate dalla legge di Newton) o anche
  semplicemente misurare posizione & velocità delle singole particelle.
  L’approccio della meccanica statistica consiste nell’individuare grandezze
  macroscopiche, es. energia, entropia definite in termini di medie
  statistiche

                               A. Porretta   Equilibri di Nash in teoria dei giochi
Microscopico → Macroscopico.

  Nella teoria dei mean field games, viene mutuato un paradigma
  ampiamente usato nella meccanica statistica:
  in sistemi con un numero molto grande di particelle risulta impossibile
  gestire le mutue interazioni (regolate dalla legge di Newton) o anche
  semplicemente misurare posizione & velocità delle singole particelle.
  L’approccio della meccanica statistica consiste nell’individuare grandezze
  macroscopiche, es. energia, entropia definite in termini di medie
  statistiche
  Si parla di teorie di campo medio: una volta specificato in che modo ogni
  particella microscopica contribuisce alla formazione del campo (es.
  definizione dell’energia, o dell’entropia), si studia l’evoluzione di
  grandezze macroscopiche per descrivere il fenomeno.

                               A. Porretta   Equilibri di Nash in teoria dei giochi
In analogia, nella teoria dei Giochi di campo medio (Mean Field Games):
    gli agenti sono nella sostanza simili tra loro: hanno simili margini di
    scelta, simili dinamiche, simili obiettivi.

Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle
strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli
agenti non cambia il gioco...

                             A. Porretta   Equilibri di Nash in teoria dei giochi
In analogia, nella teoria dei Giochi di campo medio (Mean Field Games):
    gli agenti sono nella sostanza simili tra loro: hanno simili margini di
    scelta, simili dinamiche, simili obiettivi.

Matematicamente si traduce in ipotesi di simmetria: gli insiemi delle
strategie Qi sono gli stessi, costi/benefici sono analoghi, permutare gli
agenti non cambia il gioco...

    le interazioni reciproche individuali sono sostituite dall’interazione
    del singolo con la massa
    Ma c’è una differenza fondamentale con la meccanica statistica: ora
    le particelle sono agenti razionali con meccanismi di scelta. Non si
    tratta solo di interazioni individuo-massa bensi’ di interazioni
    strategiche.

    Oltre a descrivere un fenomeno di massa, si vuole anche descrivere il
    perché ciò avviene, ovvero i meccanismi decisionali che sottendono
    un certo fenomeno

                             A. Porretta   Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.

                             A. Porretta   Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.

   sistemi di equazioni con struttura forward-backward nel tempo:

-un’equazione determina le strategie ottimali partendo da un aspettativa
futura (meccanismo backward)
-un’altra equazione segue l’evoluzione nel tempo degli agenti
(meccanismo forward)

                             A. Porretta   Equilibri di Nash in teoria dei giochi
La peculiarità del modello è accoppiare decisioni strategiche e evoluzione
della situazione collettiva. Le strategie vengono prese anticipando
un’ipotesi di situazione collettiva; ma nel frattempo, le strategie
contribuiscono a modificare tale situazione.

   sistemi di equazioni con struttura forward-backward nel tempo:

-un’equazione determina le strategie ottimali partendo da un aspettativa
futura (meccanismo backward)
-un’altra equazione segue l’evoluzione nel tempo degli agenti
(meccanismo forward)

Tuttavia l’una dipende dall’altra ! Se esiste, la soluzione è tipicamente
indice di un equilibrio tra aspettative dei singoli e comportamento
collettivo: il limite per N → ∞ degli equilibri di Nash.

                             A. Porretta   Equilibri di Nash in teoria dei giochi
Un esempio modello: a che ora si comincia ?

In una riunione con molti partecipanti, l’orario d’inizio fissato è T ∗ , ma la
riunione avrà effettivamente inizio al tempo T quando sarà raggiunto un
quorum adeguato, es. 80% dei partecipanti.
Ciascun partecipante ha una dinamica

                                dXti = αti dt + σ dBti

controllata attraverso la strategia αti , la quale produce un tempo di arrivo τ i ;
allo scopo di ottimizzare (anche con differenti pesi):
             
                                                                i
             il tempo d’attesa dall’inizio effettivo (T − τ )+
             
                                                             i
                il tempo di ritardo sull’inizio effettivo (τ − T )+
                il tempo di ritardo sull’inizio previsto (τ i − T ∗ )+
             
             

Tuttavia, il tempo effettivo T dipende da quanti partecipanti sono arrivati !

                                 A. Porretta   Equilibri di Nash in teoria dei giochi
Nell’approccio di campo medio, le grandezze macroscopiche sono:
-m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x
al tempo t - non ancora arrivati)
- u(t, x), funzione valore del generico partecipante che si trovasse in x al
tempo t.

• La strategia di ogni partecipante dipende dalla propria dinamica e dalla
evoluzione della massa m.
• L’evoluzione di m dipende dalle strategie dei partecipanti

                              A. Porretta   Equilibri di Nash in teoria dei giochi
Nell’approccio di campo medio, le grandezze macroscopiche sono:
-m(t, x) (distribuzione di probabilità dei partecipanti che si trovano in x
al tempo t - non ancora arrivati)
- u(t, x), funzione valore del generico partecipante che si trovasse in x al
tempo t.

• La strategia di ogni partecipante dipende dalla propria dinamica e dalla
evoluzione della massa m.
• L’evoluzione di m dipende dalle strategie dei partecipanti

Matematicamente: ci saranno due equazioni differenziali accoppiate, una
determina la strategia e l’ottimizzazione dei singoli, una determina
l’evoluzione dello stato collettivo !

                              A. Porretta   Equilibri di Nash in teoria dei giochi
Si osservi il tipico meccanismo forward-backward dei MFG:

i partecipanti presuppongono una distribuzione (temporale) m̄ e un
tempo effettivo T (m̄) conseguente a questa ipotesi sugli arrivi degli altri.

Costruiscono le loro strategie supponendo questa situazione futura,
attraverso il valore atteso u.

Le strategie determinano le dinamiche, e queste producono una reale
distribuzione m.

Una soluzione è rappresentata da un punto fisso: m = m̄, che esprime un
equilibrio tra anticipazioni razionali e comportamenti individuali.

                              A. Porretta   Equilibri di Nash in teoria dei giochi
La risoluzione matematica di simili modelli richiede strumenti molto
raffinati.
Alcuni tipici risultati della teoria:
    In alcuni casi il sistema limite ammette un unico equilibrio
    (semplificazione del gioco ! ) ottenuto come limite di equilibri di
    Nash nel gioco a N giocatori.
    (tale equilibrio può essere interpretato come un ottimo di Pareto)

    questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a
    N giocatori, se N è grande.
        il modello macroscopico consente di costruire buone
    approssimazioni di equilibri di Nash.

                            A. Porretta   Equilibri di Nash in teoria dei giochi
La risoluzione matematica di simili modelli richiede strumenti molto
raffinati.
Alcuni tipici risultati della teoria:
    In alcuni casi il sistema limite ammette un unico equilibrio
    (semplificazione del gioco ! ) ottenuto come limite di equilibri di
    Nash nel gioco a N giocatori.
    (tale equilibrio può essere interpretato come un ottimo di Pareto)

    questo equilibrio fornisce un “quasi ” equilibrio di Nash per il gioco a
    N giocatori, se N è grande.
        il modello macroscopico consente di costruire buone
    approssimazioni di equilibri di Nash.

    Il sistema macroscopico può ammettere buone simulazioni numeriche
    al computer. Fornisce un modello gestibile per molte potenziali
    applicazioni.

                            A. Porretta   Equilibri di Nash in teoria dei giochi
Grazie dell’attenzione....

...E in bocca al lupo per le vostre scelte !!!

               A. Porretta   Equilibri di Nash in teoria dei giochi
Puoi anche leggere