Hra s neúplnými informacemi

Bayesovská hra nebo neúplná informační hra v teorii her je charakterizována  neúplnými informacemi o soupeřích ( jejich možných strategiích a přínosech), zatímco hráči mají o této nejistotě přesvědčení . Bayesovská hra může být přeměněna na hru úplných , ale nedokonalých informací, pokud se předpokládá běžná předchozí distribuce. Na rozdíl od neúplných informací, nedokonalé informace zahrnují znalost soupeřových strategií a výplat, ale historie hry (předchozí akce protivníků) není dostupná všem účastníkům.  

John Harsanyi popsal Bayesovské hry následovně [1] . Kromě skutečných účastníků hry se objeví i virtuální hráč „ Příroda “. Příroda obdarovává každého ze skutečných účastníků náhodnou proměnnou , jejíž hodnoty se nazývají typy . Rozdělení ( hustota nebo pravděpodobnostní funkce ) typů pro každého z hráčů je známé. Na začátku hry si příroda „vybírá“ typy hráčů. Typ zejména definuje výplatní funkci účastníka. Neúplnost informací v Bayesovské hře je tedy neznalostí alespoň jednoho hráče typu nějakého jiného účastníka. Hráči mají přesvědčení o typech protivníků; víra je rozdělení pravděpodobnosti přes sadu možných typů. Jak hra postupuje, přesvědčení se aktualizují podle Bayesova teorému .

Definice

Hra je definována následovně: , kde

  1. - mnoho hráčů.
  2. - mnoho přírodních stavů. Příklad přírodního stavu: pořadí balíčku v karetní hře.
  3. je soubor akcí hráče . Nechte _
  4. je soubor typů hráčů . Typ je určen pravidlem .
  5. definuje dostupné akce pro hráče , který má nějaký typ v .
  6. výplatní funkce hráče . Formálněji, nechte , a .
  7. rozdělení pravděpodobnosti na pro každého hráče , to znamená, že každý hráč jinak vyhodnocuje pravděpodobnosti přírodních stavů; během hry ho neznají.

Čistá strategie musí uspokojit všechny . Strategie každého hráče závisí pouze na jeho typu, protože typy ostatních hráčů jsou pro něj skryté. Očekávaná odměna hráče s tímto strategickým profilem je .

Nechť je soubor čistých strategií,

Bayesovská rovnováha hry je definována jako Nashova rovnováha hry (možná ve smíšených strategiích) . Pokud je hra konečná, Bayesovská rovnováha vždy existuje.

Příklady

Šerifovo dilema

Šerif čelí podezřelému. Oba se musí současně rozhodnout, zda budou či nebudou střílet.

Podezřelý má dva možné typy: „zločinec“ a „dodržující zákon“. Šerif má jen jeden typ. Podezřelý zná svůj typ, ale šerif ne. Ve hře jsou tedy neúplné informace, patří do Bayesovské třídy. Podle šerifa je s pravděpodobností p podezřelý zločinec, s pravděpodobností 1-p - zákonný občan. Hodnoty p a 1-p jsou oběma hráčům známy, protože se předpokládá společné předchozí rozdělení. Právě to umožňuje přeměnit tuto hru na hru úplných, ale nedokonalých informací.

Šerif raději střílí, pokud podezřelý střílí, a jinak se střelbě vyhýbá (i když je podezřelý skutečně zločinec). Zločinec má sklony střílet (i když šerif nestřílí), zatímco zákonodárný občan se chce konfliktu jakkoli vyhnout (i když šerif střílí). Výplatní matice závisí na typu podezřelého:

 
Typ = "Dodržování zákonů" Akce šerifa
oheň Nestřílej
Akce podezřelého oheň -3, -1 -12
Nestřílej -2, -1 0, 0
 
Typ = "zločinec" Akce šerifa
oheň Nestřílej
Akce podezřelého oheň 0, 0 2, -2
Nestřílej -2, -1 -1.1

Pokud mají oba společné znalosti o racionalitě hráčů (hráč 1 je racionální; hráč 1 ví, že hráč 2 je racionální; hráč 1 ví, že hráč 2 ví, že hráč 1 je racionální atd. ad infinitum), bude hra probíhat podle následující scénář rovnováhy (dokonalá Bayesovská rovnováha) [2] [3] :

Když je podezřelý typ, který dodržuje zákony, dominantní strategií je nestřílet, když je kriminálník, dominantní strategií je střílet. Silně dominované strategie mohou být vyloučeny z úvahy. Pokud pak šerif střílí, dostane 0 s pravděpodobností p a -1 s pravděpodobností 1-p. Jeho očekávaná výplata je p-1. Pokud šerif nestřílí, má nárok na -2 s pravděpodobností p a 0 s pravděpodobností 1-p; očekávaná výplata je -2p. Šerif bude střílet vždy, když p-1 > -2p, tedy když p > 1/3.

Viz také

Poznámky

  1. Harsanyi, John C., 1967/1968. "Hry s neúplnými informacemi hrané Bayesianskými hráči, I-III." Management Science 14 (3): 159-183 (část I), 14 (5): 320-334 (část II), 14 (7): 486-502 (část III).
  2. Coursera  . _ Coursera . Staženo: 16. června 2016.
  3. Hu, Yuhuang; Čau, Chu Kiong. Zobecněný kvantově inspirovaný model rozhodování pro inteligentního agenta  //  The Scientific World Journal : deník. - 2014. - 17. března ( roč. 2014 ). - ISSN 1537-744X . - doi : 10.1155/2014/240983 . — PMID 24778580 .

Literatura