Bayesovská hra nebo neúplná informační hra v teorii her je charakterizována neúplnými informacemi o soupeřích ( jejich možných strategiích a přínosech), zatímco hráči mají o této nejistotě přesvědčení . Bayesovská hra může být přeměněna na hru úplných , ale nedokonalých informací, pokud se předpokládá běžná předchozí distribuce. Na rozdíl od neúplných informací, nedokonalé informace zahrnují znalost soupeřových strategií a výplat, ale historie hry (předchozí akce protivníků) není dostupná všem účastníkům.
John Harsanyi popsal Bayesovské hry následovně [1] . Kromě skutečných účastníků hry se objeví i virtuální hráč „ Příroda “. Příroda obdarovává každého ze skutečných účastníků náhodnou proměnnou , jejíž hodnoty se nazývají typy . Rozdělení ( hustota nebo pravděpodobnostní funkce ) typů pro každého z hráčů je známé. Na začátku hry si příroda „vybírá“ typy hráčů. Typ zejména definuje výplatní funkci účastníka. Neúplnost informací v Bayesovské hře je tedy neznalostí alespoň jednoho hráče typu nějakého jiného účastníka. Hráči mají přesvědčení o typech protivníků; víra je rozdělení pravděpodobnosti přes sadu možných typů. Jak hra postupuje, přesvědčení se aktualizují podle Bayesova teorému .
Hra je definována následovně: , kde
Čistá strategie musí uspokojit všechny . Strategie každého hráče závisí pouze na jeho typu, protože typy ostatních hráčů jsou pro něj skryté. Očekávaná odměna hráče s tímto strategickým profilem je .
Nechť je soubor čistých strategií,
Bayesovská rovnováha hry je definována jako Nashova rovnováha hry (možná ve smíšených strategiích) . Pokud je hra konečná, Bayesovská rovnováha vždy existuje.
Šerif čelí podezřelému. Oba se musí současně rozhodnout, zda budou či nebudou střílet.
Podezřelý má dva možné typy: „zločinec“ a „dodržující zákon“. Šerif má jen jeden typ. Podezřelý zná svůj typ, ale šerif ne. Ve hře jsou tedy neúplné informace, patří do Bayesovské třídy. Podle šerifa je s pravděpodobností p podezřelý zločinec, s pravděpodobností 1-p - zákonný občan. Hodnoty p a 1-p jsou oběma hráčům známy, protože se předpokládá společné předchozí rozdělení. Právě to umožňuje přeměnit tuto hru na hru úplných, ale nedokonalých informací.
Šerif raději střílí, pokud podezřelý střílí, a jinak se střelbě vyhýbá (i když je podezřelý skutečně zločinec). Zločinec má sklony střílet (i když šerif nestřílí), zatímco zákonodárný občan se chce konfliktu jakkoli vyhnout (i když šerif střílí). Výplatní matice závisí na typu podezřelého:
Typ = "Dodržování zákonů" | Akce šerifa | ||
---|---|---|---|
oheň | Nestřílej | ||
Akce podezřelého | oheň | -3, -1 | -12 |
Nestřílej | -2, -1 | 0, 0 |
Typ = "zločinec" | Akce šerifa | ||
---|---|---|---|
oheň | Nestřílej | ||
Akce podezřelého | oheň | 0, 0 | 2, -2 |
Nestřílej | -2, -1 | -1.1 |
Pokud mají oba společné znalosti o racionalitě hráčů (hráč 1 je racionální; hráč 1 ví, že hráč 2 je racionální; hráč 1 ví, že hráč 2 ví, že hráč 1 je racionální atd. ad infinitum), bude hra probíhat podle následující scénář rovnováhy (dokonalá Bayesovská rovnováha) [2] [3] :
Když je podezřelý typ, který dodržuje zákony, dominantní strategií je nestřílet, když je kriminálník, dominantní strategií je střílet. Silně dominované strategie mohou být vyloučeny z úvahy. Pokud pak šerif střílí, dostane 0 s pravděpodobností p a -1 s pravděpodobností 1-p. Jeho očekávaná výplata je p-1. Pokud šerif nestřílí, má nárok na -2 s pravděpodobností p a 0 s pravděpodobností 1-p; očekávaná výplata je -2p. Šerif bude střílet vždy, když p-1 > -2p, tedy když p > 1/3.
Herní teorie | |
---|---|
Základní pojmy | |
Typy her |
|
Koncepce řešení | |
Příklady her | |