Nashova rovnováha | |
---|---|
Pojem rozhodování v teorii her | |
Související rozhodovací sady | |
Supersety |
Racionalizovatelnost Korelovaná rovnováha ε-rovnováha |
Podmnožiny |
Dokonalá rovnováha podhrou Rovnováha potřásání rukou Evolučně stabilní strategie Silná rovnováha |
Data | |
Autorství | John Nash |
aplikace | Všechny nekooperativní hry |
Nashova rovnováha je koncept rozhodnutí , jeden z klíčových konceptů teorie her . Toto je název sady strategií ve hře pro dva a více hráčů, ve které žádný účastník nemůže zvýšit výplatu změnou své strategie, pokud ostatní účastníci své strategie nezmění [1] . John Nash dokázal existenci takové rovnováhy ve smíšených strategiích v jakékoli konečné hře.
Tento koncept poprvé použil Antoine Auguste Cournot . Ukázal, jak najít to, čemu říkáme Nashova rovnováha ve hře Cournot . Nash byl první, kdo dokázal, že taková rovnováha musí existovat pro všechny konečné hry s libovolným počtem hráčů. To bylo provedeno ve své dizertační práci o nekooperativních hrách v roce 1950.
Před Nashem to bylo prokázáno pouze u her pro 2 hráče s nulovým součtem od Johna von Neumanna a Oskara Morgensterna (1947).
Předpokládejme, že se jedná o nekooperativní hru pro n hráče v normální formě, kde S je soubor čistých strategií a H je soubor přínosů. Když si každý hráč zvolí strategii v profilu strategie, vyhrává hráč i . Upozorňujeme, že výplata závisí na celém profilu strategie: nejen na strategii zvolené hráčem i , ale také na dalších strategiích , tedy na všech strategiích pro . Profil strategie je Nashovou rovnováhou, pokud změna strategie z na není zisková pro žádného hráče , tedy pro žádného hráče.
Hra může mít Nashovu rovnováhu v čistých strategiích nebo ve smíšených strategiích (to znamená stochastickou volbu čisté strategie s pevnou frekvencí). Nash dokázal, že pokud jsou povoleny smíšené strategie , pak bude v každé hře n hráčů alespoň jedna Nashova rovnováha.
V sociologické teorii racionální volby se zvlášť zdůrazňuje, že stabilní stav společnosti (sociální rovnováha) se může lišit od optimálního (sociálního optima). Takové suboptimální, ale stabilní stavy se v sociologii nazývají Nashova rovnováha.
herec B | |||
---|---|---|---|
jeden | 2 | ||
Herec A | jeden | A: +1, B: +1 | A: -1, B: +2 |
2 | A: +2, B: -1 | A: 0, B: 0 |
Tabulka vlevo ukazuje strukturu akce z hlediska teorie her , sestavenou pro dva aktéry ( herce ). Každý hráč má dvě možnosti akce, označené čísly 1 a 2. Koeficienty odměny, které obdrží při výběru určitých možností akce, jsou uvedeny v odpovídajících buňkách tabulky. Předpokládejme, že oba aktéři právě používají akci 2 a jejich odměny jsou nulové. Volbou akce 1 si aktér A zhorší svou vlastní situaci o jednu pozici (A: −1, B: +2). Podobně, pokud si aktér B zvolí možnost 1 sám, zatímco aktér A bude nadále používat možnost 2, svou situaci jen zhorší (A: +2, B: -1). Přestože tedy oba aktéři chápou, že situace by pro ně byla optimální, kdyby oba využili akci 1 (odměna - A: +1, B: +1), ani jeden z nich nemá motiv situaci změnit, a rovnováha vyplývá z absence takových motivů. Pokud je systém již v optimálním stavu (když si oba aktéři zvolili akci 1), pak budou oba vždy v pokušení začít používat akci 2, která jim přinese odměnu na úkor druhého hráče. Tento příklad ilustruje možnost dvou sociálních stavů: stabilní, ale neoptimální (oba aktéři využívají možnost 2); stejně jako druhé optimální, ale nestabilní (oba aktéři využívají možnost 1). [2]
K vysvětlení různých jevů v politické teorii se často používá koncept jádra , což je slabší verze Nashovy rovnováhy. Jádro je soubor států, v každém z nich žádná skupina aktérů schopná vybudovat nový (v daném jádru nepřítomný) stát nezlepší svou situaci oproti svému stavu v daném jádru. [2]
V oboru působí dvě firmy č. 1 a č. 2. Každá z firem může nastavit dvě cenové úrovně: „vysokou“ a „nízkou“. Pokud obě firmy zvolí vysoké ceny, pak každá dosáhne zisku 3 miliony. Pokud obě zvolí nízké ceny, pak každá obdrží 2 miliony. Pokud však jedna zvolí vysoké a druhá nízké, pak druhá obdrží 4 miliony a první jen 1 milion Nejvýhodnější variantou v součtu je současný výběr vysokých cen (součet = 6 milionů). Tento stav (v nepřítomnosti kartelu ) je však nestabilní kvůli příležitosti k relativnímu zisku, která se otevírá pro firmu, která se od této strategie odchýlí. Obě společnosti proto s největší pravděpodobností zvolí nízké ceny. Tato možnost sice nedává maximální celkový zisk (součet = 4 miliony), ale vylučuje relativní zisk konkurenta, který by mohl získat odchýlením se od vzájemně optimální strategie. Tato situace se nazývá „Nashova rovnováha“ [3] .
Ve Stackelbergově oligopolním modelu lze pro dvě firmy účastnící se nekooperativní hry předpokládat, že existují dvě strategie: 1. Cournotův duopolista (K) a Stackelbergský duopolista (S), tedy S-strateg. Pro dva hráče jsou tedy možné následující strategie:
(K1;K2) (K1;S2);(K2;S1);(S1;S2). Jak vyplývá z konstrukce modelu zisku při volbě strategie S: , a při volbě strategie K: , je zřejmé, že maximální výplata prvního hráče je realizována v situaci (S1;K2), a druhého ( Kl;S2). Vzhledem k tomu, že tyto situace jsou neslučitelné, to znamená, že je nelze realizovat současně, nemohou oba hráči získat maximální výplatu ve stejnou dobu. V tomto případě bude optimálním chováním obou hráčů volba strategie S, jelikož strategie S je v tomto případě lepší než strategie K z hlediska minimální možné výplaty. V tomto případě je volbou (S1;S2) Nashova rovnováha. Jednostranná odchylka od této strategie automaticky snižuje výplatu kteréhokoli z hráčů, přičemž celková výplata v tomto typu rovnováhy je menší než celková výplata při volbě strategie (K1;K2) oběma hráči. Za podmínek tohoto modelu však při absenci výměny informací mezi hráči nebude realizována odchylka od Nashovy rovnováhy kvůli zvýšenému riziku, že druhý hráč může využít situace a nezvolit strategii K.
Koncept vzájemného zaručeného zničení . Žádná ze stran vlastnících jaderné zbraně nemůže beztrestně zahájit konflikt ani se jednostranně odzbrojit.
Herní teorie | |
---|---|
Základní pojmy | |
Typy her |
|
Koncepce řešení | |
Příklady her | |