Nashova rovnováha

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 9. září 2020; kontroly vyžadují 11 úprav .
Nashova rovnováha
Pojem rozhodování v teorii her
Související rozhodovací sady
Supersety Racionalizovatelnost
Korelovaná rovnováha
ε-rovnováha
Podmnožiny
Dokonalá rovnováha podhrou Rovnováha potřásání rukou
Evolučně stabilní strategie
Silná rovnováha
Data
Autorství John Nash
aplikace Všechny nekooperativní hry

Nashova rovnováha  je koncept rozhodnutí , jeden z klíčových konceptů teorie her . Toto je název sady strategií ve hře pro dva a více hráčů, ve které žádný účastník nemůže zvýšit výplatu změnou své strategie, pokud ostatní účastníci své strategie nezmění [1] . John Nash dokázal existenci takové rovnováhy ve smíšených strategiích v jakékoli konečné hře.

Historie

Tento koncept poprvé použil Antoine Auguste Cournot . Ukázal, jak najít to, čemu říkáme Nashova rovnováha ve hře Cournot . Nash byl první, kdo dokázal, že taková rovnováha musí existovat pro všechny konečné hry s libovolným počtem hráčů. To bylo provedeno ve své dizertační práci o nekooperativních hrách v roce 1950.

Před Nashem to bylo prokázáno pouze u her pro 2 hráče s nulovým součtem od Johna von Neumanna a Oskara Morgensterna (1947).

Matematická formulace

Předpokládejme, že  se jedná o nekooperativní hru pro n hráče v normální formě, kde S  je soubor čistých strategií a H  je soubor přínosů. Když si každý hráč zvolí strategii v profilu strategie, vyhrává hráč i . Upozorňujeme, že výplata závisí na celém profilu strategie: nejen na strategii zvolené hráčem i , ale také na dalších strategiích , tedy na všech strategiích pro . Profil strategie je Nashovou rovnováhou, pokud změna strategie z na není zisková pro žádného hráče , tedy pro žádného hráče.

Hra může mít Nashovu rovnováhu v čistých strategiích nebo ve smíšených strategiích (to znamená stochastickou volbu čisté strategie s pevnou frekvencí). Nash dokázal, že pokud jsou povoleny smíšené strategie , pak bude v každé hře n hráčů alespoň jedna Nashova rovnováha.

Příklady použití konceptu

Sociologie

V sociologické teorii racionální volby se zvlášť zdůrazňuje, že stabilní stav společnosti (sociální rovnováha) se může lišit od optimálního (sociálního optima). Takové suboptimální, ale stabilní stavy se v sociologii nazývají Nashova rovnováha.

herec B
jeden 2
Herec A jeden A: +1, B: +1 A: -1, B: +2
2 A: +2, B: -1 A: 0, B: 0

Tabulka vlevo ukazuje strukturu akce z hlediska teorie her , sestavenou pro dva aktéry ( herce ). Každý hráč má dvě možnosti akce, označené čísly 1 a 2. Koeficienty odměny, které obdrží při výběru určitých možností akce, jsou uvedeny v odpovídajících buňkách tabulky. Předpokládejme, že oba aktéři právě používají akci 2 a jejich odměny jsou nulové. Volbou akce 1 si aktér A zhorší svou vlastní situaci o jednu pozici (A: −1, B: +2). Podobně, pokud si aktér B zvolí možnost 1 sám, zatímco aktér A bude nadále používat možnost 2, svou situaci jen zhorší (A: +2, B: -1). Přestože tedy oba aktéři chápou, že situace by pro ně byla optimální, kdyby oba využili akci 1 (odměna - A: +1, B: +1), ani jeden z nich nemá motiv situaci změnit, a rovnováha vyplývá z absence takových motivů. Pokud je systém již v optimálním stavu (když si oba aktéři zvolili akci 1), pak budou oba vždy v pokušení začít používat akci 2, která jim přinese odměnu na úkor druhého hráče. Tento příklad ilustruje možnost dvou sociálních stavů: stabilní, ale neoptimální (oba aktéři využívají možnost 2); stejně jako druhé optimální, ale nestabilní (oba aktéři využívají možnost 1). [2]

Politologie

K vysvětlení různých jevů v politické teorii se často používá koncept jádra , což je slabší verze Nashovy rovnováhy. Jádro je soubor států, v každém z nich žádná skupina aktérů schopná vybudovat nový (v daném jádru nepřítomný) stát nezlepší svou situaci oproti svému stavu v daném jádru. [2]

Ekonomie

V oboru působí dvě firmy č. 1 a č. 2. Každá z firem může nastavit dvě cenové úrovně: „vysokou“ a „nízkou“. Pokud obě firmy zvolí vysoké ceny, pak každá dosáhne zisku 3 miliony. Pokud obě zvolí nízké ceny, pak každá obdrží 2 miliony. Pokud však jedna zvolí vysoké a druhá nízké, pak druhá obdrží 4 miliony a první jen 1 milion Nejvýhodnější variantou v součtu je současný výběr vysokých cen (součet = 6 milionů). Tento stav (v nepřítomnosti kartelu ) je však nestabilní kvůli příležitosti k relativnímu zisku, která se otevírá pro firmu, která se od této strategie odchýlí. Obě společnosti proto s největší pravděpodobností zvolí nízké ceny. Tato možnost sice nedává maximální celkový zisk (součet = 4 miliony), ale vylučuje relativní zisk konkurenta, který by mohl získat odchýlením se od vzájemně optimální strategie. Tato situace se nazývá „Nashova rovnováha“ [3] .

Ve Stackelbergově oligopolním modelu lze pro dvě firmy účastnící se nekooperativní hry předpokládat, že existují dvě strategie: 1. Cournotův duopolista (K) a Stackelbergský duopolista (S), tedy S-strateg. Pro dva hráče jsou tedy možné následující strategie:

(K1;K2) (K1;S2);(K2;S1);(S1;S2). Jak vyplývá z konstrukce modelu zisku při volbě strategie S: , a při volbě strategie K: , je zřejmé, že maximální výplata prvního hráče je realizována v situaci (S1;K2), a druhého ( Kl;S2). Vzhledem k tomu, že tyto situace jsou neslučitelné, to znamená, že je nelze realizovat současně, nemohou oba hráči získat maximální výplatu ve stejnou dobu. V tomto případě bude optimálním chováním obou hráčů volba strategie S, jelikož strategie S je v tomto případě lepší než strategie K z hlediska minimální možné výplaty. V tomto případě je volbou (S1;S2) Nashova rovnováha. Jednostranná odchylka od této strategie automaticky snižuje výplatu kteréhokoli z hráčů, přičemž celková výplata v tomto typu rovnováhy je menší než celková výplata při volbě strategie (K1;K2) oběma hráči. Za podmínek tohoto modelu však při absenci výměny informací mezi hráči nebude realizována odchylka od Nashovy rovnováhy kvůli zvýšenému riziku, že druhý hráč může využít situace a nezvolit strategii K.

Válčení

Koncept vzájemného zaručeného zničení . Žádná ze stran vlastnících jaderné zbraně nemůže beztrestně zahájit konflikt ani se jednostranně odzbrojit.

Viz také

Poznámky

  1. Univertv - Nash Equilibrium: Nakupování, pověst, hlasování Archivováno 13. prosince 2009 na Wayback Machine .
  2. 1 2 James S. Coleman . Ekonomická sociologie z pohledu teorie racionální volby  // Ekonomická sociologie: elektronický časopis. - 2004. - V. 5 , č. 3 . - S. 35-44 .
  3. „Nashova Nobelova cena“ Archivováno 26. května 2015 na Wayback Machine , The Economist, 24. května 2015.

Literatura

  1. Vasin A. A. , Morozov  V. V. Teorie her a modely matematické ekonomie. - M.: MGU, 2005, 272 s. ISBN 5-317-01388-7 .
  2. Vorobyov N. N. Teorie her pro kybernetické ekonomy. — M.: Nauka, 1985
  3. Mazalov VV Matematická teorie her a aplikací. - Nakladatelství Lan, 2010, 446 s.
  4. Petrosyan L. A. , Zenkevich N. A., Shevkoplyas E. V. Teoriya igr. - Petrohrad: BHV-Petersburg, 2012, 432 s.