Rovnováha třesoucí se ruky

Rovnováha třesoucí se ruky
Pojem rozhodování v teorii her
Související rozhodovací sady
Supersety Nashova rovnováha
Podmnožiny Vlastní bilance
Data
Autorství Reinhard Selten

Dokonalá rovnováha chvění ruky je principem  optimality v nekooperativních hrách , což je Nashova rovnováha , která má navíc vlastnost stability k dostatečně malým odchylkám hráčů od rovnovážných strategií. Formuloval R. Selten v práci z roku 1975 [1] .

Formální definice

Ať je hra podána v normální formě . Soubor smíšených strategií hráčů q se nazývá rovnováha třesoucí se ruky, pokud existuje sekvence zcela smíšených strategií { p ε } → q tak, že strategie q i je nejlepší odpovědí hráče i na strategie ostatních hráčů ve hře. nastavit p ε .

Stejně jako Nashova rovnováha existuje i rovnováha třesoucích se rukou ve smíšeném rozšíření v jakékoli nekooperativní hře s konečnými sadami hráčských strategií.

Příklad

Hra pro dvě osoby zobrazená v tabulce, zobrazená v normální formě, má dvě Nashovy rovnováhy : ( Nahoře , vlevo ) a ( dole , vpravo ). Avšak pouze ( B , L ) je rovnováha třesoucí se ruky.

vlevo, odjet Že jo
Horní jedenáct dvacet
Dno 0,2 2, 2


Předpokládejme, že hráč 1 používá smíšenou strategii , pro některé . Očekávaná odměna hráče 2, pokud hraje vlevo , je:

.

Očekávaná odměna hráče 2 při výběru správné strategie je:

.

Pro dostatečně malé hodnoty ε, hráč 2 maximalizuje svůj očekávaný zisk použitím správné strategie s minimální váhou. Stejně tak musí hráč 1 použít minimální váženou nízkou strategii , pokud hráč 2 používá smíšenou strategii . Proto ( B , L ) je rovnováha třesoucí se ruky.

Podobné úvahy neplatí pro profil strategií ( N , P ). Předpokládejme, že hráč 1 používá smíšenou strategii . Očekávaná odměna hráče 2, pokud použije L , je:

.

Očekávaná odměna hráče 2 při použití strategie P :

.

V tomto případě pro všechny kladné hodnoty ε hráč 2 maximalizuje svůj očekávaný zisk použitím P při minimální frekvenci. Proto ( H , P ) není třesoucí se rovnovážnou kombinací, protože s malou pravděpodobností chyb hráč 2 maximalizuje svůj očekávaný zisk odchylkou od této strategie.

Odkazy

  1. Selten, R. Přezkoumání konceptu dokonalosti pro body rovnováhy v rozsáhlých hrách  //  International Journal of Game Theory: journal. - 1975. - Sv. 4 . - str. 25-55 .

Literatura