Cena anarchie ( anglicky Price of Anarchy , PoA ) [1] je pojem v ekonomii a teorii her , který měří, jak moc se snižuje efektivita systému kvůli sobeckému chování jeho agentů.
Cena anarchie je obecný koncept, který lze rozšířit na různé systémy a koncepty efektivity. Vezměme si například dopravní systém ve městě, kde se mnoho agentů snaží cestovat z nějakého počátečního bodu do nějakého konečného bodu. Efektivitou se v tomto případě rozumí průměrná doba, za kterou se agent dostane na místo určení. V „centralizovaném“ řešení může ústřední orgán každému agentovi sdělit, jakou cestou by se měl agent ubírat, aby se minimalizovala průměrná doba cestování. V „decentralizované“ verzi si každý agent volí trasu podle vlastního uvážení. Cena anarchie odráží poměr průměrných cestovních dob pro tyto dva případy.
Typicky je systém modelován jako hra a účinnost je určitou funkcí výsledku hry (např. maximální latence sítě, dopravní zácpa, sociální přínos v aukcích atd.). Různé koncepty rovnováhy mohou být použity k modelování sobeckého chování agentů a mezi nimi je nejobecnějším konceptem Nashova rovnováha . Různé variace Nashovy rovnováhy vedou k variacím konceptu nákladů anarchie, jako jsou náklady čisté anarchie (pro deterministické rovnováhy), náklady smíšené anarchie (pro randomizované rovnováhy) a náklady anarchie Bayes-Nash (pro hry s neúplnými informacemi). Jiné pojmy než Nashova rovnováha vedou k možnostem, jako je cena ponoření [2] .
Termín „cena anarchie“ poprvé použili Elias Koutsoupias a Christos Papadimitriou [1] , ale myšlenka měření rovnovážné neefektivity je starší [3] . Koncept ve své současné podobě měl být analogický k „faktoru aproximace“ v aproximačním algoritmu nebo „úrovni konkurenceschopnosti“ v online algoritmu . Termín je v souladu s moderním trendem analýzy her pomocí algoritmických čoček ( Algorithmic Game Theory ).
Zvažte hru definovanou sadou hráčů , sadami strategií pro každého hráče a užitečnou funkcí (která se také nazývá sada výsledků). Můžeme definovat míru efektivity každého výsledku, kterou nazveme funkce přínosu . Přirozenými kandidáty jsou součet užitků hráčů (cílové užitky), minimální užitek (cílová spravedlivost nebo rovnostářství) ... nebo jakákoliv funkce, která má smysl pro konkrétní analyzovanou hru a která by měla být maximalizována.
Podmnožinu můžeme definovat jako množinu strategií v rovnováze (například množinu Nashových rovnováh ). Cena anarchie je pak definována jako poměr optimálního „centralizovaného“ řešení a „nejhorší rovnováhy“:
Pokud namísto „dobra“, které chceme maximalizovat, je funkce měření účinnosti „funkcí nákladů“ , kterou chceme minimalizovat (jako je zpoždění sítě), použijeme (podle konvencí přijatých v aproximačních algoritmech):
Souvisejícím konceptem je cena stability ( PoS ) , která měří vztah mezi „nejlepší rovnováhou“ a optimálně „centralizovaným“ řešením:
nebo v případě cenových funkcí:
Známe to z definice. Očekává se, že ztráta účinnosti kvůli omezením teorie her bude ležet někde mezi PoS a PoA.
Obě hodnoty, PoS i PoA, byly vypočteny pro různé typy her. Některé příklady jsou uvedeny níže.
Zvažte hru 2x2 s názvem Prisoner 's Dilemma, která je dána následující maticí nákladů:
Spolupracovat | zradit | |
---|---|---|
Spolupracovat | 1 ; jeden | 7 ; 0 |
zradit | 0 ; 7 | 5 ; 5 |
a nechme funkci ceny být Nyní bude minimální cena, když oba hráči spolupracují a výsledná cena bude . Nashova rovnováha je však pozorována pouze tehdy, když oba zradí, v takovém případě je cena . Potom bude hodnota PoA této hry rovna .
Protože hra má jedinečnou Nashovu rovnováhu, hodnota PoS je PoA, což je také 5.
Přirozenějším příkladem je jeden z problémů s plánováním práce . Jsou tam hráči a každý z nich má nějakou práci, kterou musí udělat. Mohou si vybrat jeden ze strojů k provedení práce. Náklady na anarchii srovnávají situaci, kdy je výběr strojů určován centrálně, a situaci, kdy si každý hráč vybírá auto tak, aby svou práci dokončil rychleji.
Každý stroj má rychlost Každá práce má váhu Hráč si vybere stroj, který vykoná jeho/její práci. Strategie každého hráče tedy budou Definujte zatížení stroje jako:
Cena pro hráče je rovna , to znamená, že se rovná zatížení stroje, které si hráč vybere. Budeme uvažovat funkci rovnostářské ceny , která se zde nazývá obdobím zpracování.
Budeme zvažovat dva koncepty rovnováhy – čistou Nashovu strategii a smíšenou Nashovu strategii . Je jasné, že smíšený PoA je čistý PoA, protože jakákoli čistá Nashova rovnováha je také smíšená Nashova rovnováha (nerovnice se může ukázat jako přísná, jsoukdyžnapříklad ). První věc, kterou musíme udělat, je ukázat existenci čisté Nashovy rovnováhy.
Prohlášení . Pro každou hru na distribuci práce existuje alespoň jedna čistá rovnovážná strategie Nash.
Důkaz . Potřebujeme získat společensky optimální soubor strategií . To může jednoduše znamenat soubor strategií, u kterých je doba zpracování minimální. To však nestačí. Může existovat několik takových sad strategií, které vedou k řadě různých rozložení zatížení (všechny mají stejné maximální zatížení). Navíc se omezíme na to, že je zde druhá nejnižší zátěž. Opět to vede k mnoha možným rozložením zatížení a postup opakujeme, dokud nedosáhneme tého nejlepšího (tj. nejmenšího) zatížení, kde může být pouze jedno rozložení zatížení (jediné až po permutaci). To lze také nazvat lexikograficky nejmenším vektorem tříděných stahování.
Tvrdíme, že jde o čistou strategii Nashovy rovnováhy. Prokážeme protikladem. Předpokládejme, že některý hráč může zlepšit svůj výkon tím, že přechází ze stroje na stroj . To znamená, že zvýšené zatížení stroje po přechodu zůstává menší než zatížení stroje před přechodem. Vzhledem k tomu, že zatížení stroje by se mělo v důsledku přechodu snížit a žádný další stroj není ovlivněn, což znamená, že nová konfigurace zaručuje snížení --té největší zátěže v distribuci. To však porušuje předpoklad lexikografické minimalizace . Q.E.D.
Prohlášení . U žádné hry pro distribuci práce nepřekračuje čistá strategie PoA .
Důkaz . Je snadné shora svázat dobro získané jako jakákoli smíšená strategie Nashovy rovnováhy podle vzorce
Zvažte pro jasnost jakoukoli sadu čistých strategií , pak je to jasné
Protože výše uvedené platí i pro sociální optimum, porovnání poměrů toto tvrzení potvrzuje . Q.E.D
Zvažte síť silnic, po kterých musí pevný počet řidičů cestovat ze společného výchozího bodu do společného koncového bodu. Předpokládejme, že každý řidič volí trasu sobecky a že doba jízdy závisí lineárně na počtu řidičů, kteří si trasu volí.
Tyto podmínky můžeme formalizovat jako problém výběru trasy v orientovaném souvislém grafu , ve kterém chceme poslat jednotku toku ze zdrojového uzlu do uzlu sink (představme si, že tok se skládá ze zvolených tras různých řidičů). Konkrétně nechť je tok funkcí, která každé hraně přiřadí nezáporné reálné číslo, a uvažujme sadu lineárních funkcí , které mapují tok hranou ke zpoždění hrany. Definujme také společenské dobro toku jako
Vezměme si příklad na obrázku – pokud není k dispozici tečkovaná cesta, získá se Nashova rovnováha ve smíšených strategiích, když si každý hráč zvolí horní cestu a dolní cestu se stejnou pravděpodobností – tato rovnováha má sociální náklady 1,5 a trvá 1,5 jednotky času pro každého řidiče ke každému řidiči projet z do . V naději na zlepšení průjezdu sítí může zákonodárce rozhodnout o otevření tečkované silnice pro řidiče s malým zpožděním. V tomto případě může Nashova rovnováha nastat pouze v případě, že kterýkoli řidič použije novou silnici, takže společenské náklady se zvýší o 2 a každému řidiči nyní trvá cesta z do 2 jednotky času .
Dochází proto k neobvyklému výsledku – legislativní zákaz používání rychlejší silnice v některých případech může mít pozitivní výsledek.
Problém směrování prezentovaný v Braesově paradoxu lze zobecnit na mnoho různých toků na stejném grafu současně.
Definice (Generalized Stream) . Nechť , a je definováno stejným způsobem jako výše, a předpokládejme, že chceme předat hodnoty přes každý jiný pár uzlů v . Tok je definován jako rozdělení reálných nezáporných čísel na každou cestu procházející z do , s omezeními
Tok procházející určitou hranou grafu je definován jako
Pro stručnost napíšeme , pokud je to jasné z kontextu.
Definice (Nashův rovnovážný tok) . Tok je Nashův rovnovážný tok tehdy a jen tehdy a od do
Tato definice úzce souvisí s tím, o čem mluvíme, když smíšená strategie udržuje Nashovu rovnováhu ve hrách v normální formě.
Definice (Conditional Flow Good) . Dovolit a být dva proudy spojené s množinami a . V následujícím vynecháme index, abychom si usnadnili zápis. Představte si pevná zpoždění generovaná funkcemi v grafu — podmíněný statek s ohledem na je definován jako
Fakt 1 . Pokud existuje Nashův rovnovážný tok a jakýkoli jiný tok , .
Důkaz (z konverzace) . Předpokládejme, že . Podle definice,
.Protože a souvisí se stejnými množinami , víme to
Proto musí existovat dvojice a dvě cesty od do takové, že , , a
Jinými slovy, tok může získat pouze menší užitek, než když dvě cesty od do mají různé ceny a když přesměruje nějaký tok z cesty s vysokými náklady na cestu s nižšími náklady. Je jasné, že tato situace je neslučitelná s předpokladem, že jde o Nashův rovnovážný tok. Q.E.D.
Všimněte si, že skutečnost 1 neznamená žádnou konkrétní strukturu množiny .
Fakt 2 . Jsou-li dána dvě reálná čísla a , .
Důkaz . Toto je další způsob, jak vyjádřit správnou nerovnost . Q.E.D.
Věta . PoA čisté strategie pro jakýkoli zobecněný problém se směrováním s lineárním zpožděním se rovná .
Důkaz . Všimněte si, že tato věta je ekvivalentní tvrzení, že každý Nashův rovnovážný tok , , kde je jakýkoli jiný tok. Podle definice
Pomocí Fakta 2 dostaneme
protože
Můžeme dojít k závěru, že , a tvrzení dokázat pomocí Faktu 1. který bylo požadováno dokázat.
Všimněte si, že v důkazu jsme hojně využívali předpokladu, že funkce v jsou lineární. Ve skutečnosti platí obecnější fakta.
Věta . Vzhledem k zobecněnému problému směrování na grafu a funkcím polynomiálního stupně zpoždění s nezápornými koeficienty je PoA čistá strategie .
Všimněte si, že PoA může růst jako . Uvažujme příklad znázorněný na obrázku, kde předpokládáme jednotkový tok: Nashovy rovnovážné toky mají sociální statek 1. Nejlepšího statku je však dosaženo , když v tomto případě
Hodnota se blíží nule, když se blíží nekonečnu.
Herní teorie | |
---|---|
Základní pojmy | |
Typy her |
|
Koncepce řešení | |
Příklady her | |