Problém dvou obálek

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 2. května 2021; kontroly vyžadují 8 úprav .

Problém dvou obálek ( Paradox dvou obálek ) je známý paradox , který demonstruje jak rysy subjektivního vnímání teorie pravděpodobnosti , tak meze její použitelnosti . V hávu dvou obálek se tento paradox objevil na konci 80. let 20. století , ačkoliv jej matematici v různých formulacích znali již od první poloviny 20. století .

Formulace

Jsou tam dvě k nerozeznání obálky s penězi. V jednom je množství dvakrát větší než v druhém. Hodnota této částky není známa. Obálky dostávají dva hráči. Každý z nich si může otevřít vlastní obálku a spočítat peníze v ní. Poté se hráči musí rozhodnout: má cenu vyměnit obálku za něčí?

Oba hráči argumentují následovně. Vidím částku v obálce . V obálce někoho jiného je stejně pravděpodobné, že nebo lze nalézt . Pokud tedy změním obálku, tak v průměru budu mít , tedy více než nyní. Výměna je tedy dobrá. Výměna však nemůže být výhodná pro oba hráče. Kde je chyba v jejich úvahách?

Historie

V roce 1953 navrhl belgický matematik Maurice Krajczyk podobný problém s použitím dvou vazeb jako příkladu [1] :

Každá ze dvou tváří tvrdí, že jeho kravata je hezčí. Pro vyřešení sporu se obrátí na arbitra. Vítěz musí dát poraženému jako útěchu kravatu. Každý z diskutujících argumentuje následovně: „Vím, kolik stojí moje kravata. Mohu ji prohrát, ale také vyhrát hezčí remízu, takže v tomto sporu mám výhodu.“ Jak může být v jedné hře se dvěma účastníky výhoda na straně každého z nich?

Krajczyk tvrdí, že ve hře je symetrie, ale naznačuje, že je špatné používat pravděpodobnost 1/2 při výpočtu průměrného příjmu [2] :

Z pohledu obou účastníků sporu je hra symetrická a každý má stejnou pravděpodobnost výhry. Pravděpodobnost však není objektivně daný fakt a závisí na znalosti podmínek problému. V tomto případě je rozumné nepokoušet se odhadnout pravděpodobnost.

Původní text  (anglicky)[ zobrazitskrýt] Z pohledu soutěžících jsou podmínky hry symetrické, takže každý má poloviční pravděpodobnost výhry. Ve skutečnosti však pravděpodobnost není objektivně daný fakt, ale závisí na znalosti okolností. V tomto případě je moudré nepokoušet se odhadnout pravděpodobnost.

Problém se stal populárním díky Martinu Gardnerovi , který jej v roce 1982 popsal pod názvem "Čí peněženka je tlustší?" [3] . Gardner souhlasí s Krajczykem jak v tom, že hra je „férová“ (symetrická), tak v tom, že hra nemůže být výhodná pro obě strany zároveň, a také v tom, že úvahy hráčů působí pochybně:

Může být stejná hra „výnosnější“ pro každého ze dvou partnerů? Je jasné, že nemůže. Nevzniká paradox proto, že se každý hráč mylně domnívá, že jeho šance na výhru a prohru jsou stejné?

Gardner však také poznamenává, že Krajczyk neposkytl podrobnou matematickou analýzu problému:

bohužel nám to nic neříká o tom, kde přesně je chyba v uvažování dvou hráčů. Ať jsme se sebevíc snažili, nikdy se nám nepodařilo najít jednoduché a uspokojivé řešení Krajczykova paradoxu.

V budoucnu se problém nazýval „paradox dvou rakví“, „paradox dvou kapes“, „paradox směny“ atd.

Nový zájem o paradox vyvstal poté, co Barry Nailbuff publikoval článek uvádějící řadu paradoxů v teorii pravděpodobnosti v Journal of Economic Perspectives [4] . Po obdržení mnoha ohlasů na tuto publikaci připravil druhý článek "The Other Person's Envelope is Always Greener" ( Eng.  The Other Person's Envelope is Always Greener ), věnovaný přímo problému obálek [2] . V jeho navrhované formulaci jsou dvě obálky [2] :

V jedné obálce je umístěno určité množství peněz, které ostatní neznají, a tato obálka je dána Ali. Pak se tajně hodí mincí. Pokud se dostane na hlavu, druhá obálka se zdvojnásobí množstvím v první obálce. V opačném případě se polovina částky vloží do druhé obálky. Tato obálka je dána Bábě. Ali a Baba mohou otevřít své obálky, aniž by si navzájem řekli částky, které tam vidí. Poté si mohou (po vzájemné dohodě) obálky vyměnit.

Předpokládejme, že Ali vidí ve své obálce 10 dolarů. Ali naznačuje, že Baba bude mít v obálce stejně pravděpodobně 5 nebo 20 dolarů. V tomto případě výměna obálek přináší Ali 2,5 dolaru (nebo 25 %). Podobně Baba věří, že Aliho obálka bude stejně pravděpodobně obsahovat částku dvakrát menší nebo větší, než kterou má. Průměrně tedy při výměně obálek dostává . Bába tedy také očekává, že dostane v průměru 25 % z příjmu oproti částce v jeho obálce.

To je však paradoxní. Výměna obálek nemůže být výhodná pro oba účastníky. Kde je chyba v jejich úvahách?

Původní text  (anglicky)[ zobrazitskrýt] Máte dvě obálky. Do jednoho umístíte skrytou částku peněz a obálku předáte Ali. Pak hodíte skrytou mincí. Pokud se to stane hlavou, vložíte do druhé obálky dvojnásobek původní částky peněz. Pokud se to zvedne, vložíte do druhé obálky pouze polovinu původní částky. Tuto druhou obálku dáš Bábě. Zatím je obsah obou obálek skrytý, stejně jako výsledek hodu mincí. Ali a Baba se mohou soukromě podívat na množství peněz ve svých vlastních obálkách. Poté dostanou příležitost obchodovat s obálkami, pokud oba souhlasí. Pro argumentaci předpokládejme, že Ali najde ve své obálce 10,00 dolarů. Ali zdůvodňuje, že Baba bude mít stejně pravděpodobně $5,00 nebo $20,00. Obchodování s obálkami jí dává očekávaný zisk 2,50 $ (nebo 25 procent). Chovat se rizikově neutrálním způsobem by chtěla přejít. Teď se Baba dívá do své obálky. Ať už najde jakoukoli částku (buď 5,00 $ nebo 20,00 $), i on zdůvodňuje, že Ali bude mít stejně pravděpodobně polovinu nebo dvojnásobek své částky. Očekávání je 0,5[0,5X + 2X] = 1,25X, takže i on očekává 25procentní zisk ze změny obálek. To je ale paradoxní. Součet částky v obou obálkách je jakýkoli. Obchodní obálky nemohou oba účastníky zlepšit. Přesto oba očekávají 25procentní zisk. Kde udělali chybu?

Nailbufova modifikace podmínek problému a jím navrhovaných řešení umožnila mnohé objasnit o podstatě paradoxu . Hození mincí po naplnění první obálky však znatelně narušilo počáteční symetrii kapitálek hráčů. Při rozhodování se důraz přesunul na prokázání nerovnoměrnosti výchozích podmínek pro Bábu oproti Alimu. Proto v důsledku další evoluce [5] , mince zmizela ze stavu problému, s jehož pomocí Nailbuf určil obsah druhé obálky.

K dnešnímu dni je nejznámější a pro matematiky největší zájem o dokonale symetrické uspořádání s navenek nerozlišitelnými obálkami obsahujícími méně a dvakrát tolik, přičemž jednu z obálek lze otevřít před zahájením diskuse o ziskovosti burzy.

Řešení paradoxu

Z Nailbufova pohledu [2] , první uspokojivé vysvětlení jeho problému podává Sandi Zabell v článku „Ztráty a zisky: paradox směny“ [6] . Nailbuf trochu parafrázuje:

Baba se domnívá, že na částce, kterou vidí, nezáleží vzhledem k možnosti, že později bude jeho obálka obsahovat větší částku. To znamená, že Baba si myslí, že pravděpodobnost, že částka v jeho obálce je větší, je 1/2, bez ohledu na viděnou částku. To platí pouze v případě, že každá hodnota od nuly do nekonečna je ekvipravděpodobná. Ale pokud je všechen nekonečný počet možností stejně pravděpodobný, šance každé hodnoty je nulová. Pak má každý výsledek nulovou šanci. A to je nesmysl.

Původní text  (anglicky)[ zobrazitskrýt] Baba se domnívá, že částka, kterou vidí, není informativní s ohledem na pozdější pravděpodobnost, že jeho obálka obsahuje vyšší částku. To znamená, že Baba věří, že pravděpodobnost, že jeho obálka obsahuje vyšší částku, je ½ bez ohledu na to, jakou částku v obálce vidí. To platí pouze v případě, že každá hodnota, od nuly do nekonečna, je stejně pravděpodobná. Ale pokud je nekonečně mnoho možností všechny stejně pravděpodobné, šance na kterýkoli výsledek musí být nulová. Pak má každý výsledek nulovou šanci, a to je nesmysl. Formální argumentace

Označme pravděpodobností, že Aliho obálka obsahuje součet x . Když Baba pozoruje množství X ve své obálce , podmíněná pravděpodobnost , že Ali má ve své obálce 2 X , je

Bába při formulaci problému považuje tuto pravděpodobnost za 1/2 bez ohledu na to, jakou částku X vidí ve své obálce. Proto pro všechny . V souladu s tím musí být konstantní na intervalu od 0 do nekonečna. Takový předpoklad je však neplatný: pokud je pravděpodobnost kladná a konstantní na celé kladné poloose, pak je její integrál roven nekonečnu, což je nemožné. Počáteční předpoklad paradoxu (ekvipravděpodobnost Х /2 a 2 Х ) je tedy nerealizovatelný.

Řešení paradoxu v původní formulaci.

Označme částku v obálce prvního hráče , částku v obálce druhého hráče , a jejich poměr . Podle stavu problému nabývá hodnot 2 a 1/2 s pravděpodobnostmi 1/2, a tedy . Totéž lze říci o distribuci (a tedy očekávání) reciproční hodnoty . Neexistují žádné informace o rozdělení náhodných veličin , kromě toho, že jejich poměr je rozdělen podle popsaného zákona. Hráči pozorují ve svých obálkách výsledky jednoho testu nad "svými" náhodnými veličinami, ale neznají tento výsledek pro jiného hráče a pro poměr součtů v obálkách. Označte - výplatu prvního hráče (v případě výměny) a podle toho - výplatu druhého hráče. Pak je celkový zisk , a zejména . Ve stejný čas:

,

kde rovnost s otázkou je pravdivá, jestliže množství a nejsou ve vzájemném vztahu (zejména pokud jsou nezávislé). Rovněž,

,

kde rovnost s otázkou je pravdivá, jestliže množství a nejsou ve vzájemném vztahu (zejména jestliže a jsou nezávislé).

V případě „naivního“ vnímání hráč považuje hodnotu a „jeho“ hodnotu ( nebo ) za nezávislé, to znamená, že aposteriorní rozdělení navzdory testu považuje za stejné jako apriorní. Možná má jeden z nich pravdu, pak je jedna z rovnosti s otázkou pravdivá. Ale obě rovnosti nemohou být pravdivé, protože v tomto případě by to dopadlo .

Je tedy možné, že některý z hráčů má pravdu v tom, že výměnu považuje za pro sebe výhodnou – například to platí v případě, že částka v jeho obálce a poměr částek v obálkách jsou nezávislé (nebo alespoň ne korelované). Ale pro obojí najednou je to nemožné, takže v tom není žádný rozpor.

Například v Nailbufově formulaci jsou množství a právě nezávislá (a tudíž nekorelovaná ), protože mince se hází a hází bez ohledu na množství v Aliho obálce. Výměna je tedy pro něj výhodná. Ale pro Bábu je to úplně stejně nevýhodné. Pokud Bába s výměnou souhlasí, je to buď proto, že nedokáže pochopit nerentabilnost takového scénáře pro něj, nebo proto, že byl organizátory hry uveden v omyl.

Zdánlivý paradox (nesamozřejmost) celé této situace lze odstranit pochopením, že peníze kolují nejen v obálkách dvou hráčů, ale také u organizátorů (sponzorů) hry. To znamená, že hráči jsou vlastně tři. Výše uvedené úvahy o rovnosti nekonečna (nemožnosti stejné pravděpodobnosti všech výsledků) jsou pak formulovány z hlediska toho, zda jsou sponzoři nekonečně bohatí, nebo zda je jejich kapitál omezený. V prvním případě nejde o žádný rozpor a intuice hráčů o ziskovosti burzy je poněkud správná – jejich celkový příjem je odebírán od nekonečně bohatého sponzora. Ve druhém případě je ekvipravděpodobnost všech součtů v obálkách nemožná, protože integrál musí konvergovat. To znamená, že pozorování určitého množství v obálce, obecně řečeno, nějak ovlivňuje pravděpodobnost poměru částek v obálkách.

Poznámky

  1. Maurice Kraitchik. Matematika jeux! — 1953.
  2. 1 2 3 4 Nalebuff B. Hádanky. Obálka druhé osoby je vždy zelenější  //  Journal of Economic Perspectives. - 1989. - Sv. 3 , ne. 1 . - S. 171-181.  (nedostupný odkaz)
  3. Gardner M. No tak, hádejte! - M. : Mir, 1984. - S. 139. - 214 s. 100 000 výtisků.
  4. Nalebuff B. Hádanky: Cider ve vašem uchu, pokračující dilema, poslední bude první a další  //  Journal of Economic Perspectives. - 1988. - Sv. 2 , ne. 2 . - S. 149-156.
  5. Mark D. McDonnell, Derek Abbott. Náhodné přepínání v problému dvou obálek  // Proc . R. Soc. A. - 2009.  
  6. Zabell S. Proceedings of the Third Valencia International Meeting  //  Clarendon Press, Oxford. - 1988. - S. 233-236.