Problém zruinování hráče je problém z oblasti teorie pravděpodobnosti . Podrobně se jí zabýval ruský matematik A. N. Shiryaev v monografii „Pravděpodobnost“ [1] .
U stolu jsou dva hráči . První má k dispozici rubly, druhý má k dispozici rubly . Před nimi na stole leží asymetrická mince ( pravděpodobnost , že vypadne líc , se může rovnat libovolnému číslu od 0 do 1 včetně). Pokud na minci padne líc, pak první hráč vyhrává rubl (druhý hráč zaplatí prvnímu 1 rubl), a pokud padne rub, první hráč zaplatí druhému jeden rubl. Je nutné zjistit pravděpodobnost, že jeden z hráčů prohraje v krocích na nulu, a pravděpodobnost prohry každého hráče. Je také nutné vypočítat průměrnou délku hry.
Tuto situaci lze modelovat podobným způsobem: existuje bludná částice a chodba . Uvažujeme pravděpodobnost, že částice opustí chodbu po krocích (proklouzne horní nebo spodní stěnou).
Zvažte Bernoulliho schéma se zkouškami.
Nechť je pravděpodobnostní prostor, kde
Ve výše uvedeném výrazu lze počet shozených jednotek zjistit následovně: .
Zavádíme posloupnost Bernoulliho náhodných proměnných:
Dokázat to
Řešení
To je pravda vzhledem k tomu, že
, protože podle podmínky .
Dokažte to a buďte nezávislí.
Řešení
Nezávislost náhodných veličin to znamená
pojďme si to ukázat:
Pro Bernoulliho schéma se shodneme na následujícím významu náhodné veličiny ξ: znamená, že druhý hráč platí prvnímu a první hráč platí druhému.
Pojďme si představit nový zápis:
, .
Číslo se rovná délce trvání hry a posloupnost lze považovat za trajektorii náhodné procházky nějaké částice počínaje nulou, přičemž rovnost je zřejmá a znamená to, že první hráč vyhrává nad druhým (což může být negativní).
Nechť , jsou dvě celá čísla, , . Je potřeba najít pravděpodobnost, s jakou bude výstup částice z koridoru ohraničený a proveden v krocích .
Dále nechť je celé číslo, . Nechť také za to (což znamená, že hráči začali hrát s nenulovým kapitálem, který měli k dispozici). Nechte _ Předpokládejme, že pokud . Pokud částice nikdy nepřekročila hranice, pak je nedefinovaná.
Pro každý a moment se nazývá moment zastavení , což je náhodná veličina definovaná v prostoru elementárních událostí . je událost , kdy náhodná procházka , počínaje bodem , opustí interval v daném čase . Zaveďme nový zápis: , pro . Nechť , jsou pravděpodobnosti částice opouštějící interval v čase, respektive v bodech a .
Nechat ; je zřejmé, že (do zahájení hry je částice uvnitř intervalu s pravděpodobností 1). Nechte teď . Pak podle vzorce celkové pravděpodobnosti
Dokázat to
(1 )
(2) .
Důkaz.
(1) Dokažme, že .
, kde je množina trajektorií tvaru , které poprvé opouštějí interval v bodě (zobrazeno na obrázku). Pokud náhodný vektor spadne do vhodné trajektorie, pak spadne do množiny . Představme množinu jako . Disjunktní spojení je legitimní, protože každá částice procházející podél trajektorie má . jsou ty trajektorie, ze kterých . jsou ty trajektorie, ze kterých . Všimněte si, že každá trajektorie z je v přímé shodě s trajektorií z . Osobní korespondence je dokázána rozporem . Předpokládejme, že (nejednoznačná korespondence); pak tato trajektorie nebude schopna vynést částici z chodby po krocích (ale pouze kvůli počáteční vzdálenosti od horní stěny chodby). V opačném směru je korespondence také jedna ku jedné z definice: . Z toho vyplývá, že (protože se jedná o nezávislé identicky rozdělené náhodné proměnné ).
Existuje další způsob, jak to dokázat:
. |
To je pravda, protože pravděpodobnosti jsou nezávislé (to bylo prokázáno dříve).
(2) Podobným způsobem dokážeme, že .
Každá trajektorie z je v přímé shodě s trajektorií z . Odtud
Z rovnice pro to vyplývá a platí:
, pro .
Vzorec celkové pravděpodobnosti nám také dává následující výsledek: .
Všimněte si také, že a tedy pro . Toto tvrzení je pravdivé, protože ke každé trajektorii, která vynese částici v méně krocích, lze na začátek přidat jeden krok ( ), ve kterém částice může přijít do bodu jak z (for ), tak z ( ).
Pro dostatečně velké , pravděpodobnost se blíží - vyřešení rovnice za podmínek, že (k odchodu došlo okamžitě od bodu - konec hry, vyhrál první hráč), (první hráč nikdy nevyhraje, pokud k odchodu dojde okamžitě v bodě ). Tyto podmínky vyplývají ze skutečnosti, že . To bude také prokázáno v této části.
Nejprve dostaneme řešení rovnice . Ať je hra nespravedlivá ( ). V tomto případě najdeme kořeny rovnice, tedy . Jedno konkrétní řešení je okamžitě viditelné: . Jiné řešení najdeme pomocí skutečnosti, že je funkce. Je vhodné použít výraz se vztahem , protože : . Proto je rozumné předpokládat, že . Přidáním konstanty se nic nezmění, protože .
Nyní zvažte obecné řešení: . Použijeme stejné podmínky jako a , a dostaneme to
Dokažme jedinečnost řešení tohoto problému. Abychom to udělali, ukážeme, že jakékoli řešení problému s okrajovými podmínkami může být reprezentováno jako .
Řešení
Zvažte nějaké řešení za podmínek , . Potom je vždy možné zvolit konstanty a takové, že , . Z rovnice předloženého problému pak vyplývá, že . Pak v obecném případě . Proto je řešení jedinečné. Přesně stejný způsob uvažování lze použít na .
Zvažte otázku rychlosti omezující konvergence a do a . Nechte procházku začít od počátku ( ). Pro zjednodušení označujeme , , . Jinými slovy, je jedna mínus součet pravděpodobností, že částice opustí koridor – pravděpodobnost, že zůstane v koridoru putovat: . představuje událost . Uvažujme číslo , kde a řetězec náhodných proměnných . Označíme-li celkové bohatství za , pak . Existuje pro to rozumné vysvětlení: pokud se částice dostane mimo nulu a nepřekročí hranice, pak je součet kusů rozhodně menší než celková zásoba.
Dokažme, že jsou nezávislé a rovnoměrně rozložené . Stačí dokázat, že jsou nezávislé, protože všechny mají binomické rozdělení .
Řešení
Pojďme to dokázat
. |
Vraťme se k úvahám o konvergenci.
Z toho, co bylo právě prokázáno, vyplývá, že .
Uvažujme rozptyl : (který je zcela legitimní, protože , a je modifikovanou Bernoulliho náhodnou proměnnou ), tedy pro dostatečně velké a , platí: , kde , protože když , pak . Jestliže nebo , pak pro dostatečně velké platí , že , takže nerovnost je pravdivá . Z výše uvedeného vyplývá , že kde . Od té doby ; od té doby a , pak ; v . Podobné odhady jsou platné i pro rozdíly a protože tyto rozdíly lze redukovat na rozdíly a pro , .
Vraťme se k úvahám . Analogicky k řešení rovnice můžeme říci, že rovnice za okrajových podmínek má jedinečné řešení
U každého je to snadné vidět . Pokud je hra férová (pravděpodobnost averzu se rovná pravděpodobnosti obrácení), řešení budou vypadat takto: , .
Množství a lze nazvat pravděpodobnosti zmaru prvního a druhého hráče s počátečním kapitálem as počtem tahů sahajícím do nekonečna a charakterizující náhodnou veličinu jako zisk prvního hráče a prohru prvního hráče. V následujícím bude ukázáno, proč lze takovou sekvenci skutečně sestavit.
Jestliže , pak intuitivní význam funkce je pravděpodobnost, že částice, která opustila pozici, dosáhne horní stěny ( ) dříve než nula. Ze vzorců je vidět , že
.Co má dělat první hráč, když je pro něj hra nevýhodná?
Jeho pravděpodobnost prohry je dána vzorcem .
Nyní ať se první hráč s kapitálem rozhodne zdvojnásobit sázku a hrát o dva rubly, tedy , , . Potom označíme limitní pravděpodobnost zkázy prvního hráče takto: .
Proto , protože se násobí zlomkem, který je větší než jedna v .
Pokud je tedy pravděpodobnost získání lícové strany, která je pro prvního hráče tak žádoucí, menší než , pak je pro něj výhodné zvýšit sázku o faktor 1: tím se sníží pravděpodobnost, že jeho terminál zruinuje v důsledku skutečnost, že pravděpodobnost vyskočení z chodby v místě se zvyšuje . Toto rozhodnutí se zdá paradoxní, protože se zdá, že v nepříznivé situaci by měl člověk snížit sázku a snížit ztrátu, ale ve skutečnosti při nekonečném počtu her a nízké sázce prohrávající hráč nakonec prohraje na nulu a hráč s vysokým vkladem má větší šanci zasáhnout počet líců dostačujících k dokončení hry v bodě .
Zvažte průměrnou dobu trvání chůze naší částice. Zaveďme matematické očekávání okamžiku, kdy se hra zastaví: pro . Odvoďme rekurentní vztah pro matematické očekávání trvání hry:
For a získali jsme rekurzivní vztah pro funkci : for .
Zaveďme okrajové podmínky: pokud hra začíná v bodě nebo , pak okamžitě skončí - její trvání se bude rovnat 0: .
Ze vztahu opakování a okrajových podmínek lze vypočítat . Protože , pak existuje limit , který splňuje vztah : při provádění . Tyto přechody jsou podobné těm, které jsme uvažovali při přechodu do rovnice pravděpodobnosti ztráty. K vyřešení této rovnice je třeba zavést ještě jednu podmínku: očekávání počtu tahů musí být konečné, tedy , , .
Pojďme vyřešit tuto rovnici. V rovnici pravděpodobnosti ztráty ( ), konkrétní řešení a již byly získány . Zde se objevuje ještě jeden uchazeč o roli konkrétního řešení: , tedy . Vezmeme-li v úvahu okrajovou podmínku, zjistíme pomocí dříve získaných vztahů : . V případě ideální mince získáme následující výraz: . Aplikace okrajové podmínky dává: . Z toho vyplývá, že v případě rovného počátečního kapitálu . Například, pokud má každý hráč 5 rublů a sázka je 1 rubl, pak v průměru hráči zkrachují po 25 tazích.
Při zvažování výše uvedených vzorců se předpokládalo, že matematické očekávání počtu tahů je konečné: . Nyní navrhneme důkaz této skutečnosti.
Dokažte to .
Řešení
Stačí to pro daný případ prokázat (protože již dříve bylo ukázáno, že případy lze redukovat na variaci a ) a , a poté případ zvážit .
Zvažte tedy sekvenci a zaveďte náhodnou proměnnou , kde je čas zastavení.
Nechte _ Interpretace je následující: je hodnota náhodné procházky v tuto chvíli . Pokud , pak ; pokud , tak . Připomeň si to a dokaž to .
Abychom dokázali první rovnost, píšeme: . Je zcela zřejmé , že od , v . Zbývá to dokázat .
Neboť je pravda, že . Poslední událost může být reprezentována jako , kde je nějaká podmnožina množiny . Tato sada je definována pouze pro . U velkých hodnot neovlivňuje . Sada pohledů může být také reprezentována jako . Z důvodu nezávislosti (prokázáno v dílčím problému 2 ) vyplývá, že náhodné veličiny a jsou nezávislé. Proto , vzhledem k tomu, že první faktor je nulový.
Je stanoveno, že pro ideální minci je .
V případě existují vztahy (protože ) a , protože . Teď si to ukažme .
V případě férové hry na základě vztahu platí, že . Pak tedy . Z nerovnosti vyplývá, že matematické očekávání konverguje k limitní hodnotě . V případě nekalé hry . Protože okamžik prvního letu částice z koridoru byl označen jako, je její matematické očekávání menší než určitá čísla, tedy menší než nekonečno. Za takového stavu .
Pro simulaci hry použijeme program MATLAB .
Nejprve vygenerujeme sekvenci a poté, s určitou počáteční bohatostí, vytvoříme řetězec :
Poté zavedeme funkci getS(n, q, x) , která by nejen, jako výše uvedený výpis, okamžitě a okamžitě vygenerovala řadu , ale umožnila by na základě zadaných hodnot sestavit řadu zobecněným způsobem bez komplikující výpočty. Tím by se zjednodušil pracovní prostor.
Nabízí se rozumná otázka: proč počítat až od druhé hodnoty ( pro i = 2:n )? Faktem je, že se to děje pouze za účelem vizualizace. Při vykreslování grafu v následujícím kódu budou trajektorie sestaveny , a pokud by pro i = 1:n bylo zapsáno , pak od úplně první hodnoty by některé trajektorie vycházely z , některé - z . Protože v tomto programu je z důvodů optimality lepší nepoužívat nulovou hodnotu (částice ji opustí, ale není vykreslena, protože sčítání nastane okamžitě), jednoduše posuneme číslování na ose x o jedničku na že jo. Nyní provedeme řadu testů a vizuálně zvážíme možné trajektorie pro určité pravděpodobnosti, délky her a počet her.
Nyní pojďme k nejdůležitější součásti softwarové části - algoritmu, který by nám umožnil vypočítat průměrnou délku hry pro dané parametry . Pokud je teorie správná, pak to následující experiment jen potvrdí. Do programu také přidáme řádek, který spočítá pravděpodobnost krachu prvního hráče ( ) pro daný počáteční kapitál a porovná ji s teoretickou.
Všimněte si, že pro malé hodnoty neuniknou všechny částice z koridoru, takže zde je třeba zdůraznit, že teorie říká: „pro dostatečně velké , pravděpodobnost se blíží .
Následující údaje jsou vypočteny pro , .
Test č. | ALFA | BETA | středníTAU | |||||||
---|---|---|---|---|---|---|---|---|---|---|
jeden | ||||||||||
2 | ||||||||||
3 | ||||||||||
čtyři | ||||||||||
5 | ||||||||||
6 |
Experimenty 2 a 3 demonstrují následující vlastnost: pokud hra prohrává pro prvního hráče, pak se zvýšení sázky v modelu rovná snížení , a o stejný počet krát vzhledem k nule. Sazba se ztrojnásobila – pravděpodobnost vyskočení z koridoru s hodnotou se zvýšila 11krát!