Problém s ruinou hráče

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 13. února 2020; kontroly vyžadují 5 úprav .

Problém zruinování hráče  je problém z oblasti teorie pravděpodobnosti . Podrobně se jí zabýval ruský matematik A. N. Shiryaev v monografii „Pravděpodobnost“ [1] .

Formulace

U stolu jsou dva hráči . První má k dispozici rubly, druhý má k dispozici rubly . Před nimi na stole leží asymetrická mince ( pravděpodobnost , že vypadne líc , se může rovnat libovolnému číslu od 0 do 1 včetně). Pokud na minci padne líc, pak první hráč vyhrává rubl (druhý hráč zaplatí prvnímu 1 rubl), a pokud padne rub, první hráč zaplatí druhému jeden rubl. Je nutné zjistit pravděpodobnost, že jeden z hráčů prohraje v krocích na nulu, a pravděpodobnost prohry každého hráče. Je také nutné vypočítat průměrnou délku hry.

Tuto situaci lze modelovat podobným způsobem: existuje bludná částice a chodba . Uvažujeme pravděpodobnost, že částice opustí chodbu po krocích (proklouzne horní nebo spodní stěnou).

Bernoulliho schéma

Zvažte Bernoulliho schéma se zkouškami.

Nechť  je pravděpodobnostní prostor, kde

Ve výše uvedeném výrazu lze počet shozených jednotek zjistit následovně: .

Zavádíme posloupnost Bernoulliho náhodných proměnných:

Podproblém normalizace pravděpodobnosti

Dokázat to


Řešení

To je pravda vzhledem k tomu, že

, protože podle podmínky .

Dílčí problém nezávislosti náhodných veličin ξ i

Dokažte to a buďte nezávislí.


Řešení

Nezávislost náhodných veličin to znamená

pojďme si to ukázat:

Náhodná procházka

Pro Bernoulliho schéma se shodneme na následujícím významu náhodné veličiny ξ: znamená, že druhý hráč platí prvnímu a první hráč platí druhému.

Pojďme si představit nový zápis:

, .

Číslo  se rovná délce trvání hry a posloupnost lze považovat za trajektorii náhodné procházky nějaké částice počínaje nulou, přičemž rovnost je zřejmá a znamená to, že první hráč vyhrává nad druhým (což může být negativní).


Nechť ,  jsou dvě celá čísla, , . Je potřeba najít pravděpodobnost, s jakou bude výstup částice z koridoru ohraničený a proveden v krocích .

Dále nechť  je celé číslo, . Nechť také za to (což znamená, že hráči začali hrát s nenulovým kapitálem, který měli k dispozici). Nechte _ Předpokládejme, že pokud . Pokud částice nikdy nepřekročila hranice, pak je nedefinovaná.

Pro každý a moment se nazývá moment zastavení , což je náhodná veličina definovaná v prostoru elementárních událostí .  je událost , kdy náhodná procházka , počínaje bodem , opustí interval v daném čase . Zaveďme nový zápis: , pro . Nechť ,  jsou pravděpodobnosti částice opouštějící interval v čase, respektive v bodech a .

Nechat ; je zřejmé, že (do zahájení hry je částice uvnitř intervalu s pravděpodobností 1). Nechte teď . Pak podle vzorce celkové pravděpodobnosti

Dílčí problém opakování

Dokázat to

(1 )

(2) .

Důkaz.

(1) Dokažme, že .

, kde  je množina trajektorií tvaru , které poprvé opouštějí interval v bodě (zobrazeno na obrázku). Pokud náhodný vektor spadne do vhodné trajektorie, pak spadne do množiny . Představme množinu jako . Disjunktní spojení je legitimní, protože každá částice procházející podél trajektorie má .  jsou ty trajektorie, ze kterých .  jsou ty trajektorie, ze kterých . Všimněte si, že každá trajektorie z je v přímé shodě s trajektorií z . Osobní korespondence je dokázána rozporem . Předpokládejme, že (nejednoznačná korespondence); pak tato trajektorie nebude schopna vynést částici z chodby po krocích (ale pouze kvůli počáteční vzdálenosti od horní stěny chodby). V opačném směru je korespondence také jedna ku jedné z definice: . Z toho vyplývá, že (protože se jedná o nezávislé identicky rozdělené náhodné proměnné ).

Existuje další způsob, jak to dokázat:

.

To je pravda, protože pravděpodobnosti jsou nezávislé (to bylo prokázáno dříve).


(2) Podobným způsobem dokážeme, že .

Každá trajektorie z je v přímé shodě s trajektorií z . Odtud

Odvození rekurence relace

Z rovnice pro to vyplývá a platí:

, pro .


Vzorec celkové pravděpodobnosti nám také dává následující výsledek: .


Všimněte si také, že a tedy pro . Toto tvrzení je pravdivé, protože ke každé trajektorii, která vynese částici v méně krocích, lze na začátek přidat jeden krok ( ), ve kterém částice může přijít do bodu jak z (for ), tak z ( ).

Pravděpodobnosti hledání

Pro dostatečně velké , pravděpodobnost se blíží  - vyřešení rovnice za podmínek, že (k odchodu došlo okamžitě od bodu  - konec hry, vyhrál první hráč), (první hráč nikdy nevyhraje, pokud k odchodu dojde okamžitě v bodě ). Tyto podmínky vyplývají ze skutečnosti, že . To bude také prokázáno v této části.

Nejprve dostaneme řešení rovnice . Ať je hra nespravedlivá ( ). V tomto případě najdeme kořeny rovnice, tedy . Jedno konkrétní řešení je okamžitě viditelné: . Jiné řešení najdeme pomocí skutečnosti, že  je funkce. Je vhodné použít výraz se vztahem , protože : . Proto je rozumné předpokládat, že . Přidáním konstanty se nic nezmění, protože .

Nyní zvažte obecné řešení: . Použijeme stejné podmínky jako a , a dostaneme to

Dílčí problém jedinečnosti řešení

Dokažme jedinečnost řešení tohoto problému. Abychom to udělali, ukážeme, že jakékoli řešení problému s okrajovými podmínkami může být reprezentováno jako .


Řešení

Zvažte nějaké řešení za podmínek , . Potom je vždy možné zvolit konstanty a takové, že , . Z rovnice předloženého problému pak vyplývá, že . Pak v obecném případě . Proto je řešení jedinečné. Přesně stejný způsob uvažování lze použít na .

Limitní konvergence

Zvažte otázku rychlosti omezující konvergence a do a . Nechte procházku začít od počátku ( ). Pro zjednodušení označujeme , , . Jinými slovy,  je jedna mínus součet pravděpodobností, že částice opustí koridor – pravděpodobnost, že zůstane v koridoru putovat: . představuje událost . Uvažujme číslo , kde a řetězec náhodných proměnných . Označíme-li celkové bohatství za , pak . Existuje pro to rozumné vysvětlení: pokud se částice dostane mimo nulu a nepřekročí hranice, pak je součet kusů rozhodně menší než celková zásoba.

Dílčí problém nezávislosti náhodných veličin ζ i

Dokažme, že jsou nezávislé a rovnoměrně rozložené . Stačí dokázat, že jsou nezávislé, protože všechny mají binomické rozdělení .


Řešení

Pojďme to dokázat

.


Vraťme se k úvahám o konvergenci.

Z toho, co bylo právě prokázáno, vyplývá, že .

Uvažujme rozptyl : (který je zcela legitimní, protože , a  je modifikovanou Bernoulliho náhodnou proměnnou ), tedy pro dostatečně velké a , platí: , kde , protože když , pak . Jestliže nebo , pak pro dostatečně velké platí , že , takže nerovnost je pravdivá . Z výše uvedeného vyplývá , že kde . Od té doby ; od té doby a , pak ; v . Podobné odhady jsou platné i pro rozdíly a protože tyto rozdíly lze redukovat na rozdíly a pro , .

Vraťme se k úvahám . Analogicky k řešení rovnice můžeme říci, že rovnice za okrajových podmínek má jedinečné řešení

U každého je to snadné vidět . Pokud je hra férová (pravděpodobnost averzu se rovná pravděpodobnosti obrácení), řešení budou vypadat takto: , .

Odpověď o pravděpodobnosti krachu

Množství a lze nazvat pravděpodobnosti zmaru prvního a druhého hráče s počátečním kapitálem as počtem tahů sahajícím do nekonečna a charakterizující náhodnou veličinu jako zisk  prvního hráče a prohru prvního hráče. V následujícím bude ukázáno, proč lze takovou sekvenci skutečně sestavit.

Jestliže , pak intuitivní význam funkce  je pravděpodobnost, že částice, která opustila pozici, dosáhne horní stěny ( ) dříve než nula. Ze vzorců je vidět , že

.

Paradox zvyšování sázky na nevýhodnou hru

Co má dělat první hráč, když je pro něj hra nevýhodná?

Jeho pravděpodobnost prohry je dána vzorcem .


Nyní ať se první hráč s kapitálem rozhodne zdvojnásobit sázku a hrát o dva rubly, tedy , , . Potom označíme limitní pravděpodobnost zkázy prvního hráče takto: .

Proto , protože se násobí zlomkem, který je větší než jedna v .


Pokud je tedy pravděpodobnost získání lícové strany, která je pro prvního hráče tak žádoucí, menší než , pak je pro něj výhodné zvýšit sázku o faktor 1: tím se sníží pravděpodobnost, že jeho terminál zruinuje v důsledku skutečnost, že pravděpodobnost vyskočení z chodby v místě se zvyšuje . Toto rozhodnutí se zdá paradoxní, protože se zdá, že v nepříznivé situaci by měl člověk snížit sázku a snížit ztrátu, ale ve skutečnosti při nekonečném počtu her a nízké sázce prohrávající hráč nakonec prohraje na nulu a hráč s vysokým vkladem má větší šanci zasáhnout počet líců dostačujících k dokončení hry v bodě .

Délka náhodné procházky

Zvažte průměrnou dobu trvání chůze naší částice. Zaveďme matematické očekávání okamžiku, kdy se hra zastaví: pro . Odvoďme rekurentní vztah pro matematické očekávání trvání hry:

For a získali jsme rekurzivní vztah pro funkci : for .


Zaveďme okrajové podmínky: pokud hra začíná v bodě nebo , pak okamžitě skončí - její trvání se bude rovnat 0: .


Ze vztahu opakování a okrajových podmínek lze vypočítat . Protože , pak existuje limit , který splňuje vztah : při provádění . Tyto přechody jsou podobné těm, které jsme uvažovali při přechodu do rovnice pravděpodobnosti ztráty. K vyřešení této rovnice je třeba zavést ještě jednu podmínku: očekávání počtu tahů musí být konečné, tedy , , .


Pojďme vyřešit tuto rovnici. V rovnici pravděpodobnosti ztráty ( ), konkrétní řešení a již byly získány . Zde se objevuje ještě jeden uchazeč o roli konkrétního řešení: , tedy . Vezmeme-li v úvahu okrajovou podmínku, zjistíme pomocí dříve získaných vztahů : . V případě ideální mince získáme následující výraz: . Aplikace okrajové podmínky dává: . Z toho vyplývá, že v případě rovného počátečního kapitálu . Například, pokud má každý hráč 5 rublů a sázka je 1 rubl, pak v průměru hráči zkrachují po 25 tazích.

Při zvažování výše uvedených vzorců se předpokládalo, že matematické očekávání počtu tahů je konečné: . Nyní navrhneme důkaz této skutečnosti.

Problém konečnosti očekávaného počtu tahů

Dokažte to .


Řešení

Stačí to pro daný případ prokázat (protože již dříve bylo ukázáno, že případy lze redukovat na variaci a ) a , a poté případ zvážit .

Zvažte tedy sekvenci a zaveďte náhodnou proměnnou , kde  je čas zastavení.

Nechte _ Interpretace je následující:  je hodnota náhodné procházky v tuto chvíli . Pokud , pak ; pokud , tak . Připomeň si to a dokaž to .


Abychom dokázali první rovnost, píšeme: . Je zcela zřejmé , že od , v . Zbývá to dokázat .

Neboť je pravda, že . Poslední událost může být reprezentována jako , kde  je nějaká podmnožina množiny . Tato sada je definována pouze pro . U velkých hodnot neovlivňuje . Sada pohledů může být také reprezentována jako . Z důvodu nezávislosti (prokázáno v dílčím problému 2 ) vyplývá, že náhodné veličiny a jsou nezávislé. Proto , vzhledem k tomu, že první faktor je nulový.

Je stanoveno, že pro ideální minci je .

V případě existují vztahy (protože ) a , protože . Teď si to ukažme .

V případě férové ​​hry na základě vztahu platí, že . Pak tedy . Z nerovnosti vyplývá, že matematické očekávání konverguje k limitní hodnotě . V případě nekalé hry . Protože okamžik prvního letu částice z koridoru byl označen jako, je její matematické očekávání menší než určitá čísla, tedy menší než nekonečno. Za takového stavu .

Počítačová simulace (metoda Monte Carlo)

Pro simulaci hry použijeme program MATLAB .

Nejprve vygenerujeme sekvenci a poté, s určitou počáteční bohatostí, vytvoříme řetězec :

Sekvence ξ (getXI)

n = 100 _ % Délka řady \xi_i U = rand ( n , 1 ); % Generovat 100 náhodných jednotných [0;1] hodnot XI = nuly ( n , 1 ); % Rezervní paměť pro 100 upravených Bernoulli q = 0,55 ; % zpětné pravděpodobnosti p = 1 - q ; % Averzní pravděpodobnost % Následující cyklus vytvoří Bernoulliho rozdělení založené na rovnoměrném [0;1] for i = 1 : n % Tento cyklus rozdělí pole [0;1] na 2 části: délky q a p, q+p=1 if ( U ( i , 1 ) < q ) XI ( i , 1 ) = -1 ; _ % Pokud jednotná náhodná hodnota spadne do q, pak \xi=-1 jinak XI ( i , 1 ) = 1 ; % Pokud jednotná náhodná hodnota spadne do p, pak \xi=+1 konec konec x = 10 ; % Počáteční kompenzace rozpočtu 1. hráče S = nuly ( n , 1 ); % Rezerva paměti pro 100 S_1...S_100 pro i = 1 : n % Vytvořte řadu S_k podle pravidla S_{k+1} = S_k + \xi_{k+1} S ( i , 1 ) = x + součet ( XI ( 1 : i , 1 )); % s ohledem na počáteční kompenzaci blahobytu x konec

Poté zavedeme funkci getS(n, q, x) , která by nejen, jako výše uvedený výpis, okamžitě a okamžitě vygenerovala řadu , ale umožnila by na základě zadaných hodnot sestavit řadu zobecněným způsobem bez komplikující výpočty. Tím by se zjednodušil pracovní prostor.

Generování řad (funkce getS)

funkce [S] = getS ( n, q, x ) % Tato funkce závisí na n, q a x --- 3 proměnné U = rand ( n , 1 ); XI = nuly ( n , 1 ); pro i = 2 : n % Rovnoměrná->Bernoulliho distribuční transformace if ( U ( i , 1 ) < q ) XI ( i , 1 ) = -1 ; _ jinak XI ( i , 1 ) = 1 ; konec konec S = nuly ( n , 1 ); % Rezerva paměti pro n S_1...S_n pro i = 2 : n % Vypočítejte řadu S_1...S_n S ( i , 1 ) = součet ( XI ( 1 : i , 1 )); % Součte \xi konec S = x + S ; % Přidá počáteční blahobyt ke každému S_k celé matice

Nabízí se rozumná otázka: proč počítat až od druhé hodnoty ( pro i = 2:n )? Faktem je, že se to děje pouze za účelem vizualizace. Při vykreslování grafu v následujícím kódu budou trajektorie sestaveny , a pokud by pro i = 1:n bylo zapsáno , pak od úplně první hodnoty by některé trajektorie vycházely z , některé - z . Protože v tomto programu je z důvodů optimality lepší nepoužívat nulovou hodnotu (částice ji opustí, ale není vykreslena, protože sčítání nastane okamžitě), jednoduše posuneme číslování na ose x o jedničku na že jo. Nyní provedeme řadu testů a vizuálně zvážíme možné trajektorie pro určité pravděpodobnosti, délky her a počet her.

Vizualizace (grafy)

N = 3 ; % Počet odehraných her n = 10 _ % Počet hodů q = 0,45 ; % Šance 1. hráč prohrává 1 rubl x = 0 _ % Počáteční kompenzace blahobytu matrS = nuly ( N , n ); % Rezerva paměti pro N řádků n matice sloupců for i = 1 : N % Tato smyčka vyplní matici S hodnotou S_k, což dává N trajektorií matrS ( i ,:) = getS ( n , q , x ) ' ; plot ( matrS ( i ,:)); % Poskytuje obrázek vydrž ; _ % Podrží osy pro další překrytí trajektorie konec zdržet se ; % Vymaže osy pro nový plot

Nyní pojďme k nejdůležitější součásti softwarové části - algoritmu, který by nám umožnil vypočítat průměrnou délku hry pro dané parametry . Pokud je teorie správná, pak to následující experiment jen potvrdí. Do programu také přidáme řádek, který spočítá pravděpodobnost krachu prvního hráče ( ) pro daný počáteční kapitál a porovná ji s teoretickou.

Kompletní model hry (Monte_Carlo)

N = 3000 _ % Počet odehraných her n = 3000 _ % Počet hodů q = 0,5 ; % Šance 1. hráč prohrává 1 rubl p = 1 - q ; % Šance 1. hráč vyhraje 1 rubl A = -10 ; _ Rozpočet %1. hráče B = 10 ; % rozpočtu druhého hráče x = 0 _ % kompenzace rozpočtu vůči 1. hráči Bs = 0 ; % množství případů, kdy částice zasáhne B (brzy se změní) As = 0 ; % množství případů, kdy částice zasáhne A (brzy se změní) matrS = nuly ( N , n ); % Rezerva paměti pro N řádků n matice sloupců TAU1 = n * jedniček ( N , n ); % Vyplňte dalších N řádků n sloupců matice n for i = 1 : N % Tato smyčka tvoří N trajektorií S_k v závislosti na vstupu q, x, n matrS ( i ,:) = getS ( n , q , x ) ' ; pro j = 1 : n if ( matrS ( i , j ) == A ) || ( matrS ( i , j ) == B ) % Pokud částice přesáhne A nebo B, pak TAU1 ( i , j ) = j ; % uveďte počet kroků do tabulky konec konec plot ( matrS ( i ,:)); % Zobrazí číslo mřížka na ; vydrž ; _ % Simultánní grafy ve stejných osách konec zdržet se ; % Vymaže osy pro nový plot TAU = ( min ( TAU1 ' )) ' ; % TAU = nejranější krok překročení koridoru [A;B] % Jako [min] ovlivňuje sloupce a dává řádek, pak transponujeme TAU1, % minimalizovat po řádcích a znovu z něj udělat sloupec pro i = 1 : N % Naše řady S_n jsou připraveny; hnízdí v matrS pro j = 1 : TAU ( i ) % Skenujte pouze do doby, než narazíme na únikový krok! if ( matrS ( i , j ) == A ); % Pokud částice unikla skrz A (1. hráč vyřazen) As = As + 1 ; % pak přidejte +1 k selháním 1. hráče elseif ( matrS ( i , j ) == B ) % Jinak pokud jeho první práh byl B Bs = Bs + 1 ; % pak přidejte +1 k výhrám 1. hráče end % Pokud n není dostatečně velké, pak konec % As + Bs nemusí tvořit N konec ALFA = As / ( As + Bs ) % Porovnejte alfa s jejich teoretickými hodnotami if ( q == p ) TEORALFA = ( B - x ) / ( B - A ) else THEORALPHA = (( q / p ) ^ B - ( q / p ) ^ x ) / ( ( q / p ) ^ B - ( q / p ) ^ A ) konec BETA = 1 ALFA % Totéž pro beta verze if ( q == p ) TEORBETA = ( x - A ) / ( B - A ) jinak TEORBETA = 1 - TEORALFA konec meanTAU = průměr ( TAU ) % Zákon velkých čísel pro velká N if ( q == p ) THEORTAU = ( B - x ) * ( x - A ) jinak THEORTAU = 1 / ( p - q ) * ( B * THEORBETA + A * THEORBETA - x ) konec

Všimněte si, že pro malé hodnoty neuniknou všechny částice z koridoru, takže zde je třeba zdůraznit, že teorie říká: „pro dostatečně velké , pravděpodobnost se blíží .

Testování

Následující údaje jsou vypočteny pro , .

Test č. ALFA BETA středníTAU
jeden
2
3
čtyři
5
6

Experimenty 2 a 3 demonstrují následující vlastnost: pokud hra prohrává pro prvního hráče, pak se zvýšení sázky v modelu rovná snížení , a o stejný počet krát vzhledem k nule. Sazba se ztrojnásobila – pravděpodobnost vyskočení z koridoru s hodnotou se zvýšila 11krát!

Viz také

Poznámky

  1. Shiryaev A. N. Probability-1, Probability-2 // Moskva, MTsNMO. — 2007.