Sturgesovo pravidlo

Sturgesovo pravidlo  je empirickým pravidlem pro stanovení optimálního počtu intervalů, do kterých se rozdělí pozorovaný rozsah variace náhodné veličiny při konstrukci histogramu hustoty jejího rozdělení. Pojmenováno po americkém statistikovi Herbertu Sturgesovi ( 1882-1958 ).

Počet intervalů je definován jako:

,

kde  je celkový počet pozorování veličiny,  je logaritmus se základem 2  a je celočíselná část .

Často se vyskytuje zapsané v dekadickém logaritmu:

,

Základem je odhad počtu událostí s různou pravděpodobností v Bernoulliho testovacím schématu s trváním jedné fáze. Pokud existují testovací série se 2 alternativními výsledky s konstantní pravděpodobností každého z nich, pak počet typů sérií, kde složení obsahuje výsledky, které nabývají první z alternativních hodnot, a tedy  i druhé, se rovná: (od do ) a celkový počet sérií .

Pokud aproximujeme hodnoty pozorované náhodné veličiny výsledky sečtení hodnot dvou čísel náhodně vypadlých v sérii testů a (například a ) odpovídajících výsledkům Bernoulliho schématu, pak každá série testů obsahujících výsledky s výsledkem a výsledky s výsledkem bude odpovídat součtu . Počet různých hodnot (v uvažovaném případě: , pro pár  - ) se bude rovnat počtu sekvencí s různým počtem výsledků . Pokud tedy nastavíme úlohu tak, že pro každý interval mezi a existuje v průměru alespoň jedna hodnota součtu, a tedy alespoň jedna série testů simulujících příjem náhodné veličiny, pak počet fází v řadě se rovná počtu intervalů, pro které je rozčleněn rozsah pozorovaných hodnot, by neměl být větší než

Rozdělení výsledných veličin ( Bernoulliho rozdělení ) je obecně aproximováno normálním rozdělením podle Moivre-Laplaceovy věty , což dává důvod za předpokladu, že rozdělení studované veličiny je blízké normálnímu, a tedy i normálnímu rozdělení. jím aproximovaný binomický, použít odhad počtu intervalů rozdělení podle počtu očekávaných diskrétních hodnot pro Bernoulliho rozdělení, což vede ke Sturgesovu pravidlu.

Literatura

Odkazy