Dost statistik

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 6. prosince 2021; ověření vyžaduje 1 úpravu .

Dostatečná statistika pro parametr, který definuje určitou rodinu rozdělení pravděpodobnosti ,  je taková, že podmíněná pravděpodobnost vzorku pro danou hodnotu nezávisí na parametru. To znamená, že rovnost platí:

Dostatečná statistika tak obsahuje všechny informace o parametru , které lze ze vzorku X získat . Proto je koncept dostatečné statistiky široce používán v teorii odhadu parametrů .

Nejjednodušší dostačující statistikou je samotný vzorek , ale opravdu důležité jsou případy, kdy je dimenze dostatečné statistiky mnohem menší než dimenze vzorku, zejména když je dostatečná statistika vyjádřena pouze několika čísly.

O dostatečné statistice se říká , že je minimálně dostačující , pokud pro každou dostatečnou statistiku T existuje nenáhodná měřitelná funkce g , která je téměř všude .

Faktorizační teorém

Faktorizační teorém poskytuje praktický způsob, jak najít dostatečné statistiky pro rozdělení pravděpodobnosti. Dává dostatečné a nutné podmínky pro dostatečnost statistiky a někdy se jako definice používá tvrzení teorémů.

Nechť je  nějaká statistika a  buď podmíněná funkce hustoty nebo pravděpodobnostní funkce (v závislosti na typu distribuce) pro pozorovací vektor X . Pak je dostatečná statistika pro parametr tehdy a jen tehdy, pokud existují takové měřitelné funkce a že můžeme napsat:

Důkaz

Níže je uveden důkaz pro speciální případ, kdy je rozdělení pravděpodobnosti diskrétní . Potom  — Pravděpodobnostní funkce .

Nechť má daná funkce rozklad, jako ve výroku věty, a

Pak máme:

Z toho vidíme, že podmíněná pravděpodobnost vektoru X pro danou hodnotu statistiky nezávisí na parametru a  je tedy dostatečnou statistikou.

Naopak můžeme napsat:

Z výše uvedeného máme, že první faktor na pravé straně nezávisí na parametru a lze jej vzít jako funkci z formulace věty. Druhý faktor je funkcí a a lze jej brát jako funkci .Tak se získá potřebný rozklad, který dokončí důkaz věty.

Příklady

Bernoulliho distribuce

Dovolit být  posloupnost náhodných proměnných , které se rovnají 1 s pravděpodobností a rovné 0 s pravděpodobností (to znamená, že mají Bernoulliho rozdělení ). Pak

pokud vezmete

Pak tato statistika stačí podle faktorizační věty, pokud označíme

Poissonovo rozdělení

Dovolit  je posloupnost náhodných proměnných s Poissonovým rozdělením . Pak


kde

Tato statistika je dostatečná podle faktorizační věty, pokud označíme

Jednotná distribuce

Dovolit být  posloupnost rovnoměrně distribuovaných náhodných proměnných . Ad hoc

Z toho vyplývá, že statistiky jsou dostatečné.

Normální rozdělení

Pro náhodné veličiny s normálním rozdělením by byla dostatečná statistika

Vlastnosti

navíc rovnosti je dosaženo pouze tehdy, když je měřitelná funkce T . ( Rao-Blackwell-Kolmogorovova věta )

Viz také

Literatura