Dostatečná statistika pro parametr, který definuje určitou rodinu rozdělení pravděpodobnosti , je taková, že podmíněná pravděpodobnost vzorku pro danou hodnotu nezávisí na parametru. To znamená, že rovnost platí:
Dostatečná statistika tak obsahuje všechny informace o parametru , které lze ze vzorku X získat . Proto je koncept dostatečné statistiky široce používán v teorii odhadu parametrů .
Nejjednodušší dostačující statistikou je samotný vzorek , ale opravdu důležité jsou případy, kdy je dimenze dostatečné statistiky mnohem menší než dimenze vzorku, zejména když je dostatečná statistika vyjádřena pouze několika čísly.
O dostatečné statistice se říká , že je minimálně dostačující , pokud pro každou dostatečnou statistiku T existuje nenáhodná měřitelná funkce g , která je téměř všude .
Faktorizační teorém poskytuje praktický způsob, jak najít dostatečné statistiky pro rozdělení pravděpodobnosti. Dává dostatečné a nutné podmínky pro dostatečnost statistiky a někdy se jako definice používá tvrzení teorémů.
Nechť je nějaká statistika a buď podmíněná funkce hustoty nebo pravděpodobnostní funkce (v závislosti na typu distribuce) pro pozorovací vektor X . Pak je dostatečná statistika pro parametr tehdy a jen tehdy, pokud existují takové měřitelné funkce a že můžeme napsat:
Níže je uveden důkaz pro speciální případ, kdy je rozdělení pravděpodobnosti diskrétní . Potom — Pravděpodobnostní funkce .
Nechť má daná funkce rozklad, jako ve výroku věty, a
Pak máme:
Z toho vidíme, že podmíněná pravděpodobnost vektoru X pro danou hodnotu statistiky nezávisí na parametru a je tedy dostatečnou statistikou.
Naopak můžeme napsat:
Z výše uvedeného máme, že první faktor na pravé straně nezávisí na parametru a lze jej vzít jako funkci z formulace věty. Druhý faktor je funkcí a a lze jej brát jako funkci .Tak se získá potřebný rozklad, který dokončí důkaz věty.
Dovolit být posloupnost náhodných proměnných , které se rovnají 1 s pravděpodobností a rovné 0 s pravděpodobností (to znamená, že mají Bernoulliho rozdělení ). Pak
pokud vezmete
Pak tato statistika stačí podle faktorizační věty, pokud označíme
Dovolit je posloupnost náhodných proměnných s Poissonovým rozdělením . Pak
kde
Tato statistika je dostatečná podle faktorizační věty, pokud označíme
Dovolit být posloupnost rovnoměrně distribuovaných náhodných proměnných . Ad hoc
Z toho vyplývá, že statistiky jsou dostatečné.
Pro náhodné veličiny s normálním rozdělením by byla dostatečná statistika
![]() |
---|