Heteroskedasticita

Heteroscedasticita je pojem  používaný v aplikované statistice (nejčastěji v ekonometrii ) , což znamená heterogenitu pozorování, vyjádřenou v neidentickém (nekonstantním) rozptylu náhodné chyby regresního (ekonometrického) modelu. Heteroscedasticita je opakem homoskedasticity , což znamená homogenitu pozorování, tedy stálost rozptylu náhodných chyb modelu.

Přítomnost heteroskedasticity náhodných chyb vede k neefektivnosti odhadů získaných pomocí metody nejmenších čtverců . Navíc se v tomto případě klasický odhad kovarianční matice odhadů parametrů nejmenších čtverců ukazuje jako zkreslený a neudržitelný . Proto mohou být statistické závěry o kvalitě získaných odhadů nedostatečné. V tomto ohledu je testování modelů heteroskedasticity jedním z nezbytných postupů pro budování regresních modelů.

Testování heteroskedasticity

Jako první přiblížení lze přítomnost heteroskedasticity vidět na grafech regresních reziduí (nebo jejich čtverců) pro některé proměnné, pro odhadovanou závisle proměnnou nebo pro počet pozorování. V těchto grafech se může rozptyl bodů měnit v závislosti na hodnotě těchto proměnných.

Pro důslednější ověření se používají např. statistické testy Whitea , Goldfeld-Kuandta , Broish -Pagana , Parka , Glasera , Spearmana .

Hodnocení modelu za heteroskedasticity

Protože odhady parametrů modelu metodou nejmenších čtverců zůstávají nezkreslené konzistentní i s heteroskedasticitou, je možné při dostatečném počtu pozorování použít obvyklé nejmenší čtverce. Pro přesnější a správnější statistické závěry je však nutné použít standardní chyby ve Whiteově formě .

Způsoby, jak snížit heteroskedasticitu

  1. Použití vážených nejmenších čtverců (WLS) . V této metodě je každé pozorování váženo nepřímo s odhadovanou směrodatnou odchylkou náhodné chyby v tomto pozorování. Tento přístup umožňuje učinit náhodné chyby modelu homoskedastické. Zejména, pokud se předpokládá, že směrodatná odchylka chyb je úměrná nějaké proměnné , pak se data vydělí touto proměnnou, včetně konstanty.
  2. Nahrazení původních dat jejich derivacemi, jako je logaritmus, relativní změna nebo jiná nelineární funkce. Tento přístup se často používá, když odchylka chyby roste s hodnotou nezávisle proměnné a vede ke stabilizaci rozptylu v širším rozsahu vstupních dat.
  3. Určení "oblastí kompetence" modelů, v rámci kterých je rozptyl chyb relativně stabilní, a pomocí kombinace modelů. Každý model tedy funguje pouze v oblasti své působnosti a odchylka chyby nepřesahuje zadanou hraniční hodnotu. Tento přístup je běžný v oblasti rozpoznávání vzorů, kde se často používají složité nelineární modely a heuristika.

Příklad

Uvažujme například závislost zisku na velikosti aktiv:

.

S největší pravděpodobností však na aktivech nezávisí pouze zisk, ale také „kolísání“ zisku není stejné pro to či ono množství aktiv. To znamená, že s největší pravděpodobností by standardní odchylka náhodné chyby modelu měla být považována za úměrnou hodnotě aktiv:

.

V tomto případě je rozumnější zvážit nikoli původní model, ale následující:

,

za předpokladu, že náhodné chyby jsou v tomto modelu homoskedastické. Tento transformovaný model můžete použít přímo, nebo můžete získané odhady parametrů použít jako odhady parametrů původního modelu (vážené nejmenší čtverce). Teoreticky by takto získané odhady měly být lepší.

Viz také

Literatura