Vzorkování (matematické statistiky)

Vzorkování je zobecněný název v matematické statistice pro metody řízení výchozího vzorku se známým modelovacím cílem, které umožňují provést strukturně-parametrickou identifikaci nejlepšího statistického modelu stacionárního ergodického náhodného procesu.

Popis

Vědecká novinka metody vzorkování spočívá v tom, že se jedná o účinnou techniku ​​pro logické sémantické propojení statistických vlastností vzorku a účelu modelování. Vzorkování zároveň zvětšuje rozměr prostoru kritérií a zároveň působí jako prostředek k řešení problému Pareto-optimality tím, že jednotlivá kritéria odděluje a klasifikuje (strukturální kritérium má vyšší pořadí než parametrické , takže tato kritéria nejsou v rozporu). N. N. Chubukov uvádí následující příklad [1] . Nechť je náhodný proces reprezentován vzorkem o velikosti : . Je třeba vyřešit tři úkoly:

  1. Spusťte podmíněně dlouhodobou předpověď pro ;
  2. Spusťte podmíněně krátkodobou předpověď pro ;
  3. Definujte funkci pro obnovení hodnoty v libovolném bodě výběru.

Vezmeme-li pro modelování tradiční přístup, zaměřený na jedinečnost popisu statistických vlastností procesu, pak výsledkem budou tři zcela totožné funkce. Pravidlo pro výpočet kvalitativního kritéria modelu totiž nezohlednilo podstatné detaily: horizont prognózy, povaha statistických trendů náhodného procesu reprezentovaného výběrovými daty a cílová specifičnost úloh byla zcela bez problémů. ignoroval .

Princip rozmanitosti

Cestou z této nesnáze může být použití principu diverzity v rámci vzorkování , který je známý a používaný k řešení inženýrských problémů aplikací metody křížové validace dat, například bootstrap analysis [2] , metoda tzv. skupinové účtování argumentů [3] atd. Projevem principu diverzity při řešení statistických problémů je, že algoritmus reaguje na neznalost pravděpodobnostních vlastností výchozích dat řadou generovaných modelových struktur, z nichž každá je podrobena křížení -kontrola optimality podle určitého schématu společného pro všechny modely.

Úkoly

Vzorkování je moderní metoda, která může být prakticky užitečná pro řešení problémů matematické statistiky, včetně inverzních a špatně položených problémů [4] . Vzorkování implementuje princip diverzity a může zobecnit celou řadu nástrojů statistické analýzy založených na správě zdrojových dat. Vzorkování je chápáno jako soubor technik pro rozdělení výchozího vzorku na pracovní a kontrolní úseky podle pravidel, která odpovídají cílům modelování. Na pracovních úsecích se počítají parametry „konkurenčních“ modelů, na kontrolních se hodnotí jejich schopnost obnovit hodnoty, které nebyly použity k výpočtu parametrů.

Vzorkování metodicky správně „obchází“ hlavní překážku, která je objektivně přítomná v inverzních problémech. Důvodem je nemožnost stanovit striktní matematický vztah mezi proměnným parametrem a číselnou hodnotou kritéria optimality modelu. Vzorkování zároveň převádí algoritmus strukturně-parametrické identifikace modelu z kategorie přísně matematického do třídy heuristiky a činí jej perspektivním pro vytváření systémů umělé inteligence .

Ve vztahu k výše uvedenému příkladu, první případ  - "dlouhá" extrapolace mimo vzorek, odpovídá variantě vzorkování s vyloučením posledních deseti hodnot vzorku v řadě z výpočtu parametrů modelu. Desátý počet bude kontrola. Pracovní dílčí vzorek bude obsahovat všechny hodnoty kromě této desítky. Poté se alternativním výčtem určí nejlepší model, který nejpřesněji předpověděl kontrolní bod. Změnou polohy vyloučených vzorků, aniž by došlo k porušení jejich počtu a návaznosti, se tvoří zbytkové statistiky použitelné pro výpočet kritéria a „trubice“ statistické stability pro hodnocení spolehlivosti výsledku. Algoritmus jakoby „prozkoumává“ modely extrapolací do dané hloubky a vybírá z nich ten, který nejpřesněji zachycuje „dlouhé“ trendy obsahující informace o hodnotách na desetivzorkovém zpoždění. V tomto případě budou diskriminovány modely „na krátkou střelbu“.

Druhá úloha bude odpovídat vzorkování s vyloučením z výpočtů jednoho kontrolního bodu, s kombinací počtu a pořadí předchozích hodnot zohledněných pro předpověď. V tomto případě budou „potlačeny“ modely „dlouhého trendu“ a naopak budou upřednostněny modely, které poskytují přesné krátkodobé předpovědi.

Ve třetí úloze bude zdůvodněno rozdělení vzorku do vzájemně se prostupujících bloků, kdy se kontrolní hodnoty „prostřídají“ mezi pracovníky. Délka takových bloků a hloubka jejich vzájemného prostupu musí zohledňovat intervaly mezi sousedními body rozsahu, požadovanou stabilitu a přesnost odhadů. Třetí úloha tedy může odpovídat vyřazení z výpočtů každého třetího vzorku vzorku a použití vyloučených dat pro kontrolu s cyklickým přeřazením kontrolních a pracovních dílčích vzorků.

Typy vzorkování

Viz také

Poznámky

  1. Chubukov N. N. Algoritmizace kalibrací mechatronických systémů pomocí vzorkování // Mechatronika, avtomatizatsiya, upravlenie. 2013. č. 7.
  2. Efron B. Netradiční metody vícerozměrné statistické analýzy: Sat. články: Per. z angličtiny / Předmluva Yu. P. Adler, Yu. A. Koshevnik. - M .: Finance a statistika, 1988. - 263 s. nemocný.
  3. Ivakhnenko, 1971 .
  4. Tichonov A.N., Arsenin V.Ya. Metody řešení špatně položených problémů. - M.: Nauka, 1979. - S. 283 s.

Literatura