Matematické statistiky

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 6. srpna 2021; kontroly vyžadují 5 úprav .

Matematická statistika  je věda, která vyvíjí matematické metody pro systematizaci a využití statistických dat pro vědecké a praktické závěry.

Matematická statistika je v mnoha svých částech založena na teorii pravděpodobnosti , která umožňuje posoudit spolehlivost a přesnost závěrů vyvozených na základě omezeného statistického materiálu (například odhadnout požadovanou velikost vzorku pro získání výsledků požadované přesnosti ve výběrovém šetření).

Předmět a metody

Matematická statistika je odvětví matematiky, které vyvíjí metody pro záznam, popis a analýzu pozorovacích a experimentálních dat za účelem sestavení pravděpodobnostních modelů hromadných náhodných jevů [1] . V závislosti na matematické povaze konkrétních výsledků pozorování se matematická statistika dělí na statistiku čísel, vícerozměrnou statistickou analýzu [2] , analýzu funkcí (procesů) a časových řad , statistiku nenumerických objektů.

Jedná se o deskriptivní statistiku , teorii odhadu a teorii testování hypotéz . Deskriptivní statistika je soubor empirických metod používaných k vizualizaci a interpretaci dat (výpočet charakteristik vzorku, tabulky, tabulky, grafy atd.), které zpravidla nevyžadují předpoklady o pravděpodobnostní povaze dat. Některé metody popisné statistiky zahrnují využití schopností moderních počítačů . Patří mezi ně zejména shluková analýza , zaměřená na identifikaci skupin objektů, které jsou si podobné, a vícerozměrné škálování , které umožňuje vizualizovat objekty v rovině.

Metody odhadu a testování hypotéz jsou založeny na pravděpodobnostních modelech původu dat. Tyto modely se dělí na parametrické a neparametrické. V parametrických modelech se předpokládá, že charakteristiky studovaných objektů jsou popsány pomocí rozdělení, které závisí na (jednom nebo více) číselných parametrech. Neparametrické modely nejsou spojeny se specifikací parametrické rodiny pro distribuci studovaných charakteristik. V matematické statistice se vyhodnocují parametry a funkce z nich, které představují důležité charakteristiky rozdělení (například matematické očekávání , medián, směrodatná odchylka , kvantily atd.), hustoty a distribuční funkce atd. Používejte bodové a intervalové odhady .

Velkou část moderní matematické statistiky tvoří statistická sekvenční analýza , k jejímuž vzniku a rozvoji zásadním způsobem přispěl A. Wald během 2. světové války . Na rozdíl od tradičních (nekonzistentních) metod statistické analýzy založených na náhodném vzorku pevné velikosti, sekvenční analýza umožňuje vytvořit pole pozorování jedno po druhém (nebo obecněji ve skupinách), zatímco rozhodnutí provést další pozorování (skupina pozorování) se provádí na základě již nashromážděného pole pozorování. S ohledem na to je teorie sekvenční statistické analýzy úzce spjata s teorií optimálního zastavení .

V matematické statistice existuje obecná teorie testování hypotéz a velké množství metod věnovaných testování konkrétních hypotéz. Uvažují se hypotézy o hodnotách parametrů a charakteristik, o kontrole homogenity (tj. o shodě charakteristik nebo distribučních funkcí ve dvou vzorcích), o shodě empirické distribuční funkce s danou distribuční funkcí nebo s parametrickou rodina takových funkcí, o symetrii rozdělení atd.

Velký význam má část matematické statistiky spojená s prováděním výběrových šetření , s vlastnostmi různých výběrových schémat a konstrukcí adekvátních metod pro odhadování a testování hypotéz.

Problémy obnovy závislosti byly aktivně studovány již více než 200 let, od doby, kdy K. Gauss v roce 1794 vyvinul metodu nejmenších čtverců .

Vývoj metod pro aproximaci dat a redukci popisných rozměrů začal před více než 100 lety, kdy Karl Pearson vytvořil metodu hlavních komponent . Později byla vyvinuta faktoriální analýza [3] a četná nelineární zobecnění [4] .

Různé metody konstrukce (shluková analýza), analýza a použití (diskriminační analýza) klasifikací (typologie) se také nazývají metody rozpoznávání vzorů (s učitelem i bez něj), automatická klasifikace atd.

V dnešní době hrají počítače velkou roli v matematické statistice. Používají se jak pro výpočty, tak pro simulační modelování (zejména v metodách vzorkování a při studiu vhodnosti asymptotických výsledků).

Viz také

Poznámky

  1. Pravděpodobnostní úseky matematiky / Ed. Yu. D. Maksimova. - Petrohrad. : "Ivan Fedorov", 2001. - S.  400 . — 592 s. — ISBN 5-81940-050-X .
  2. Vícerozměrná statistická analýza  / S. A. Ayvazyan  // Velká ruská encyklopedie  : [ve 35 svazcích]  / kap. vyd. Yu. S. Osipov . - M  .: Velká ruská encyklopedie, 2004-2017.
  3. Harman G. , Moderní faktorová analýza. — M.: Statistika, 1972. — 486 s.
  4. Gorban AN, Kegl B., Wunsch D., Zinovyev AY (eds.), Principal Manifolds for Data Visualization and Dimension Reduction Archived 6. března 2019 na Wayback Machine , Series: Lecture Notes in Computational Science and Engineering 58, Springer, Berlín-Heidelberg-New York, 2007, XXIV, 340 s. 82illus. ISBN 978-3-540-73749-0 (a také online Archivováno 16. března 2019 na Wayback Machine ).

Literatura

Odkazy