Normální distribuce

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 20. října 2022; kontroly vyžadují 2 úpravy .
Normální distribuce

Zelená čára odpovídá standardnímu normálnímu rozděleníHustota pravděpodobnosti

Barvy v této tabulce odpovídají tabulce výše.distribuční funkce
Označení
Možnosti μ  - faktor posunu ( skutečný ) σ > 0  - faktor měřítka (reálný, přísně kladný)
Dopravce
Hustota pravděpodobnosti
distribuční funkce
Očekávaná hodnota
Medián
Móda
Disperze
Koeficient asymetrie
Kurtózní koeficient
Diferenciální entropie
Generující funkce momentů
charakteristická funkce

Normální rozdělení [1] [2] , nazývané také Gaussovo nebo Gaussovo- Laplaceovo rozdělení [3] ,  je rozdělení pravděpodobnosti , které je v jednorozměrném případě dáno funkcí hustoty pravděpodobnosti , která se shoduje s Gaussovou funkcí :

, kde parametrem  je matematické očekávání (střední hodnota), medián a distribuční režim a parametrem  je směrodatná odchylka ,  je rozptyl distribuce .

Jednorozměrné normální rozdělení je tedy dvouparametrová rodina rozdělení, která patří do exponenciální třídy rozdělení [4] . Vícerozměrný případ je popsán v článku " Vícerozměrné normální rozdělení ".

Standardní normální rozdělení je normální rozdělení se střední hodnotou a směrodatnou odchylkou

Obecné informace

Je-li veličina součtem mnoha náhodných slabě vzájemně závislých veličin, z nichž každá má malý příspěvek vzhledem k celkovému součtu, pak centrované a normalizované rozdělení takové veličiny směřuje k normálnímu rozdělení s dostatečně velkým počtem členů .

Toto vyplývá z centrální limitní věty teorie pravděpodobnosti . Ve světě kolem nás se často vyskytují veličiny, jejichž hodnotu určuje kombinace mnoha nezávislých faktorů. Tato skutečnost, stejně jako skutečnost, že distribuce byla považována za typickou, běžnou, vedla k tomu, že se koncem 19. století začalo používat označení „normální distribuce“. Normální rozdělení hraje významnou roli v mnoha oblastech vědy, jako je matematická statistika a statistická fyzika .

Náhodná veličina, která má normální rozdělení, se nazývá normální nebo Gaussova náhodná veličina.

Definice

Standardní normální rozdělení

Nejjednodušší případ normálního rozdělení - standardní normální rozdělení  - je speciální případ, kdy a Jeho hustota pravděpodobnosti je:

Faktor ve výrazu poskytuje podmínku pro normalizaci integrálu [5] . Protože faktor v exponentu poskytuje disperzi rovnou jedné, pak je směrodatná odchylka rovna 1. Funkce je symetrická v bodě , její hodnota v něm je maximální a rovná se inflexním bodům funkce: a

Gauss nazval standardní normální rozdělení s tím, že:

Normální rozdělení s parametry

Každé normální rozdělení je variantou standardního normálního rozdělení, jehož rozsah je natažen o faktor (směrodatná odchylka) a přenesen na (očekávání):

jsou parametry normálního rozdělení. Hustota pravděpodobnosti musí být normalizována tak, aby se integrál rovnal 1.

Pokud  je standardní normální náhodná veličina, pak hodnota bude mít normální rozdělení s matematickým očekáváním a směrodatnou odchylkou , naopak, pokud  je normální proměnná s parametry a pak bude mít standardní normální rozdělení.

Pokud otevřeme závorky v exponentu hustoty pravděpodobnosti a vezmeme v úvahu, že , pak:

Hustota pravděpodobnosti každého normálního rozdělení je tedy exponentem kvadratické funkce :

kde

Odtud lze vyjádřit průměr jako a a rozptyl jako Pro standardní normální rozdělení a

Označení

Hustota pravděpodobnosti standardního normálního rozdělení (s nulovým průměrem a jednotkovým rozptylem) se často označuje řeckým písmenem ( phi ) [6] . Zcela běžně se používá i alternativní forma řeckého písmene phi .

Normální rozdělení se často označuje nebo [7] . Pokud je náhodná veličina rozdělena podle normálního zákona se střední hodnotou a variací, pak píšeme:

Distribuční funkce

Distribuční funkce standardního normálního rozdělení se obvykle označuje velkým řeckým písmenem ( phi ) a je integrálem:

S tím je spojena chybová funkce (pravděpodobnostní integrál) , která dává pravděpodobnost, že normální náhodná veličina se střední hodnotou 0 a variací 1/2 bude spadat do segmentu :

Tyto integrály nejsou vyjádřeny v elementárních funkcích a nazývají se speciální funkce . Je známo mnoho jejich číselných aproximací. Viz níže .

Funkce spolu souvisí zejména vztahem:

.

Normální rozdělení s průměrem hustoty a rozptylem má následující distribuční funkci:

Můžete použít funkci  - dá pravděpodobnost, že hodnota standardní normální náhodné proměnné překročí :

.

Graf funkce standardního normálního rozdělení má 2násobnou rotační symetrii kolem bodu (0; 1/2), to znamená, že jeho neurčitý integrál je:

Distribuční funkci standardní normální náhodné veličiny lze rozšířit pomocí metody integrace po částech v sérii:

kde znaménko znamená dvojitý faktoriál .

Asymptotické rozšíření distribuční funkce pro velké hodnoty lze také provést integrací po částech.

Směrodatná odchylka

Asi 68 % hodnot z normálního rozdělení je ve vzdálenosti nejvýše jedné standardní odchylky σ od průměru; asi 95 % hodnot leží ve vzdálenosti nejvýše dvou směrodatných odchylek; a 99,7 % ne více než tři. Tato skutečnost je speciálním případem pravidla 3 sigma pro normální vzorek.

Přesněji, pravděpodobnost získání normálního čísla mezi a je:

S přesností na 12 platných číslic jsou hodnoty pro uvedeny v tabulce [8] :

OEIS
jeden 0,682689492137 0,317310507863
3,15148718753
A178647
2 0,954499736104 0,045500263896
21,9778945080
A110894
3 0,997300203937 0,002699796063
370,398347345
A270712
čtyři 0,999936657516 0,000063342484
15787,1927673
5 0,999999426697 0,000000573303
1744277,89362
6 0,999999998027 0,000000001973
506797345,897

Vlastnosti

Momenty

Momenty a absolutní momenty náhodné veličiny se nazývají matematická očekávání náhodných veličin , resp. Pokud je matematickým očekáváním náhodná veličina, pak se tyto parametry nazývají centrální momenty . Ve většině případů jsou zajímavé momenty pro celá čísla.

Pokud má normální rozdělení, pak má (konečné) momenty pro všechny s reálnou částí větší než -1. Pro nezáporná celá čísla jsou centrální momenty:

Zde  je přirozené číslo a zápis znamená dvojitý faktoriál čísla, tedy (protože je v tomto případě lichý) součin všech lichých čísel od  1 do

Centrální absolutní momenty pro nezáporná celá čísla jsou:

Poslední vzorec platí také pro libovolný .

Fourierova transformace a charakteristická funkce

Fourierova transformace normální hustoty pravděpodobnosti se střední směrodatnou odchylkou je [9] :

kde je pomyslná jednotka .

Pokud je očekávání , pak je první faktor 1 a Fourierova transformace, až do konstanty, je normální hustota pravděpodobnosti přes frekvenční intervaly, s očekáváním rovným 0 a směrodatnou odchylkou . Zejména standardní normální rozdělení je vlastní funkcí Fouriera přeměnit.

V teorii pravděpodobnosti Fourierova transformace hustoty rozdělení reálné náhodné veličiny úzce souvisí s charakteristickou funkcí této proměnné, která je definována jako matematické očekávání reálné proměnné a je funkcí reálné proměnné (frekvenční parametr Fourierovy přeměnit). Definici lze rozšířit na komplexní proměnnou [10] . Poměr se píše takto:

Nekonečná dělitelnost

Normální rozdělení je nekonečně dělitelné .

Pokud jsou náhodné proměnné a nezávislé a mají normální rozdělení se střední hodnotou a rozptylem , pak má také normální rozdělení se střední hodnotou a rozptylem

To znamená, že normální náhodná proměnná může být reprezentována jako součet libovolného počtu nezávislých normálních náhodných proměnných.

Maximální entropie

Normální rozdělení má maximální diferenciální entropii mezi všemi spojitými rozděleními, jejichž rozptyl nepřesahuje danou hodnotu [11] [12] .

Pravidlo tři sigma pro Gaussovu náhodnou veličinu

Pravidlo tří sigma ( ) — téměř všechny hodnoty normálně rozdělené náhodné proměnné leží v intervalu:

kde  jsou matematické očekávání a parametr normální náhodné veličiny.

Přesněji, s přibližně pravděpodobností 0,9973 leží hodnota normálně rozdělené náhodné veličiny ve stanoveném intervalu.

Simulace normálních pseudonáhodných proměnných

V počítačových simulacích, zejména při aplikaci metody Monte Carlo , je žádoucí používat veličiny rozdělené podle normálního zákona. Mnoho algoritmů poskytuje standardní normální hodnoty, protože normální hodnotu lze získat jako:

kde Z je standardní normální hodnota.

Algoritmy také využívají různé transformace jednotných veličin. Nejjednodušší přibližné metody modelování jsou založeny na centrální limitní větě . Pokud sečteme dostatečně velký počet nezávislých shodně rozdělených veličin s konečným rozptylem , pak bude mít součet rozdělení blízké normálu. Pokud například přidáte 100 nezávislých standardních rovnoměrně rozdělených náhodných proměnných, bude rozdělení součtu přibližně normální .

Pro programové generování normálně distribuovaných pseudonáhodných proměnných je vhodnější použít Box-Mullerovu transformaci . Umožňuje generovat jednu normálně rozdělenou hodnotu na základě jedné rovnoměrně rozdělené.

Existuje také algoritmus Ziggurat , který je ještě rychlejší než Box-Mullerova transformace. Je však náročnější na implementaci, ale jeho použití má své opodstatnění v případech, kdy je požadováno generování velmi velkého množství nerovnoměrně rozložených náhodných čísel.

Normální distribuce v přírodě a aplikacích

Normální distribuce se často vyskytuje v přírodě. Například následující náhodné proměnné jsou dobře modelovány normálním rozdělením:

  • odchylka při střelbě;
  • chyby měření (chyby některých měřicích přístrojů však mají jiné rozložení);
  • některé vlastnosti živých organismů v populaci.

Toto rozdělení je tak rozšířené, protože jde o nekonečně dělitelné spojité rozdělení s konečným rozptylem. Proto se k němu některé další přibližují v limitě, například binomický a Poissonův . Toto rozdělení modeluje mnoho nedeterministických fyzikálních procesů [13] .

Vícerozměrné normální rozdělení se používá při studiu vícerozměrných náhodných veličin (náhodných vektorů). Jedním z mnoha příkladů takových aplikací je studium parametrů lidské osobnosti v psychologii a psychiatrii .

Vztah s jinými distribucemi

  • Normální rozdělení je Pearsonovo rozdělení typu XI [14] .
  • Poměr dvojice nezávislých standardních normálně rozdělených náhodných veličin má Cauchyho rozdělení [15] . To znamená, že pokud je náhodná proměnná poměr (kde a  jsou nezávislé standardní normální náhodné proměnné), pak bude mít Cauchyho rozdělení.
  • Jestliže  jsou společně nezávislé standardní normální náhodné proměnné, to znamená, že náhodná proměnná má rozdělení chí-kvadrát s k  stupni volnosti.
  • Pokud má náhodná proměnná lognormální rozdělení , pak její přirozený logaritmus má normální rozdělení. Tedy pokud pak A naopak, pokud pak
  • Pokud jsou nezávislé normálně rozdělené náhodné proměnné s matematickými očekáváními a rozptyly, pak je jejich výběrový průměr nezávislý na výběrové směrodatné odchylce [16] a poměr následujících dvou proměnných bude mít t-rozdělení se stupni volnosti:
  • Pokud jsou nezávislé standardní normální náhodné proměnné, pak poměr normalizovaných součtů čtverců bude mít Fisherovo rozdělení s ( ) stupni volnosti [17] :
  • Poměr druhých mocnin dvou standardních normálních náhodných veličin má Fisherovo rozdělení se stupni volnosti

Historie

Poprvé se normální rozdělení jako limit binomického rozdělení na objevilo v roce 1738 ve druhém vydání De Moivreho „Doctrine of Chance“ [18] . Toto byl první důkaz speciálního případu centrální limitní věty . V roce 1809 Gauss v The Theory of the Motion of Celestial Body představil toto rozdělení jako vycházející z opakovaných měření pohybu nebeských těles. Gauss však odvodil vzorec pro skutečné náhodné veličiny z principu maximalizace hustoty spojů všech měření v bodě se souřadnicemi rovnými průměru všech měření. Tento princip byl následně kritizován. V roce 1812 Laplace v Moivre-Laplaceově větě zobecnil výsledek Moivre pro libovolné binomické rozdělení, to znamená pro součty identicky distribuovaných nezávislých binárních veličin [3] .

Viz také

Poznámky

  1. Wentzel E. S. Teorie pravděpodobnosti. - 10. vyd., stereotypní .. - M . : Academia , 2005. - 576 s. — ISBN 5-7695-2311-5 .
  2. Shiryaev A.N. Pravděpodobnost. — M .: Nauka, 1980.
  3. 1 2 Matematický encyklopedický slovník . - M .: Sovětská encyklopedie , 1988. - S.  139 -140.
  4. Wasserman L. Všechny statistiky . - New York, NY: Springer, 2004. - S.  142 . — 433 s. — ISBN 978-1-4419-2322-6 .
  5. Důkaz, viz Gaussův integrál
  6. Halperin, Hartley & Hoel, 1965 , položka 7.
  7. McPherson (1990 )
  8. Wolfram|Alpha: Computational Knowledge Engine . Wolframalpha.com . Staženo: 3. března 2017.
  9. Bryc (1995 , s. 23)
  10. Bryc (1995 , s. 24)
  11. Obálka, Thomas M.; Thomas, Joy A. Prvky teorie informace. - John Wiley and Sons , 2006. - S. 254.
  12. Park, Sung Y.; Bera, Anil K. Maximální entropie Autoregresivní podmíněný model heteroskedasticity  //  Journal of Econometrics : deník. - Elsevier, 2009. - S. 219-230 . Archivováno z originálu 7. března 2016.
  13. Taleb N. N. Černá labuť. Ve znamení nepředvídatelnosti = Černá labuť: Dopad vysoce nepravděpodobného. - Kolibřík, 2012. - 525 s. - ISBN 978-5-389-00573-0 .
  14. Koroljuk, 1985 , str. 135.
  15. Galkin V. M., Erofeeva L. N., Leshcheva S. V. Odhady parametru Cauchyho distribuce // Proceedings of the Nizhny Novgorod State Technical University. R. E. Alekseeva . - 2014. - č. 2 (104). - S. 314-319. - MDT  513.015.2 .
  16. Lukacs, Eugene. Charakteristika normálního rozdělení  //  The Annals of Mathematical Statistics : deník. - 1942. - Sv. 13 , č. 1 . - S. 91-3 . — ISSN 0003-4851 . - doi : 10.1214/aoms/1177731647 . — .
  17. Lehmann, E. L. Testování statistických hypotéz . — 2. — Springer, 1997. - S.  199 . — ISBN 978-0-387-94919-2 .
  18. Doktrína šancí; nebo způsob výpočtu pravděpodobnosti událostí ve hře, L., 1718, 1738, 1756; L., 1967 (reprodukované vyd.); Miscellanea analytica de scriebus et quadraturis, L., 1730.

Literatura

  • Koroljuk V. S. , Portenko N. I. , Skorokhod A. V. , Turbin A. F. Příručka teorie pravděpodobnosti a matematické statistiky. - M. : Nauka, 1985. - 640 s.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Doporučené standardy pro statistické symboly a notaci. COPSS Committee on Symbols and Notation  //  The American Statistician : deník. - 1965. - Sv. 19 , č. 3 . - S. 12-14 . - doi : 10.2307/2681417 . — .
  • McPherson, Glen. Statistika ve vědeckém výzkumu : její základy, aplikace a interpretace  . - Springer-Verlag , 1990. - ISBN 978-0-387-97137-7 .
  • Bryc, Wlodzimierz. Normální distribuce: Charakterizace s  aplikacemi . - Springer-Verlag , 1995. - ISBN 978-0-387-97990-8 .

Odkazy