Standardní odchylka

V teorii a statistice pravděpodobnosti je odchylka odmocniny (odmocnina)  nejběžnějším ukazatelem rozptylu hodnot náhodné proměnné vzhledem k jejímu matematickému očekávání (analoga aritmetického průměru s nekonečným počtem výsledky). Obvykle to znamená druhou odmocninu rozptylu náhodné veličiny, ale někdy to může znamenat jednu či druhou variantu odhadu této hodnoty.

V literatuře se obvykle označuje řeckým písmenem (sigma). Ve statistice se přijímají dvě označení:  - pro obecnou populaci a sd (z anglického standardní odchylka  - standardní odchylka ) - pro výběrový soubor .  

Termín

Existují také synonyma pro frázi směrodatná odchylka :

Samotný termín střední čtverec znamená střední mocninu 2 (viz níže ).

Základní informace

Směrodatná odchylka je definována jako druhá odmocnina rozptylu náhodné veličiny : .

Směrodatná odchylka se měří v jednotkách samotné náhodné veličiny a používá se při výpočtu směrodatné chyby aritmetického průměru , při konstrukci intervalů spolehlivosti , při statistickém testování hypotéz , při měření lineárního vztahu mezi náhodnými veličinami.

V praxi, kdy je místo přesného rozdělení náhodné veličiny k dispozici pouze výběrový soubor, se odhaduje směrodatná odchylka i matematické očekávání ( výběrový rozptyl ), a to lze provést různými způsoby. Pojmy "směrodatná odchylka" a "směrodatná odchylka" se obvykle používají pro druhou odmocninu rozptylu náhodné veličiny (definované z hlediska jejího skutečného rozdělení), ale někdy i pro různé odhady této veličiny na základě vzorku.

Konkrétně, pokud  je i - tý prvek vzorku,  je velikost vzorku,  je aritmetický průměr vzorku ( průměr vzorku  je odhad matematického očekávání hodnoty):

potom jsou dva hlavní způsoby odhadu směrodatné odchylky zapsány následovně.

Odhad směrodatné odchylky založený na zkresleném odhadu rozptylu (někdy označovaný jednoduše jako výběrový rozptyl [1] ):

Je to doslova střední kvadrát rozdílu mezi naměřenými hodnotami a průměrem.

Odhad směrodatné odchylky na základě nezkresleného odhadu rozptylu (opravený výběrový rozptyl [1] , v GOST R 8.736-2011 - "směrodatná odchylka"):

Samo o sobě však nepředstavuje nezaujatý odhad druhé odmocniny rozptylu, tj. braní druhé odmocniny „kazí“ nestrannost.

Oba odhady jsou konzistentní [1] .

Směrodatná odchylka je navíc matematické očekávání druhé mocniny rozdílu mezi skutečnou hodnotou náhodné veličiny a jejím odhadem pro nějakou metodu odhadu [2] . Pokud je odhad nezkreslený (výběrový průměr je pouze nezkreslený odhad pro náhodnou veličinu), pak se tato hodnota rovná rozptylu tohoto odhadu.

Směrodatná odchylka průměru

Výběrový průměr je také náhodná veličina s odhadovanou směrodatnou odchylkou [2]

Pravidlo tři sigma

Pravidlo tří sigma ( ) říká: pravděpodobnost, že se jakákoli náhodná veličina odchýlí od své střední hodnoty o méně než , - .

Téměř všechny hodnoty normálně rozdělené náhodné veličiny leží v intervalu , kde  je matematické očekávání náhodné veličiny. Přesněji, přibližně s pravděpodobností 0,9973, leží hodnota normálně rozdělené náhodné veličiny ve stanoveném intervalu.

Interpretace hodnoty směrodatné odchylky

Větší hodnota směrodatné odchylky indikuje větší rozptyl hodnot v prezentovaném souboru s průměrem souboru; menší hodnota znamená, že hodnoty v sadě jsou seskupeny kolem průměrné hodnoty.

Máme například tři sady čísel: {0, 0, 14, 14}, {0, 6, 8, 14} a {6, 6, 8, 8}. Všechny tři soubory mají střední hodnoty 7 a směrodatné odchylky 7, 5 a 1. Poslední soubor má malou směrodatnou odchylku, protože hodnoty v souboru jsou seskupeny kolem průměru; první sada má největší hodnotu směrodatné odchylky - hodnoty v rámci sady se silně liší od průměrné hodnoty.

V obecném smyslu lze směrodatnou odchylku považovat za míru nejistoty. Například ve fyzice se směrodatná odchylka používá k určení chyby série po sobě jdoucích měření nějaké veličiny. Tato hodnota je velmi důležitá pro určení věrohodnosti studovaného jevu ve srovnání s hodnotou předpovídanou teorií: pokud je střední hodnota měření velmi odlišná od hodnot předpovídaných teorií (velká směrodatná odchylka), pak získané hodnoty nebo způsob jejich získání je třeba znovu zkontrolovat.

Praktická aplikace

V praxi vám standardní odchylka umožňuje odhadnout, jak moc se hodnoty ze sady mohou lišit od průměrné hodnoty.

Ekonomika a finance

Směrodatná odchylka výnosu portfolia je ztotožněna s rizikem portfolia.

V technické analýze se směrodatná odchylka používá k sestavení Bollingerových pásem , k výpočtu volatility .

Hodnocení a kritika rizik

Směrodatná odchylka je ve finančním sektoru široce používána jako kritérium pro hodnocení investičního rizika . Podle amerického ekonoma Nassima Taleba by se to nemělo dělat. Takže podle teorie by se asi dvě třetiny změn měly vejít do určitých mezí (směrodatné odchylky -1 a +1) a že výkyvy nad sedm směrodatných odchylek jsou prakticky nemožné. V reálném životě je však podle Taleba vše jinak – skoky v jednotlivých ukazatelích mohou přesáhnout 10, 20 a někdy i 30 směrodatných odchylek. Taleb věří, že manažeři rizik by se měli vyvarovat používání nástrojů a metod směrodatných odchylek, jako jsou regresní modely, koeficient determinace (R-squared) a beta faktory. Podle Taleba je navíc směrodatná odchylka příliš komplikovaná na pochopení metody. Věří, že každý, kdo se pokusí posoudit riziko pomocí jediného ukazatele, je odsouzen k neúspěchu [3] .

Klima

Předpokládejme, že existují dvě města se stejnou průměrnou denní maximální teplotou, ale jedno se nachází na pobřeží a druhé ve vnitrozemí. Je známo, že pobřežní města mají mnoho různých denních maximálních teplot nižších než města ve vnitrozemí. Proto bude směrodatná odchylka maximálních denních teplot v pobřežním městě menší než ve městě druhém, a to i přesto, že mají stejnou průměrnou hodnotu této hodnoty, což v praxi znamená, že pravděpodobnost, že maximální teplota vzduchu bude max. každý konkrétní den v roce bude silnější lišit se od průměrné hodnoty, vyšší pro město nacházející se uvnitř kontinentu.

Sport

Předpokládejme, že existuje několik fotbalových týmů, které jsou seřazeny podle nějakého souboru parametrů, například podle počtu vstřelených a inkasovaných gólů, šancí na skórování atd. Je velmi pravděpodobné, že nejlepší tým v této skupině bude mít nejlepší hodnoty. ve více parametrech. Čím menší je standardní odchylka týmu pro každý z prezentovaných parametrů, tím je výsledek týmu předvídatelnější, takové týmy jsou vyrovnané. Na druhou stranu tým s velkou směrodatnou odchylkou těžko předpovídá výsledek, což se zase vysvětluje nevyvážeností, například silná obrana, ale slabý útok.

Použití směrodatné odchylky parametrů týmu umožňuje do určité míry předvídat výsledek zápasu mezi dvěma týmy, vyhodnotit silné a slabé stránky týmů, a tím i zvolené metody boje.

Příklad

Předpokládejme, že skupina, která nás zajímá ( obecná populace ), je třída osmi studentů, kteří jsou hodnoceni 10bodovým systémem. Protože odhadujeme celou skupinu a ne její vzorek, můžeme použít směrodatnou odchylku založenou na zkresleném odhadu rozptylu. Za tímto účelem vezmeme druhou odmocninu aritmetického průměru čtverců odchylek hodnot od jejich střední hodnoty.

Známky studentů ve třídě nechť jsou následující:

Pak je průměrné skóre:

Vypočítejme druhou mocninu odchylek známek studentů od jejich průměrné známky:

Aritmetický průměr těchto hodnot se nazývá rozptyl :

Směrodatná odchylka se rovná druhé odmocnině rozptylu:

Tento vzorec je platný pouze v případě, že těchto osm hodnot představuje populaci. Pokud by tato data byla náhodným vzorkem z nějaké velké populace (například ročníky osmi náhodně vybraných studentů ve velkém městě), pak místo n  = 8 by bylo třeba do jmenovatele vzorce pro výpočet rozptylu uvést n  − 1 = 7:

a směrodatná odchylka by byla:

Tento výsledek se nazývá směrodatná odchylka založená na nezkresleném odhadu rozptylu. Dělení n  − 1 místo n dává nezkreslený odhad rozptylu pro velké populace.

Viz také

Poznámky

  1. 1 2 3 Ivchenko G. I., Medveděv Yu. I. Úvod do matematické statistiky. - M .  : Nakladatelství LKI, 2010. - §2.2. Vybrané momenty: exaktní a asymptotická teorie. - ISBN 978-5-382-01013-7 .
  2. ↑ 1 2 C. Patrignani et al. (Skupina údajů o částicích). 39 STATISTIKY . — In: Přehled částicové fyziky // Chin. Phys. C. - 2016. - Sv. 40. - P. 100001. - doi : 10.1088/1674-1137/40/10/100001 .
  3. Taleb, Goldstein, Spitsnagel, 2022 , str. 46.

Literatura

  • Borovikov V. STATISTICA. Umění počítačové analýzy dat: Pro profesionály / V. Borovikov. - Petrohrad. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1 . .
  • Nassim Taleb, Daniel Goldstein, Mark Spitznagel. Šest generálních chyb v řízení rizik // Řízení rizik (Harvard Business Review Series: Top 10 Articles) = O řízení rizik / Tým autorů. - M .: Alpina Publisher , 2022. - S. 41-50. — 206 s. - ISBN 978-5-9614-8186-0 .