Histogram (statistika)

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 27. dubna 2016; kontroly vyžadují 10 úprav .

Histogram v matematické statistice  je jednou z grafických metod pro studium distribuční řady hodnot náhodné veličiny. [B:1]

Mezi grafické metody pro studium distribučních řad jsou uvedeny následující [1] :

Krokové polygony a frekvenční polygony se souhrnně nazývají distribuční polygony . Bodový graf, stupňovitý polygon a frekvenční polygon jsou označeny jako nejvhodnější. [jeden]

Pro dvourozměrný případ se místo distribuční řady zkonstruuje distribuční tabulka a odpovídající grafická konstrukce se nazývá prismogram . [jeden]

Definice

Podle GOST

GOST R 50779.10-2000 nabízí následující definice:

2.17 histogram
Grafické znázornění rozdělení četností pro kvantitativní charakteristiku, tvořené souvislými obdélníky, jejichž základnami jsou intervaly tříd a jejichž plochy jsou úměrné četnostem těchto tříd

2.18 sloupcový graf
Grafické znázornění rozdělení četností pro diskrétní náhodnou veličinu, tvořený sadou sloupců stejné šířky, jejichž výšky jsou úměrné frekvencím[D:1]

Alternativní definice

Nechť je ukázkou z nějaké distribuce . Definujme oddíl reálné čáry . Nechat

je počet prvků vzorku, které spadají do tého intervalu. Pak po částech konstantní funkce , která má tvar:

, se nazývá normalizovaný histogram.[2]

Histogram dokonale spojitého rozdělení

Nechť je rozdělení náhodných veličin absolutně spojité a je dáno hustotou pravděpodobnosti . Pak

v pravděpodobnosti na . [3]

Postup pro konstrukci histogramu

Při kreslení metodou obdélníků je vodorovná osa rozdělena na stejné segmenty odpovídající řadám ; na těchto segmentech, stejně jako na základnách, jsou postaveny obdélníky s výškou úměrnou frekvenci daného výboje. [čtyři]

Pojďme si tento postup popsat podrobněji. Za prvé, sada hodnot, které může prvek vzorku nabývat, je rozdělena do několika bitů (binů). Nejčastěji se tyto intervaly berou stejně, ale není to striktní požadavek. Tyto intervaly se vynesou na vodorovnou osu a nad každým se nakreslí obdélník. Pokud by všechny intervaly byly stejné, pak je výška každého obdélníku úměrná počtu prvků vzorku spadajících do odpovídajícího intervalu. Pokud jsou intervaly různé, pak se výška obdélníku volí tak, aby jeho plocha byla úměrná počtu prvků vzorku, které spadají do tohoto intervalu.

Volba optimálního oddílu je pro konstrukci histogramu zásadní, protože s přibývajícími intervaly klesá podrobnost odhadu hustoty distribuce a se snižováním intervalů klesá přesnost jeho hodnoty. K výběru optimálního počtu intervalů se často používá Sturgesovo pravidlo .

,

kde je celkový počet pozorování veličiny, je logaritmus se základem 2 a je celočíselná část .

Často se také vyskytuje pravidlo, které odhaduje optimální počet intervalů jako druhou odmocninu z celkového počtu měření:

Použití

Znázornění distribučních řad v transformované podobě je nutnou podmínkou při vzájemném porovnávání těchto řad [1] .

Studium distribučních řad je značně usnadněno použitím grafické metody . Při zobrazování distribučních řad jsou na vodorovnou osu vyneseny hodnoty výbojů nebo pozorované hodnoty náhodné veličiny a na svislou osu bitové frekvence nebo pozorované frekvence [1] .

Konstrukce histogramů se používá k získání empirického odhadu hustoty rozdělení náhodné veličiny [5] .

V nejobecnější podobě je jeden z nejdůležitějších úkolů formulován následovně: na dané hladině významnosti otestujte hypotézu, že rozdělení uvedené na histogramu je monomodální [A: 1] .

Příklady použití

Histogramová analýza je mezi geology tradičně považována za jasnou a informativní metodu řešení geologických problémů, protože histogramová analýza umožňuje testovat geologické hypotézy formulované v jazyce statistiky [A: 1] .

V kardiologii je konstrukce a popis histogramu povinnou geometrickou metodou pro analýzu variability srdeční frekvence , navrženou standardy z roku 1996 [A: 2] [B: 2] . Jako další způsoby popisu histogramů srdeční frekvence se používají metody jejich trojúhelníkové interpretace , jako je St. George index a trojúhelníkový index [6] .

Ve výrobě, při analýze stavu technologického procesu, je konstrukce histogramů považována za efektivní způsob, jak posoudit situaci a provést analýzu v první fázi studia stability technologického procesu, a je také považována za jeden z efektivní nástroje řízení kvality ve fázi kontroly kvality hotového výrobku a analýzy současného stavu technologického procesu [A :3] .

Viz také

Poznámky

  1. 1 2 3 4 5 Mitropolsky, 1971 , § 2 Řádky a distribuční tabulky, str. 20-43.
  2. Normalizovaný histogram je hustota pravděpodobnosti. Zejména:
    • .
    • .
  3. Plocha obrázku pod normalizovaným histogramem, omezená intervalem , se tedy blíží pravděpodobnosti přijetí hodnot v tomto intervalu kterékoli z náhodných veličin . Normalizovaný histogram však bodově nekonverguje k teoretické hustotě rozdělení těchto náhodných veličin.
  4. Mitropolsky, 1971 , s. 32.
  5. Pro konstrukci histogramu se pozorovaný rozsah variace náhodné veličiny rozdělí do několika intervalů a vypočítá se podíl všech měření, která spadají do každého z intervalů. Hodnota každého podílu je brána jako odhad pravděpodobnosti, že náhodná veličina spadne do odpovídajícího intervalu. Hovořit o hustotě pravděpodobnosti v kontextu histogramu je nesprávné, protože histogramování transformuje rozdělení jakéhokoli druhu na diskrétní (uvažuje se událost, kdy hodnota spadá do určitého intervalu, jehož počet je spočetný), a pro diskrétní náhodnou veličinu neexistuje žádná funkce hustoty pravděpodobnosti.
  6. Ryabykina, 1998 , § 3.6. Geometrické metody analýzy rytmogramů, str. 43-49.

Literatura

Knihy

  1. Mitropolsky A. K. . Technika statistických výpočtů. - 2. vyd., přepracováno. a další .. - M . : Nauka, 1971. - 576 s. - (Fyzikálně-matematická knihovna inženýra). - 19 500 výtisků.
  2. Ryabykina G.V. , Sobolev A.V. Variabilita srdeční frekvence. - M .: "Star'Ko", 1998. - 200 s. — ISBN 5-85493-032-3 .

Články

  1. 1 2 Tkachev Yu.A. Studium histogramů geologických jevů pomocí počítačového modelování  // Bulletin Ústavu geologie Vědeckého centra Komi Uralské pobočky Ruské akademie věd: časopis. - 2004. - č. 2 . - S. 7-11 .
  2. Pracovní skupina Evropské kardiologické společnosti a Severoamerické společnosti stimulace a elektrofyziologie. Variabilita srdeční frekvence. Standardy měření, fyziologická interpretace a klinické použití Bulletin of Arrhythmology  : Journal  . - 1999. - č. 11 . - S. 53-78 .
  3. Abdullin I. A. , Beloborodova O. I. , Laptev N. I. , Moskvicheva E. L. , Goryainov A. D. Aplikace statistických metod k posouzení technologického postupu výroby tvarovaných náloží  // Bulletin Kazaňské technologické univerzity: časopis. - 2010. - č. 12 . - S. 477-482 .

Normativní dokumenty

  1. GOST R 50779.10-2000 (ISO 3534-1-93) Statistické metody. Pravděpodobnost a základy statistiky. Termíny a definice . docs.cntd.ru. Staženo 27. května 2020. Archivováno z originálu dne 19. května 2020.

Odkazy

  • Canva Online Bar Chart Builder
  • Online mapovací nástroj pro webovou službu ChartBlocks