Histogram v matematické statistice je jednou z grafických metod pro studium distribuční řady hodnot náhodné veličiny. [B:1]
Mezi grafické metody pro studium distribučních řad jsou uvedeny následující [1] :
Krokové polygony a frekvenční polygony se souhrnně nazývají distribuční polygony . Bodový graf, stupňovitý polygon a frekvenční polygon jsou označeny jako nejvhodnější. [jeden]
Pro dvourozměrný případ se místo distribuční řady zkonstruuje distribuční tabulka a odpovídající grafická konstrukce se nazývá prismogram . [jeden]
GOST R 50779.10-2000 nabízí následující definice:
2.17 histogram
Grafické znázornění rozdělení četností pro kvantitativní charakteristiku, tvořené souvislými obdélníky, jejichž základnami jsou intervaly tříd a jejichž plochy jsou úměrné četnostem těchto tříd
2.18 sloupcový graf
Grafické znázornění rozdělení četností pro diskrétní náhodnou veličinu, tvořený sadou sloupců stejné šířky, jejichž výšky jsou úměrné frekvencím[D:1]
Nechť je ukázkou z nějaké distribuce . Definujme oddíl reálné čáry . Nechat
je počet prvků vzorku, které spadají do tého intervalu. Pak po částech konstantní funkce , která má tvar:
, se nazývá normalizovaný histogram.[2]Nechť je rozdělení náhodných veličin absolutně spojité a je dáno hustotou pravděpodobnosti . Pak
v pravděpodobnosti na . [3]Při kreslení metodou obdélníků je vodorovná osa rozdělena na stejné segmenty odpovídající řadám ; na těchto segmentech, stejně jako na základnách, jsou postaveny obdélníky s výškou úměrnou frekvenci daného výboje. [čtyři]
Pojďme si tento postup popsat podrobněji. Za prvé, sada hodnot, které může prvek vzorku nabývat, je rozdělena do několika bitů (binů). Nejčastěji se tyto intervaly berou stejně, ale není to striktní požadavek. Tyto intervaly se vynesou na vodorovnou osu a nad každým se nakreslí obdélník. Pokud by všechny intervaly byly stejné, pak je výška každého obdélníku úměrná počtu prvků vzorku spadajících do odpovídajícího intervalu. Pokud jsou intervaly různé, pak se výška obdélníku volí tak, aby jeho plocha byla úměrná počtu prvků vzorku, které spadají do tohoto intervalu.
Volba optimálního oddílu je pro konstrukci histogramu zásadní, protože s přibývajícími intervaly klesá podrobnost odhadu hustoty distribuce a se snižováním intervalů klesá přesnost jeho hodnoty. K výběru optimálního počtu intervalů se často používá Sturgesovo pravidlo .
,kde je celkový počet pozorování veličiny, je logaritmus se základem 2 a je celočíselná část .
Často se také vyskytuje pravidlo, které odhaduje optimální počet intervalů jako druhou odmocninu z celkového počtu měření:
Znázornění distribučních řad v transformované podobě je nutnou podmínkou při vzájemném porovnávání těchto řad [1] .
Studium distribučních řad je značně usnadněno použitím grafické metody . Při zobrazování distribučních řad jsou na vodorovnou osu vyneseny hodnoty výbojů nebo pozorované hodnoty náhodné veličiny a na svislou osu bitové frekvence nebo pozorované frekvence [1] .
Konstrukce histogramů se používá k získání empirického odhadu hustoty rozdělení náhodné veličiny [5] .
V nejobecnější podobě je jeden z nejdůležitějších úkolů formulován následovně: na dané hladině významnosti otestujte hypotézu, že rozdělení uvedené na histogramu je monomodální [A: 1] .
Histogramová analýza je mezi geology tradičně považována za jasnou a informativní metodu řešení geologických problémů, protože histogramová analýza umožňuje testovat geologické hypotézy formulované v jazyce statistiky [A: 1] .
V kardiologii je konstrukce a popis histogramu povinnou geometrickou metodou pro analýzu variability srdeční frekvence , navrženou standardy z roku 1996 [A: 2] [B: 2] . Jako další způsoby popisu histogramů srdeční frekvence se používají metody jejich trojúhelníkové interpretace , jako je St. George index a trojúhelníkový index [6] .
Ve výrobě, při analýze stavu technologického procesu, je konstrukce histogramů považována za efektivní způsob, jak posoudit situaci a provést analýzu v první fázi studia stability technologického procesu, a je také považována za jeden z efektivní nástroje řízení kvality ve fázi kontroly kvality hotového výrobku a analýzy současného stavu technologického procesu [A :3] .