Zipfův zákon („hodnost-frekvence“) je empirická zákonitost rozložení frekvence slov v přirozeném jazyce : pokud jsou všechna slova jazyka (nebo jen poměrně dlouhý text ) uspořádána v sestupném pořadí podle jejich frekvence použití, pak bude četnost n-tého slova v takovém seznamu přibližně nepřímo úměrná jeho pořadovému číslu n (tzv. hodnost tohoto slova, viz stupnice pořadí ). Například druhé nejpoužívanější slovo je asi dvakrát častější než první, třetí je třikrát vzácnější než první a tak dále.
Autorem objevu pravidelnosti je francouzský stenograf Jean-Baptiste Estoup ( fr. Jean-Baptiste Estoup ), který ji popsal v roce 1908 ve svém díle „Rozsah těsnopisu“ [1] . Zákon poprvé použil k popisu rozložení velikostí měst německý fyzik Felix Auerbach ve své práci „The Law of Population Concentration“ v roce 1913 [2] a je pojmenován po americkém lingvistovi George Zipfovi , který v roce 1949 aktivně popularizoval tento vzor. , nejprve navrhovat používat to k popisu distribuce ekonomických sil a sociálního postavení [2] .
Vysvětlení Zipfova zákona na základě korelačních vlastností aditivních Markovových řetězců (s funkcí krokové paměti) bylo podáno v roce 2005 [3] .
Zipfův zákon je matematicky popsán pomocí Paretova rozdělení . Je to jeden ze základních zákonů používaných v infometrii .
George Zipf v roce 1949 poprvé ukázal rozdělení příjmů lidí podle jejich velikosti: nejbohatší člověk má dvakrát více peněz než druhý nejbohatší atd. Toto tvrzení se v letech 1926 až 1936 ukázalo jako pravdivé pro řadu zemí (Anglie, Francie, Dánsko, Holandsko, Finsko, Německo, USA) [2] .
Tento zákon funguje i ve vztahu k rozložení městského systému: město s největším počtem obyvatel v jakékoli zemi je dvakrát větší než další největší město atd. [2] . Pokud seřadíte všechna města určité země v seznamu v sestupném pořadí podle počtu obyvatel, pak každému městu může být přiřazena určitá hodnost, tedy číslo, které obdrží v tomto seznamu. Velikost populace a pořadí se přitom řídí jednoduchým vzorcem vyjádřeným vzorcem [4] :
,kde je počet obyvatel města n-tého pořadí; - počet obyvatel hlavního města země (1. místo).
Empirické studie toto tvrzení podporují [5] [6] [7] [8] [9] .
V roce 1999 popsal ekonom Xavier Gabet Zipfův zákon jako příklad mocenského zákona : pokud města rostou náhodně se stejnou směrodatnou odchylkou, pak na limitu se rozdělení sníží na Zipfův zákon [10] .
Podle závěrů výzkumníků ve vztahu k městskému osídlení v Ruské federaci v souladu se Zipfovým zákonem [11] :
Americký bioinformatik Wentian Li navrhl statistické vysvětlení Zipfova zákona, dokazující, že tomuto zákonu se řídí i náhodná posloupnost znaků [12] . Autor dochází k závěru, že Zipfův zákon je zjevně čistě statistický jev, který nemá nic společného se sémantikou textu a má povrchní vztah k lingvistice.
Obecně lze říci, že důkaz této teorie je následující. Pravděpodobnost náhodného výskytu slova délky n v řetězci náhodných znaků klesá s růstem n ve stejném poměru, jako roste pořadí tohoto slova v seznamu četností (ordinální stupnice). Proto je součin hodnosti slova a jeho frekvence konstanta .
![]() | |
---|---|
V bibliografických katalozích |