Joyneův koeficient

Joyneův koeficient je v lingvistice koeficient, který ukazuje, jak univerzální nebo naopak specializované je použití určitého slova v textech různých předmětů. Pokud je slovo použito pouze v textech určitého úzkého tématu, Joyneův koeficient se blíží 0, ale pokud je frekvence použití slova v jakémkoli textu přibližně stejná, koeficient se blíží 100.

Výpočet

Joyneův koeficient je definován vzorcem [1] [2]

kde je počet tematických segmentů, do kterých jsou studované texty rozděleny;

je průměrná frekvence slova ve všech segmentech;

— směrodatná odchylka frekvencí pro jednotlivé segmenty.

Pro výpočet Joine koeficientu jsou studované texty rozděleny do segmentů různých témat přibližně stejného objemu (při sestavování frekvenčních slovníků je obvykle přiděleno 100 segmentů). Pro každý segment se vypočítá frekvence použití určitého slova, to znamená počet použití slova vydělený celkovým objemem segmentu. Pro získanou řadu frekvencí se vypočítá směrodatná odchylka , po které se získané hodnoty dosadí do vzorce.

Příklad

Nechte prostudované texty rozdělit do 4 segmentů, každý o velikosti 1 milionu slov. Určité slovo, například "koeficient" se v těchto segmentech vyskytuje 10, 11, 8 a 3krát, v tomto pořadí. Pak = 10, = 11, = 9, = 3 použití na milion. Znamenat

standardní odchylka

Potom koeficient spojení

Poznámky

  1. Sharov S.A., Lyashevskaya O.N. Frekvenční slovník moderního ruského jazyka na základě materiálů Národního korpusu ruského jazyka Archivováno 21. září 2019 na Wayback Machine - M .: Publishing Center "Azbukovnik", 2009. - 1060 s.
  2. Frekvenční slovník francouzských slov : A. Juilland, D. Brodin a C. Davidovitch Románské jazyky ​​a jejich struktury, první řada F 1. Mouton, Haag-Paris, 1970. lxxv, 503 stran. ⨍ 120.

Viz také

frekvenční slovník