Joyneův koeficient je v lingvistice koeficient, který ukazuje, jak univerzální nebo naopak specializované je použití určitého slova v textech různých předmětů. Pokud je slovo použito pouze v textech určitého úzkého tématu, Joyneův koeficient se blíží 0, ale pokud je frekvence použití slova v jakémkoli textu přibližně stejná, koeficient se blíží 100.
Joyneův koeficient je definován vzorcem [1] [2]
kde je počet tematických segmentů, do kterých jsou studované texty rozděleny;
je průměrná frekvence slova ve všech segmentech;
— směrodatná odchylka frekvencí pro jednotlivé segmenty.
Pro výpočet Joine koeficientu jsou studované texty rozděleny do segmentů různých témat přibližně stejného objemu (při sestavování frekvenčních slovníků je obvykle přiděleno 100 segmentů). Pro každý segment se vypočítá frekvence použití určitého slova, to znamená počet použití slova vydělený celkovým objemem segmentu. Pro získanou řadu frekvencí se vypočítá směrodatná odchylka , po které se získané hodnoty dosadí do vzorce.
Nechte prostudované texty rozdělit do 4 segmentů, každý o velikosti 1 milionu slov. Určité slovo, například "koeficient" se v těchto segmentech vyskytuje 10, 11, 8 a 3krát, v tomto pořadí. Pak = 10, = 11, = 9, = 3 použití na milion. Znamenat
standardní odchylka
Potom koeficient spojení