Kvantitativní lingvistika
Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od
verze recenzované 25. března 2018; kontroly vyžadují
12 úprav .
Kvantitativní lingvistika ( angl. quantitative linguistics ) je úsek obecné lingvistiky a zejména matematické lingvistiky . Kvantitativní lingvistika (QL) zkoumá jazyk pomocí statistických metod ; jeho konečným cílem je formulovat zákonitosti, podle kterých jazyk funguje, a v konečném důsledku vybudovat obecnou teorii jazyka ve formě souboru vzájemně souvisejících zákonitostí fungování jazyků [1] :1-16[ kým? ] Synergická lingvistika . [1] :760-774 Kvantitativní lingvistika je empiricky založena na výsledcích jazykové statistiky, kterou lze naopak interpretovat jako statistiku jazyků nebo statistiku lingvistického objektu. Tato oblast znalostí nemusí nutně souviset se základními vědeckými cíli. Korpusová lingvistika a počítačová lingvistika rovněž přispívají ke kvantitativní lingvistice tím, že poskytují důležitá empirická data.
Historie
Nejstarší koncepty KL pocházejí ze starověkých řeckých a starověkých indických kultur. Jeden z historických pramenů zahrnuje aplikace kombinatoriky na lingvistické reálie [2] , druhý vychází z elementárních statistických studií, které lze nalézt pod hesly kolorometrie a stichometrie . [3]
Jazykové zákony v kvantitativní lingvistice
Zákon je v CL chápán jako třída hypotéz odvozených z teoretických předpokladů, matematicky formulovaných, propojených s dalšími zákony v této oblasti a dostatečně a úspěšně ověřených na empirických datech, tedy těch, které se přes četné pokusy nepodařilo vyvrátit. Köhler o zákonech KL píše: „Navíc lze ukázat, že tyto vlastnosti lingvistických prvků a vztahy mezi nimi se řídí univerzálními zákony, které lze formulovat přísně matematicky, stejně jako zákony přírodních věd. V této souvislosti je třeba mít na paměti, že tyto zákony jsou stochastické povahy; nejsou dodržovány v každém jednotlivém případě (to by nebylo nutné a možné); spíše určují pravděpodobnosti událostí nebo kvantitativní vztahy zkoumaných jevů. Je snadné najít protiklady ke každému z výše uvedených příkladů, nicméně tyto případy neporušují odpovídající zákony, protože odchylky kolem statistického průměru jsou nejen přípustné, ale dokonce nutné, protože samy jsou kvantitativně přesně určeny odpovídajícím zákony. Situace je stejná jako v přírodních vědách, které již dávno opustily staré deterministické a kauzální (kauzální) pohledy na svět a nahradily je statistickými/pravděpodobnostními modely“ [4] .
Některé jazykové (lingvistické) zákony
Existuje řada jazykových zákonů, mezi nimi [5] :
- Zákon diverzifikace: Pokud se jazykové kategorie (jako jsou slovní druhy nebo gramatické koncovky) objevují v různých formách, pak lze říci, že frekvence jejich výskytu v textech jsou řízeny určitými zákony.
- Zákon rozdělení délek (nebo obecněji vícesložkový). Studium četností různých jazykových jednotek z hlediska jejich délek v textech a slovnících pravidelně vede k identifikaci řady distribucí v závislosti na studované jednotce. Dosud byly studovány následující jednotky:
- Zákon rozdělení délek morfů;
- Zákon rozdělení délek rytmických jednotek [6] ;
- Zákon rozdělení délky vět;
- Zákon o rozdělení délek slabik;
- Zákon o rozdělení délky slova [7] [8] ;
Dalšími jazykovými jednotkami, které se také tomuto zákonu řídí, jsou například písmena (symboly) různé složitosti, délky tzv. hřebenů a řečových aktů. Totéž platí pro rozložení zvuků (pozadí) různé délky (zeměpisné délky).
- Martinův zákon: Tento zákon se týká lexikálních řetězců, které se tvoří při vyhledávání definic (definic) slov ve slovníku, dále pak definic nově nalezených definic atd. Všechny tyto definice nakonec tvoří hierarchii stále obecnějších významů, které se stávají stále více obecnými. zatímco definice se zmenšují, tím obecnější hodnota je získána. Mezi úrovněmi této hierarchie existuje řada vztahů, které se řídí zákonem.
- Menzerathův zákon (také, zejména v lingvistice, známý jako Menzerath-Altmannův zákon): Tento zákon říká, že rozměry složek struktury se zmenšují, jak se struktura sama zvětšuje. Čím delší je například věta (měřeno počtem jejích souvětí), tím kratší jsou její souvětí (měřeno počtem slov), nebo: čím delší je slovo (ve slabikách nebo morfech), tím kratší jsou slabiky nebo jejich zvuk.
- Zákony frekvenčního rozdělení: Téměř každá jazyková jednotka se řídí těmito zákony. Zde je jen několik příkladů:
- Slova v textu jsou uspořádána podle četnosti jejich výskytu v textu a každému z nich je přiřazeno pořadové číslo a odpovídající četnost. Od dob George Kingsleyho Zipfa (a jeho slavného zákona) bylo navrženo velké množství matematických modelů k popisu vztahu mezi hodností a frekvencí.
- Podobné rozložení lze pozorovat mezi hodností a frekvencí zvuků, fonémů a písmen.
- Slovní asociace: Pořadí a frekvence asociací reagují na (verbální) podnět.
- Zákon jazykové změny: procesy růstu v jazyce (jako je rozšiřování slovní zásoby), šíření cizích a přejatých slov, změny ve flektivním systému – dodržujte zákon známý v KL jako Piotrovského zákon a odpovídají vzorcům růstu v jiné vědní obory. Piotrovského zákon je speciálním případem tzv. logistického modelu (srov . logistická rovnice ). Ukázalo se, že ovlivňuje i procesy osvojování jazyka (srov. zákon osvojování jazyka).
- Zákon textových bloků: Jazykové jednotky (např. slova, písmena, syntaktické funkce a konstrukce) vykazují určitá frekvenční rozložení ve stejně velkých blocích textů.
- Zipfův zákon : frekvence slova je nepřímo úměrná jeho pořadovému číslu v seznamech frekvencí [9] .
Stylistika
Studium básnických a nebásnických stylů může být založeno na statistických metodách; navíc je možné provádět odpovídající výzkum na základě speciálních forem (parametrů), které jazykové zákony nabývají v textech různých stylů. V takových případech provádí CL výzkum ve stylistice: jedním z konečných cílů je prokázat existenci stylistického jevu odkazem na působení jazykového zákona (a co možná nejobjektivněji. Jedním z hlavních předpokladů CL je, že některé zákony (například zákonitá rozdělení délek slov) vyžadují různé modely, alespoň různé hodnoty parametrů zákona (rozdělení nebo funkce), v závislosti na typu textu. Pokud se studují básnické texty, pak metody CL tvoří dílčí disciplínu s názvem „Kvantitativní studium literatury“ ( Stylometrie ) [10] .
Poznámky
- ↑ 1 2 Reinhard Köhler. Gegenstand und Arbeitsweise der Quantitativen Linguistik // Kvantitativní lingvistika / Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.). — Berlín/New York: Ein internationales Handbuch. de Gruyter, 2005. - ISBN 3-11-015578-8 .
- ↑ NL Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, s. 109-136.
- ↑ Adam Pawłowski: Prolegomena k dějinám korpusu a kvantitativní lingvistiky. Řecký starověk. In: Glottotheory 1, 2008, s. 48-54.
- ↑ srov. poznámka 1, str. 1-2.
- ↑ srov. reference: Köhler, Altmann, Piotrowski (eds.) (2005)
- ↑ Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. In: Glottometrics 16, 2008, str. 57-62. (PDF ram-verlag.eu Archivováno 11. června 2020 na Wayback Machine )
- ↑ Ioan-Iovitz Popescu, et alii: Délka slova: aspekty a jazyky. In: Reinhard Köhler, Gabriel Altmann (eds.): Problémy kvantitativní lingvistiky 3. Věnováno Karlu-Heinzi Bestovi k jeho 70. narozeninám . Ludenscheid: RAM-Verlag 2013, str. 224-281. ISBN 978-3-942303-12-5 .
- ↑ Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Jednotné modelování délky v jazyce. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2 .
- ↑ H. Guiter, MV Arapov (eds.): Studie o Zipfově zákonu. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8 .
- ↑ Alexander Mehler: Eigenschaften der textellen Einheiten und Systeme . In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Kvantitativní lingvistika - kvantitativní lingvistika. Ein internationales Handbuch. de Gruyter, Berlín/ New York 2005, str. 325-348, esp. Kvantitativní styl , str. 339-340. ISBN 3-11-015578-8 ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9 .
Literatura
- Karl-Heinz Best : Kvantitativní lingvistika. Eine Annaherung . 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4 .
- Karl-Heinz Best, Otto Rottmann: Kvantitativní lingvistika, pozvánka. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4 .
- Peter Grzybek, Emmerich Kelih: Zur Vorgeschichte quantitativer Ansätze in der russischen Sprach- und Literaturwissenschaft . In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Kvantitativní lingvistika - kvantitativní lingvistika. Ein internationales Handbuch - mezinárodní příručka. de Gruyter, Berlín/ New York 2005, str. 23-64. ISBN 3-11-015578-8 .
- Emmerich Kelih: Geschichte der Anwendung kvantitativní Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6 .
- Sebastian Kempgen Systematischer Oberblick und Bibliographie. Verlag Otto Sagner, München 1995. ISBN 3-87690-617-2 .
- VV Levitsky: Kvantitativní metody v lingvistice. Nová kniha, Vinnitsa 2007. ISBN 978-966-382-046-0 .
- AV Zenkov, Metoda atribuce textu na základě statistiky číslovek // Journal of Quantitative Linguistics. 2018 sv. 25, č. 3, s. 256-270. DOI: 10.1080/09296174.2017.1371915.
Slovníky a encyklopedie |
|
---|
V bibliografických katalozích |
|
---|