Strojový fond ruského jazyka

Strojový fond ruského jazyka  je projektem vytvoření velkého reprezentativního korpusu ruského jazyka. Zkušenosti MFRL se od roku 2004 využívají při vývoji Národního korpusu ruského jazyka .

Program pro vytvoření MFRN

Oddělení strojového fondu ruského jazyka bylo založeno v roce 1985 z iniciativy akademika A.P. Ershova po zvláštní celounijní konferenci konané v roce 1983 [ 1] Pod vedením člena korespondenta Akademie věd SSSR Yu.N. vědecký výzkum a aplikovaný vývoj na vytvoření Strojového fondu ruského jazyka na léta 1996-2000 a informatizaci výzkumu.

Na vytvoření Strojového fondu ruského jazyka (1986-1990) se podílelo více než 40 spolupracujících organizací, mezi nimi moskevské , Leningradské , Charkovské , Grodno , Syktyvkarské a Saratovské univerzity.

Komplexní informatizace vědeckého výzkumu a aplikovaného vývoje v ruských studiích byla chápána jako:

Realizace programu (1985-1992)

Za 8 let práce oddělení strojního fondu ruského jazyka (částečně za účasti spoluvykonavatelů) provedlo:

 — UNILEX-T pro vytváření frekvenčních slovníků, rejstříků slov (rejstříky slov k textům) a konkordancí a práci s nimi [5]  - UNILEX-D pro vytváření a práci se slovníkovými databázemi. [6] Automatický slovník syntaxe ruského jazyka Automatický slovník ruských synonym Automatická verze Slovníku ruského jazyka od S. I. Ožegova Automatický slovník ovládání sloves v ruštině. [7]

Činnost odboru ministerstva financí ruského jazyka (1992-1998)

Kompletní testování systémů pro zpracování lingvistických dat UNILEX prostřednictvím účasti na přípravě Pravopisného slovníku a Slovníku poezie 20. století.

Zrychlená akumulace nových zdrojů založených na elektronických vydáních novin a skenování děl ruské klasické literatury. Kompletní archiv zdrojů Strojového fondu ruského jazyka nyní obsahuje více než 100 milionů slovních použití;

Práce na slovníku jazyka F. M. Dostojevského [8] .

Akumulace pramenů za účelem široké distribučně-statistické studie ruské prózy poslední třetiny 19. století. a noviny konce 20. století.

Akumulace a analýza distributivně-statistických dat, příprava publikací souhrnných dat [9] .

Analýza aktivit pro rozvoj MF ruského jazyka

Koncepce rozvoje MF ruského jazyka (1983)

Moderní úkoly vytváření MFRN

Viz také

Poznámky

  1. Materiály publikované v knize: Machine Fund of the Russian Language: Ideas and Judgments, M .: Nauka , 1989
  2. Publikováno v knize V. M. Andrjuščenka Koncepce a architektura strojového fondu ruského jazyka, M .: 1989
  3. Publikováno v knize Lingvistická koncepce terminologické databanky Strojového fondu ruského jazyka (projekt), ed. A. S. Gerda, M.: 1989
  4. obsah Archivu pramenů byl publikován ve Věstníku strojního fondu ruského jazyka, sv. jeden; je nyní velmi zastaralý a současný stav archivu nejlépe odráží zde: [ 1] Archivováno 13. září 2007 na Wayback Machine  Wayback Machine
  5. Vývojář Zh. G. Anoshkina
  6. Vývojář L. I. Kolodyazhnaya
  7. Popisy ve Věstníku strojního fondu ruského jazyka, sv. 1-3).
  8. pod vedením Yu. N. Karaulova
  9. prvním výsledkem takové publikace je kniha A. Ya. Shaikevich, V. M. Andryushchenko a N. A. Rebetskaya „Statistický slovník jazyka F. M. Dostojevského“
  10. příklad takového zpracování je uveden ve Statistickém slovníku jazyka Dostojevského). V. M. Andrjuščenko

Literatura

Odkazy