Automatické odkazování

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 21. října 2020; kontroly vyžadují 3 úpravy .

Automatická abstrakce, anotace nebo sumace  je vytvoření krátké verze ( abstrakt , anotace ) textového dokumentu pomocí počítačového programu.

Historie

První práci na automatickém odkazování provedl americký vědec G.P. Lun v roce 1958 na materiálu anglického jazyka. [1] [2] [3] Principy extraktivní abstrakce formuloval J. Salton koncem 50. a začátkem 60. let. [2] [4]

V SSSR byli průkopníky v oblasti automatického odkazování V. E. Berzon, I. P. Sevbo , E. F. Skorokhodko , D. G. Lakhuti , R. G. Piotrovsky a další [5] [2]

Přístupy

Existují dva hlavní přístupy k automatickému odkazování: extrahování (extrakce, povrchní) a generování (abstrakce, hluboké). [6] [1] [5] [2]

Extrakce (extrakce)

Nejdůležitější fráze, věty nebo odstavce jsou vybírány z výchozího textu, jehož souhrn tvoří určitý výtah, kvaziabstrakt. [5] V tomto případě se tyto fragmenty nezpracovávají, ale extrahují v pořadí a podobě, v jaké jsou uvedeny ve zdrojovém textu. [6]

Výhody přístupu: nezávislost na předmětu, srovnatelná snadnost vývoje. [1] Nevýhody: nekoherentní výsledek. [jeden]

Generování (abstrakce)

Metody generování jsou založeny na lingvistických pravidlech zpracování přirozeného jazyka nebo metod umělé inteligence. [6] Obsahově zobecňují zdrojový dokument a vytvářejí text, který v něm není výslovně uveden. [6]

Výhody přístupu: nejlepší kvalita výsledku. [1] Nevýhody: složitost praktické realizace, nutnost shromáždit velké množství jazykových znalostí. [jeden]

Poznámky

  1. 1 2 3 4 5 6 Batura T. V., Bakieva A. M. Metody a systémy pro automatickou sumarizaci textů - Novosibirsk : 2019. - 110 s. - 100 kopií. — ISBN 978-5-4437-0974-1
  2. 1 2 3 4 Sedova E.P. Automatické abstrahování vědeckých publikací pomocí syntaktické analýzy založené na moderních článcích o počítačové syntaxi - Petrohrad. : 2018. - 49 s.
  3. Luhn H. P. The Automatic Creation of Literature Abstracts  (Angl.) // IBM Journal of Research and Development / C. A. Pickover - IBM Corporation , IEEE , 1958. - Vol. 2, Iss. 2. - S. 159-165. — ISSN 0018-8646 ; 2151-8556doi:10.1147/RD.22.0159
  4. Salton G. Dynamic Information and Library Processing  (anglicky) - 1975. - 523 s.
  5. 1 2 3 Trevgoda S. A. Metody a algoritmy pro automatické abstrahování textu založené na analýze funkčních vztahů - Petrohrad. : 2009. - 157 s. - 100 kopií.
  6. 1 2 3 4 Osminin P. G. Moderní přístupy k automatickému odkazování a anotaci // Bulletin of the South Ural State University - Čeljabinsk : 2012. - sv. 25. - S. 134-135.