Strojový překlad na základě pravidel

Rule-based machine translation ( RBMT od rule-based machine translation ) je  označení technologií strojového překladu založených na jazykových informacích o zdrojovém a cílovém jazyce. Tyto informace jsou zpravidla získávány ze slovníků ( jazykových i překladových ), popisů gramatiky jazyků a jsou strukturovány do podoby strojově čitelných pravidel pokrývajících hlavní sémantické, morfologické a syntaktické vzorce každého jazyka. Na základě těchto pravidel je zdrojový text postupně, větu po větě, převáděn na cílový text.

Systémy strojového překladu založené na pravidlech spadají do tří skupin:

Typický systém strojového překladu založený na pravidlech může obsahovat následující součásti:

Historicky použití systémů pravidel ve strojovém překladu předcházelo použití korpusových metod , a proto se tento přístup nazývá také klasickým. Předností klasických systémů je syntaktická a morfologická přesnost, stabilita a předvídatelnost výsledku, schopnost přizpůsobení se předmětu; nevýhody - složitost a délka vývoje, nutnost údržby a aktualizace lingvistických databází; "strojový přízvuk" při překladu. Jak se technologie strojového překladu vyvíjely, rozšířil se hybridní přístup , který kombinuje metody založené na pravidlech a korpusové technologie (včetně statistického překladu a překladu založeného na příkladech ).

Poznámky

  1. Koehn, Philipp. Statistický strojový překlad . - Cambridge : Cambridge University Press, 2010. - S. 15. - ISBN 9780521874151 . Archivováno 21. dubna 2022 na Wayback Machine
  2. Nirenburg, Sergej (1989). „Strojový překlad založený na znalostech“. Machine Tradation 4 (1989), 5-24 . Kluwer Academic Publishers. 4 (1): 5-24. JSTOR40008396  . _

Literatura