Rule-based machine translation ( RBMT od rule-based machine translation ) je označení technologií strojového překladu založených na jazykových informacích o zdrojovém a cílovém jazyce. Tyto informace jsou zpravidla získávány ze slovníků ( jazykových i překladových ), popisů gramatiky jazyků a jsou strukturovány do podoby strojově čitelných pravidel pokrývajících hlavní sémantické, morfologické a syntaktické vzorce každého jazyka. Na základě těchto pravidel je zdrojový text postupně, větu po větě, převáděn na cílový text.
Systémy strojového překladu založené na pravidlech spadají do tří skupin:
Typický systém strojového překladu založený na pravidlech může obsahovat následující součásti:
Historicky použití systémů pravidel ve strojovém překladu předcházelo použití korpusových metod , a proto se tento přístup nazývá také klasickým. Předností klasických systémů je syntaktická a morfologická přesnost, stabilita a předvídatelnost výsledku, schopnost přizpůsobení se předmětu; nevýhody - složitost a délka vývoje, nutnost údržby a aktualizace lingvistických databází; "strojový přízvuk" při překladu. Jak se technologie strojového překladu vyvíjely, rozšířil se hybridní přístup , který kombinuje metody založené na pravidlech a korpusové technologie (včetně statistického překladu a překladu založeného na příkladech ).
strojovému překladu | Přístupy ke|
---|---|
|
zpracování přirozeného jazyka | |
---|---|
Obecné definice | |
Analýza textu |
|
Odkazování |
|
Strojový překlad |
|
Identifikace a sběr dat | |
Tematický model | |
Peer review |
|
Rozhraní přirozeného jazyka |