Strojový překlad založený na transformaci je typ strojového překladu (MT). V současnosti je to jedna z nejpoužívanějších metod strojového překladu. Na rozdíl od jednoduššího modelu přímého MT rozděluje MT založený na transformaci proces překladu do tří fází: analýza textu ve zdrojovém jazyce za účelem určení jeho gramatické struktury, překlad výsledné struktury do struktury vhodné pro tvorbu textu v cílovém jazyce a generování textu. Transformační MT systémy jsou tedy schopny využívat znalost zdrojového a cílového jazyka [1] .
Překlad založený na transformaci a mezijazykový strojový překlad jsou založeny na stejné myšlence, podle níž je k překladu nutné získat přechodnou reprezentaci. S ním můžete opravit význam původní věty, abyste pak mohli vytvořit správný překlad. V mezijazykové MT musí být takováto mezijazyčná reprezentace nezávislá jak na zdrojovém, tak na cílovém jazyce, zatímco v případě MT založeném na přenosu existuje určitá míra závislosti na konkrétní dvojici jazyků. Způsoby, jakými systémy MT založené na transformaci fungují, se výrazně liší, ale obecně se řídí stejným vzorem: aplikují soubory lingvistických pravidel určovaných korespondencemi mezi strukturou zdrojového jazyka a cílového jazyka. První fáze zahrnuje analýzu vstupního textu z hlediska morfologie a syntaxe (někdy také sémantiky ) za účelem vytvoření přechodné reprezentace. Z výsledné reprezentace se vytvoří překlad pomocí dvojjazyčných slovníků a gramatických stavebních pravidel. Tato strategie umožňuje získat dostatečně kvalitní překlad s přesností cca 90 % originálu (přesnost však do značné míry závisí na konkrétní jazykové dvojici a je dána mírou blízkosti dvou konkrétních jazyků).
V systému MT založeném na pravidlech je zdrojový text nejprve analyzován z hlediska morfologie a syntaxe, aby se získala syntaktická reprezentace. V budoucnu může být tato prezentace změněna směrem k menší specifikaci z důvodu nutnosti věnovat zvýšenou pozornost nejvýznamnějším fragmentům pro překlad a ignorovat ostatní typy informací. Během procesu transformace se konečná reprezentace (stále existující ve zdrojovém jazyce) transformuje na reprezentaci stejné úrovně konkretizace v cílovém jazyce. Tyto dva pohledy se nazývají mezilehlé pohledy . Proces transformace reprezentace v cílovém jazyce na hotový text se skládá z podobných kroků prováděných v opačném pořadí.
Než se získá konečný výsledek, je možné se uchýlit k různým metodám analýzy a transformace. Spolu se statistickými přístupy lze zvýšit počet generujících hybridních systémů. Vybrané metody a priority do značné míry závisí na návrhu samotného systému. Většina stávajících systémů však obsahuje alespoň následující kroky:
Jedním z hlavních rysů systémů MT založených na transformaci je fáze, ve které je prostřední reprezentace textu ve zdrojovém jazyce přeložena do prostřední reprezentace textu v cílovém jazyce. Tento proces může probíhat na jedné z úrovní lingvistické analýzy nebo v intervalu mezi nimi. Úrovně jsou uvedeny níže:
strojovému překladu | Přístupy ke|
---|---|
|
zpracování přirozeného jazyka | |
---|---|
Obecné definice | |
Analýza textu |
|
Odkazování |
|
Strojový překlad |
|
Identifikace a sběr dat | |
Tematický model | |
Peer review |
|
Rozhraní přirozeného jazyka |