Strojový překlad založený na transformaci

Strojový překlad založený na transformaci je typ strojového překladu (MT). V současnosti je to jedna z nejpoužívanějších metod strojového překladu. Na rozdíl od jednoduššího modelu přímého MT rozděluje MT založený na transformaci proces překladu do tří fází: analýza textu ve zdrojovém jazyce za účelem určení jeho gramatické struktury, překlad výsledné struktury do struktury vhodné pro tvorbu textu v cílovém jazyce a generování textu. Transformační MT systémy jsou tedy schopny využívat znalost zdrojového a cílového jazyka [1] .

Zařízení

Překlad založený na transformaci a mezijazykový strojový překlad jsou založeny na stejné myšlence, podle níž je k překladu nutné získat přechodnou reprezentaci. S ním můžete opravit význam původní věty, abyste pak mohli vytvořit správný překlad. V mezijazykové MT musí být takováto mezijazyčná reprezentace nezávislá jak na zdrojovém, tak na cílovém jazyce, zatímco v případě MT založeném na přenosu existuje určitá míra závislosti na konkrétní dvojici jazyků. Způsoby, jakými systémy MT založené na transformaci fungují, se výrazně liší, ale obecně se řídí stejným vzorem: aplikují soubory lingvistických pravidel určovaných korespondencemi mezi strukturou zdrojového jazyka a cílového jazyka. První fáze zahrnuje analýzu vstupního textu z hlediska morfologie a syntaxe (někdy také sémantiky ) za účelem vytvoření přechodné reprezentace. Z výsledné reprezentace se vytvoří překlad pomocí dvojjazyčných slovníků a gramatických stavebních pravidel. Tato strategie umožňuje získat dostatečně kvalitní překlad s přesností cca 90 % originálu (přesnost však do značné míry závisí na konkrétní jazykové dvojici a je dána mírou blízkosti dvou konkrétních jazyků).

Proces překladu

V systému MT založeném na pravidlech je zdrojový text nejprve analyzován z hlediska morfologie a syntaxe, aby se získala syntaktická reprezentace. V budoucnu může být tato prezentace změněna směrem k menší specifikaci z důvodu nutnosti věnovat zvýšenou pozornost nejvýznamnějším fragmentům pro překlad a ignorovat ostatní typy informací. Během procesu transformace se konečná reprezentace (stále existující ve zdrojovém jazyce) transformuje na reprezentaci stejné úrovně konkretizace v cílovém jazyce. Tyto dva pohledy se nazývají mezilehlé pohledy . Proces transformace reprezentace v cílovém jazyce na hotový text se skládá z podobných kroků prováděných v opačném pořadí.

Analýza a transformace

Než se získá konečný výsledek, je možné se uchýlit k různým metodám analýzy a transformace. Spolu se statistickými přístupy lze zvýšit počet generujících hybridních systémů. Vybrané metody a priority do značné míry závisí na návrhu samotného systému. Většina stávajících systémů však obsahuje alespoň následující kroky:

Typy transformací

Jedním z hlavních rysů systémů MT založených na transformaci je fáze, ve které je prostřední reprezentace textu ve zdrojovém jazyce přeložena do prostřední reprezentace textu v cílovém jazyce. Tento proces může probíhat na jedné z úrovní lingvistické analýzy nebo v intervalu mezi nimi. Úrovně jsou uvedeny níže:

Viz také

Poznámky

  1. Jurafský, Daniel; Martin, James H. (2009). Zpracování řeči a jazyka. Pearson. str. 906-908.