Po úpravě

Posteditace ( postiting ) je proces zpracování strojového překladu pro dosažení přijatelné kvality. Osoba, která provádí dodatečné úpravy, se nazývá posteditor . Pojem post-editace souvisí s pojmem pre-editace . Nejlepšího výsledku při překladu pomocí strojového překladu lze dosáhnout předúpravou zdrojového textu a následnou úpravou textu přijatého ze stroje. Následná úprava se liší od pouhé úpravy , což znamená zpracování textu vytvořeného člověkem. Text, který prošel fází následné úpravy, lze také odeslat editoru k opravě stylistických, gramatických a lexikálních chyb.

Posteditace zahrnuje opravu výsledků strojového překladu tak, aby kvalita výsledného produktu odpovídala požadavkům zákazníka. Lehká post-editace má za cíl učinit výsledný text srozumitelným; celý příspěvek -úprava pro zachování stylu originálu v překladu. S rozvojem strojového překladu se plné následné úpravy stávají alternativou k ručnímu překladu. Téměř všechny systémy počítačově podporovaného překladu (CAT) nyní podporují následné úpravy výsledků strojového překladu.

Posteditace a strojový překlad

Strojový překlad začaly ke svému zamýšlenému účelu používat koncem sedmdesátých let některé významné instituce jako Evropská komise a Panamerická zdravotnická organizace a později některé korporace jako Caterpillar a General Motors . První posteditační výzkum byl proveden v 80. letech a souvisel s těmito implementacemi. [1] V roce 1999 členové American Machine Translation Association (AMTA) a European Association for Machine Translation (EAMT) vytvořili Post-Editing Task Force, která měla vypracovat pokyny a školení. [2]

Po devadesátých letech pokroky ve výkonu počítače a konektivitě urychlily vývoj strojového překladu a umožnily jej implementovat prostřednictvím webového prohlížeče, mimo jiné jako bezplatný užitečný doplněk k hlavním vyhledávačům ( Google Translate , Bing Translator , Yahoo! Babel Ryby ). Větší akceptace nestandardního strojového překladu byla také doprovázena větší akceptací posteditací. Vzhledem k tomu, že poptávka po lokalizaci zboží a služeb roste tak rychle, že ji lidští překladatelé nedokážou uspokojit, dokonce ani s překladovými pamětmi a dalšími technologiemi pro správu překladů, očekávají průmyslové orgány, jako je Společnost uživatelů pro automatizaci překladů (TAUS), strojový překlad a následné úpravy. mnohem větší roli v příštích několika letech. [3]

Použití strojového překladu někdy vyžaduje předúpravu .

Snadné a úplné dodatečné úpravy

Ve studiích, které probíhaly v 80. letech 20. století, se rozlišovalo mezi stupni post-editace, které se nejprve nazývaly normální a rychlé, nebo plné a rychlé. Nejčastějšími termíny jsou odlehčené a úplné následné úpravy.

Lehká posteditace vyžaduje minimální zásah ze strany posteditora, protože jejím účelem je pomoci koncovému uživateli porozumět významu textu. Lehké následné úpravy se používají, když zákazník potřebuje dokument naléhavě a kvalita je na druhém místě.

Úplné následné úpravy zahrnují více zásahů, aby bylo dosaženo kvality, kterou klient požaduje. Má se za to, že výsledkem by měl být text, který je nejen srozumitelný, ale také stylisticky konzistentní s původním testem.

A co je nejdůležitější, při kompletní následné úpravě musí konečný text splňovat všechna kritéria kvality tradičního překladu. Má se však za to, že překladatelé vyžadují menší úsilí při přímé práci se zdrojovým textem než při následné úpravě strojového překladu. S rozvojem strojového překladu se situace může změnit. Pro některé jazykové páry a pro některé úkoly a s motory, které byly vyladěny pomocí kvalitativních dat specifických pro doménu, již někteří klienti po překladatelích žádají, aby místo překládání od začátku provedli dodatečné úpravy, protože věří, že kvalita bude podobná a náklady - níže.

Efektivita po editaci

Následné úpravy se používají, když není surový strojový překlad dost dobrý a lidský překlad není potřeba. Následná úprava se doporučuje, pokud může zvýšit produktivitu ručního překladu alespoň o faktor dva, v případě lehkých následných úprav dokonce o faktor čtyři.

Efektivitu post-editací je však obtížné předvídat. Podle různých studií bývá posteditování rychlejší než překládání od začátku, bez ohledu na jazykové páry nebo zkušenosti překladatelů. [4] Nepanuje však shoda v tom, kolik času (pokud vůbec nějaký) lze ušetřit následnými úpravami v praxi: zatímco průmysl hlásil asi 40% úsporu času, [5] některé akademické studie naznačují, že úspora času v reálném pracovní podmínky budou s největší pravděpodobností od 0 do 20 %. Specialisté také hlásí negativní nárůst produktivity tam, kde zpracování textu trvá déle než překlad od začátku. [6] [7]

Posteditace a trh překladatelských služeb

Zhruba o třicet let později je post-editování stále „rodící se profesí“. [8] Jaké vlastnosti by měl mít post-editor, není dosud zcela pochopeno. Posteditace je trochu, ale prolíná s překladem a úpravou. Většina lidí si myslí, že ideálním post-editorem by byl překladatel, který se chce naučit určité dovednosti, ale jsou tací, kteří si myslí, že bilingvista bez překladatelských zkušeností bude snazší učit. [9] Málo se ví o tom, kdo jsou skuteční posteditoři, zda jsou to profesionální překladatelé, zda pracují primárně jako zaměstnanci nebo OSVČ a za jakých podmínek. Mnoho profesionálních překladatelů nemá rádo dodatečné úpravy, částečně proto, že bývají placeny nižšími sazbami než běžné překlady, a Mezinárodní asociace profesionálních překladatelů (IAPTI) se k tomu vyjádřila obzvláště hlasitě. [deset]

Kvalita výstupu strojového překladu pro následné úpravy je vyšší, a proto vyžaduje menší úsilí po úpravách, když je strojový překlad zajišťován neuronovým, vertikálním nebo vlastním strojovým překladem. Zlepšení efektivity překladu lze měřit sledováním doby, kterou lingvisté potřebují k opravě strojových překladů ve stejném překladovém prostředí, jako je XTM Cloud [11] , Translation Management Systems a Computer-Aided Translation Systems , kde čas po úpravě a post -upravené skóre kvality lze porovnat.texty.

Neexistuje žádný jasný důkaz o tom, jak důležitá je v překladatelském průmyslu posteditace. Nedávná studie zjistila, že je nabízí 50 % poskytovatelů jazykových služeb, ale pro 85 % z nich představuje post-editace méně než 10 % jejich produktivity. [12] Memsource , cloudové prostředí pro automatický překlad, tvrdí, že více než 50 % překladů mezi angličtinou a španělštinou, francouzštinou a dalšími jazyky bylo vytvořeno pomocí překladové paměti spolu se strojovým překladem. [13] Posteditace se také provádí prostřednictvím crowdsourcingových portálů, jako je Unbabel , který měl k listopadu 2014 posteditovaných přes 11 milionů slov. [čtrnáct]

Odhady výkonu a objemu jsou každopádně hnacími cíli, protože pokroky ve strojovém překladu , tažené z velké části návratem post-editovaného textu do jeho enginů, budou znamenat, že čím více následných úprav se provede, tím vyšší bude kvalita strojového překladu. bude a tím bude rozšířenější.

Poznámky

  1. Senez, Dorothy. Posteditační služba pro uživatele strojového překladu v Evropské komisi (1998). Získáno 4. ledna 2021. Archivováno z originálu dne 20. ledna 2021.
  2. Allen, Jeffrey. "Post-editace", v Harold Somers (ed.). Počítače a překlady. Průvodce překladatele . (2003). Získáno 4. ledna 2021. Archivováno z originálu dne 17. ledna 2021.
  3. Web TAUS . Získáno 4. ledna 2021. Archivováno z originálu dne 23. února 2020.
  4. Green, Spence, Jeffrey Heer a Christopher D. Manning. Efektivita lidské post-editace pro jazykový překlad . ACM Human Factors in Computing Systems (2013). Získáno 4. ledna 2021. Archivováno z originálu dne 11. března 2020.
  5. Plitt, Mirko a Francois Masselot (2010). „Test produktivity následné úpravy statistického strojového překladu v typickém kontextu lokalizace“ (PDF) . Pražský bulletin matematické lingvistiky . 93 :7–16. DOI : 10.2478/v10108-010-0010-x . Archivováno (PDF) z originálu dne 20.09.2020 . Získáno 2021-01-04 . Použitý zastaralý parametr |deadlink=( nápověda )
  6. Marcello Federico, Alessandro Cattelan a Marco Trombetti (2012). „Měření produktivity uživatelů při strojovém překladu rozšířený počítačově podporovaný překlad“ (PDF) . Sborník příspěvků z desáté bienálové konference Asociace pro strojový překlad v Americe (AMTA), San Diego, CA, 28. října – 1. listopadu . Archivováno z originálu (PDF) dne 2017-03-07 . Získáno 2021-01-04 . Použitý zastaralý parametr |deadlink=( nápověda )
  7. Läubli, Samuel, Mark Fishel, Gary Massey, Maureen Ehrensberger-Dow a Martin Volk (2013). „Posouzení efektivity po úpravách v realistickém překladovém prostředí“ (PDF) . Sborník příspěvků z 2. workshopu posteditační technologie a praxe . str. 83-91. Archivováno z originálu (PDF) dne 23. 4. 2018 . Získáno 2021-01-04 . Použitý zastaralý parametr |deadlink=( nápověda )
  8. Web TAUS . Získáno 4. ledna 2021. Archivováno z originálu 12. srpna 2016.
  9. Hutchins, John. Úvahy o historii a současném stavu strojového překladu (odkaz není k dispozici) (1995). Získáno 4. ledna 2021. Archivováno z originálu dne 6. listopadu 2020. 
  10. Webové stránky IAPTI (stahovací odkaz) . Získáno 4. ledna 2021. Archivováno z originálu 7. února 2017. 
  11. Oficiální stránky XTM International . Získáno 4. ledna 2021. Archivováno z originálu dne 24. dubna 2020.
  12. Publikování v praxi. Zpráva TAUS. (březen 2010). Získáno 4. ledna 2021. Archivováno z originálu dne 22. ledna 2022.
  13. Web Memsource . Získáno 4. ledna 2021. Archivováno z originálu dne 25. září 2016.
  14. Unbabel spouští službu strojového překladu upravovanou člověkem, která má firmám pomoci jít globálně, lokalizovat zákaznickou podporu . Získáno 4. ledna 2021. Archivováno z originálu dne 27. února 2021.