Překladová paměť
Překladová paměť (PP, English translation memory , TM, někdy také nazývaná „překladová jednotka“) je databáze obsahující sadu dříve přeložených textových segmentů .
Popis
Jeden záznam v databázi překladové paměti odpovídá segmentu nebo „ překladové jednotce “ ( anglicky translation unit ), která se obvykle bere jako jedna věta (méně často část složené věty nebo odstavce ). Pokud se překladová jednotka zdrojového textu přesně shoduje s překladovou jednotkou uloženou v databázi ( přesná shoda ), může být automaticky nahrazena do překladu . Nový segment se také může mírně lišit od segmentu uloženého v databázi (fuzzy shoda, anglicky fuzzy match ). Takový segment lze také nahradit v překladu, ale překladatel bude muset provést potřebné změny.
Kromě zrychlení procesu překladu opakujících se fragmentů a změn provedených v již přeložených textech (například nové verze softwarových produktů nebo změny v legislativě) zajišťují PP systémy také jednotnost překladu terminologie ve stejných fragmentech, které je zvláště důležitý pro technický překlad. Na druhou stranu, pokud překladatel pravidelně do svého překladu dosazuje přesné shody extrahované z překladové paměti bez kontroly nad jejich použitím v novém kontextu, může se kvalita přeloženého textu zhoršit.
V každém konkrétním PC systému jsou data uložena ve vlastním formátu (textový formát ve Wordfastu, databáze Access v Deja Vu), ale existuje mezinárodní standard TMX ( English Translation Memory eXchange format ), který je založen na XML a lze jej generovat téměř všemi PC systémy. Díky tomu mohou být vytvořené překlady použity v různých aplikacích, to znamená, že překladatel pracující s OmegaT může používat BT vytvořený v Trados a naopak.
Většina softwarových systémů alespoň podporuje tvorbu a používání uživatelských slovníků, tvorbu nových databází založených na paralelních textech ( English alignment ), stejně jako poloautomatickou extrakci terminologie z původních a paralelních textů.
Populární softwarové systémy PP
Podle recenzí používání PP systémů patří mezi nejoblíbenější systémy [1] [2] :
- memoQ
- XTM Cloud
- Zdroj paměti
- Deja Vu
- OmegaT (bezplatný systém licencovaný pod GNU GPL )
- SDLX [3]
- Trados
- SmartCAT (bezplatný software s vestavěným rozpoznáváním PDF)
- STAR Transit
- Wordfast (implementováno jako sada maker pro MS Word , nová verze 2009 je samostatná aplikace)
Anglická Wikipedie má seznam porovnávající možnosti různých systémů.
Standardy a formáty překladové paměti [4]
- TMX (Formát výměny překladové paměti - Výměna překladové paměti). Tento standard umožňuje výměnu mezi různými poskytovateli překladové paměti. TMX je mezi překladateli běžně používaný formát a je nejvhodnější pro import a export překladových pamětí. Nejnovější verze tohoto formátu, 1.4b, umožňuje obnovit původní dokumenty a jejich překlad ze souboru TMX.
- TBX (formát Termbase Exchange - termbase exchange). Tento formát LISA ( Lokalization Industry Standards Association ) je v současné době revidován a znovu vydáván podle ISO 30042 . Tato norma umožňuje výměnu terminologie, včetně podrobných lexikálních informací. Hlavní základ TBX definují normy: ISO 12620 , ISO 12200 a ISO 16642 . ISO 12620 poskytuje registr dobře definovaných „kategorií dat“ se standardizovanými názvy, které fungují jako typy datových prvků nebo předdefinované hodnoty. ISO 12200 (také známý jako MARTIF ) poskytuje rámec pro rámec TBX. ISO 16642 (také známý jako Terminological Markup Framework ) obsahuje strukturní metamodel pro terminologické značkovací jazyky obecně.
- SRX je navržen tak, aby zlepšil formát TMX a zefektivnil přenos překladových pamětí mezi programy. Možnost specifikovat pravidla segmentace, která byla použita v předchozím překladu, zlepšuje efektivitu identifikace segmentů v aktuálním textu s obsahem PG.
- GMX GILT je zkratka pro globalizaci, internacionalizaci, lokalizaci a překlad (Globalizace, internacionalizace , lokalizace , překlad). Standard GILT Metrics se skládá ze tří částí: GMX-V pro objemové metriky, GMX-C pro metriky složitosti a GMX-Q pro metriky kvality. Navrhovaný standard GILT Metrics si klade za cíl kvantifikovat rozsah práce a požadavky na kvalitu pro realizaci cílů GILT.
- OLIF je otevřený standard kompatibilní s XML , který se používá k výměně terminologických a lexikálních dat. Ačkoli byl původně používán jako způsob výměny lexikálních dat mezi soukromými lexikony strojového překladu, postupně se tento formát vyvinul v obecnější standard pro výměnu terminologie.
- XLIFF (XML Localization Interchange File Format ) je navržen jako jediný formát souboru pro výměnu, který je rozpoznán veškerým lokalizačním softwarem. XLIFF je nejlepší způsob výměny informací ve formátu XML v dnešním překladatelském průmyslu. Některé nástroje používají proprietární formáty XLIFF, které neumožňují otevření souborů v nich vytvořených v jiných programech.
- TransWS (Translation Web Services - překladové webové služby), definuje požadované parametry pro volání webových služeb při odesílání a přijímání souborů a zpráv souvisejících s lokalizačními projekty. Byl koncipován jako nasazený systém pro automatizaci procesu lokalizace pomocí služeb na internetu .
- xml:tm , tento přístup k překladové paměti je založen na konceptu textové paměti, která umožňuje kombinaci autorské paměti a překladové paměti. Formát xml:tm byl předán Lise OSCAR od XML-INTL .
Výhody a nevýhody
Výhody
- Snížení času a objemu práce překladatele.
- Zlepšení konzistence překladů, zvláště když skupina překladatelů pracuje na stejném projektu.
- Zvyšování zisku zvýšením produktivity překladatele, skupiny překladatelů.
- Zkvalitňování služeb zvýšením přesnosti a jednotnosti překladů termínů, zejména v odborných textech.
Nevýhody
- Může udělat překlad "suchější"; samotná podstata textu se ztrácí, pokud překlad pomocí překladové paměti provádí překladatel s nízkou kvalifikací.
- Často neexistuje žádná spojitost mezi větou/textem navrženým programem se sousedními větami as textem jako celkem.
- Originál musí být v elektronické podobě.
- Jedna neodhalená chyba se může rozšířit na celý projekt.
- Je potřeba se naučit pracovat v samotném programu a při změně zaměstnání třeba vícekrát (pokud zaměstnavatelé používají různé programy TM).
- Nevhodné pro všechny typy textů.
- Vysoká cena licencovaného softwaru.
Viz také
Poznámky
- ↑ Viz strana 26 v Imperial College London Translation Memories Survey 2006 Archived 2007-03-25. (PDF)
- ↑ ITI Translation Memory Survey, 2007 (downlink) (downlink k 13-05-2013 [3456 dnů])
- ↑ V důsledku akvizice společnosti Trados v červnu 2005 britskou společností SDL International v roce 2006 se objevil jediný produkt TRADOS SDLX 2006
- ↑ Standardy LISA (Lokalization Industry Standards Association).
Literatura
- Grabovsky VN Technology Překladová paměť // Bridges. Časopis překladatelů. 2004. č. 2. - S. 57-62.
Odkazy