Statistický strojový překlad

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 18. června 2021; kontroly vyžadují 2 úpravy .

Statistický strojový překlad (  SMT ) je   typ strojového překladu, kde je překlad generován na základě statistických modelů, jejichž parametry jsou odvozeny z analýzy dvojjazyčných textových korpusů (textových korpusů).

Statistický strojový překlad je v kontrastu se systémy strojového překladu založeného na pravidlech (RBMT) a na příkladech založených na MT (EBMT).

První nápady na statistický strojový překlad publikoval Warren Weaver v roce 1949. "Druhá vlna" - počátek 90. ​​let, IBM . "Třetí vlna" - Google, Microsoft, Language Weaver, Yandex ...

Vývojáři systémů strojového překladu zavádějí některá „průřezová“ pravidla pro zlepšení kvality, čímž přeměňují čistě statistické systémy na hybridní strojový překlad . Přidání některých pravidel, tedy vytváření hybridních systémů, poněkud zlepšuje kvalitu překladů, zvláště když množství vstupních dat použitých pro sestavení indexu strojového překladače je nedostatečné.

Základy

Výhody SMT

Nevýhody SMT

Jazykové modely

Systémy statistického překladu jako jazykový model používají především různé modifikace n-gramového modelu, který říká, že „ gramatickost “ výběru dalšího slova při tvorbě textu je určena pouze tím, jaká (n-1) slova jsou před ním [ 1] .

Statistické modely překladu

Viz také

Zdroje

  1. Statistický systém strojového překladu (Distribuovaný statistický systém strojového překladu) | Ilya (w-495) Nikitin - Academia.edu . Získáno 19. března 2013. Archivováno z originálu 22. března 2013.
  2. Archivovaná kopie (odkaz není dostupný) . Získáno 17. března 2013. Archivováno z originálu dne 3. listopadu 2013. 
  3. Zdroj . Získáno 17. března 2013. Archivováno z originálu dne 3. listopadu 2013.
  4. Zdroj . Získáno 17. března 2013. Archivováno z originálu dne 26. května 2013.
  5. Archivovaná kopie (odkaz není dostupný) . Získáno 17. března 2013. Archivováno z originálu 3. února 2013. 
  6. Archivovaná kopie (odkaz není dostupný) . Získáno 17. března 2013. Archivováno z originálu dne 26. května 2013.