Neurální strojový překlad Google

Google Neural Machine Translation  (GNMT) je systém  Neural Machine Translation (NMT) vyvinutý společností Google a představený v listopadu 2016, který využívá  umělou neuronovou síť ke zlepšení plynulosti a přesnosti překladu v Google Translate . [1] [2] [3]

GNMT zlepšuje kvalitu překladu pomocí strojového překladu založeného na příkladech (EBMT), ve kterém se systém „učí z milionů příkladů“. [2] Navrhovaná architektura učení systému GNMT byla poprvé testována ve více než stovce jazyků podporovaných Překladačem Google. [2] Díky rozsáhlé struktuře typu end-to-end se systém postupem času učí vytvářet lepší a přirozenější překlady. [1] GNMT je schopen překládat celé věty, nikoli části. [1] Síť GNMT může provádět mezijazykový strojový překlad kódováním sémantiky věty namísto memorování překladů jednotlivých frází. [2] [4]

Historie

Projekt Google Brain vytvořili v roce 2011 v „tajné výzkumné laboratoři Google X“ [5] Jeff Dean , zaměstnanec společnosti Google, Greg Corrado, výzkumník společnosti Google, a Andrew Ng , profesor počítačových věd na Stanfordské univerzitě . [6] [7] [8] Eunova práce byla základem jednoho z největších technologických průlomů ve společnostech Google a Stanford. [5]

V září 2016 výzkumná skupina Google oznámila vývoj překladového systému GNMT a v listopadu začal Google Translate používat neuronový strojový překlad (NMT) namísto předchozích statistických metod (SMT) [1] [9] [10] [ 11] , který byl používán od října 2007 v našem vlastním uzavřeném SMT systému. [12] [13]

Systém NMT uvnitř Google Translate využívá velkou umělou neuronovou síť vhodnou pro hluboké učení . [1] [2] [3] Zkoumáním milionů příkladů zlepšuje GNMT kvalitu překladu pomocí širšího kontextu k odvození nejvhodnějšího překladu. Výsledek je pak přeskupen a přizpůsoben tak, aby odpovídal gramatice lidského jazyka. GNMT si nevytvořilo svůj vlastní vnitřní univerzální jazyk, ale spíše se snažilo najít společné rysy mezi mnoha jazyky, které by měly zajímat spíše psychology a lingvisty než počítačové vědce. [14] V roce 2016 byl v obou směrech zahrnut nový překladač pro devět jazyků: angličtina, francouzština, němčina, španělština, portugalština, čínština, japonština, korejština a turečtina. [15] V březnu 2017 byly přidány další tři jazyky: ruština, hindština a vietnamština. [16] Ve stejném měsíci byla přidána podpora pro hebrejštinu a arabštinu s pomocí komunity Google Translate. [17] Další podpora byla přidána na konci dubna 2017 pro devět indických jazyků, konkrétně hindštinu, bengálštinu, maráthštinu, gudžarátčinu, pandžábštinu, tamilštinu, telugštinu, malajálamštinu a kannadu. [osmnáct]

Jazyky podporované GNMT

Níže je uveden seznam jazykových párů, které k překladu používají model Google Neural Machine Translation (NMT). Od července 2017 je pro všechny jazyky podporován pouze překlad do az angličtiny: [19]

jazykový pár Jazykové kódy
jeden afrikánština <-> angličtina af<->en
2 arabština <-> angličtina ar<->en
3 bulharština <-> angličtina bg<->en
čtyři Čínština (zjednodušená) <-> angličtina zh-CN <->en
5 Čínština (tradiční) <-> angličtina zh-TW<->en
6 chorvatština <-> angličtina hr<->en
7 čeština <-> angličtina cs<->en
osm dánština <-> angličtina da<->en
9 holandština <-> angličtina nl<->en
deset francouzština <-> angličtina fr<->en
jedenáct Němčina <-> angličtina de<->en
12 řečtina <-> angličtina el<->en
13 hebrejština <-> angličtina iw<->en
čtrnáct hindština <-> angličtina hi<->en
patnáct islandština <-> angličtina is<->en
16 indonéština <-> angličtina id<->en
17 italština <-> angličtina it<->en
osmnáct japonština <-> angličtina ja<->en
19 korejština <-> angličtina ko<->en
dvacet norština <-> angličtina no<->en
21 polština <-> angličtina pl<->en
22 portugalština <-> angličtina pt<->en
23 rumunština <-> angličtina ro<->en
24 ruština <-> angličtina ru<->en
25 slovenština <-> angličtina sk<->en
26 Španělština <-> Angličtina es<->en
27 švédština <-> angličtina sv<->en
28 thajština <-> angličtina th<->en
29 turečtina <-> angličtina tr<->en
třicet vietnamština <-> angličtina vi<->en

Přímý překlad

Systém GNMT je prý lepší než předchozí verze Google Translate v tom, že umí provádět „přímý překlad“, tzn. přímo překládat z jednoho jazyka do druhého (například z japonštiny do korejštiny). [2] Dříve překladač Google nejprve překládal ze zdrojového jazyka do angličtiny a poté z angličtiny do cílového jazyka namísto přímého překladu z jednoho jazyka do druhého. [čtyři]

Viz také

Odkazy

  1. 1 2 3 4 5 Barak Turovsky (15. listopadu 2016), Nalezeno v překladu: Přesnější, plynulejší věty v Google Translate , < https://blog.google/products/translate/found-translation-more-accurate-fluent -sentences-google-translate/ > . Získáno 11. ledna 2017. Archivováno 7. dubna 2017 na Wayback Machine 
  2. 1 2 3 4 5 6 Mike Schuster, Melvin Johnson a Nikhil Thorat (22. listopadu 2016), Zero-Shot Translation with Google's Multilingual Neural Machine Translation System , < https://research.googleblog.com/2016/11/ zero-shot-translation-with-googles.html > . Získáno 11. ledna 2017. Archivováno 10. července 2017 na Wayback Machine 
  3. 1 2 Gil Fewster (5. ledna 2017), Ohromující oznámení o umělé inteligenci od společnosti Google, které jste pravděpodobně přehlédli , < https://medium.freecodecamp.com/the-mind-blowing-ai-announcement-from-google- že-jste-pravděpodobně-minul-2ffd31334805#.msj1mdvbh > . Získáno 11. ledna 2017. Archivováno 31. května 2017 na Wayback Machine 
  4. 12 Boitet , Christian; Blanchon, Herve; Seligman, Mark; Bellynck, Valérie MT na webu a pro web (PDF)  (odkaz není k dispozici) (2010). Datum přístupu: 1. prosince 2016. Archivováno z originálu 29. března 2017.
  5. 1 2 Robert D. Hof. Čínský internetový gigant začíná snít: Baidu je stálicí online života v Číně, ale chce se stát globální velmocí. Může jeden z předních světových výzkumníků umělé inteligence pomoci postavit se největším společnostem ze Silicon Valley? . Technology Review (14. srpna 2014). Staženo 11. ledna 2017. Archivováno z originálu 8. ledna 2020.
  6. Používání rozsáhlých simulací mozku pro strojové učení a AI . Oficiální blog Google (26. června 2012). Získáno 26. ledna 2015. Archivováno z originálu 23. srpna 2020.
  7. Velký projekt hlubokých neuronových sítí společnosti Google . Získáno 25. října 2015. Archivováno z originálu 16. února 2019.
  8. Markoff, John Kolik počítačů k identifikaci kočky? 16 000 . New York Times (25. června 2012). Datum přístupu: 11. února 2014. Archivováno z originálu 9. května 2017.
  9. Katyanna Quach (17. listopadu 2016), neuronová síť Google se učí překládat jazyky, na které nebyla školena: Strojový překlad poprvé použil skutečné přenosové učení , < https://www.theregister.co.uk/ 2016/ 17. 11./googles_neural_net_translates_languages_not_trained_on > . Získáno 11. ledna 2017. Archivováno 22. září 2017 na Wayback Machine 
  10. Lewis-Kraus, Gideon . The Great AI Awakening , The New York Times  (14. prosince 2016). Archivováno z originálu 5. května 2017. Staženo 11. ledna 2017.
  11. Le, Quoc; Schuster, Mike Neuronová síť pro strojový překlad, ve výrobním měřítku . Výzkumný blog Google . Google (27. září 2016). Získáno 1. prosince 2016. Archivováno z originálu 7. května 2018.
  12. Google přechází na svůj vlastní překladový systém Archivováno 29. dubna 2017 na Wayback Machine , 22. října 2007
  13. Barry Schwartz. Google Translate Drops SYSTRAN pro domácí překlad . Země vyhledávačů (23. října 2007). Staženo 4. 5. 2017. Archivováno z originálu 21. 5. 2017.
  14. Chris McDonald (7. ledna 2017), komentář k článku Gila Fewstera z 5. ledna v Atlantiku , < https://medium.com/@chrismcdonald_94568/ok-slow-down-516f93f83ac8#.l0ti3ct0b > . Získáno 11. ledna 2017. Archivováno 22. června 2017 na Wayback Machine 
  15. Turovský, Barak Nalezeno v překladu: Přesnější, plynulejší věty v Google Translate . Blog Google pro klíčová slova . Google (15. listopadu 2016). Získáno 1. prosince 2016. Archivováno z originálu 14. dubna 2020.
  16. Turovský, Barak Kvalitnější neuronové překlady pro spoustu dalších jazyků . Blog Google pro klíčová slova . Google. Získáno 6. března 2017. Archivováno z originálu dne 7. března 2017.
  17. Novet, Jordánsko Google nyní poskytuje překlady do arabštiny a hebrejštiny založené na umělé inteligenci . Venture Beat (30. března 2017). Archivováno z originálu 1. ledna 2020.
  18. Turovsky, Barak Učinit internet více inkluzivní v Indii . Klíčové slovo (25. dubna 2017). Archivováno 11. listopadu 2020.
  19. Jazyková podpora překladového rozhraní API . Google Cloud Platform (4. května 2017). Archivováno z originálu 16. září 2017.

Externí odkazy