Lobanov, Boris Metoděvič

Boris Lobanov
Datum narození 18. července 1938( 1938-07-18 ) [1] (ve věku 84 let)
Místo narození
Země  SSSR , Bělorusko 
Vědecká sféra počítačová analýza , syntéza řeči , rozpoznávání řeči
Místo výkonu práce Společný ústav pro problémy informatiky Národní akademie věd Běloruska
Alma mater Minsk Radio Engineering Institute
Akademický titul Doktor technických věd
Ocenění a ceny Odznak „ Čestný radiotelegrafista SSSR “; 1 stříbrná a 2 bronzové medaile VDNKh SSSR ; Jubilejní medaile „ Na počest 80. výročí Národní akademie věd Běloruska “

Boris Methodievich Lobanov (narozený 18. července 1938) je sovětský a běloruský vědec v oboru technické kybernetiky [2] . Rozvinul teoretické základy a metody analýzy, syntézy a rozpoznávání řeči . Vyvinul první zařízení v SSSR pro syntézu ruské a běloruské řeči [3] . Autor více než 300 vědeckých prací o problémech analýzy, rozpoznávání a syntézy řeči [4] [5] [6] . Autor tří kapitol první příručky o umělé inteligenci , vydané v SSSR , věnované systémům řečové komunikace [7] . V této oblasti učinil řadu vynálezů [8] .

Životopis

Boris Methodievich Lobanov se narodil 18. července 1938 ve městě Prokopyevsk (na území moderní Kemerovské oblasti ). V roce 1948 se rodina přestěhovala do Minsku na trvalé bydliště [9] .

Vzdělávání a raný výzkum

Již ve škole se Boris Lobanov začal zajímat o navrhování rádiových zařízení: v 6. ročníku sestrojil své první detektorové rádio, v 8. - trubkové a v 10. ročníku navrhl vlastní VHF radiostanici. V roce 1955 absolvoval střední školu č. 13 v Minsku a nakonec se rozhodl pro volbu své budoucí specializace [10] [9] .

V té době v Minsku neexistovala žádná vysoká škola vhodného profilu a Boris Lobanov vstoupil na oddělení radiokomunikací a vysílání na Minské elektrotechnické škole spojů . Na technické škole pokračoval jako radioamatér, organizoval první republikové rozhlasové soutěže v „honbě na lišku“, získal I. kategorii v radiosportu a certifikát radiového pozorovatele pro signály první družice Země [9] .

Po absolvování technické školy v roce 1958 získal Boris Lobanov diplom s vyznamenáním, ale místo aby pokračoval ve studiu na univerzitě, byl povolán k vojenské službě v sovětské armádě jako starší rozhlasový mistr ( Petrozavodsk ). Již v roce 1959, s dostatečným speciálním výcvikem a rádiovou dílnou dobře vybavenou přístroji, začal Boris Lobanov studovat řeč, kterou studoval s mikrofonem a osciloskopem. Zároveň vstoupil do korespondence se známým vědcem, profesorem L. A. Chistovichem , od kterého získal řadu cenných tipů pro provádění výzkumu řeči. V Lobanově deníku se zachoval dokumentární záznam z 25. října 1959: " Fonemofon vede k fonografu ." Z tohoto příspěvku je patrné, že již tehdy si Boris Lobanov uvědomil a určil obecnou strategii svého budoucího výzkumu řeči: „ K rozpoznání řeči syntézou “, které se bez výjimky držel po celou dobu své další vědecké činnosti [ 9] .

Po absolvování armády v roce 1961 nastoupil Boris Lobanov do Minského radiotechnického institutu (MRTI) s titulem v oboru radiotechnika a již v prvním ročníku se stal předsedou studentské vědecké společnosti institutu, v jejímž rámci spolu se skupinou studentů, začal vyvíjet analyzátor řečového signálu. V roce 1965, jako student čtvrtého ročníku, Lobanov publikoval své první čtyři vědecké práce o analýze řečových signálů, které byly počítány jako absolventský projekt, což mu umožnilo dokončit institut v předstihu. Metoda navržená v těchto pracích pro zlepšení hlavních parametrů paralelní spektrální analýzy byla poté efektivně využita při vývoji systémů pro rozpoznávání řeči [9] .

Po absolvování MRTI v roce 1965 nastoupil Boris Lobanov na postgraduální školu institutu a pokračoval v práci na úkolech primární analýzy řečových signálů pro systémy rozpoznávání a syntézy řeči. V roce 1968 ukončil postgraduální studium a obhájil disertační práci na téma „ Některé problémy analýzy řečových signálů “ [11] .

Vědecká činnost v 60. a 70. letech

Ještě na postgraduální škole zorganizoval B. M. Lobanov v roce 1966 na katedře rádiových přijímačů MRTI samonosnou vědeckou laboratoř pro analýzu a syntézu řečových signálů, jejíž mnozí zaměstnanci se výzkumem řeči věnovali po dlouhou dobu. V laboratoři pod vedením Lobanova byl poprvé v SSSR navržen spektrální analyzátor pro výzkum řeči " Spektr-1 " a zařízení pro intonografický výzkum řeči " Intonograf ". Současně laboratoř prováděla výzkum metod automatického zvýraznění fonetických rysů zvuků řeči, jako jsou „hlučné“, „znělé“, „samohlásky“, „výbušné“. Na jejich základě bylo poprvé v SSSR vyvinuto zařízení pro rozpoznávání řečových povelů „ Sesam-1 “, které bylo oceněno stříbrnou medailí VDNKh SSSR [11] .

V druhé polovině 60. let se B. M. Lobanov podílel na řešení zásadního problému rozpoznávání řeči spojeného s nelineárním zkreslením časové osy v procesu vyslovování hlásek řeči. Tento druh zkreslení způsobil značné potíže při porovnávání mluvených slov s jejich standardy v procesu rozpoznávání řeči. V roce 1968, nezávisle a téměř současně, G.S. Slutsker ( Moskevský státní výzkumný ústav rozhlasu ) a T.K. Vintsyuk ( Ústav kybernetiky Akademie věd Ukrajinské SSR ) navrhli použít k řešení tohoto problému metodu dynamického programování (metoda DP) . [11] . V roce 1969 publikoval B. M. Lobanov ve spolupráci s G. S. Slutskerem článek, ve kterém byl uveden další vývoj metody DP pro mimořádně důležitý praktický případ, kdy jsou hranice rozpoznaného slova neznámé, tedy k vyřešení problému detekce a rozpoznání kombinací zvuků v nepřetržitém hlasovém signálu. Metoda DP byla následně široce uznávána zahraničními výzkumníky [12] .

Další rok po úspěšné obhajobě disertační práce, v listopadu 1969, byl B. M. Lobanov vyslán na vědeckou stáž na dobu 10 měsíců do Velké Británie . B. M. Lobanov absolvoval stáž na problematice analýzy řečových signálů pod vedením profesora K. Cheriho na Imperial College of Science and Technology ( Londýn ) a na problematice syntézy řeči - pod vedením profesora R. Lorenze na University of Edinburgh [12] .

Po absolvování stáže ve VB byl hlavním směrem vědecké práce B. M. Lobanova vývoj metod a zařízení pro syntézu řeči z textu. Ještě během stáže na Edinburské univerzitě prováděl úspěšné experimenty se syntézou ruských řečových zvuků, které umožnily položit základy formantové syntézy řeči z fonematického textu. V důsledku toho byl již v roce 1972 pod vedením B. M. Lobanova vyvinut první syntetizátor ruské řeči v SSSR „ Fonemofon-1 “, který byl oceněn dvěma medailemi VDNKh SSSR [12] . „ Fonemofon “ dokázal nejen syntetizovat ruskou řeč, ale také číst zadaný text v několika cizích jazycích a také syntetizovat zpěv [13] .

V roce 1973 získal B. M. Lobanov titul „ Senior Researcher “. V souvislosti s otevřením vyhlídek na zavedení řečových technologií do komunikačního průmyslu upozornilo vedení moskevské pobočky Ústředního výzkumného ústavu spojů (TsNIIS) na práci B. M. Lobanova na syntéze ruské řeči. V důsledku toho byla v roce 1974 na základě Minského oddělení Ústředního výzkumného ústavu otevřena Laboratoř řečových systémů, kterou na dalších 15 let vedl B. M. Lobanov. Hlavním směrem práce laboratoře byl vývoj metod a tvorba systémů pro automatické rozpoznávání a syntézu řeči se zaměřením na jejich praktické využití v oboru " Komunikace " [14] .

Spolu s praktickou činností při tvorbě systémů řečového dialogu věnoval B. M. Lobanov velkou pozornost vědecké a organizační práci. V roce 1976 zorganizoval a uspořádal v Minsku celounijní školní seminář „ Automatické rozpoznávání sluchových vzorů “ (ARSO), kterého se zúčastnilo více než 200 účastníků ze 75 různých vědeckých organizací SSSR. Školní seminář ARSO se konal pravidelně (každé dva roky) až do roku 1991 a od roku 1976 byl B. M. Lobanov členem stálého programového výboru ARSO. Na semináři byl účastníkům ARSO v Minsku poprvé ukázán prototyp telefonického dotazovacího systému se syntetizovanou hlasovou odezvou [15] .

V roce 1978 byl Lobanov na pozvání francouzských vědců vyslán na dvouměsíční služební cestu do Francie za účelem vědecké práce a seznámení se s prací předních vědeckých center pro výzkum řeči: univerzit v Paříži , Nancy a Aix-en-Provence , stejně jako řečové laboratoře v Toulouse , Grenoble , Orsay a Lanion. Během svého pobytu ve Francii se Lobanov zúčastnil konference o hlasové komunikaci a byl přijat za člena Akustické společnosti frankofonních zemí [15] .

V roce 1979 představil B. M. Lobanov na světové výstavě " Telecom-79 " v Ženevě nový model řečového syntezátoru - " Fonemofon-3 ", oceněný diplomem výstavy. Slavný spisovatel sci-fi Arthur Clark , který navštívil pavilon SSSR a seznámil se se syntezátorem řeči, napsal do knihy hostů: „ Předvídali jste mé fantazie z filmu „ Vesmírná odysea 2001[15] [16] a Švýcarský list Obozrevatel zveřejnil článek: „ Nyní se Rusové učí cizí jazyky s počítačem, který mluví . Za soubor prací o vytvoření řečových syntezátorů v roce 1981 získal Lobanov titul „ Čestný radiooperátor SSSR “ [15] .

Vědecká činnost v 80. letech

Počátkem 80. let začal B. M. Lobanov rozvíjet jím navrženou metodu artikulačně-formantové syntézy řeči, která byla základem nové generace řečových syntetizérů. V roce 1983 vydal B. M. Lobanov ve spolupráci s V. Ya. Kucherovem knihu „ Syntetizovaná řeč v systémech řazení do front “ [17] .

Začátkem roku 1984 vytvořil Lobanov konečnou formulaci a provedl teoretický a experimentální vývoj jednotného linguoakustického přístupu k řešení problému syntézy řeči z textu. Vyvinuté metody a algoritmy pro jejich implementaci se staly základem jeho doktorské disertační práce „ Výzkum a vývoj metod pro automatickou syntézu řeči z fonematického textu “, kterou Lobanov úspěšně obhájil v roce 1984 na Ústavu elektroniky a výpočetní techniky Akademie věd ČR. lotyšské SSR v Rize . Později byly získané teoretické a experimentální výsledky adaptovány pro systémy syntézy řeči v jiných evropských jazycích. Konkrétně v roce 1987 byla vyvinuta anglická verze syntezátoru, která byla předvedena na Světovém kongresu fonetických věd a byla vysoce oceněna anglicky mluvícími odborníky [18] .

Osmdesátá léta byla obdobím vzniku prvních průmyslových systémů pro syntézu a rozpoznávání řeči a jejich širokého zavedení do komunikačního průmyslu SSSR za přímé účasti B. M. Lobanova a jeho kolegů - B. V. Pančenka, N. P. Degtyareva, V. P. Afanasiev. V kaliningradském softwaru " Quartz " byl proveden experimentální návrh s následnou sériovou výrobou řečového terminálu Mars - 1 , který obsahuje subsystémy pro rozpoznávání řeči " Sesam " a syntézu řeči " Fonemofon " . Na základě hlasového terminálu Mars-1 byl vyvinut systém pro automatické informování účastníků dálkové telefonní sítě (AIAMTS) o dluhu za hovory. Systém AIAMTS byl úspěšně implementován a dlouhodobě provozován v řadě velkých měst: Minsk , Novosibirsk , Alma-Ata , Frunze , Petropavlovsk-Kamčatskij . Další systém - systém sledování parametrů vybavení telefonních a radiostanic s rychlým vyrozuměním služebního personálu o vzniklých problémech - byl zaveden na automatických telefonních ústřednách Minsk, Moskva a Zelenograd a také v běloruském republikovém rozhlase. reléová stanice RTS-5 [19] .

Laboratoř rozpoznávání a syntézy řeči

V roce 1988 nastoupil B. M. Lobanov na pozvání ředitele ústavu V. S. Tanaeva do Ústavu technické kybernetiky Akademie věd BSSR a vedl nově vytvořenou Laboratoř rozpoznávání a syntézy řeči. Přechod B. M. Lobanova na Ústav technické kybernetiky se časově shodoval se vznikem prvních osobních počítačů (PC) a pracovní plány laboratoře zahrnovaly témata související s vybavením PC systémy pro vstup a výstup řeči. Formantová metoda, která dlouho hrála klíčovou roli v systémech převodu řeči na text, nebyla pro tento účel vhodná kvůli potřebě velkého množství výpočtů v reálném čase. V roce 1989 navrhl B. M. Lobanov novou mikrovlnnou metodu (MW metodu) pro syntézu řečových signálů, při které byla místo výpočtu formantových kmitů použita předem připravená sada mikrovln přirozeného řečového signálu. Metodu MW zavedl pod vedením B. M. Lobanova pracovník laboratoře A. N. Ivanov v syntezátoru Fonemofon-5 . Kompaktnost jeho softwaru (pouze 64 Kb) umožnila vybavit syntézou řeči první IBM PC / XT a dokonce i domácí PC EC-1840 . Syntetizátor řeči byl žádaný v mnoha praktických aplikacích nevidomými uživateli. Později byly na základě metody MW vyvinuty verze pro český a polský jazyk a také autonomní jednodeskový modul syntézy řeči, jehož ukrajinská verze nějakou dobu fungovala na lince kyjevského metra [20 ] .

Akademické tituly a tituly

Hlavní publikace

Monografie

Disertační práce

Některé články v časopisech a sbornících z konferencí

Poznámky

  1. Běloruská encyklopedie  (Bělorusko) - Běloruská encyklopedie pojmenovaná po Petru Brockim , 1996.
  2. Běloruská encyklopedie = Běloruská encyklopedie / Redkol. G.P. Pashkov a další - Minsk : Běloruská encyklopedie pojmenovaná po Petru Brovkovi . - T. 9. - S. 80. - 560 str.
  3. Lobanov B. Historie a vývoj vědy a techniky řeči v SSSR  (anglicky)  // Eds. D. Mehnert, D. Kordon, M. Wolff Systemtheorie Signalverarbeitung Sprachtechnologie: Rüdiger Hoffmann zum 65. Geburtstag. - Drážďany: TUDpress, 2013. - S. 327-338 . — ISBN 9783944331195 .
  4. Boris  Lobanov . ResearchGate _ _ Staženo: 8. října 2018.
  5. B.M. Labanau  (bělorusky) . Laboratoř rozpoznávání a syntézy řeči . Získáno 8. října 2018. Archivováno z originálu 11. září 2018.
  6. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 .
  7. Umělá inteligence: Komunikační systémy a expertní systémy, 1990 .
  8. Patenty autora LOBANOV BORIS MEFODIEVICH . " najítpatent.ru ". Staženo: 8. října 2018.
  9. 1 2 3 4 5 Boris Methodievich Lobanov: u příležitosti jeho 70. narozenin, 2008 , str. 7.
  10. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 , str. 3.
  11. 1 2 3 Boris Metoděvič Lobanov: k jeho 70. narozeninám, 2008 , str. osm.
  12. 1 2 3 Boris Metoděvič Lobanov: k jeho 70. narozeninám, 2008 , str. 9.
  13. Phonemophone – Syntetizátor lidské řeči vytvořený v Institutu komunikací. 1976 . Staženo: 18. března 2019.
  14. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 , str. 9-10.
  15. 1 2 3 4 Boris Metoděvič Lobanov: u příležitosti jeho 70. narozenin, 2008 , str. deset.
  16. Lobanov, B.M. K historii rusky mluvících strojů (Od hlasu robota k osobnímu klonu lidského hlasu)  // Zprávy o umělé inteligenci. - Moskva , 2003. - č. 1 (55) . - str. 3-9 .
  17. Syntetizovaná řeč v systémech řazení, 1983 .
  18. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 , str. 10-11.
  19. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 , str. jedenáct.
  20. Boris Methodievich Lobanov: k jeho 70. narozeninám, 2008 , str. 11-12.
  21. Výzkum a vývoj metod pro automatickou syntézu řeči z fonematického textu . " dslib.net ". Získáno 9. října 2018. Archivováno z originálu 30. června 2018.

Literatura