Řečový korpus ( zvukový korpus ) je databáze zvukových souborů a přepisů textů, typ korpusu textů . V řečových technologiích se řečové korpusy používají mimo jiné k vytváření akustických modelů (které pak lze použít v motorech pro rozpoznávání řeči ). V lingvistice se korpusy řeči používají pro výzkum fonetiky , dialektologie , konverzační analýzy a dalších polí.
Existují dva typy řečových korpusů:
1. Základy dobře čitelných textů, včetně:
2. Základy zvukových záznamů spontánní řeči - včetně:
Speciálním druhem řečových korpusů je databáze textů namluvených lidmi, kteří nejsou rodilými mluvčími , které obsahují řeč s cizím přízvukem .
zpracování přirozeného jazyka | |
---|---|
Obecné definice | |
Analýza textu |
|
Odkazování |
|
Strojový překlad |
|
Identifikace a sběr dat | |
Tematický model | |
Peer review |
|
Rozhraní přirozeného jazyka |