Společný hlas

společný hlas

Typ hlasový datový soubor [d] acrowdsourcing
Vývojář Nadace Mozilla
Jazyky rozhraní Vícejazyčný ( seznam jazyků )
První vydání 19. června 2017  ( 19-06-2017 )
Licence Creative Commons CC0
webová stránka commonvoice.mozilla.org
 Mediální soubory na Wikimedia Commons

Common Voice  je crowdsourcovaný projekt spuštěný Mozillou s cílem vytvořit bezplatnou databázi pro software pro rozpoznávání řeči . Projekt podporují dobrovolníci, kteří nahrávají ukázkové věty mikrofonem a poslouchají nahrávky ostatních uživatelů. Přepsané věty budou sestaveny do databáze hlasů dostupné pod licencí CC0 public domain . Tato licence zajišťuje, že vývojáři mohou používat tuto databázi pro hlasové aplikace bez omezení a nákladů.

Common Voice vznikl jako reakce na hlasové asistenty velkých společností, jako je Amazon Echo , Siri nebo Google Assistant .

Hlasová databáze

Databáze English Common Voice je po LibriSpeech druhou největší volně dostupnou hlasovou databází. V době, kdy byla 29. listopadu 2017 zveřejněna první data, zaznamenalo více než 20 000 uživatelů po celém světě 400 000 potvrzených návrhů s celkovou dobou trvání 500 hodin. [jeden]

V únoru 2019 byla vydána první várka jazyků. Zahrnoval 18 jazyků: angličtinu , francouzštinu , němčinu a mandarínskou čínštinu , ale také méně běžné jazyky, jako je velština a kabylština . Celkem zahrnoval téměř 1 400 hodin nahraných hlasových dat od více než 42 000 přispěvatelů. [2]

Poznámky

  1. Oznámení prvního vydání Open Source modelu rozpoznávání řeči a sady hlasových dat od společnosti Mozilla . blog mozilla.org (29. listopadu 2017). Staženo 14. února 2020. Archivováno z originálu dne 29. listopadu 2017.
  2. Mozilla aktualizuje datovou sadu Common Voice s 1 400 hodinami řeči v 18 jazycích . Venture Beat (28. února 2019). Získáno 14. února 2020. Archivováno z originálu dne 4. března 2019.