Skotský korpus textu a řeči ( Skotský korpus textu a řeči ) je národní korpus skotského (germánského) jazyka , vytvořený v roce 2004 skupinou odborníků: členy English Language Project a Stella Project of the School of Critical Studium na University of Glasgow .
V posledních letech došlo ve Skotsku k významným změnám v politické situaci. Nové politické hnutí oživilo zájem o místní jazyky a kulturu. Ve Skotsku je jazykové dědictví jasné, izolované od ostatních. Moderní jazyková situace je zde velmi bohatá, protože zde koexistují skotská, anglická, gaelská a mnoho dalších jazykových komunit. Otázky, jako je zachování skotského jazyka, charakteristické rysy skotské angličtiny nebo používání nepůvodních jazyků, jako je čínština nebo urdština, však nemají dostatek údajů a jednoznačných odpovědí. A tato neinformovanost vytváří značné problémy pro ty, kteří pracují v oblasti vzdělávání nebo se o tuto problematiku jednoduše zajímají.
Moderní technologie umožnily ukládat a analyzovat velmi velké množství informací. A „SCOTS“ je první rozsáhlý projekt věnovaný výhradně jazykům Skotska. Poskytuje velký elektronický korpus psaných a mluvených textů pro jazyky této země. Korpus existuje od listopadu 2004 a po pravidelných aktualizacích a doplňování dosáhl v květnu 2007 počet slov na webu 4 milionů. Doufáme, že zájemcům o jazykovou rozmanitost Skotska poskytnou THE SCOTS odpovědi na všechny jejich otázky. Korpus má příležitost prozkoumat jazyky Skotska novými způsoby a překlenout mezery, které v současnosti existují v našich znalostech o nich.
Co se týče samotného pouzdra, působí dojmem moderního, mimořádně pohodlného, snadno ovladatelného pouzdra, neustále se vyvíjejícího a schopného zodpovědět mnoho otázek. Takže například každý, kdo má jakékoli připomínky, může svá přání poslat tvůrcům e-mailem, kde je zase mohou zvážit a provést příslušné úpravy.
Skotský korpus v současnosti obsahuje přes 1 100 psaných a mluvených textů v celkovém počtu přes 4 000 000 slov. 80 % jsou psané texty, 20 % jsou ústní texty, které jsou nám poskytovány ve formě pravopisného přepisu, synchronizované se zdrojem zvuku nebo videa.
Jednou z funkcí korpusu je zobrazování celých textů tam, kde je to možné, díky čemuž je korpus znatelně lidnatější. V některých případech může být kvůli autorskému právu zobrazena pouze část textu. V "The SCOTS" uvedené informace jsou převzaty ze zdrojů od roku 1945 do současnosti. SCOTS se snaží dosáhnout spravedlivosti pro širokou škálu textů, textů v různých jazycích, žánrech a rejstřících; prezentovat řečníky či spisovatele v maximální míře podle žánru, věku, pohlaví, profesních a geografických charakteristik.
Existují tři různé způsoby vyhledávání. Ti uživatelé, kteří se zajímají o statistické informace, jako je relativní četnost určitých slov v různých žánrech, mohou v tomto směru využít data Skotů. V závislosti na množství požadovaných informací si můžete vybrat rychlý, standardní nebo rozšířený typ vyhledávání.
Rychlé vyhledávání je nejjednodušší způsob, jak zjistit frekvenci použití slova, které vás zajímá, v různých zvukových souborech a textových dokumentech. V důsledku toho získáte frekvenci slova a formát souborů, ve kterých se používá.
Standardní vyhledávání umožňuje provádět některé jednoduché typy vyhledávání a také umožňuje prohlížet všechny dokumenty v korpusu.
Pokročilé vyhledávání poskytuje širší škálu možností než standardní. Zde jsou hlavní statistické informace, konkordant a mapy, na kterých jsou zobrazeny výsledky. Pokročilé vyhledávání je rozděleno podle vyhledávacích kritérií, která lze nastavit tak, aby omezovala vyhledávání slov v textech určitého režimu (ústní nebo písemný projev), žánru (korespondence, beletrie, rozhovory) nebo s určitou sadou kritérií (konverzace). po roce 2000, odborné vědecké články aj.) Dále). Výsledky různých vyhledávacích dotazů tak mohou být vzájemně konzistentní.
Při vyhledávání pomocí rychlého nebo standardního vyhledávání se dostanete na stránku s výsledky se dvěma hlavními částmi: souhrn výsledků vyhledávání a seznam dokumentů.
Kromě University of Glasgow se na projektu podíleli specialisté z následujících organizací:
V současné době je zdarma pouze vyhledávání korpusů.
Korpusová lingvistika | |
---|---|
Anglické korpusy |
|
ruskojazyčné korpusy |
|
Korpusy v jiných jazycích |
|
Organizace |