Webometrie ( angl. webometrics ) je úsek informatiky , v rámci kterého jsou zkoumány kvantitativní aspekty návrhu a využití informačních zdrojů, struktur a technologií ve vztahu k World Wide Web [1] .
Termín zavedli Tomas C. Almind a Peter Ingwersen v roce 1997 v Informetric analysis on the World Wide Web: Methodological approachs to "webometrics" [2] .
Webometrie je součástí infometriky .
Od poloviny 90. let se Cybermetrics Lab zabývá webometrickým výzkumem a hodnocením webových stránek univerzit po celém světě .
Webometrie zahrnuje čtyři hlavní oblasti výzkumu:
Webometrie je jednou ze součástí infometriky. Webometrie navíc souvisí s bibliometrií a se scientometrií se do jisté míry překrývá [1] .
Infometrie je vědní disciplína, jejímž předmětem je kvantitativní měření uložených a používaných informací [4] .
Bibliometrie je vědní disciplína, která se zabývá studiem dokumentů na základě kvantitativní analýzy primárních a sekundárních zdrojů informací pomocí formalizovaných metod s cílem získat data o efektivitě, dynamice, struktuře a zákonitostech rozvoje studovaných oblastí [4 ] .
Scientometrie je vědní disciplína, která studuje kvantitativní metody pro rozvoj vědy jako informačního procesu [5] .
Kybermetrie je vědní disciplína , která se zabývá kvantitativní analýzou nových možností zpracování informací uložených v elektronické podobě a jejich vizualizací [6] .
Španělská kybermetrická laboratoř vyvinula metodologii pro hodnocení webových zdrojů univerzit a výzkumných ústavů.
V souladu s touto metodikou je sestaven algoritmus hodnocení stránek založený na čtyřech ukazatelích [7] :
Indikátor | Zkratka | Význam | vyhledávače |
---|---|---|---|
Viditelnost | PROTI | Počet odkazů z jiných stránek | Google, Yahoo, Live Search a Exalead |
velikost | S | Celkový počet stránek webu | Yahoo Search, Live Search a Exalead |
Bohaté soubory | R | Počet fulltextových souborů | |
Učenec | sc | Počet článků zveřejněných na webu a jejich citace | Google Scholar |
Stránky jsou seřazeny podle následujícího algoritmu:
Existuje řada nedostatků v práci metody hodnocení webových stránek navržené Cybermetrics Lab [7] :
Příchozí odkazy - počet webových stránek, které odkazují na tuto webovou stránku nebo na tento web [9] . Tento indikátor se používá jako indikátor významnosti určité webové stránky algoritmy PageRank a HITS . Tyto algoritmy jsou založeny na hledání stránek, které jsou relevantní pro vyhledávací dotaz, a na dalším hodnocení výsledného seznamu s přihlédnutím k příchozím odkazům. Stránky s nejvíce příchozími odkazy mají vyšší hodnocení. Dále je seznam webových stránek seřazen podle jejich hodnocení.
Některé hypertextové odkazy mohou být vytvořeny pouze za účelem navigace mezi stránkami. Takové hypertextové odkazy by měly být ignorovány, protože neurčují hodnotu cílové webové stránky. Kromě toho se na některých stránkách mohou stejné odkazy opakovat vícekrát. V tomto případě je třeba vzít v úvahu pouze jeden příchozí odkaz a všechny ostatní ignorovat.
Vzhledem k tomu, že metodika hodnocení webových zdrojů navržená společností Cybermetrics Lab má řadu nevýhod [7] a navíc nepoužívá ruské vyhledávače (například Yandex ), vznikají v Rusku projekty na vytváření vlastních webometrických hodnocení vědeckých institucí, bez výše uvedených nevýhod.
Pod vedením Andreje Anatoljeviče Pečnikova vzniklo Webometrické hodnocení vědeckých institucí v Rusku [10] . Tento projekt zahrnuje pouze oficiální stránky vědeckých institucí v Rusku. Žebříček vychází z metodiky navržené Cybermetrics Lab, ale zohledňuje použití ruského vyhledávače Yandex a crawleru BeeCrawler [ 11] . Metodika použitá pro hodnocení stránek je popsána v práci „O hodnocení oficiálních stránek vědeckých institucí na severozápadě Ruska“ [12] .
Jedním z projektů tohoto ústavu je vytvoření Ratingu míst vědeckých institucí SB RAS pod vedením Yu.I. Shokina . Pro výpočet počtu externích odkazů (V) a počtu stránek na webu (S) se kromě vyhledávačů Google a Yandex používá také Bing [13] . K nalezení výsledné hodnoty V a S je aritmetický průměr. K nalezení citačního indexu (Sc) se používají Google Scholar a Yandex Citation Index. Metodika použitá pro hodnocení lokalit je popsána v práci „Hodnocení lokalit vědeckých organizací Sibiřské pobočky Ruské akademie věd“ [14] .
Pod vedením doktora technických věd A. B. Antopolského byl vytvořen Webometrický index ruských univerzit a výzkumných ústavů . Jako zdroje pro seznam analyzovaných webových zdrojů slouží oficiální seznamy institucí zveřejněné na portálech státních akademií a seznam akreditovaných vzdělávacích institucí [15] . Pro tvorbu indexu se používají hlavní webometrické ukazatele [16] . Indikátory V, S a R jsou založeny na výsledcích práce vyhledávačů Google a Yandex a indikátor Sc je vypočítán na základě Citace instituce podle RSCI . Použitá metodika hodnocení stránek je popsána v práci „Měření přítomnosti vzdělávacích institucí na internetu“ [17] .
Služba webometrického výzkumu pro vědecká místa je navržena tak, aby analyzovala místa vědeckých organizací Dálného východu pobočky Ruské akademie věd, Oddělení věd o Zemi Ruské akademie věd a dalších vědeckých míst. Služba byla vytvořena pod vedením d.g.-m.s. Naumová V.V. K výpočtu hlavních webometrických ukazatelů se používají vyhledávače Google, Yandex, Bing a Yahoo [18] . Pro výpočet webometrické pozice se používá následující vzorec:
Metodika použitá pro hodnocení lokalit je popsána v práci „Informační prostor pobočky Dálného východu Ruské akademie věd“ [19] .
Hodnocení webových stránek univerzit a ústavů poskytuje univerzitám nejúplnější aktuální informace o stavu jejich webových stránek z hlediska webometrie. Za tímto účelem se hodnocení aktualizuje každý týden a ukládá se historie změn indikátoru. Metodika výpočtu ratingu je podobná metodice Cybermetrics Lab. Webometrické pořadí se vypočítá podle následujícího vzorce [20] :
Výpočet hlavních webometrických parametrů může být založen na výsledcích různých vyhledávačů. Níže je uvedena srovnávací tabulka využití vyhledávačů každou z výše uvedených institucí a počet jimi zpracovávaných webových zdrojů.
Ústav | Viditelnost | velikost | Bohaté soubory | Učenec | Počet zpracovaných webových zdrojů |
---|---|---|---|---|---|
Ústav aplikovaného matematického výzkumu KarRC RAS | Google, BeeCrawler | Yandex, Google, BeeCrawler | Yandex, Google | Google Scholar | 343 (2013) [21] |
Ústav výpočetních technologií SB RAS | Yandex, Google, Bing | Yandex, Google, Bing | Yandex, Google | Yandex Citation Index, Google Scholar | 94 (2013) [22] |
Ústav vědeckých a pedagogických informací Ruské akademie vzdělávání | Yandex, Google | Yandex, Google | Yandex, Google | Citace instituce podle RSCI | 1843 (2012) [23] |
Geologický institut Dálného východu, pobočka Dálného východu Ruské akademie věd | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google Scholar | 121 (2013) [24] |
Sibiřská federální univerzita SibFU | Majestátní SEO | Google Scholar | 657 (2013) [25] |