Citační analýza je studium frekvence, vzorců a rozvrhů citací v dokumentech. Používá vzor nabídky, odkazy z jednoho dokumentu do jiného dokumentu, aby zjistil vlastnosti dokumentů. Typickým cílem je identifikovat nejdůležitější dokumenty ve sbírce. Klasickým příkladem jsou citace mezi akademickými pracemi a knihami. [1] [2] Soudní rozhodnutí v anglosaském právním systému se za účelem potvrzení svých rozhodnutí odvolávají na rozhodnutí učiněná v předchozích případech, proto je důležitá analýza citace v právním kontextu. Dalším příkladem jsou patenty obsahující předchozí vynálezy, dříve citované patenty týkající se současného nároku.
Dokumenty mohou být spojeny s mnoha dalšími funkcemi kromě citací, jako jsou autoři, vydavatelé, časopisy a také jejich skutečné texty. Obecná analýza sbírek dokumentů se nazývá bibliometrie a citační analýza je klíčovou součástí tohoto směru. Například bibliografické propojení a sdílení jsou související metriky založené na citační analýze (sdílené citace nebo sdílené citace). Citace ve sborníku prací mohou být také prezentovány ve formě následujících citačních grafů, jak poznamenal Derek de Solla Price v článku z roku 1965 „Networks of Scientific Papers“. [3] To znamená, že citační analýza čerpá z aspektů analýzy sociálních sítí a síťových věd.
Prvním příkladem automatického indexování citací byl CiteSeer , který se používal pro citace ve vědeckých zprávách, a Google Scholar je příkladem moderního systému, který zahrnuje více než jen akademické knihy a články a odráží širší škálu informačních zdrojů. Dnes automatizované indexování citací [4] změnilo povahu výzkumu analýzy citací a umožnilo analyzovat miliony citací pro rozsáhlé modely a objevování znalostí. Nástroje citační analýzy mohou vědci použít k výpočtu různých stupňů dopadu na základě dat citačního indexu . [5] [6] [7] Mají aplikace od identifikace odborných soudců přes přezkoumání dokumentů a grantových návrhů až po poskytování transparentních dat na podporu rozhodování o akademických zásluhách, funkčních obdobích a rozhodování. Tato soutěž o omezené zdroje může vést k eticky spornému chování při zvýšeném počtu citací. [8] [9]
Praxe naivního používání citační analýzy k porovnání dopadu různých vědeckých článků bez zohlednění dalších faktorů, které mohou ovlivnit citační vzorce, byla silně kritizována. [10] Mezi výtkami se důsledně zaměřuje na „odvětvovou nezávislost“, konkrétně na skutečnost, že citační praxe v jedné vědní oblasti se liší od praxe v jiné a dokonce i mezi obory výzkumu v rámci disciplíny. [jedenáct]
Zatímco citační indexy byly původně vyvinuty pro vyhledávání informací , stále více se používají pro bibliometrické a další studie zahrnující hodnocení výzkumu. Citační údaje jsou také základem kvocientu vlivu populárního časopisu .
Existuje velké množství literatury o analýze citací, někdy označované jako scientometrics , termín vytvořený Vasilijem Nalimovem , nebo přesněji bibliometrics . Průmysl začal vzkvétat s příchodem Science Citation Index, který zahrnuje literaturu publikovanou od roku 1900. Předními časopisy v oboru jsou Scientometrics , Informatics a Journal of the Association for Information Science and Technology. Ten také organizuje elektronický mailing list nazvaný Sigmetrica ve společnosti ATIT. [12] Tato metoda se oživuje díky širokému přijetí databází, předplatným Web Science a Scopus na mnoha univerzitách a veřejným bezplatným citačním nástrojům, jako jsou CiteBase, CiteSeerX , Google Scholar a bývalý program Windows Live Academic (nyní dostupný s dalšími funkcemi, např. jako Microsoft Academic Search). Metody výzkumu citační analýzy zahrnují kvalitativní, kvantitativní a výpočetní přístupy. Hlavními ohnisky takovýchto scientometrických studií bylo srovnávání výkonu, hodnocení institucionálního výzkumu, klasifikace časopisů [13] s ohledem na stanovení výkonnostních faktorů a standardů vlastnictví, [14] hodnocení dopadu špičkových vědeckých prací, [15] sledování trajektorie vědy resp. technologický průmysl [16] a rozvoj profilů předních autorů a institucí z hlediska výsledků výzkumu. [17]
Právní citační analýza je technika citační analýzy pro analýzu právních dokumentů, která usnadňuje porozumění souvisejícím normativním dokumentům zkoumáním citací, které spojují ustanovení s jinými ustanoveními ve stejném dokumentu nebo mezi různými dokumenty. Právní citační analýza využívá citační graf převzatý z regulačního dokumentu, který může doplňovat elektronické objevování, což je proces, který ovlivňuje technologické inovace v analýze velkých dat . [18] [19] [20] [21]
V článku z roku 1965 Derek de Solla Price popsal inherentní vazebnou vlastnost SCI jako „síť vědeckých prací“. Spojení mezi citacemi a citovanými články se stalo dynamickým, když SCI začala publikovat online. Social Science Citation Index byl jednou z prvních databází nainstalovaných v systému Dialog [22] v roce 1972. S příchodem CD se odkazy ještě zjednodušily, což umožňuje použití bibliografických odkazů k nalezení souvisejících záznamů. V roce 1973 Henry Small publikoval svou klasickou práci o analýze společných citací, která se stala samoorganizovaným klasifikačním systémem, který vedl k experimentům se shlukováním dokumentů a nakonec k Atlasu vědy, který se později stal Research Reviews.
Inherentní topologickou a grafickou povahu celosvětového citačního webu, který je vlastní vědecké literatuře, popsal Ralph Garner (Drexel University) v roce 1965. [23]
Používání citačních skóre v hodnocených časopisech bylo běžnou praxí v první polovině 19. století, ale systematické průběžné měření těchto skóre pro vědecké časopisy inicioval Eugene Garfield z Institutu pro vědecké informace, který se také stal primárním zdrojem za použití těchto skóre k hodnocení autorů a článků. V přelomovém článku z roku 1965 spolu s Irvingem Sherem ukázali vztah mezi četností a růstem citovanosti a ukázali, že nositelé Nobelovy ceny publikovali své články v průměru pětkrát, zatímco jejich články byly v průměru citovány 30–50krát. Garfield o tomto fenoménu informoval v dlouhé sérii esejů o Nobelově a dalších cenách. Obvyklé konečné skóre je známé jako vlivový poměr , počet citací v časopise v předchozích dvou letech dělený počtem článků publikovaných v těchto letech. Je široce používán pro běžné i speciální účely, zejména jeho použití pro hodnocení autorů a dokumentů je značně kontroverzní .
Ve studii z roku 1964, která používala citační analýzu při psaní historie DNA , Garfield a Sher prokázali potenciál produkovat historiografii , topologické mapy hlavních kroků v historii vědeckých témat. Tato práce byla později automatizována E. Garfieldem, A. I. Pudovkinem z Ústavu mořské biologie Národní akademie věd a V. S. Istominem z Centra pro výuku, učení a technologie, Washington State University a vedla k vytvoření softwaru Histcite [ 24] do roku 2002.
Automatické indexování citací zavedli v roce 1998 Lee Giles, Steve Lawrence a Kurt Bollacker a umožnilo automatické algoritmické mazání a seskupování citací pro jakýkoli digitální akademický a vědecký dokument. Tam, kde bylo předběžné stažení citace manuálním procesem, lze nyní citovanost zvýšit a vypočítat pro jakýkoli akademický obor nebo místo, nejen pro ty, které přidělily organizace, jako je ISI. To vedlo k vytvoření nových systémů pro indexování veřejných a automatických citací, z nichž prvním byl CiteSeer (nyní CiteSeerX , brzy zděděný systémem Cora, který se soustředil především na informatiku a informatiku . Později se objevily velké akademické systémy doménových jmen jako např. jako Google Scholar a Microsoft Academic Toto offline citační indexování dosud nebylo zdokonaleno v extrakci citací nebo shlukování citací s odhadovanou chybovostí někde kolem 10 %, ačkoliv ještě nebylo provedeno pečlivé statistické vzorkování. Autoři jako Ann Arbor , Milton Keynes a Walton Hall přinesli obrovské množství akademických výsledků.25 SCI tvrdí, že vytváří automatickou indexaci citací pomocí čistě programových metod. Dokonce i starší záznamy mají stejnou chybovost.
Citační analýza právních dokumentů je přístup, který pomáhá porozumět a analyzovat související normativní dokumenty zkoumáním citací, které spojují ustanovení s jinými ustanoveními ve stejném dokumentu a mezi různými dokumenty. Citační analýza využívá citační graf odvozený z normativního dokumentu, který by mohl doplňovat elektronické objevování, proces, který pohání technologické inovace v analýze velkých dat. [26]
Elektronické publikace . Vzhledem k bezprecedentnímu nárůstu dostupnosti elektronických zdrojů se jednou z palčivých otázek, které jsou nyní studovány, stala otázka „jak často jsou elektronické zdroje v mém oboru citovány na internetu?“. [27] Například se tvrdilo, že online přístup k literatuře počítačové vědy vede k vyšší citovanosti, [28] nicméně humanitní články mohou trpět, pokud neexistují v tisku.
Vlastní citace . Hodně kritizována je praxe autorů „hrát si“ se systémem hromaděním citací, přecitováním sebe sama [29] . Přitom se například zjistilo, že muži sami sebe citují častěji než ženy.