Citační analýza

Citační analýza  je studium frekvence, vzorců a rozvrhů citací v dokumentech. Používá vzor nabídky, odkazy z jednoho dokumentu do jiného dokumentu, aby zjistil vlastnosti dokumentů. Typickým cílem je identifikovat nejdůležitější dokumenty ve sbírce. Klasickým příkladem jsou citace mezi akademickými pracemi a knihami. [1] [2] Soudní rozhodnutí v anglosaském právním systému se za účelem potvrzení svých rozhodnutí odvolávají na rozhodnutí učiněná v předchozích případech, proto je důležitá analýza citace v právním kontextu. Dalším příkladem jsou patenty obsahující předchozí vynálezy, dříve citované patenty týkající se současného nároku.

Dokumenty mohou být spojeny s mnoha dalšími funkcemi kromě citací, jako jsou autoři, vydavatelé, časopisy a také jejich skutečné texty. Obecná analýza sbírek dokumentů se nazývá bibliometrie a citační analýza je klíčovou součástí tohoto směru. Například bibliografické propojení a sdílení jsou související metriky založené na citační analýze (sdílené citace nebo sdílené citace). Citace ve sborníku prací mohou být také prezentovány ve formě následujících citačních grafů, jak poznamenal Derek de Solla Price  v článku z roku 1965 „Networks of Scientific Papers“. [3] To znamená, že citační analýza čerpá z aspektů analýzy sociálních sítí a síťových věd.

Prvním příkladem automatického indexování citací byl CiteSeer , který se používal pro citace ve vědeckých zprávách, a Google Scholar je příkladem moderního systému, který zahrnuje více než jen akademické knihy a články a odráží širší škálu informačních zdrojů. Dnes automatizované indexování citací [4] změnilo povahu výzkumu analýzy citací a umožnilo analyzovat miliony citací pro rozsáhlé modely a objevování znalostí. Nástroje citační analýzy mohou vědci použít k výpočtu různých stupňů dopadu na základě dat citačního indexu . [5] [6] [7] Mají aplikace od identifikace odborných soudců přes přezkoumání dokumentů a grantových návrhů až po poskytování transparentních dat na podporu rozhodování o akademických zásluhách, funkčních obdobích a rozhodování. Tato soutěž o omezené zdroje může vést k eticky spornému chování při zvýšeném počtu citací. [8] [9]

Praxe naivního používání citační analýzy k porovnání dopadu různých vědeckých článků bez zohlednění dalších faktorů, které mohou ovlivnit citační vzorce, byla silně kritizována. [10] Mezi výtkami se důsledně zaměřuje na „odvětvovou nezávislost“, konkrétně na skutečnost, že citační praxe v jedné vědní oblasti se liší od praxe v jiné a dokonce i mezi obory výzkumu v rámci disciplíny. [jedenáct]

Přehled

Zatímco citační indexy byly původně vyvinuty pro vyhledávání informací , stále více se používají pro bibliometrické  a další studie zahrnující hodnocení výzkumu. Citační údaje jsou také základem kvocientu vlivu populárního časopisu .

Existuje velké množství literatury o analýze citací, někdy označované jako scientometrics , termín  vytvořený Vasilijem Nalimovem , nebo přesněji bibliometrics . Průmysl začal vzkvétat s příchodem Science Citation Index, který zahrnuje literaturu publikovanou od roku 1900. Předními časopisy v oboru jsou Scientometrics , Informatics a Journal of the Association for Information Science and Technology. Ten také organizuje elektronický mailing list nazvaný Sigmetrica ve společnosti ATIT. [12] Tato metoda se oživuje díky širokému přijetí databází, předplatným Web Science a Scopus na mnoha univerzitách a veřejným bezplatným citačním nástrojům, jako jsou CiteBase, CiteSeerX , Google Scholar a bývalý program Windows Live Academic (nyní dostupný s dalšími funkcemi, např. jako Microsoft Academic Search). Metody výzkumu citační analýzy zahrnují kvalitativní, kvantitativní a výpočetní přístupy. Hlavními ohnisky takovýchto scientometrických studií bylo srovnávání výkonu, hodnocení institucionálního výzkumu, klasifikace časopisů [13] s ohledem na stanovení výkonnostních faktorů a standardů vlastnictví, [14] hodnocení dopadu špičkových vědeckých prací, [15] sledování trajektorie vědy resp. technologický průmysl [16] a rozvoj profilů předních autorů a institucí z hlediska výsledků výzkumu. [17]

Právní citační analýza je technika citační analýzy pro analýzu právních dokumentů, která usnadňuje porozumění souvisejícím normativním dokumentům zkoumáním citací, které spojují ustanovení s jinými ustanoveními ve stejném dokumentu nebo mezi různými dokumenty. Právní citační analýza využívá citační graf převzatý z regulačního dokumentu, který může doplňovat elektronické objevování, což je proces, který ovlivňuje technologické inovace v analýze velkých dat . [18] [19] [20] [21]

Historie

V článku z roku 1965 Derek de Solla Price popsal inherentní vazebnou vlastnost SCI jako „síť vědeckých prací“. Spojení mezi citacemi a citovanými články se stalo dynamickým, když SCI začala publikovat online. Social Science Citation Index byl jednou z prvních databází nainstalovaných v systému Dialog [22] v roce 1972. S příchodem CD se odkazy ještě zjednodušily, což umožňuje použití bibliografických odkazů k nalezení souvisejících záznamů. V roce 1973 Henry Small publikoval svou klasickou práci o analýze společných citací, která se stala  samoorganizovaným  klasifikačním systémem, který vedl k experimentům se shlukováním dokumentů a nakonec k Atlasu vědy, který se později stal Research Reviews.

Inherentní topologickou a grafickou povahu celosvětového citačního webu, který je vlastní vědecké literatuře, popsal Ralph Garner (Drexel University) v roce 1965. [23]

Používání citačních skóre v hodnocených časopisech bylo běžnou praxí v první polovině 19. století, ale systematické průběžné měření těchto skóre pro vědecké časopisy inicioval Eugene Garfield z Institutu pro vědecké informace, který se také stal primárním zdrojem za použití těchto skóre k hodnocení autorů a článků. V přelomovém článku z roku 1965 spolu s Irvingem Sherem ukázali vztah mezi četností a růstem citovanosti a ukázali, že nositelé Nobelovy ceny publikovali své články v průměru pětkrát, zatímco jejich články byly v průměru citovány 30–50krát. Garfield o tomto fenoménu informoval v dlouhé sérii esejů o Nobelově a dalších cenách. Obvyklé konečné skóre je známé jako vlivový poměr , počet citací v časopise v předchozích dvou letech dělený počtem článků publikovaných v těchto letech. Je široce používán pro běžné i speciální účely, zejména jeho použití pro hodnocení autorů a dokumentů je značně kontroverzní .

Ve studii z roku 1964, která používala citační analýzu při psaní historie DNA , Garfield a Sher prokázali potenciál produkovat historiografii , topologické mapy hlavních kroků v historii vědeckých témat. Tato práce byla později automatizována E. Garfieldem, A. I. Pudovkinem z Ústavu mořské biologie Národní akademie věd a V. S. Istominem z Centra pro výuku, učení a technologie, Washington State University a vedla k vytvoření softwaru Histcite [ 24] do roku 2002.

Automatické indexování citací zavedli v roce 1998 Lee Giles, Steve Lawrence a Kurt Bollacker a umožnilo automatické algoritmické mazání a seskupování citací pro jakýkoli digitální akademický a vědecký dokument. Tam, kde bylo předběžné stažení citace manuálním procesem, lze nyní citovanost zvýšit a vypočítat pro jakýkoli akademický obor nebo místo, nejen pro ty, které přidělily organizace, jako je ISI. To vedlo k vytvoření nových systémů pro indexování veřejných a automatických citací, z nichž prvním byl CiteSeer (nyní CiteSeerX , brzy zděděný systémem Cora, který se soustředil především na informatiku a informatiku . Později se objevily velké akademické systémy doménových jmen jako např. jako Google Scholar a Microsoft Academic Toto offline citační indexování dosud nebylo zdokonaleno v extrakci citací nebo shlukování citací s odhadovanou chybovostí někde kolem 10 %, ačkoliv ještě nebylo provedeno pečlivé statistické vzorkování. Autoři jako Ann Arbor , Milton Keynes a Walton Hall přinesli obrovské množství akademických výsledků.25 SCI tvrdí, že vytváří automatickou indexaci citací pomocí čistě programových metod. Dokonce i starší záznamy mají stejnou chybovost.

Citační analýza pro právní dokumenty

Citační analýza právních dokumentů je přístup, který pomáhá porozumět a analyzovat související normativní dokumenty zkoumáním citací, které spojují ustanovení s jinými ustanoveními ve stejném dokumentu a mezi různými dokumenty. Citační analýza využívá citační graf odvozený z normativního dokumentu, který by mohl doplňovat elektronické objevování, proces, který pohání technologické inovace v analýze velkých dat. [26]

Kritika

Elektronické publikace . Vzhledem k bezprecedentnímu nárůstu dostupnosti elektronických zdrojů se jednou z palčivých otázek, které jsou nyní studovány, stala otázka „jak často jsou elektronické zdroje v mém oboru citovány na internetu?“. [27] Například se tvrdilo, že online přístup k literatuře počítačové vědy vede k vyšší citovanosti, [28] nicméně humanitní články mohou trpět, pokud neexistují v tisku.

Vlastní citace . Hodně kritizována je praxe autorů „hrát si“ se systémem hromaděním citací, přecitováním sebe sama [29] . Přitom se například zjistilo, že muži sami sebe citují častěji než ženy.

Viz také

Poznámky

  1. Rubin, Richard. Základy knihovnictví a informační vědy  (anglicky) . — 3. - New York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
  2. Garfield, E. Citation Indexing - Its Theory and Application in Science, Technology and Humanities Philadelphia: ISI Press, 1983. . Získáno 29. srpna 2018. Archivováno z originálu 9. března 2018.
  3. Derek J. de Solla Price. Networks of Scientific Papers  (anglicky)  // Science  : journal. - 1965. - 30. července ( roč. 149 , č. 3683 ). - str. 510-515 . - doi : 10.1126/science.149.3683.510 . - . — PMID 14325149 .
  4. Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: systém automatického indexování citací. , Digital libraries 98: The Third ACM Conference on Digital Libraries, 23.–26. června 1998, Pittsburgh, PA (New York: Association for Computing Machinery): 89–98, ISBN 0-89791-965-3 , doi : 10.1145/ 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Staženo 7. července 2011. 
  5. Příklady zahrnují nástroje založené na předplatném založené na proprietárních datech, jako jsou Web of Science a Scopus , a bezplatné nástroje založené na otevřených datech, jako je Scholarometer Archived 18. dubna 2022 na Wayback Machine od Filippa Menczera a jeho týmu.
  6. Kaur, Jasleen. Scholarometer: A Social Framework for Analysing Impact across Disciplines  (anglicky)  // PLoS ONE  : journal. - 2012. - Sv. 7 , č. 9 . - doi : 10.1371/journal.pone.0043235 . - . — PMID 22984414 .
  7. Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society on-line, 26.–27. dubna 2010, Raleigh, NC: USA , < http:/ /žurnál .webscience.org/321/ > . Získáno 29. srpna 2018. Archivováno 17. dubna 2015 na Wayback Machine 
  8. Anderson, dodávka MS.  Zvrácené účinky konkurence na práci a vztahy vědců  // Etika vědy a inženýrství : deník. - 2007. - Sv. 4 , ne. 13 . - str. 437-461 . - doi : 10.1007/s11948-007-9042-5 .
  9. Wesel, M. van. Hodnocení podle citace: Trendy v publikačním chování, kritéria hodnocení a úsilí o vysoce působivé publikace   // Etika vědy a techniky : deník. - 2016. - Sv. 22 , č. 1 . - str. 199-225 . - doi : 10.1007/s11948-015-9638-0 . — PMID 25742806 .
  10. Co měří počty citací? Přehled studií o chování při citování  //  Journal of Documentation : deník. - 2008. - Sv. 64 , č. 1 . - str. 45-80 . - doi : 10.1108/00220410810844150 .
  11. Anauati, Maria Victoria and Galiani, Sebastian a Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11. listopadu 2014). Dostupné na SSRN: http://ssrn.com/abstract=2523078 Archivováno 17. listopadu 2014.
  12. Americká společnost pro informační vědu a technologie (nepřístupný odkaz) . Informační společnost pro informační věk . Získáno 21. května 2006. Archivováno z originálu dne 3. října 2019. 
  13. Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; a Wilson, David W. (2013). " Hodnocení kvality časopisů a koše časopisů Senior Scholars Asociace pro informační systémy (AIS) prostřednictvím bibliometrických měření: Přidávají hodnocení odborných časopisů hodnotu? Archivováno 21. března 2019 na Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993-1012. Také YouTube viz video vyprávění tohoto dokumentu na: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Archivováno 21. března 2019 na Wayback Machine .
  14. Děkan, Douglas L; Lowry, Paul Benjamin; a Humpherys, Sean (2011). Profilování výzkumné produktivity fakulty informačních systémů s držbou v institucích USA Archivováno 9. ledna 2016 na Wayback Machine , MIS Quarterly (MISQ), sv . 35(1), str. 1-15 ( ISSN 0276-7783 ).
  15. Karuga, Gilbert G.; Lowry, Paul Benjamin; a Richardson, Vernon J. (2007). Hodnocení dopadu předního výzkumu informačních systémů v čase, Komunikace Asociace pro informační systémy, sv. 19(7), str. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Archivováno 25. ledna 2016 na Wayback Machine
  16. Liu, John S. Integrovaný přístup k analýze hlavní cesty: Vývoj Hirschova indexu jako příklad  //  Journal of the American Society for Information Science and Technology : deník. - 2012. - 1. března ( roč. 63 , č. 3 ). - str. 528-542 . — ISSN 1532-2890 . - doi : 10.1002/asi.21692 .
  17. Lowry, Paul Benjamin; Karuga, Gilbert G.; a Richardson, Vernon J. (2007). Hodnocení předních institucí, fakulty a článků v předních časopisech o výzkumu informačních systémů, Communications of the Association for Information Systems, sv. 20(16), str. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Archivováno 9. ledna 2016 na Wayback Machine
  18. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1  (odkaz ke stažení k 29.08.2018 [1517 dní])
  19. Mohammad Hamdaqa a A. Hamou-Lhadj, „Analýza citací: Přístup k usnadnění porozumění a analýza dokumentů o shodě s předpisy“, v Proc. 6. mezinárodní konference o informačních technologiích, Las Vegas, USA
  20. Zvláštní zpráva E-Discovery: Rostoucí příliv nelineární recenze . Hudson Global . Získáno 1. července 2012. Archivováno z originálu dne 3. července 2012. od Cat Casey a Alejandry Perez
  21. Co nás Technology-Assisted Electronic Discovery učí o úloze člověka v technologii – Re-Humanizing Technology-Assisted Review . Forbes . Získáno 1. července 2012. Archivováno z originálu 18. června 2012.
  22. Dialog, A Thomson Business . „Dialog vynalezl online informační služby“ . Získáno 21. května 2006. Archivováno z originálu 13. ledna 2004.
  23. Archivovaná kopie . Získáno 29. srpna 2018. Archivováno z originálu 9. září 2017.
  24. Eugene Garfield Algorithmic Citation-Linked Historiography—Mapping the Literature of Science . Prezentoval ASIS&T 2002: Informace, spojení a komunita. 65. výroční zasedání ASIST ve Philadelphii, PA. 18.–21. listopadu 2002 (2002). Získáno 21. května 2006. Archivováno z originálu dne 20. října 2016.
  25. Postellon DC Hall a Keynes se připojují k Arborovi v citačních rejstřících  // Nature  :  journal. - 2008. - březen ( roč. 452 , č. 7185 ). - doi : 10.1038/452282b . — . — PMID 18354457 .
  26. Hamdaqa, M.; Hamou-Lhadj. Citační analýza: Přístup k usnadnění porozumění a analýze  dokumentů o shodě s předpisy . - Las Vegas, NV: Institute of Electrical and Electronics Engineers , 2009. - S. 278-283. - ISBN 978-1-4244-3770-2 . - doi : 10.1109/ITNG.2009.161 .
  27. Zhao, Lisa. "Jak knihovník používal elektronické zdroje - analýza citací v CCQ." Katalogizace a klasifikace čtvrtletní 42(1) (2006): 117-131.
  28. Lawrence, Steve. Bezplatná online dostupnost podstatně zvyšuje dopad papíru. Nature volume 411 (číslo 6837) (2001): 521. Také online na http://citeseer.ist.psu.edu/online-nature01/ Archivováno 9. června 2010 na Wayback Machine
  29. Gálvez RH Posuzování autocitace autora jako mechanismu šíření relevantních znalostí  //  Scientometrie : časopis. - 2017. - březen ( roč. 111 , č. 3 ). - str. 1801 . - doi : 10.1007/s11192-017-2330-1 .