Akademie Google

Google Scholar
URL scholar.google.com
Komerční Ne
Typ webu Vyhledávání podle vědeckých publikací
Registrace Volitelný
jazyky) 40 podporovaných jazyků
Majitel Google
Začátek práce 20. listopadu 2004
Aktuální stav funguje
 Mediální soubory na Wikimedia Commons

Google Scholar je bezplatný  vyhledávač výzkumných publikací spuštěný v listopadu 2004 z iniciativy inženýrů Google Alexe Verstaka a Anuraga Acharya [ . S pomocí vyhledávacích robotů portál indexuje metadata a provádí fulltextové vyhledávání ve vědecké literatuře, včetně článků v časopisech, preprintů , dizertací, knih a technických zpráv. Uživatelé mohou vyhledávat požadovaná díla podle autorů, klíčových slov, názvu časopisu. Hloubkové vyhledávání umožňuje seřadit materiály podle publikace, data a předmětu.

Akademie Google neposkytuje údaje o přesném počtu indexovaných děl, nicméně podle předběžných odhadů jich v roce 2019 bylo minimálně 390 milionů. I přes nedostatek spolehlivých údajů o velikosti databáze je portál považován za světový největší akademický vyhledávač s dosahem až 90 % všech článků v angličtině.

Historie

Myšlenka vytvoření Akademie Google patří Alexi Verstakovi a Anuragu Acharyovi [ . Na počátku 21. století inženýři spolupracovali na zlepšení webového indexování vědeckých publikací Google . Následně se rozhodli vytvořit podobný vyhledávač vědecké literatury [1] [2] [3] . Podle Acharya vymyslel podobný projekt ještě během studií na Indian Institute of Technology . Poté inženýr poprvé narazil na problém paywalls , kvůli kterému vědecké práce nepadaly do výsledků vyhledávání a vědci museli udělat dvojí práci, aby sestavili přehled literatury [4] [5] [3] [6] . Workbench a Acharya se snažili usnadnit přístup k vědeckým poznatkům. Sloganem Google akademie byla fráze „ Stát na ramenou obrů “, připisovaná Bernardovi z Chartres a Isaacu Newtonovi [7] .

Bezplatný vyhledávač byl spuštěn v roce 2004 [5] [8] [5] . Google Scholar v době svého vzniku indexoval články z databází časopisů Nature , Online Computer Library Center , Association for Computing Machinery a dalších [9] . Zároveň chyběly některé základní funkce, jako je filtrování dat podle data [10] .

V roce 2006 přidal Google Scholar novou funkci, která automaticky generuje a importuje bibliografické citace indexovaných vědeckých prací do komerčních systémů pro správu bibliografických informací , včetně RefWorks , Reference Manager , EndNote a BibTeX [7] . Od roku 2007 do roku 2011 byl odkaz Google Scholar na domovské stránce Google [11] . V roce 2007 služba po dohodě s vydavateli spustila program digitalizace vědeckých časopisů. Jeho hlavním cílem bylo získat přístup k metadatům publikací za účelem usnadnění procesu vyhledávání, identifikace a citování [7] . V roce 2010 Google Scholar oznámil novou funkci – „budík“ pro určité požadavky – uživatelé mohli dostávat aktualizace o nových publikacích poštou [12] [13] . Od roku 2012 si vědci mohou vytvářet osobní profily, samostatně přidávat a pravidelně aktualizovat informace o všech publikovaných pracích. Služba zároveň automaticky vypočítává jednotlivé scientometrické ukazatele [7] . Možnost nejen zlepšila vyhledávací možnosti systému, ale umožnila také sledovat jednotlivé kariéry výzkumných pracovníků [1] . V roce 2013 služba propojila funkci osobní knihovny pro fondy vědecké literatury a výsledky vyhledávání pro určité dotazy v osobním účtu [7] .

V květnu 2014 byla služba Google Scholar v Číně zablokována [14] . Mnoho čínských vědců uvedlo, že uzamčení negativně ovlivní rozvoj vědy v zemi [15] [16] .

V roce 2021 portál zavedl další funkci pro sledování čitelnosti těch výzkumných prací, které spadají pod mandáty otevřeného přístupu, což je politika poskytovatelů grantů, která vyžaduje, aby výzkumníci otevřeli svou práci prostřednictvím archivace v úložištích [17] [18] .

Jak to funguje

Indexování

Vyhledávací roboti Akademie Google neustále skenují web a automaticky přidávají materiály, které jsou svým obsahem a designem vhodné pro formát vědeckého článku [1] . Zpravodajské články, knihy, recenze, komerční stránky, blogy a stránky Wikipedie tedy indexaci nepodléhají [19] . Vyhledávací roboti skenují materiály ze dvou hlavních skupin zdrojů. První zahrnuje publikace v časopisech, preprinty , dizertační práce a technické zprávy. Mezi takto identifikované materiály patří jak plnotextové dokumenty, tak citace s anotacemi. Do druhé skupiny patří materiály poskytované partnerskými organizacemi – vydavateli časopisů, vědeckými společnostmi, poskytovateli databází a výzkumnými institucemi. Většina z těchto prací je prezentována v Google Scholarship jako citace s anotacemi, protože plný text je stále skryt za paywally [20] [21] [22] [23] .

Vyhledávací roboti mají přístup k největším databázím komerčních vědeckých a univerzitních vydavatelů, včetně Association for Computing Machinery , Nature , Institute of Electrical and Electronics Engineers , Online Computer Library Center , Macmillan Publishers , John Wiley & Sons , University of Chicago Press [5 ] . Kromě toho roboti skenují také své digitální hostitele, včetně HighWire Press , Metapress , Ingenta , webové stránky vědeckých a vládních institucí, jako je American Physical Society , US National Institutes of Health , National Oceanic a Atmospheric Administration a předtiskové servery jako arXiv.org , NASA Astrophysical Information System , RePEc a Citebase [24] [25] [22] . V roce 2007 Elsevier také zpřístupnil svou databázi ScienceDirect společnosti Google [26] .

V některých případech Google Scholar také indexuje webové stránky. K tomu musí portály splňovat určitá kritéria: publikovat především vědecké práce (původní výzkumné články, technické zprávy, časopisecké publikace, sborníky z konferencí, disertační práce a abstrakty), být veřejně přístupné a také dodržovat všechna nezbytná technická doporučení [27] .

Systém neposkytuje údaje o přesném počtu indexovaných prací, takže výzkumníci jsou nuceni provádět vlastní hodnocení. Předpokládá se, že v roce 2010 byl počet dokumentů přidaných do Google Scholar asi 82 ​​milionů, v roce 2014 - 99,3-109,3 milionů, v roce 2015 - 160-165 milionů a v roce 2019 - více než 390 milionů [28] [29] . Navzdory nedostatku spolehlivých údajů o velikosti databáze je Google Scholar považován za největší akademický vyhledávač na světě s mírou pokrytí až 90 % všech článků v angličtině a 50 % všech fulltextových dokumentů [25 ] [30] [6] [31] [21] [32] .

Prohledávače Google Academy indexují akademické práce ze všech jazyků a oborů [27] [21] . Většina indexovaného obsahu je uložena na serverech vydavatele, kde jsou k dispozici fulltextové dokumenty ke stažení [8] .

Algoritmus hodnocení

Ke studiu struktury odkazů článku a určení jeho „důležitosti“ používá Google Scholar algoritmy podobné PageRank [ 33] . Prohledávače extrahují bibliografická data a informace o citacích, které se pak použijí k hodnocení výsledků vyhledávání. Algoritmus přikládá největší váhu počtu citací vědecké práce – čím více jich je, tím výše se článek zobrazí ve výsledcích vyhledávání. To se liší od přístupu většiny podobných vědeckých databází využívajících obrácené chronologické pořadí [23] . Důležitou roli hraje také kvalita citování děl; pokud tedy na publikaci odkazují materiály s vysokým hodnocením, roste i její pozice ve výsledcích vyhledávání [34] [35] . Vyhledávač seřadí výsledky vyhledávání a míru jejich relevance k dotazu. Přítomnost klíčových slov v názvu práce má významný vliv na pozici článku v seznamu. V tomto případě nezáleží na četnosti výskytu klíčových slov dotazu v celém textu [36] [37] [27] . Stáří článku také nehraje pro algoritmus významnou roli [38] .

Jednotlivé organizace, včetně Elsevier, OpenScience, Mendeley, SAGE Publishing, radí autorům, aby se řídili principy optimalizace pro vyhledávače a upravili svou práci tak, aby bylo pro akademické vyhledávače snazší ji procházet a indexovat [39] . Autorům se také doporučuje, aby své texty nezávisle přizpůsobili standardům Google Scholar tak, aby k nim mělo přístup co nejvíce lidí [40] [41] [42] .

Citace

Funkce sledování citací se objevila v Google Scholar v prosinci 2004, téměř okamžitě po spuštění platformy [43] [44] . Výzkumníci se často spoléhají na citační skóre, impakt faktor , aby sledovali nejvlivnější články na určité téma [22] [23] . Tato funkce umožnila službě Google Scholar konkurovat placeným vyhledávačům od tradičních vydavatelů. Předtím tuto možnost nabízel pouze portál Web of Science od Thomson Scientific [23] [22] [21] [45] .

Google Scholar automaticky vypočítá a zobrazí tři metriky citací autorů [25] :

Dostupné funkce

Rozhraní Google Scholar je podobné domovské stránce Google. Uživatelé mohou vyhledávat podle autorů, klíčových slov, názvů časopisů. Pokročilé vyhledávání umožňuje filtrovat výsledky podle konkrétních časopisů, data a oboru [46] [47] . Po zadání požadavku portál vrátí až 1000 výsledků, z nichž každý obsahuje bibliografické údaje (název, jména autorů, zdroj publikace) a také odkazy na abstrakt nebo plnou verzi práce, pokud je v veřejná doména . Uživatelé si mohou prohlížet citace publikace z jiných zdrojů, odkazy na online zdroje, kde je materiál prezentován, nebo na knihovny, které mají fyzickou kopii díla. V tomto případě se digitální identifikátor objektu nezobrazí. Google Scholar umožňuje uživatelům přístup k více verzím stejného dokumentu [46] [21] .

Funkce Moje knihovna umožňuje „ukládat“ osobní sbírky článků, které lze organizovat pomocí značek. Uživatelé mohou vytvářet bibliografické odkazy na jakýkoli vědecký článek. Systém generuje odkazy ve všech nejběžněji používaných mezinárodních bibliografických standardech, jako je styl MLA Modern Language Association , styl APA , styl Turabian (Chicago) [ , styl Harvard , styl American Chemical Society , styl AIP American Institute of Physics, styl IEEE , styl Vancouver a další [7] . Portál také umožňuje importovat citace pro programy jako EndNote, BibTeX, RefMan nebo RefWorks. Uživatelé mohou nastavovat a upravovat profily autorů, včetně uvedení své institucionální příslušnosti, pěti oblastí vědeckého zájmu a přidávání publikací. Ve výsledcích vyhledávání se však zobrazují pouze profily s ověřenými akademickými e-mailovými adresami. Je také možné přihlásit se k odběru aktualizací jiných autorů a dostávat e-mailová upozornění na nové články nebo citace [25] .

Vliv

Moderní vědci nazývají vznik Akademie Google revolucí v oblasti vyhledávání vědecké literatury. Podle různých zdrojů portál využívá 43,7 % až 88 % výzkumníků. Google Scholar snižuje šanci na neúmyslnou duplikaci výzkumu, což je důležité zejména pro oblasti vědy s vysokými náklady na experimenty, jako je fyzika a medicína [4] [47] [48] [49] [50] [28] .

Rozšíření Google Scholar zvýšilo význam „neprestižních“ vědeckých časopisů a starých článků. To lze vysvětlit vlivem hodnotícího algoritmu, který upřednostňuje relevanci práce k požadavku uživatele, a nikoli elitářství časopisu, ve kterém jsou publikovány. Staré práce mají více výhod, protože systém se zaměřuje na práce s více citacemi [50] [51] [52] .

Funkčnost Google Academy přispěla k popularizaci používání scientometrických ukazatelů pro hodnocení práce výzkumníků: řada zaměstnavatelů na ně začala spoléhat při hodnocení kandidátů [48] . Vyhledávač měl také vliv na hnutí otevřeného přístupu . Prostřednictvím spolupráce s předními vydavateli přiměl Google Scholar komerční vydavatele, aby digitalizovali abstrakty placených článků – předtím nebyly souhrny k dispozici k prohlížení a uživatelé je mohli prohlížet pouze po získání plného přístupu k papíru [4] .

Kritika

Mnoho výzkumníků varuje před používáním služby Google Scholar jako jediného zdroje pro revizi vědecké literatury. Důvodem jsou chyby v algoritmu hodnocení, někdy ukazující nepřesné výsledky, katalogizační chyby, přiřazení chybných citací nebo zahrnutí nepřísně akademického materiálu. Pokrytí indexovaných děl je rovněž omezeno na přístup k určitým organizacím a podléhá dohodě s vydavateli [28] . Vyhledávání stipendií Google není ani reprodukovatelné, ani transparentní – opakované dotazy často vracejí různé výsledky [53] [54] [31] . Indexované časopisy navíc nepodléhají ručnímu ověřování, což vede ke vstupu do databáze predátorských časopisů [55] . Studie z roku 2021 také zjistila lingvistické zkreslení v algoritmu Akademie Google – dokumenty publikované v jiných než anglických jazycích jsou systematicky odsouvány do pozic, které je činí téměř neviditelnými [56] .

Rozšíření Google Scholar přispělo k Matthewovu efektu — relativně malý počet publikací přitahuje neúměrně rostoucí počet citací, zatímco většina ostatních prací zůstává do značné míry bez povšimnutí [57] . Vědci totiž nadále vybírají články z nejlepších výsledků, automaticky za předpokladu jejich platnosti (například na základě velkého počtu předchozích citací) a také je citují ve svých pracích [58] [59] . Algoritmus hodnocení Akademie Google má však řadu zranitelností. Výzkumníci experimentovali s manipulací se svými vlastními individuálními citačními žebříčky přidáním neviditelných slov na přední stranu jednoho ze svých příspěvků na konferenci a změnou obsahu a bibliografie některých svých již publikovaných příspěvků. To mělo za následek nárůst citací a zlepšení individuálního skóre [60] [61] . Propagace individuálních citačních skóre portálem navíc potenciálně vede ke zhoršení kvality vědeckých prací, protože výzkumníci se více zabývají individuálními citačními skóre než obsahem [62] .

Poznámky

  1. 1 2 3 Noorden, 2014 .
  2. Anurag Acharya. Tech Guru Anurag Acharya . Nový Indian Express (15. listopadu 2014). Získáno 10. května 2022. Archivováno z originálu dne 2. listopadu 2021.
  3. 1 2 Bude mnohem snazší prolomit paywally Vědeckého žurnálu . Kabelové. Získáno 11. května 2022. Archivováno z originálu dne 11. května 2022.
  4. 1 2 3 Steven Levy. Gentleman, který udělal učence . Drátováno (17. října 2014). Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  5. 1 2 3 4 John Markoff. Google plánuje novou službu pro vědce a učence . The New York Times (18. listopadu 2004). Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  6. 1 2 Gusenbauer, 2019 , pp. 177-214.
  7. 1 2 3 4 5 6 Bizenkov, 2017 .
  8. 12. května 2007 .
  9. Daniel Terdiman. Nástroj pro učence, kteří rádi kopají hluboko . The New York Times (25. listopadu 2004). Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  10. Google Nouveau . Příroda. Datum přístupu: 10. května 2022.
  11. Google Scholar dělá známku . Drátové (7. května 2007). Získáno 11. května 2022. Archivováno z originálu dne 17. května 2022.
  12. Amy Cavender. Knihovna Google Scholar . Kronika vysokého školství (19. prosince 2013). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  13. Ryan Cordell. Automatizace výzkumu pomocí Google Scholar Alerts . Kronika vysokého školství (1. července 2010). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  14. Paul Stapleton. Čína musí odblokovat Google Scholar a ponechat internet otevřený pro své výzkumníky . South China Morning Post (27. května 2015). Získáno 11. května 2022. Archivováno z originálu dne 17. května 2022.
  15. Alexis Modrigal. Čínští vědci říkají, že ztráta Google by poškodila výzkum . Drátováno (24. února 2010). Získáno 11. května 2022. Archivováno z originálu dne 17. května 2022.
  16. Věda trpí tím, jak Čína ucpává díry ve Velkém firewallu . Věda (1. září 2017). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  17. Richard Van Noorden. Dodržujete mandáty pro veřejný přístup? Služba Google Scholar sleduje . Příroda (31. března 2021). Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  18. Pola Lem. Přesun s otevřeným přístupem Google Scholar „vysílá účinnou zprávu“ . Research Professional News (25. března 2021). Získáno 12. května 2022. Archivováno z originálu dne 21. dubna 2021.
  19. Dewan, 2012 , str. 41-42.
  20. Walters, 2007 , s. 1121-1132.
  21. 1 2 3 4 5 Thelwall, 2021 , str. 871-906.
  22. 1 2 3 4 Jim Giles. Nastartujte své motory  // Příroda. — 2005.
  23. 1 2 3 4 Bakkabalbasi, 2006 .
  24. Jasco, 2005 , str. 208.
  25. 1 2 3 4 5 6 7 Jak Google Scholar Judges Research . Společenskovědní prostor (19. března 2019). Získáno 11. května 2022. Archivováno z originálu dne 21. ledna 2021.
  26. Věda přímo do Googlu . O'relly radar (3. července 2007). Získáno 14. května 2022. Archivováno z originálu dne 21. dubna 2008.
  27. 1 2 3 Jonathan Knepper. Současný stav Google Scholar: Vše, co jsme se naučili po práci s webovými deníky . Komunita Business 2 (4. listopadu 2021). Staženo: 11. května 2022.
  28. 1 2 3 Ayllon, 2015 , str. 931-949.
  29. Jia You. Jak velká je služba Google Scholar? Ummm… . Věda (30. září 2014). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  30. David Matthews. Topit se v literatuře? Tyto chytré softwarové nástroje mohou pomoci . Příroda. Získáno 11. května 2022. Archivováno z originálu dne 27. dubna 2022.
  31. 12 Jasco , 2005 .
  32. Khabsa, 2014 .
  33. Aalst, 2010 , str. 387-399.
  34. Declan Butler. Vyhledávání ve vědě řadí na vyšší rychlost, protože Google spouští nástroj Scholar . Příroda. Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  35. Maharana, 2006 , pp. 475-481.
  36. Beel, 2009 , s. 160-164.
  37. Google klade nový důraz na stipendium . The Guardian (22. listopadu 2004). Získáno 11. května 2022. Archivováno z originálu dne 17. května 2022.
  38. Beel, 2009 , s. 230-241.
  39. Schilhan, 2021 .
  40. Wilde, 2010 .
  41. Wietold Kinc. Akademické SEO: 7 kroků k optimalizaci výzkumných článků pro vyhledávače . De Gruyterova konverzace (9. dubna 2014). Získáno 16. května 2022. Archivováno z originálu dne 20. ledna 2022.
  42. Získejte nalezení – optimalizujte své výzkumné články pro vyhledávače . Elsevier. Získáno 16. května 2022. Archivováno z originálu dne 23. října 2019.
  43. James Fallows. V IBM je to s Googlem tak včera . The New York Times (26. prosince 2004). Získáno 6. května 2022. Archivováno z originálu dne 17. května 2022.
  44. Bauer, 2005 .
  45. Alakangas, 2015 , pp. 787-804.
  46. 12. Maharana , 2006 .
  47. 12 Haddaway , 2015 .
  48. 12 Grofman , 2020 .
  49. Richard Van Norden. Online spolupráce: Učenci a sociální síť . Příroda (13. 8. 2014). Získáno 6. května 2022. Archivováno z originálu dne 11. května 2022.
  50. 1 2 Stojíme na ramenou giganta Google: Udržitelné objevy a komplexní pokrytí služby Google Scholar. . Blog LSE (19. listopadu 2015). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  51. Varshney, 2012 .
  52. 101 Inovace ve vědecké komunikaci: jak se výzkumníci vypořádávají s nesčetnými novými nástroji . Blog LSE (11. listopadu 2015). Získáno 12. května 2022. Archivováno z originálu dne 23. dubna 2022.
  53. Neal Haddaway. Nefunkční systém – proč vyhledávání literatury potřebuje FÉROVOU revoluci . Blog LSE (3. února 2020). Získáno 6. května 2022. Archivováno z originálu dne 26. dubna 2022.
  54. Halevi, 2017 .
  55. Gina Kolata. Mnoho akademiků touží publikovat v bezcenných časopisech . New York Times (30. října 2017). Získáno 15. května 2022. Archivováno z originálu dne 8. listopadu 2017.
  56. Rovira, 2021 .
  57. Perc, 2014 .
  58. Dumay, 2015 .
  59. Hilda Bastian. Rizika a alternativy Google Scholar . PLOS (27. září 2019). Získáno 11. května 2022. Archivováno z originálu dne 17. ledna 2022.
  60. Jacso, 2011 , s. 154-160.
  61. John Bonannon. Google Scholar vítězí – ale dá se mu věřit? . Věda (3. ledna 2014). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.
  62. Jak Google Scholar změnil Akademii? . Forbes (8. srpna 2017). Získáno 12. května 2022. Archivováno z originálu dne 17. května 2022.

Literatura