WebCite

WebCite
WebCite

URL webcitation.org
Typ webu archiv
jazyky) Angličtina
Majitel University of Toronto
Autor Gunther Eysenbach [d]
Začátek práce 2003
Země
 Mediální soubory na Wikimedia Commons

WebCite je webová archivační služba spuštěná v roce 2003 Günterem Eisenbachem z University of Toronto . WebCite zajišťuje dlouhodobou dostupnost URL . Služba nepoužívala vyhledávací roboty k archivaci celých zdrojů a zpracovávala požadavky uživatelů na uložení jednotlivých stránek. WebCite „zachytil“ HTML , PDF , CSS , JavaScript , obrázky a další součásti webové stránky.

Od července 2019 byla WebCite efektivně vyřazena z důvodu letitých finančních problémů: služba již nepřijímá žádosti o archivaci, ale nadále obsluhuje již vytvořené archivy. Předtím byla tato služba jedním z nejpopulárnějších nástrojů ve svém výklenku, který Wikipedie aktivně používal k archivaci zdrojů. Od konce roku 2020 je WebCite v Rusku blokován kvůli „propagandě nebo obchodu s drogami“.

Historie

Myšlenka vytvoření WebCite patří Güntheru Eisenbachovi , zaměstnanci Centra pro globální inovace eHealth   na  University of Toronto . Zpočátku Eisenbach koncipoval WebCite jako platformu, která nejen šetří internetové zdroje, ale také určuje jejich „citační index“ (analogický s impakt faktorem ), měřící počet hypertextových odkazů vedoucích na konkrétní web. V roce 1998 zdůvodnil Eisenbach potřebu takové služby ve svém článku o kontrole kvality internetu, publikovaném v PubMed Central [1] . V témže roce byl spuštěn stejnojmenný pilotní projekt, který však nebyl prodloužen - s rozšířením záběru „ Internet Archive “ a Google Cache nevznikla naléhavá potřeba takové služby [2 ] .

Eisenbach znovu spustil WebCite v roce 2003. Podnítil to článek publikovaný v Science o zániku odkazů ve vědeckých pracích, který naznačoval nedostatečnou standardizaci v oblasti elektronické archivace [3] . Navíc všechny tehdy existující webové archivační služby šetřily zdroje pomocí vyhledávacích robotů (nebo webových prohledávačů), archivace webových stránek na vyžádání byla nemožná. WebCite zaplnil tuto mezeru a stal se první platformou svého druhu, která archivovala stránky na vyžádání uživatelů. Partnery projektu jsou Katedra informačních studií a Knihovna University of Toronto , stejně jako Internet Archive. Dále bylo vytvořeno stejnojmenné neziskové konsorcium , jehož členy se mohly stát redakce vědeckých časopisů a nakladatelství. V roce 2008 měla asi 200 členů [4] [2] [4] .

Poprvé po vytvoření WebCite byl financován Centrem pro globální inovace eHealth. Částečně práci služby hradili členové konsorcia, kteří potřebovali archivovat odkazy použité v publikacích autora [5] . Od roku 2011 se WebCite potýkal s problémy s financováním, a tak Eisenbach zvažoval komercializaci služby. V roce 2012 byla společnost WebCite nucena opustit International Consortium for the Preservation of the Internet , protože podle Eisenbachova tweetu nebyla schopna zaplatit svůj roční členský příspěvek ve výši 4 000 EUR [6] [7] .

V roce 2013 zahájil Eisenbach fundraisingovou kampaň na modernizaci WebCite. Deklarovaná částka byla 25-50 tisíc $, předpokládalo se, že pokryje i převod databáze na Amazon EC2 (v roce 2012 velikost archivu 2 terabajty [8] ) a právní podporu. Sbírka probíhala na platformě FundRazr [8] .

Služba byla aktivně využívána v práci Wikipedie . Ještě v červnu 2009 byl WebCite dočasně nedostupný z důvodu zvýšené zátěže serverů způsobené prací robota WebCiteBOT v anglické sekci . Úplné zotavení trvalo několik týdnů [9] . Na pozadí pokračujících finančních potíží WebCite redaktoři Wikipedie v únoru 2013 navrhli, aby projekt převzala nadace Wikimedia Foundation , protože v té době archivovala více než 500 000 odkazů z wiki článků, ale vše bylo omezeno na diskusi o nápadu. v rámci komunity [10] . Stránka byla dočasně nedostupná také v letech 2013 a 2014 [11] .

Finanční potíže vedly k faktickému uzavření projektu. Od července 2019 WebCite nepřijímá nové žádosti o archiv, ale nadále podporuje přístup k již vytvořeným webovým archivům [12] [13] .

Jak to funguje

WebCite poskytuje dlouhodobou dostupnost URL archivovaných na přímou žádost uživatele. Služba je založena výhradně na open source softwaru [14] [2] . Slovo WebCite je registrovaná ochranná známka [15] .

WebCite se častěji používá k ukládání statických webů . Stejně jako mnoho jiných webových archivačních služeb nedokázala plně zachránit složité webové stránky s dynamickým obsahem [16] .

WebCite poskytl uživatelům tři hlavní archivační nástroje. Prvním je speciální formulář na webu s poli pro zadání URL a e-mailu , který obdržel odkazy na kopii požadované webové stránky. Druhým nástrojem je bookmarklet nebo malý JavaScriptový program, který se instaluje do prohlížeče a umožňuje ukládat vybrané webové stránky přímo v okamžiku jejich prohlížení na internetu. Třetí metodou s názvem Comb byla „hromadná“ archivace – služba vygenerovala seznam všech hypertextových odkazů na zadané stránce a uživatel mohl specifikovat ty zdroje, které bylo potřeba uložit. Nástroj Hřeben byl nejvhodnější pro zpracování velkých článků, které byly rozděleny do více stránek [5] .

Po zadání URL pořídil WebCite „snímek“ stránky, uložil kopii HTML a nahrál obrázky (nebo jakékoli jiné soubory, jako je PDF ) na server [4] . Poté uživatelé obdrželi dopis se dvěma novými odkazy na zadaný e-mail. První, delší, obsahovala URL původní stránky a datum archivace a mohla být použita místo původní adresy. Druhá, kratší, tyto informace neobsahovala a byla nejčastěji uvedena navíc k původní URL. WebCite tedy fungoval i jako zkracovač odkazů [2] . Také každé uložené webové stránce byl přiřazen jedinečný číselný identifikátor [5] .

Dlouhá a krátká verze odkazu https://webcitation.org/query?url=http://en.wikipedia.org/wiki/Main_Page&date=2008-03-04 http://webcitation.org/5W56XTY5h Archivováno 16. února 2012 na Wayback Machine

Návštěvníci webu mohou vyhledávat dokumenty v kolekci WebCite pomocí adresy URL, data zkopírování stránky nebo ID přiřazeného stránce [5] .

Použití

Autoři, editoři a vydavatelé se zájmem o vytvoření funkčních odkazů na online zdroje, které lze použít pro citování v akademických publikacích, hojně využívají WebCite [5] [6] [17] . Archivační služby byly poskytovány zdarma, vydavatelé se však mohli připojit ke stejnojmennému konsorciu a za členský poplatek získat přístup ke službě retrospektivní archivace – v tomto případě WebCite nastavil vyhledávací roboty, které „česaly“ články organizace. neuložené adresy URL. Publikace konsorcia také nařídily použití služby ve svých podmínkách a nařídily autorům, aby archivovali všechny použité odkazy přes WebCite před odesláním rukopisů [18] [14] [19] .

Práce WebCite byla založena na doktríně fair use . Služba považuje archivované kopie stránek za transformační díla – veřejně užitečná pro vědecký výzkum a nepoškozující tržní hodnotu jakéhokoli autorského díla [4] [5] . WebCite proto nepožádal o povolení archivovat konkrétní zdroj, ale odstranil stránky z veřejného přístupu na žádost držitelů autorských práv. Taková díla byla umístěna v „temném archivu“ ( anglicky  dark archive ), k němuž bylo možné získat placený přístup – 200 $ za 5 stran plus 100 $ za každých následujících 10 stran. Služba se řídila standardem robot výjimky , značkami no-cache a no-archive [14] [20] .

V Rusku je doména webcitation.org zahrnuta do Jednotného registru zakázaných stránek . Služba byla přidána do registru rozhodnutím Ministerstva vnitra dne 20. listopadu 2020 s důvodem „propaganda nebo prodej drog“ [21] .

Poznámky

  1. Diepgen, 1998 .
  2. 1 2 3 4 Eysenbach, 2008 , str. 378-389.
  3. Going, Going, Gone: Lost Internet  References . Věda (31. října 2003). Získáno 21. prosince 2021. Archivováno z originálu dne 22. prosince 2021.
  4. 1 2 3 4 Časté dotazy konsorcia  WebCite® . Webová citace. Získáno 21. prosince 2021. Archivováno z originálu dne 29. září 2011.
  5. 1 2 3 4 5 6 Alexej Kutovenko. Internetoví kronikáři.  Služby ukládání do mezipaměti webových zdrojů . OSP Průvodce digitálními komunikačními technologiemi (6. listopadu 2011). Získáno 26. prosince 2021. Archivováno z originálu dne 31. května 2020.
  6. 12 Ian Milligan . Tři nástroje pro webového historika: Memento, Zotero a WebCite . Aktivní historie (7. července 2014). Získáno 21. prosince 2021. Archivováno z originálu dne 24. září 2021.  
  7. Příspěvek na Twitteru  ( 11. června 2012). Získáno 21. prosince 2021. Archivováno z originálu dne 5. března 2016.
  8. 1 2 Konverzace mezi GiveWell a Webcite dne  4/10/13 . Dávejte dobře. Získáno 21. prosince 2021. Archivováno z originálu dne 20. listopadu 2021.
  9. Gunther Eysenbach  . Cvrlikání. Získáno 27. prosince 2021. Archivováno z originálu dne 6. června 2019.
  10. WebCite  . _ Meta – Wikimedia. Získáno 21. prosince 2021. Archivováno z originálu dne 24. listopadu 2021.
  11. Data o provozuschopnosti služby v celé její historii jsou fragmentovaná
  12. Fund WebCite (http://www.webcitation.org  ) . FundRz. Staženo: 18. prosince 2021.
  13. Archive Now (archivenow  ) . GitHub. Získáno 20. prosince 2021. Archivováno z originálu dne 20. prosince 2021.
  14. 1 2 3 Eysenbach, 2005 .
  15. WebCite Právní informace a informace o autorských  právech . Konsorcium WebCite. Získáno 16. června 2009. Archivováno z originálu dne 25. července 2008.
  16. Matthew Cockerill. Odkazy na webové stránky poskytují přístup k archivované kopii odkazovaných webových  stránek . BMC (17. září 2007). Získáno 21. prosince 2021. Archivováno z originálu dne 31. srpna 2021.
  17. Alexander Lawrence. Odhalení skrytých spojení s ID Google  Analytics . Bellingcat (23. července 2015). Získáno 21. prosince 2021. Archivováno z originálu dne 27. října 2021.
  18. Michail Gorbunov-Posadov. Živá publikace  (anglicky) . O.S.P. Získáno 26. prosince 2021. Archivováno z originálu dne 13. června 2019.
  19. Leighton Walter Kille. Rostoucí problém internetové „hniloby odkazů“ a osvědčené postupy pro média a online  vydavatele . The Journalist's Resource (9. října 2015). Získáno 21. prosince 2021. Archivováno z originálu dne 10. října 2021.
  20. Zásady žádostí o zastavení šíření WebCite  . webová stránka. Získáno 27. prosince 2021. Archivováno z originálu dne 11. prosince 2021.
  21. Blokovaný web webcitation.org  (eng.) . Rubanlist.com je seznam zakázaných stránek. Získáno 1. ledna 2022. Archivováno z originálu 3. ledna 2022.

Literatura

Odkazy