WebCite | |
---|---|
WebCite | |
| |
URL | webcitation.org |
Typ webu | archiv |
jazyky) | Angličtina |
Majitel | University of Toronto |
Autor | Gunther Eysenbach [d] |
Začátek práce | 2003 |
Země | |
Mediální soubory na Wikimedia Commons |
WebCite je webová archivační služba spuštěná v roce 2003 Günterem Eisenbachem z University of Toronto . WebCite zajišťuje dlouhodobou dostupnost URL . Služba nepoužívala vyhledávací roboty k archivaci celých zdrojů a zpracovávala požadavky uživatelů na uložení jednotlivých stránek. WebCite „zachytil“ HTML , PDF , CSS , JavaScript , obrázky a další součásti webové stránky.
Od července 2019 byla WebCite efektivně vyřazena z důvodu letitých finančních problémů: služba již nepřijímá žádosti o archivaci, ale nadále obsluhuje již vytvořené archivy. Předtím byla tato služba jedním z nejpopulárnějších nástrojů ve svém výklenku, který Wikipedie aktivně používal k archivaci zdrojů. Od konce roku 2020 je WebCite v Rusku blokován kvůli „propagandě nebo obchodu s drogami“.
Myšlenka vytvoření WebCite patří Güntheru Eisenbachovi , zaměstnanci Centra pro globální inovace eHealth na University of Toronto . Zpočátku Eisenbach koncipoval WebCite jako platformu, která nejen šetří internetové zdroje, ale také určuje jejich „citační index“ (analogický s impakt faktorem ), měřící počet hypertextových odkazů vedoucích na konkrétní web. V roce 1998 zdůvodnil Eisenbach potřebu takové služby ve svém článku o kontrole kvality internetu, publikovaném v PubMed Central [1] . V témže roce byl spuštěn stejnojmenný pilotní projekt, který však nebyl prodloužen - s rozšířením záběru „ Internet Archive “ a Google Cache nevznikla naléhavá potřeba takové služby [2 ] .
Eisenbach znovu spustil WebCite v roce 2003. Podnítil to článek publikovaný v Science o zániku odkazů ve vědeckých pracích, který naznačoval nedostatečnou standardizaci v oblasti elektronické archivace [3] . Navíc všechny tehdy existující webové archivační služby šetřily zdroje pomocí vyhledávacích robotů (nebo webových prohledávačů), archivace webových stránek na vyžádání byla nemožná. WebCite zaplnil tuto mezeru a stal se první platformou svého druhu, která archivovala stránky na vyžádání uživatelů. Partnery projektu jsou Katedra informačních studií a Knihovna University of Toronto , stejně jako Internet Archive. Dále bylo vytvořeno stejnojmenné neziskové konsorcium , jehož členy se mohly stát redakce vědeckých časopisů a nakladatelství. V roce 2008 měla asi 200 členů [4] [2] [4] .
Poprvé po vytvoření WebCite byl financován Centrem pro globální inovace eHealth. Částečně práci služby hradili členové konsorcia, kteří potřebovali archivovat odkazy použité v publikacích autora [5] . Od roku 2011 se WebCite potýkal s problémy s financováním, a tak Eisenbach zvažoval komercializaci služby. V roce 2012 byla společnost WebCite nucena opustit International Consortium for the Preservation of the Internet , protože podle Eisenbachova tweetu nebyla schopna zaplatit svůj roční členský příspěvek ve výši 4 000 EUR [6] [7] .
V roce 2013 zahájil Eisenbach fundraisingovou kampaň na modernizaci WebCite. Deklarovaná částka byla 25-50 tisíc $, předpokládalo se, že pokryje i převod databáze na Amazon EC2 (v roce 2012 velikost archivu 2 terabajty [8] ) a právní podporu. Sbírka probíhala na platformě FundRazr [8] .
Služba byla aktivně využívána v práci Wikipedie . Ještě v červnu 2009 byl WebCite dočasně nedostupný z důvodu zvýšené zátěže serverů způsobené prací robota WebCiteBOT v anglické sekci . Úplné zotavení trvalo několik týdnů [9] . Na pozadí pokračujících finančních potíží WebCite redaktoři Wikipedie v únoru 2013 navrhli, aby projekt převzala nadace Wikimedia Foundation , protože v té době archivovala více než 500 000 odkazů z wiki článků, ale vše bylo omezeno na diskusi o nápadu. v rámci komunity [10] . Stránka byla dočasně nedostupná také v letech 2013 a 2014 [11] .
Finanční potíže vedly k faktickému uzavření projektu. Od července 2019 WebCite nepřijímá nové žádosti o archiv, ale nadále podporuje přístup k již vytvořeným webovým archivům [12] [13] .
WebCite poskytuje dlouhodobou dostupnost URL archivovaných na přímou žádost uživatele. Služba je založena výhradně na open source softwaru [14] [2] . Slovo WebCite je registrovaná ochranná známka [15] .
WebCite se častěji používá k ukládání statických webů . Stejně jako mnoho jiných webových archivačních služeb nedokázala plně zachránit složité webové stránky s dynamickým obsahem [16] .
WebCite poskytl uživatelům tři hlavní archivační nástroje. Prvním je speciální formulář na webu s poli pro zadání URL a e-mailu , který obdržel odkazy na kopii požadované webové stránky. Druhým nástrojem je bookmarklet nebo malý JavaScriptový program, který se instaluje do prohlížeče a umožňuje ukládat vybrané webové stránky přímo v okamžiku jejich prohlížení na internetu. Třetí metodou s názvem Comb byla „hromadná“ archivace – služba vygenerovala seznam všech hypertextových odkazů na zadané stránce a uživatel mohl specifikovat ty zdroje, které bylo potřeba uložit. Nástroj Hřeben byl nejvhodnější pro zpracování velkých článků, které byly rozděleny do více stránek [5] .
Po zadání URL pořídil WebCite „snímek“ stránky, uložil kopii HTML a nahrál obrázky (nebo jakékoli jiné soubory, jako je PDF ) na server [4] . Poté uživatelé obdrželi dopis se dvěma novými odkazy na zadaný e-mail. První, delší, obsahovala URL původní stránky a datum archivace a mohla být použita místo původní adresy. Druhá, kratší, tyto informace neobsahovala a byla nejčastěji uvedena navíc k původní URL. WebCite tedy fungoval i jako zkracovač odkazů [2] . Také každé uložené webové stránce byl přiřazen jedinečný číselný identifikátor [5] .
Dlouhá a krátká verze odkazu https://webcitation.org/query?url=http://en.wikipedia.org/wiki/Main_Page&date=2008-03-04 http://webcitation.org/5W56XTY5h Archivováno 16. února 2012 na Wayback MachineNávštěvníci webu mohou vyhledávat dokumenty v kolekci WebCite pomocí adresy URL, data zkopírování stránky nebo ID přiřazeného stránce [5] .
Autoři, editoři a vydavatelé se zájmem o vytvoření funkčních odkazů na online zdroje, které lze použít pro citování v akademických publikacích, hojně využívají WebCite [5] [6] [17] . Archivační služby byly poskytovány zdarma, vydavatelé se však mohli připojit ke stejnojmennému konsorciu a za členský poplatek získat přístup ke službě retrospektivní archivace – v tomto případě WebCite nastavil vyhledávací roboty, které „česaly“ články organizace. neuložené adresy URL. Publikace konsorcia také nařídily použití služby ve svých podmínkách a nařídily autorům, aby archivovali všechny použité odkazy přes WebCite před odesláním rukopisů [18] [14] [19] .
Práce WebCite byla založena na doktríně fair use . Služba považuje archivované kopie stránek za transformační díla – veřejně užitečná pro vědecký výzkum a nepoškozující tržní hodnotu jakéhokoli autorského díla [4] [5] . WebCite proto nepožádal o povolení archivovat konkrétní zdroj, ale odstranil stránky z veřejného přístupu na žádost držitelů autorských práv. Taková díla byla umístěna v „temném archivu“ ( anglicky dark archive ), k němuž bylo možné získat placený přístup – 200 $ za 5 stran plus 100 $ za každých následujících 10 stran. Služba se řídila standardem robot výjimky , značkami no-cache a no-archive [14] [20] .
V Rusku je doména webcitation.org zahrnuta do Jednotného registru zakázaných stránek . Služba byla přidána do registru rozhodnutím Ministerstva vnitra dne 20. listopadu 2020 s důvodem „propaganda nebo prodej drog“ [21] .