Elektronická archivace ( digital preservation ) je soubor postupů, strategií a pracovních postupů pro ochranu elektronických dokumentů před zastaráním a ztrátou informací. Činnosti digitální archivace mají za cíl vytvořit, udržovat a uchovávat integritu digitálních informací. Pro označení praxe elektronické archivace se používá několik termínů - digitální uchovávání (doslova - elektronické nebo digitální uchovávání), digitální archivace (elektronická nebo digitální archivace) nebo digitální správa (správa digitálních dat). Často se tyto pojmy používají zaměnitelně, ale použití jednotlivých termínů se v jednotlivých zemích liší.
Praxe elektronické archivace se začala objevovat v polovině 90. let, kdy se s rozvojem informačních technologií a nových typů digitálních médií stále častěji objevovala otázka potřeby dlouhodobého uchovávání digitálních objektů. Potřeba toho vznikla kvůli relativně krátké životnosti digitálních médií - například spolehlivost ukládání informací na diskety a paměťové karty je jen několik let a v případě optických disků - od 3 do 20 let. Magnetické pásky jsou považovány za nejstabilnější způsob uchovávání informací , na kterých lze data spolehlivě uchovat 15 až 30 let. Až do počátku 90. let byly digitální informace duplikovány v papírových kopiích. Ne všechny materiály však byly tímto způsobem archivovány - vzhledem k tomu, že je řada elektronických dokumentů neveřejná, nepodléhala archivaci.
Elektronické archivační činnosti jsou regulovány řadou přijatých mezinárodních standardů a zpráv pracovních skupin, včetně modelu Open Archival Information System (OAIS), Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project , PRONOM a další. Proces archivace digitálních materiálů probíhá prostřednictvím konzervačních strategií (práce s materiály v původních formátech a na originálních médiích, s využitím původní technologie nebo dříve používaného hardwaru a softwaru), emulace (reprodukce funkčnosti zastaralého systému pro zajištění práce se zastaralými materiály). datové formáty), zapouzdření (začlenění technického popisu dokumentu do samotného digitálního objektu, čímž se sníží jeho závislost na vnějším prostředí, protože tyto informace umožňují buď reprodukovat původní prostředí nebo přenést dokument do nového) , migrace (přenos elektronických dokumentů na jiná média nebo na jiný operační systém - např. z magnetické pásky na CD), digitální archeologie (způsob archivace materiálů, který spočívá v záchraně těch digitálních objektů, které se staly nedostupnými v důsledku technologické zastaralosti a/nebo fyzická degradace), strategie obnovy (přenos informace z jednoho trvalého média na jiné) nebo webovou archivaci ( proces shromažďování, uchovávání a extrahování webových stránek a materiálů z internetu za účelem jejich umístění do elektronického archivu pro přístup budoucím generacím).
První pokusy o automatizaci akcí lze vysledovat již ve 14. století, kdy byly vynalezeny zvonkohry – mechanické zvonice ovládané pedálovým mechanismem, který při otáčení pák přiváděl do požadované sekvence díky upevnění na kovový válec s kolíky [1]. . Tento princip bubnové automatizace byl následně zaveden v textilním průmyslu – v 18. století vznikl první děrný štítek nebo papírová páska s otvory, kterými procházely člunky [2] . Brzy se děrné štítky začaly používat k automatizaci výpočtů, tvořily základ analytického motoru Charlese Babbage [3] a později - tabulátorů a počítačů první generace [4] [5] .
Až do 70. let 20. století byly děrné štítky široce používány pro ukládání a zadávání dat – bylo na nich možné zakódovat až 80 znaků. Rychlý rozvoj počítačů však vedl ke vzniku alternativních způsobů ukládání a automatizace dat [6] . V roce 1954 bylo vytvořeno první magnetické médium IBM 350 a v roce 1956 pevný disk [7] . Již v 60. letech 20. století byl děrný štítek nahrazen magnetickým páskem , který se stal přední metodou pro záznam a automatizované zpracování informací [8] [9] . S vývojem a zavedením magnetických disků a flash pamětí pro ukládání a záznam informací výrazně vzrostla jejich kapacita a výkon. Objevil se však problém křehkosti paměťových médií, což negativně ovlivnilo bezpečnost dat. Spolehlivost ukládání informací na magnetických discích a flash kartách je tedy jen několik let – tato média jsou nestabilní jak vůči teplotám nad 100 ℃, tak vůči silným elektromagnetickým polím . Informace na optických discích se postupně vymazávají pod vlivem 50-70 ℃, jsou schopny uchovat data od 3 do 20 let. Nejspolehlivějším způsobem uchovávání informací jsou magnetické pásky, na kterých lze data ukládat od 15 do 30 let [10] .
S rozvojem informačních technologií a nových typů digitálních médií se problematika dlouhodobého uchovávání elektronických informací stala aktuálnější. Až do počátku 90. let byla většina digitálních informací duplikována na papírové kopie. Ne všechny materiály však byly tímto způsobem archivovány a mnoho elektronických dokumentů nepodléhalo papírové archivaci z důvodu uzavření pro veřejnost [11] [12] . První projekty elektronické archivace se začaly objevovat v druhé polovině 90. let. V roce 1996 tedy australský projekt Zachování přístupu k digitálním informacím (PADI) získal vládní financování. Jeho provedení bylo svěřeno Národní knihovně Austrálie . PADI publikoval zprávy o projektech a články v časopisech na širokou škálu témat a také zaznamenal formování odborné komunity v oblasti digitálního uchovávání [13] . Ve stejném roce byl zahájen projekt webové archivace Internet Archive [14] založený Brewsterem Keilem , projekty Švédské národní knihovny (Projekt kulturního dědictví) a Australské národní knihovny (Projekt PANDORA) [15] . V roce 1998 vytvořila řada evropských národních knihoven Networked European Deposit Library (NEDLIB) za účelem uchování elektronických objektů v knihovním systému [16] . Ve stejné době se začaly vyvíjet projekty na vývoj efektivních archivačních strategií - Arts and Humanities Data Service (1999) a Project CAMiLEON (1999). Od roku 2000 byly všude zavedeny postupy elektronického uchovávání dat. V roce 2000 tak Kongresová knihovna iniciovala iniciativu Minerva ke sběru a archivaci elektronických informací a holandský projekt Digital Preservation Testbed se stal součástí národního programu pro uchování digitálních informací. V roce 2001 byla vytvořena Digital Preservation Coalition - koalice organizací zavádějících postupy elektronické archivace ve Spojeném království a dalších zemích. V roce 2006 byl založen podobný projekt - Digital Preservation Europe [17] [18] .
Strategie elektronické archivace, které se zavádějí po celém světě, změnily role knihoven, archivů a vydavatelů tradičně odpovědných za archivaci informací. Od roku 2000 se do uchovávání elektronických záznamů zapojují také soukromé organizace, vědecká datová centra, neziskové organizace [19] .
V roce 2003 se UNESCO pokusilo spojit mezinárodní úsilí o vytvoření systematického přístupu k elektronické archivaci vydáním Charty digitální ochrany, která vyzvala světové společenství, aby zavedlo strategie pro zachování ohrožených elektronických objektů. V roce 2012 byla na konferenci programu UNESCO Paměť světa znovu zdůrazněna potřeba jednotného mezinárodního úsilí o zachování a zpřístupnění elektronického dědictví. V důsledku toho vznikl v roce 2013 program PERSIST, zaměřený na zachování světového dokumentárního dědictví [20] [21] .
Účelem uchování digitálního dědictví je zpřístupnit jej veřejnosti. Přístup k materiálům digitálního dědictví, zejména k materiálům ve veřejné doméně, by proto měl být bez nepřiměřených omezení. Zároveň musí být zajištěna ochrana proti jakékoli formě narušení bezpečnosti informací důvěrné a soukromé povahy.[...]
Existuje nebezpečí, že digitální dědictví světa může být nenávratně ztraceno pro budoucí generace. Mezi faktory, které k tomu přispívají, patří zastaralost zařízení a programů, které poskytují přístup k digitálním materiálům, nejistota v otázkách poskytování zdrojů, odpovědnost a metody pro zajištění uchování a uchovávání, absence vhodných legislativních aktů.[...]
V případě pokud nebudou přijata opatření zaměřená na předcházení převládajícím hrozbám, dojde k rychlé a nevyhnutelné ztrátě digitálního dědictví. Přijetí opatření právní, hospodářské a technické povahy zaměřených na zachování dědictví bude přínosem pro členské státy. Existuje naléhavá potřeba zvýšit povědomí a zvýšit prosazování, upozornit tvůrce politik a podnítit veřejný zájem jak o potenciál digitálních médií, tak o praktické aspekty uchovávání digitálních záznamů.
K označení postupů pro elektronickou archivaci se používá několik termínů - digital preservation (z angličtiny - "electronic / digital preservation"), digitální archivace (z angličtiny - "electronic / digital archiving") nebo digitální správa (z angličtiny - "management of electronic / digitální data"). Často se tyto pojmy používají zaměnitelně, ale použití jednotlivých termínů se v jednotlivých zemích liší. Například ve Spojených státech se termín „digital preservation“ ( digital preservation ) používá častěji a zpravidla zahrnuje veškeré činnosti pro správu elektronických archivů od okamžiku jejich vytvoření. Termín „digitální uchovávání“ byl poprvé použit v roce 1992 v článku časopisu Theatre Crafts o nových typech digitálního uchovávání. Naopak ve Spojeném království se termín „správa digitálních dat“ ( digitální správa ) používá k označení postupů pro správu životního cyklu elektronických dokumentů a digitálního uchovávání – pro ty činnosti, které jsou zaměřeny na zajištění jejich dostupnosti. v budoucnu. Zároveň se termín preservation nebo „preservation“ v angličtině používá častěji než termín archiving nebo „archiving“, protože ten znamená uchování fyzických dokumentů ve stávajících materiálových úložištích. Z tohoto důvodu je uchování častěji označováno jako elektronické objekty [23] [24] [25] .
Pracovní skupina American Library Association , založená v roce 2007, definovala elektronickou archivaci jako kombinaci strategií, principů a postupů zaměřených na věrnou reprodukci ověřeného obsahu v průběhu času bez ohledu na problémy s médii a změny v technologiích ukládání. Tento koncept se vztahuje jak na dokumenty původně vytvořené v elektronické podobě, tak na digitalizované materiály [26] . Jinými slovy, jedná se o činnost výběru, uchovávání a uchovávání informací za účelem poskytnutí přístupu k nim budoucím generacím [27] [28] . Cornell University Library definuje elektronickou archivaci jako širokou škálu činností zaměřených na prodloužení životnosti strojově čitelných počítačových souborů a jejich ochranu před selháním médií, fyzickou ztrátou a zastaráním [27] [29] .
Elektronická archivace se snaží chránit a uchovávat informace pro budoucí generace [30] [31] [29] . Činnosti elektronického uchovávání se zaměřují na vytváření, udržování a uchovávání integrity digitálních informací. Vytvoření předpokládá specifikaci úplných a jasných specifikací souborů, vytvoření spolehlivých kmenových souborů a dostatečných popisných, administrativních a strukturálních metadat pro zajištění budoucího přístupu. Údržba je dokumentace všech akcí prováděných se soubory a úplné sledování změn. Uchování informací předpokládá vytvoření spolehlivé výpočetní a síťové infrastruktury, která umožňuje ukládat a synchronizovat materiály na více místech, stejně jako nepřetržité sledování a vývoj strategií pro zamezení ztráty dat [26] [32] .
Elektronická archivace může být v závislosti na cíli dlouhodobá (přístup je poskytován na dobu neurčitou), střednědobá (přístup na určitou dobu) a krátkodobá (přístup k digitálním materiálům po určitou dobu a / nebo do doby, než se stane nepřístupnou – např. v důsledku změn technologie) [28] [33] . Existují tři hlavní součásti infrastruktury elektronické archivace [24] :
Technologické aspekty elektronické archivace lze přitom rozdělit do následujících skupin [34] :
Rozhodnutí o nutnosti archivace digitálních objektů jsou založena na posouzení jejich trvalé hodnoty . Vyhodnocování je pouze jednou ze strategií, archiváři k výběru materiálů k uchování využívají i metody statistického vzorkování a analýzy rizik . Statistické vzorkování spoléhá na statistické metody k vytvoření reprezentativního vzorku a vhodnému výběru papírových a digitálních dokumentů pro uchování nebo digitalizaci. Metoda analýzy rizik spočívá v posouzení potenciálních potíží, které mohou při práci s digitálními zdroji nastat, a také jejich potenciálních důsledků – například riziko zastarání formátu souborů a médií, riziko ztrát spojených s neuchováním digitálních zdrojů , a tak dále. Analýza rizik se zpravidla provádí společně s dalšími výběrovými kritérii, jako jsou odhady nákladů [35] .
Od 80. let 20. století se stále více archivářů začalo věnovat tomu, že vytváření digitálních objektů a jakýchkoli elektronických záznamů bylo prováděno bez zohlednění požadavků na jejich dlouhodobé uchování. Počátkem 90. let se stal zřejmým problém zastarávání softwaru a tím i nemožnost spolehlivé archivace informací vytvořených s jeho pomocí. Se zavedením elektronické archivace se objevily první pokusy o regulaci procesu. Vznikla tak pracovní skupina projektu InterPARES, která se zabývala vývojem modelu pro výběr elektronických objektů k archivaci [36] [37] .
Přidělte makro- a mikro-hodnocení. Makroevaluace je chápána jako výběr dokumentů pro archivaci na základě důležitosti kontextu – za důležité a cenné budou považovány všechny zdroje vytvořené určitými organizacemi, aktéry nebo v daném časovém období [35] . Podle modelu vyvinutého InterPARES se hodnocení kontextů elektronických dokumentů skládá ze čtyř hlavních kroků:
Rozhodnutí o archivaci spisů lze učinit na základě právně-administrativního kontextu (právní a správní systém, ve kterém byly materiály vytvořeny), finančního kontextu (tvůrce, jeho pravomoci, struktura a funkce), procesního kontextu (tzv. obchodní postup, během kterého jsou záznamy vytvářeny ), dokumentační kontext (struktura a vztahy s jinými dokumenty) nebo technologický kontext (technické součásti elektronických systémů, ve kterých vznikají digitální objekty) [36] .
Archiváři také shromažďují údaje o trvalé hodnotě a pravosti elektronických materiálů. Trvalá hodnota předmětu je určena schopností záznamů sloužit zájmům nebo potřebám tvůrců a společnosti. Může být zpochybněna v případech, kdy by mohlo dojít k porušení konzervace materiálů. Pokud má hodnotitel důvodné podezření, že záznamy ztratily svou autenticitu a liší se od své původní verze, je jejich archivace zpochybněna [36] .
Podle doporučení pracovní skupiny InterPARES se stanovení možnosti konzervace provádí v několika etapách. Nejprve znalec určí obsah materiálů a ty technické prvky, které musí být zachovány v souladu s požadavky na pravost. Hodnotitel pak tyto požadavky na uchování sladí s možnostmi organizace odpovědné za trvalé uchování archivovaných záznamů [36] .
Na základě předchozích vyhodnocení kritérií je uplatněno rozhodnutí o zachování dokumentu [36] .
Mikrohodnocení má určit hodnotu jednotlivých dokumentů. Jejím nejdůležitějším kritériem je soulad dokumentu se sbírkovou politikou schovatele - z důvodu nesplnění těchto kritérií může být žádost o elektronickou archivaci zamítnuta, a to i v případě cenných zdrojů. Například organizace Earth Resources Observation and Science (EROS) odmítla přístup k datové sadě tisíců záznamů pořízených NASA během mise vesmírného programu Apollo . Navzdory skutečnosti, že záběry mají pro USA nepopiratelnou hodnotu, EROS od nich upustil, protože většina filmů byla natočena z kosmické lodi nebo z povrchu Měsíce , přičemž posláním organizace je uchovávat filmy a fotografie pořízené z Země. Druhým nejdůležitějším hodnotícím kritériem je hodnota digitálních zdrojů, která může být také primární a sekundární. Primární hodnotou se rozumí administrativní, fiskální a právní hodnoty. Sekundární hodnota spočívá v užitečnosti, použitelnosti a dostupnosti materiálů. Třetím hodnotícím kritériem je cena, která může být rozhodujícím faktorem při výběru více verzí stejného materiálu. Archiváři berou v úvahu i proveditelnost archivace, protože někteří konzervátoři odmítají přijímat digitální zdroje v určitých souborových formátech nebo médiích, protože nemohou zajistit dlouhodobé uchování jednotlivých materiálů [35] .
Elektronická archivace se uplatňuje především u objektů vytvořených v digitálním prostředí nebo digitalizovaných. První kategorie zahrnuje data vytvořená pomocí nějaké digitální technologie. Digitalizovanými materiály se rozumí data převedená z analogové do digitální podoby pomocí skenování nebo změny formátu [38] . Nejčastěji se elektronická archivace uplatňuje v souvislosti s [27] :
Elektronická úložiště neboli datové sklady jsou jedním z ústředních prvků elektronické archivace. Repozitáře ukládají všechny druhy digitálních objektů spolu s jejich přidruženými popisnými a administrativními metadaty. Digitálními objekty mohou být články v elektronickém časopise, digitalizované obrázky fotografií, číselná data, digitální videa, plné verze knih [32] . V rámci hnutí otevřeného přístupu jsou repozitáře spojeny se „ zelenou “ cestou nebo praxí samoarchivace – autoři vědeckých materiálů mohou samostatně umístit články do příslušné sekce elektronického archivu a opatřit ji stručným popisem [39] [40] . Jeden z prvních hlavních tematických úložišť arXiv.org se objevil v roce 1991. Poskytuje přístup k vědeckým pracím v matematice, fyzice, informatice, kvantitativní biologii . Repozitáře umožňují nejen přístup ke sbírkám elektronických kopií děl, ale také automaticky přidávají publikace do databáze Citebase , která zajišťuje sledování citačního indexu [41] .
Repozitáře mohou být institucionální, disciplinární (nebo tematické) nebo národní. Tematické repozitáře zpřístupňují literaturu v jedné nebo více oblastech, institucionální repozitáře uchovávají díla vydaná v rámci téže instituce - zpravidla se jedná o technické zprávy, dizertační práce, databáze, články, tištěné publikace. Příkladem institucionálních repozitářů je DSpace MIT [42] . Samostatná úložiště byla vytvořena jako výsledek spolupráce s významnými vědeckými publikacemi – například Springer Nature podporuje službu In Review a Elsevier podporuje ChemRN. Také pod záštitou neziskového Centra pro otevřenou vědu existuje řada národních úložišť, včetně Arabirxiv ( předtisky z arabských zemí), Frenxiv ( francouzský server), INArxiv ( indonéský ), Indiarxiv ( indický ). Také předtisky latinskoamerických zemí jsou publikovány v repozitáři SciELO [43] [44] .
Organizace používají open source softwarové balíčky k vytváření a implementaci institucionálních úložišť. Patří mezi ně Eprints a DSpace . DSpace, vydaný v roce 2002, je open source univerzální repozitářová aplikace vyvinutá společně HP Labs a Massachusetts Institute of Technology Libraries pro multidisciplinární výzkumné organizace. DSpace používá vhodný standard metadat Dublin Core k popisu digitálních objektů a také podporuje protokol Open Archives Initiative Protocol for Metadata Harvesting [44] . Mezi další hlavní oborové repozitáře patří PubMed , založený v roce 1996, kde jsou publikovány práce z medicíny a biologie, PhilSci-Archive s články z filozofie a Social Science Research Network (SSRN), která zveřejňuje články v oblasti společenských a humanitních věd. od roku 1994. [40] . Jedním z největších archivů s otevřeným přístupem je Archive of European Integration , založený v roce 2003. Stránky zveřejňují dokumenty Evropské unie , které jsou určeny k veřejné distribuci. K lednu 2016 archiv obsahoval více než 41 800 dokumentů EU a asi 7 300 soukromých děl [45] . Řada zemí zavedla národní iniciativy k poskytování podpory infrastruktury pro úložiště, jako je projekt SHERPA ve Spojeném království , DARE v Nizozemsku a projekty australské vlády na podporu úložišť v hodnotě 12 milionů dolarů . Jednotlivé organizace si také mohou zakoupit služby, které poskytnou přístup k jednotlivým cloudovým zdrojům. Amazon tedy nabízí několik cloudových serverů najednou, včetně Amazon S3 pro hostování souborů [46] .
Zároveň se vyvíjejí systémy, které prohledávají více úložišť současně. Příkladem takového systému je OAIster , jehož prostřednictvím si můžete prohlížet informace o více než 200 úložištích [47] [48] [42] . OpenDOAR prohledává obsah téměř 3000 veřejně uvedených úložišť z celého světa [49] .
Jedním z hlavních standardů upravujících metadata je Dublin Core (DCMES), jehož hlavní soubor se skládá z 15 charakteristik [50] :
Dublin Core je běžný standard pro katalogizaci objektů. Vzhledem k obecné povaze DCMES však může být obtížné popsat složité sbírkové předměty. Z tohoto důvodu je ve většině případů Dublin Core kombinován s jinými standardy [51] .
Integrita a odolnost jsou základními charakteristikami archivovaných digitálních objektů. Integrita znamená zachování přesnosti a spolehlivosti dat po celou dobu jejich životního cyklu. Může se zlomit během přenosu nebo replikace dat. Udržování integrity je jedním z nejdůležitějších úkolů elektronické archivace [52] [53] . Perzistence znamená, že soubor zůstává během procesu elektronické archivace nezměněn a že je zachován ve formě, v jaké byl vytvořen [54] .
Mezinárodní standard PREMIS definuje metadata jako „informace, které úložiště používá k podpoře procesu digitálního uchovávání“. Metadata jsou informace o datech, jako je popis formátu souboru, softwaru a historie změn. V ideálním případě by měla být metadata shromažďována a aktualizována v průběhu životního cyklu digitálního objektu [55] . Primární úlohou metadat je identifikovat, popisovat a poskytovat inteligentní přístup k obsahu digitální sbírky. K popisu zdrojů, objevování, získávání, používání, reprezentaci a uchovávání digitálních objektů jsou potřeba různé typy metadat. Nejdůležitější metadata jsou pro organizování sbírek s vizuálními, zvukovými a animačními materiály, které je obtížné identifikovat bez textového popisu. Existuje několik typů metadat [24] :
Jedním z hlavních standardů upravujících metadata je Dublin Core (DCMES), jehož hlavní soubor se skládá z 15 charakteristik [50] :
Dublin Core je běžný standard pro katalogizaci objektů. Vzhledem k obecné povaze DCMES však může být obtížné popsat složité sbírkové předměty. Z tohoto důvodu je ve většině případů Dublin Core kombinován s jinými standardy [51] .
Dalším základním standardem je VRA Core. Na rozdíl od DCMES vám VRA Core umožňuje klasifikovat umělecká díla (nebo originální předměty) a jejich náhradníky (digitální obrázky) do různých kategorií. Toto řešení umožňuje vytvořit přesnější popis objektů a například uvést datum vzniku obou děl - původního díla i jeho fotografie [51] .
Preservation Metadata: Implementation Strategies neboli PREMIS byl vyvinut pracovní skupinou OCLC a RLG v roce 2005. Standard definuje jednotky metadat potřebné k ukládání souborů v úložištích. Pro rok 2021 je PREMIS spravován a sponzorován Kongresovou knihovnou . Standard se skládá ze dvou hlavních částí – datového modelu a slovníku. PREMIS definuje několik typů metadat, včetně popisných, strukturálních, technických a administrativních. Slovník klade velký důraz na dokumentaci digitálního původu (historie objektu) a vztahů, zejména mezi různými digitálními objekty v úložištích [24] . Podle standardu PREMIS by úložiště měla automaticky upravovat metadata pro každý jednotlivý elektronický objekt a uchovávat historii změn v souboru [56] [57] .
Základní principy elektronické archivace dat byly formulovány v řadě norem a iniciativ z konce 90. a počátku 20. století.
V roce 1994 iniciovala nezisková organizace Commission on Preservation and Access (CPA) spolu s knihovním konsorciem Research Libraries Group , speciální komisi, jejíž činnost byla zaměřena na identifikaci postupů pro dlouhodobou archivaci elektronických dokumentů a vypracování vhodných doporučení. Dalším cílem pracovní komise bylo vypracování alternativních postupů archivace – místo přenosu dat na nové verze stejných médií přijímaných v té době členové komise navrhli použití metody migrace a přesun elektronických objektů na nové pevné disky a software. V květnu 1996 vydala 21členná porota vedená Donaldem Watersem a Johnem Garrettem závěrečnou zprávu Preserving Digital Information. Zpráva obsahovala dvě hlavní doporučení – zapojení a určení tvůrců obsahu do postupů elektronické archivace a potřebu vytvořit síť spolehlivých a certifikovaných elektronických archivů [58] . Tento dokument se stal základem pro následná praktická doporučení k tématu [59] [34] . V roce 1997 byla jako výsledek spolupráce CPA a RLG vytvořena Rada pro knihovnické a informační zdroje [60] .
Skupina RLG zavedla několik praktických iniciativ k uvedení hlavních principů zprávy do praxe. Jedním z nich byl Studies in Scarlet, projekt realizovaný ve spolupráci s Harvard Law School Library na uchování souborů z Ameriky, Velké Británie a Irska z let 1815 až 1914 o domácím násilí , bigamii , porušení slibu uzavřít sňatek, opatrovnictví , znásilnění a vražda [61] . Dalším velkým projektem byl Global Immigration Project, který digitalizoval případy imigrace. Oba projekty byly věnovány digitalizaci a uchovávání dat, nicméně logika uchování byla v obou případech odlišná. Archivace dokumentů pro projekt Studies in Scarlet tedy vycházela z potřeby uvést do praxe základní principy RLG o infrastruktuře úložišť a v případě projektu Global Immigration Project z potřeby digitalizovat a zpřístupnit imigrační- související sbírky, jejichž kvalita se rychle zhoršovala. Lišily se i organizační modely projektů. Studie v Scarlet měly centralizovaný model – všechny materiály byly předloženy společně a archiv imigračních projektů sestával z řady různorodých sbírek uložených v 11 zúčastněných institucích v USA, Velké Británii a Kanadě . RLG zároveň zahájilo projekt Arches, zaměřený na vytvoření online úložiště digitálních zdrojů a softwarového prostředí pro mezinárodní přístup k archivním materiálům [62] . Arches je open source softwarová platforma vyvinutá ve spolupráci s Getty Conservation Institute a World Monuments Fund pro použití ochranářskými institucemi po celém světě. Arches poskytuje informace o archeologických nalezištích, budovách a strukturách, kulturní krajině, městských souborech [63] [64] .
Moderní přístupy a řešení v oblasti elektronické archivace vycházejí z konceptů a funkčních modulů formulovaných v mezinárodním standardu OAIS [65] . V roce 1990 začal Mezinárodní poradní výbor pro vesmírné datové systémy na žádost Mezinárodní organizace pro standardizaci (ISO) vyvíjet oficiální standardy pro dlouhodobou elektronickou archivaci informací generovaných během vesmírných misí. V roce 1995 se konala série mezinárodních seminářů, jejichž výsledkem bylo vydání referenčního modelu Open Archival Information System (OAIS). První verze byla zveřejněna v roce 1997 a konečná v roce 2002 (aktualizace v roce 2012). OAIS byl prvním systémem, který popsal koncept archivního balíčku a digitálních objektů. Následně se standard stal prototypem pro budoucí projekty na vytváření elektronických úložišť , přístupu k existujícím databázím a metadatům [58] . V roce 2003 byl OAIS schválen jako mezinárodní standard ISO 14721:2003 „Systémy přenosu dat a informací pro vesmír. Otevřený archivní informační systém. Referenční model“ (Systémy přenosu dat a informací z prostoru - Otevřený archivní informační systém - Referenční model (OAIS)) [66] . Standard jako první zavedl neutrální slovník popisující role a odpovědnosti aktérů při údržbě úložišť a regulaci uživatelského přístupu [34] . Standard OAIS tedy definoval a informoval o vývoji programu udržitelného digitálního uchovávání tím, že poskytuje společný slovník, informační model a architekturu digitálního uchovávání na vysoké úrovni [67] . OAIS je založen na třech hlavních konceptech – „prostředí OAIS“, „informace OAIS“, „externí interakce OAIS“. První kategorii tvoří „Producenti“, „Spotřebitelé“ a „Manažeři“ v prostředí obklopujícím archiv OAIS. Producenty mohou být jak jednotlivci, kteří poskytují data pro načtení do systému, tak systémy. Manažeři jsou ti aktéři, kteří se nepodílejí na každodenním chodu archivu, ale ovlivňují celkovou politiku OAIS. Jiné archivy OAIS nebo systémy nekompatibilní s OAIS mohou spolupracovat s archivem OAIS jako „producenti“ nebo „spotřebitelé“ [68] .
Podle OAIS by informační paket archivovaného objektu měl obsahovat následující informace [69] [66] :
Referenční model OAIS také popisuje tři typy informačních paketů [69] [66] :
V roce 2000 začaly RLG a Online Computer Library Center (OCLC) spolupracovat na vytvoření důvěryhodného digitálního úložiště (TDR nebo Trusted Electronic Repositories ) založeného na mezinárodním standardu OAIS. Zpráva o projektu byla vydána v srpnu 2001. Pracovní skupina RLG a OCLC podle dokumentu navrhuje vytvoření národních a mezinárodních systémů elektronických úložišť, které budou zodpovědné za zpřístupňování veřejného, sociálního, ekonomického, kulturního a intelektuálního dědictví. Podle doporučení zprávy by aktivity RLG, OCLC a dalších organizací měly být zaměřeny na rozvoj certifikace elektronických úložišť, studium a vytváření nástrojů pro identifikaci důležitých atributů digitálních materiálů pro uchování; výzkum a vývoj modelů pro kolaborativní sítě a služby úložiště [58] [70] . Spolu s touto definicí byly dány hlavní charakteristiky TDR - administrativní odpovědnost, organizační životaschopnost, finanční stabilita, technologická a procedurální kompatibilita a systémová bezpečnost [58] .
Důvěryhodné digitální úložiště je takové, jehož posláním je poskytovat důvěryhodný, dlouhodobý přístup ke spravovaným digitálním zdrojům konkrétní komunitě nyní i v budoucnu [34] .
V roce 2003 Skupina výzkumných knihoven vytvořila společnou pracovní skupinu s Národní správou archivů a záznamů USA , aby vyvinula specifická kritéria pro certifikaci elektronických úložišť. V roce 2005 začala RLG a Centrum výzkumných knihoven ověřovat základní principy v praxi a o dva roky později na základě výsledků výzkumu vydalo dokument Trustworthy Repositories Audit & Certification , který tvořil základ normy ISO 16363 a definoval základní principy pro vytváření a správu digitálních úložišť.dokumenty [71] .
V roce 2012 byla ve Spojených státech vytvořena komunita Digital Preservation Network (DPN), která zahrnovala asi 60 organizací, které se spojily, aby sdílely technologie, odborné znalosti a finanční zdroje, aby vytvořily transparentní a dlouhodobou službu elektronické archivace. Členství v neziskové organizaci DPN bylo dostupné pouze organizacím z USA, které měly zájem o dlouhodobé uchovávání elektronických informací [71] . Když se připojili k DPN, byli zahrnuti do sdílené úložné sítě fungující prostřednictvím pěti hlavních úložišť: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust , Stanford Digital Repository (SDR) a University of Texas Digital Repository (UTDR). Každé úložiště bylo považováno za „uzel“ v síti organizací DPN, které se nacházejí v různých částech USA a měly svou vlastní architekturu, hardwarovou platformu a organizační/finanční strukturu. Aktivity DPN byly zaměřeny na vytvoření udržitelného systému skladování materiálů [72] . V roce 2018 byla DPN rozpuštěna [73] .
InterPARES Project je série mezinárodních spoluprací, které jsou prováděny od roku 1994 pod názvem UBC Project. Projekt iniciovala University of British Columbia ve spolupráci s Ministerstvem obrany USA a Správou národních archivů a záznamů USA v letech 1994-1997. Jeho hlavním cílem bylo vyvinout metodiku elektronické archivace, která by umožnila uchovat materiály po dlouhou dobu v autentické podobě [74] . V roce 1999 byl InterPARES vytvořen na základě projektu UBC, který vedli výzkumníci Luciana Duranti a Terry Eastwood . První fáze projektu (1999-2001) byla věnována dlouhodobému uchovávání záznamů vytvořených a uchovávaných v databázích a systémech správy dokumentů. Ve druhé fázi projektu (2002-2007) výzkumníci analyzovali záznamy vzniklé v průběhu vědecké, umělecké a vládní činnosti. Ve třetí etapě projektu (2007-2012) byly získané praktické znalosti ověřeny v malých a středních archivních institucích. Poslední etapa (2013-2018) byla věnována elektronickým záznamům nahraným na internet samotnými uživateli [75] [76] . Výsledkem projektu bylo vytvoření DOD standardu 5015.2 pro evidenční systém [71] [74] .
V roce 2002 vytvořilo oddělení Digital Preservation Národního archivu Velké Británie PRONOM - technický registr obsahující informace o formátech souborů , softwaru a technických součástech repozitářů. Registr je neustále aktualizován a výzkumníci pracující se vzácnými a proprietárními formáty souborů mohou podávat žádosti. Zpočátku byl PRONOM považován za interní zdroj Národního archivu Velké Británie, ale později se změnil na otevřený mezinárodní portál [56] [77] .
Od roku 1996 do roku 2010 řídila Australská národní knihovna projekt Zachování přístupu k digitálním informacím (PADI) na podporu strategií a pokynů pro archivaci a zpřístupnění digitálních objektů všemi institucemi kulturního dědictví v Austrálii . Výsledkem projektu byl vytvoření společného tematického portálu, jehož prostřednictvím si instituce mohly volně vyměňovat informace a přistupovat k potřebným elektronickým zdrojům [56] .
V prosinci 2000 přidělil Kongres USA 100 milionů dolarů na vytvoření Národního programu digitální informační infrastruktury a ochrany (NDIIPP), který byl převeden do Kongresové knihovny . Peníze byly přiděleny na národní úsilí o plánování dlouhodobé archivace elektronických záznamů a spolupráci se zástupci dalších federálních, výzkumných, knihovnických a obchodních organizací [78] .
V říjnu 2011 byla v rámci mezinárodní konference „Zachování elektronických informací v informační společnosti: problémy a perspektivy“ v Moskvě přijata deklarace o uchování digitálních informací, která se později stala jedním ze zásadních dokumentů v oboru elektronické archivace [79] . Deklarace nastínila prioritní oblasti pro uchovávání digitálních informací a vydala řadu návrhů pro UNESCO, národní státy a vládní struktury na zavedení postupů pro digitalizaci dokumentů [80] .
Metodou uchovávání digitálních dat je práce s materiály v originálních formátech a na originálních médiích s využitím původní technologie nebo dříve používaného hardwaru a softwaru. V tomto případě vznikají tzv. „počítačová muzea“, kde jsou vizualizace a obsah materiálů udržovány v původním formátu a s původní funkčností. Uchování bylo označováno jako dočasná strategie elektronické archivace, i když pro některá digitální data je tato metoda nejlepším řešením díky své schopnosti zachovat původní přístupové nástroje, jako je software [65] [81] [82] . Z dlouhodobého hlediska je tato strategie problematická kvůli potenciálním problémům s údržbou a nákladům na udržování dostupnosti určitých typů souborů. Zachování také omezuje přenositelnost zdroje, která v tomto případě přímo závisí na zařízení uloženém na určitých místech [81] .
EmulaceEmulace se týká reprodukce funkcí systému pro zajištění provozu se staršími datovými formáty. Emulace znamená vytvoření virtuálního stroje na počítači, který umožňuje reprodukovat funkčnost původního hardwarového a softwarového prostředí [65] . V některých ohledech je emulace podobná konzervační strategii v tom, že zahrnuje zachování původního aplikačního programu. Cílem emulace je zachovat vzhled digitálního objektu i jeho funkčnost kopírováním technického obsahu zdroje a použitím původního objektu nebo aktualizované kopie původního objektu v budoucnu [81] . Emulační software byl vyvíjen nadšenci pro PC hry od počátku 90. let, ale od počátku 20. století také přitahoval zájem v komunitě pro uchovávání digitálních záznamů. Navzdory skutečnosti, že zpočátku byla emulace považována za technologicky složitý systém, navíc obtížně reprodukovatelný, postupně se metoda stala jednou z hlavních v oblasti elektronické archivace - nový vývoj, včetně zavedení emulátoru přímo do pluginu prohlížeče , výrazně zjednodušil použití. Emulátor je naprogramován tak, aby napodoboval chování starších hardwarových platforem a softwaru operačního systému, jako jsou hry a soubory. Tato strategie však nezahrnuje zachování staršího hardwaru a původního softwaru. Příkladem je Java Virtual Machine [81] [83] . Emulace se aplikuje jak na aplikace a operační systémy, tak na hardwarové platformy [84] .
Použití emulace pro přístup k formátům souborů a staršímu softwaru má několik výhod. Patří mezi ně možnost přístupu ke komplexním digitálním objektům, včetně her, virtuální reality a aplikací. Tím, že umožňuje uživatelům interagovat s digitálními objekty v jejich původním prostředí, poskytuje emulace výzkumníkům cenný kontext o prostředí, ve kterém tvůrce v té době pracoval. Při použití ve velkém měřítku může poskytnout přístup k velkým částem sbírky [83] . Použití emulace je však komplikováno potenciálními právními problémy – licenční podmínky pro starší software a operační systémy emulaci vždy neumožňují, protože tato metoda zahrnuje kopírování. Volba emulace jako strategie elektronické archivace může také vést k závislosti na zastaralosti emulátorů a časem naznačuje omezení kvůli ztrátě napájení zařízení [82] .
ZapouzdřeníMetoda zapouzdření znamená zahrnutí technického popisu dokumentu do kompozice samotného digitálního objektu, čímž se snižuje jeho závislost na vnějším prostředí, protože tyto informace umožňují buď reprodukovat původní prostředí, nebo přenést dokument do nového [ 65] [85] . Ve většině používaných metod ukládání informací jsou různé komponenty elektronických dat uloženy na různých místech (například v databázi nebo souborovém systému) jako součást různých digitálních objektů. Vztahy mezi různými komponentami jsou prostřednictvím odkazů, ukazatelů a názvů souborů. Rychlý rozvoj informačních technologií však vyžaduje, aby byl vztah mezi digitálními objekty stabilnější – oddělené ukládání složek elektronického záznamu je vždy zatíženo rizikem, a jakmile je vztah narušen a nelze jej obnovit, je záznam považován za ztracený. Tomuto riziku se může archivář vyhnout zahrnutím metadat do počítačových souborů obsahujících dokumenty. Při kombinaci dvou komponent v jednom fyzickém objektu nemůže dojít ke ztrátě vazby mezi záznamem a metadaty [86] . Zapouzdření lze aplikovat na digitální zdroje, jejichž formát je dobře definovaný a široce používaný [81] . Tato strategie také překonává problém technologického zastarávání formátů souborů, protože metadata zahrnují způsob, jak vytvořit originální aplikaci pro přístup k nim na pokročilejších počítačových platformách [87] [81] .
Mezinárodní standard OAIS také popisuje typy pomocných informací, které by měly být zahrnuty do zapouzdřeného souboru – původ (pro popis zdroje objektu), kontext (pro popis toho, jak objekt souvisí s jinými informacemi mimo „kontejner“), a odkaz na jeden nebo více identifikátorů (k jednoznačné identifikaci objektu) [81] .
MigraceMetodou migrace je přenos elektronických dokumentů na jiná média nebo do jiného operačního systému – například z magnetické pásky na CD. Tato strategie je jednou z nejoblíbenějších praktik v elektronické archivaci, protože zachovává integritu digitálního materiálu a schopnost uživatelů najít a používat informace, aniž by byli ovlivněni zastaralými technologiemi [81] [88] [82] .
Mezinárodní standard OAIS rozlišuje čtyři hlavní typy migrace: aktualizaci, replikaci, přebalení a transformaci. Aktualizace zajišťuje zachování spolehlivé kopie bitového toku , zatímco replikace a přebalování zajistí dostupnost spravovaného balíčku objektu [81] . Tato strategie je zaměřena na zachování obsahu přenášeného objektu, přičemž může dojít ke ztrátě některých technologických vlastností [81] [89] [90] .
Digitální archeologieDigitální archeologie je nákladná metoda archivace materiálů, která spočívá v záchraně těch digitálních objektů, které se staly nedostupnými v důsledku technologického zastarávání a/nebo fyzické degradace. Vzhledem k vysokým nákladům a chybějícím zárukám pro obnovení úplné úplnosti dat je použití takové strategie považováno za nezbytné opatření [82] [65] .
AktualizovatStrategie upgradu zahrnuje přenos informací z jednoho odolného média na druhé – například z rozpadající se 4mm DAT pásky na novou 4mm DAT pásku nebo ze starého CD-RW na nový CD-RW. Aktualizace je nezbytnou součástí každého úspěšného programu elektronické archivace, ale sama o sobě není strategií. Metoda řeší problém opotřebení a zastarávání médií, ale není považována za udržitelnou dlouhodobou archivační metodu [82] [91] [27] .
Archivace webuWebová archivace je proces shromažďování, uchovávání a extrahování webových stránek a materiálů z internetu za účelem jejich umístění do elektronického archivu pro přístup budoucím generacím. Tato strategie má za cíl překonat problém ztráty informací na internetu v důsledku dynamiky sítě a změn licenčních podmínek. Jednou z největších a nejslavnějších iniciativ v oblasti webové archivace byl neziskový Internet Archive , založený v roce 1996 . Sbírka Archive se skládá z mnoha podsbírek archivovaných webových stránek, digitalizovaných knih, audio a video souborů, her a softwaru. V roce 2001 Archives spustil Wayback Machine , službu věnovanou zachování velké části „otevřeného“ internetu. Uživatelé Wayback Machine mohou sledovat změny probíhající na vybraných stránkách a porovnávat různé verze úprav. V srpnu 2021 Wayback Machine poskytoval přístup k více než 581 miliardám uložených webových stránek [92] [93] [82] [94] .
Organizace mohou používat selektivní programy pro webovou archivaci. Mezi největší z těchto služeb patří PANDAS (PANDORA Digital Archiving System), jehož průkopníkem je Australská národní knihovna. PANDAS je webová aplikace napsaná v Javě a Perlu , která poskytuje rozhraní pro správu procesu webové archivace. Podobnou roli hraje nástroj The Web Creator Tool, open source nástroj pro workflow pro správu selektivní webové archivace, vyvinutý společně National Library of New Zealand a British Library s Oakleigh Consulting [95] .
Strategie | Výhody | Nedostatky | aplikace |
---|---|---|---|
Zachování | Udržuje vzhled. Umožňuje pracovat s původními formáty a softwarem. | Vysoké náklady na údržbu souboru. Bezpečnost závisí na vybavení. | Soubory se zastaralými formáty, software, prostředky, na jejichž vzhledu záleží. |
Emulace | Udržuje vzhled. | Složitost vytváření emulátoru. Spousta informací k uložení. Přístup k informacím vyžaduje archaický software. | Software; složité digitální zdroje (například obsahující spustitelné soubory); prostředky, jejichž hodnota je neznámá a jejichž využití je v budoucnu nepravděpodobné; zdroje, na jejichž vzhledu záleží. |
Zapouzdření | Ukládá informace o souboru a způsobu jeho přehrávání. | Znalosti o souboru a jeho systému přehrávání jsou zachovány. | Nepřístupné zdroje a zdroje se známými formáty. |
Migrace | Nevyžaduje ukládání původních aplikací. Podporuje aktivní přístup a ovládání. | Vysoké náklady na dlouhodobé uchování. Nedostatek možnosti ukládat metadata. Nutnost neustálé aktualizace a práce ze strany archivářů. | Zdroje, ke kterým se aktivně přistupuje a které jsou spravovány, jako jsou vědecká data nebo databáze. Zdroje s běžně používanými formáty. |
Digitální archeologie | Umožňuje rekonstruovat elektronické objekty, ke kterým byl ztracen přístup. | Vysoké náklady a žádné záruky na obnovu souborů. | Soubory, které byly ztraceny. |
Aktualizace | Řeší problém opotřebení a zastarávání médií. | Metoda je účinná pouze jako krátkodobé řešení. | Zdroje, jejichž médiím hrozí zastarání. |
Webová archivace | Řeší problém ztráty informací na internetu v důsledku dynamiky rozvoje sítě a změn licenčních podmínek. | Možné právní komplikace související s autorským zákonem. | Všechny soubory a stránky nalezené na internetu a považované za hodné archivace konzervátorem. |
Pro efektivní implementaci postupů elektronické archivace jsou organizace vyzývány, aby také zavedly strukturální změny. Aby se tedy snížil negativní vliv technologického zastarávání digitálních médií, je nutné přijmout a dodržovat mezinárodní standardy, které upravují otázky spojené s přejímáním softwaru a snižují závislost na aktualizacích vývojářů softwaru. Otevřené standardy pro digitální ochranu a archivaci jsou stanoveny oficiálními normalizačními orgány a mezinárodními konsorcii, včetně National Digital Stewardship Alliance (NDSA), World Wide Web Consortium (W3C), Mezinárodní organizace pro standardizaci a International Internet Preservation Consortium (IIPC). NDSA byla založena v roce 2010 a je konsorciem organizací, které se věnují dlouhodobému uchovávání digitálních informací. World Wide Web Consortium je aktivní od roku 1994 a je mezinárodním společenstvím, jehož členské organizace pracují na vývoji webových standardů. IIPC, která byla založena v roce 2003 v Bibliothèque nationale de France, má několik zapojených organizací, včetně National Library of Chile a Library of Congress, které vyvíjejí standardy a nástroje pro webovou archivaci [82] .
Uchování digitálních materiálů vyžaduje značné investice do technologické infrastruktury, která bude podporovat činnosti digitální archivace. Pro zajištění dlouhodobého uchování informací je nutné správně zvolit používané datové nosiče, které umožní přístup k informacím po dlouhou dobu. Například od roku 2000 nebylo používání magnetických a optických médií považováno za oprávněné. Kritéria výběru médií by měla zahrnovat analýzu otázek, jako je zastaralost, standardizace, náklady. Od roku 2010 jsou oblíbené trvalé lokální nebo cloudové úložné systémy [82] .
Úspěšná a dlouhodobá implementace postupů elektronické archivace vyžaduje lepší spolupráci mezi organizacemi, týmy profesionálů a tvůrci digitálních objektů. K tomu slouží mezinárodní konsorcia, tematické sítě organizací a open source software – například Open Journal Systems a DSpace [82] .
Z hlediska digitální ochrany je každý e-mail, skládající se z hlavičky, těla zprávy a příloh, komplexním komunikačním balíkem obsahujícím jedinečný zdrojový materiál, často s potenciální historickou, právní a administrativní hodnotou [96] . Výměna e-mailů je významnou součástí internetového provozu, ale součástí elektronických archivačních programů se stává poměrně zřídka. Například Knihovna Kongresu USA shromažďuje archiv veřejných tweetů z celého světa, webový archiv Spojeného království, internetový archiv a nadace Internet Memory Foundation se podílely na uchovávání webových stránek a shromažďování informací ze stránek; žádný z projektů však neshromažďuje informace přenášené e-mailem [97] . Hlavními důvody jsou potenciální důvěrnost e-mailů, rozdíly ve formátech e-mailových klientů a chybějící standardizovaný formát pro ukládání zpráv [97] [98] [96] .
Existuje řada projektů archivace e-mailů:
Počínaje rokem 2012 začal archiv Carcanet Press , vlastněný Manchesterskou univerzitní knihovnou , ukládat elektronickou korespondenci se slavnými básníky, kritiky, editory, překladateli a umělci. Projekt Carcanet Press Email Preservation Project využíval jak tradiční metody archivace, tak nové standardy pro digitální uchovávání:
Od roku 1999 do roku 2003, jako výsledek spolupráce mezi Archivem města Antverpy a Interdisciplinárním centrem práva a informatiky KU Leuven , byl aktivní projekt DAVID. Cílem tohoto projektu bylo vytvořit manuál pro elektronickou archivaci. Zaměstnanci přezkoumali právní a archivní požadavky na archivaci e-mailů a poukázali na některé možné strategie archivace. Kromě teoretické hodnoty byla zpráva důležitá v tom, že poté, co začala zavádět postupy pro správu záznamů a vedení evidence emailů a souvisejících elektronických dokumentů [99] .
Smithsonian Institution Archives byl mezi prvními organizacemi, které vyvinuly postupy uchovávání e-mailů. Archiv ve svých sbírkách uchovává e-mailové záznamy pocházející z 80. let minulého století a vytvořené pomocí ELM . Od té doby Smithsonian používá různé e-mailové aplikace a formáty, včetně PINE, cc: Mail , Lotus Notes , GroupWise a dalších aplikací. Zaměstnanci Smithsonianu dostali příkaz tisknout elektronickou poštu za účelem vedení záznamů, jak bylo v té době zvykem v jiných organizacích a podnicích. Protože v té době prakticky neexistovaly organizace, které by pracovaly v oblasti ukládání e-mailových dat, v roce 2005 vznikl ve spolupráci s Rockefeller Archive Center specializovaný projekt – Collaborative Electronic Records Project (CERP). Projekt trval tři roky a vyústil ve vytvoření standardů a postupů pro archivaci elektronických komunikací [100] [99] .
Od začátku roku 2008 funguje na Harvardské univerzitě pracovní skupina , která definuje strategie pro uchování elektronických zpráv. V roce 2015 byl na jeho základě spuštěn EAS, partnerský projekt mezi kanceláří knihovny Harvardské univerzity pro informační systémy (OIS) a řadou kurátorských organizací z divizí Harvardské knihovny [101] . EAS spolupracuje s Wordshackem na automatizaci procesu ukládání dat. Například e-mailové zprávy a přílohy vybrané pro dlouhodobé uložení jsou automaticky odesílány do DRS, služby elektronického úložiště Harvardské univerzity [101] .
XENA je bezplatný software s otevřeným zdrojovým kódem vyvinutý Australským národním archivem pro dlouhodobé uchovávání elektronických záznamů. Hlavní funkcí XENA je určit formát souboru digitálních záznamů a převést jej do vhodného formátu pro uchování na základě otevřených standardů . Software Xena přispívá k digitálnímu uchovávání prováděním dvou důležitých úkolů: definováním formátů souborů digitálních objektů a jejich převodem na otevřené formáty pro uchování [102] .
Uchovávání videoher se provádí prostřednictvím archivace vývoje zdrojového kódu , digitálních kopií videoher, emulace herních konzolí , údržby a uchovávání specializovaného videoherního hardwaru a digitalizace předdigitálních videoherních tištěných časopisů a knih . Uchování videoher umožňuje nejen prozkoumat historii odvětví, ale také analyzovat technické a kreativní aspekty výroby konkrétní hry [103] .
Technologie používaná k tvorbě her se od počátku 90. let výrazně změnila a v mnoha případech nelze původní hry té doby hrát z důvodu zastaralosti formátu [104] . Hry přitom vycházely zpravidla pro konkrétní konzoli, což značně komplikovalo jejich následnou konzervaci [105] . Proto se v tomto období začaly objevovat iniciativy na zachování dědictví videoher. Byla založena herní muzea, jako The Strong v New Yorku [106] , Museum of Art and Digital Entertainment v Aucklandu [107] , Berlin Computer Games Museum [108] , Museum of Soviet Arcade Stroje v Moskvě a Petrohradě [109] . Ve Spojených státech byla založena také nadace Video Game History Foundation, která se věnuje uchování nejen her, ale také časopisů, manuálů a propagačních materiálů k tématu. Mezi další hlavní iniciativy patří digitální distribuční služba GOG.com a sbírka arkádových emulátorů založených na prohlížeči v internetovém archivu [105] . Od roku 2015 Organizace spojených národů podporuje projekt Open Digital Library on Traditional Games, jehož cílem je elektronicky archivovat a chránit tradiční domorodé hry prostřednictvím katalogizace a budování společné databáze, ze které budou později vytvářeny videohry [110] [111] .
Od poloviny 90. let se ve vědeckém světě začalo rozvíjet hnutí za otevřenou vědu – stále více výzkumníků se stavělo proti paywallům a příliš vysokým nákladům na přístup k akademické literatuře na pozadí omezeného financování knihoven. Jedním z požadavků příznivců hnutí bylo otevření přístupu k vědeckým publikacím, především prostřednictvím publikování na internetu [112] [113] . Brzy se objevila první online úložiště a elektronické knihovny. Mezi ně patřily takové velké projekty jako arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [114] . Od srpna 2021 obsahuje adresář časopisů s otevřeným přístupem více než 15 900 časopisů s otevřeným přístupem a více než 5 milionů článků [115] . Přitom logika archivace vědeckých publikací v každém z projektů může být velmi odlišná. Například digitální databáze JSTOR byla vytvořena v roce 1995 pro ukládání digitálních kopií tištěných časopisů. Databáze zahrnuje pouze ty vědecké časopisy, ve kterých je publikování prováděno prostřednictvím systému vzájemného hodnocení . Důležitý je také počet organizací, které tento časopis odebírají, a citační rejstřík . Archivace probíhá podle principu "pohyblivé stěny" (Moving Wall) - čísla jsou v systému umístěna od okamžiku vzniku publikace až po 3-5 let do současnosti. Obsah zveřejněný na JSTOR není vždy ve veřejné doméně a může být skrytý za paywally . Přístup k takovým materiálům je zajištěn prostřednictvím systému institucionálního předplatného [116] [117] [118] . Archiv biomedicínské literatury PubMed Central, vytvořený Národní lékařskou knihovnou USA, byl spuštěn v únoru 2000. Přístup k materiálům zveřejněným na webu je bezplatný a neomezený [119] . Na druhé straně na portálu arXiv.org, který byl spuštěn v roce 1991, výzkumníci nezávisle zveřejňují předtisky nebo volně distribuují kopie svých publikovaných prací ve fyzice , matematice , astronomii , informatice a dalších exaktních vědách. Články nejsou před publikováním recenzovány , ale jsou zpočátku kontrolovány moderátory [120] .
S nástupem elektronických knihoven také vyvstal problém dlouhodobého uchovávání digitálních sbírek vědecké literatury - zajištění dostupnosti zdrojů pro budoucí generace vyžaduje zvláštní úsilí a neustálé investice [121] [122] . Materiály s otevřeným přístupem obecně neporušují autorská nebo vlastnická práva – knihovny nepotřebují zvláštní povolení k jejich ochraně. Pro dlouhodobé uchovávání literatury s otevřeným přístupem se organizacím doporučuje dodržovat otevřené mezinárodní standardy a implementovat otevřené formáty, včetně odt a xml [113] .
Jedním z hlavních problémů elektronické archivace je zastaralost technologií – v důsledku rychlých změn a vývoje vybavení a softwarových formátů může dojít ke ztrátě přístupu k elektronickým úložištím [27] . Paměťová média zastarají v průměru jednou za deset let a jsou nahrazena novými, efektivnějšími způsoby ukládání dat, a tedy novým hardwarem a softwarem. Současně se ukončuje podpora starších mediálních nástrojů. Kromě toho jsou paměťová média vystavena chybám a selháním, útokům virů a fyzické degradaci [65] . Pro elektronickou archivaci se organizacím doporučuje používat nechráněné, trvalé formáty, které jsou nezávislé na softwaru třetích stran [123] [124] .
Absence jednotné legislativy, politik, strategií a informovanosti v oblasti elektronické archivace rovněž komplikuje praxi uchovávání informací. Zákonodárci si například nemusí být vědomi požadavků na elektronickou archivaci a v důsledku toho může legislativa ignorovat nebo zcela neupravovat uchovávání digitálních dat. To vytváří další problémy z hlediska autorských práv [27] . Práva duševního vlastnictví a další zákonné povinnosti mohou bránit kopírování, ukládání, úpravám a používání obsahu digitálních zdrojů za účelem dlouhodobého uchování [82] . Otázka autorských práv a práv duševního vlastnictví u digitálních materiálů je mnohem složitější než u tradičních fyzických materiálů. V oblasti klasické archivace spolu s fyzickou kopií získala knihovna či archiv automaticky právo kopírovat a uchovávat [19] . Většina metod elektronické archivace však vyžaduje existenci a výkon výhradních práv k dílu, včetně práva na rozmnožování [125] . Kromě toho mohou vydavatelé zakázat kopírování publikací pomocí technických prostředků – což je povoleno a zakotveno v zákoně o autorských právech, a to jak ve Spojených státech , tak v Evropské unii. Jednotlivé materiály mohou mít také více držitelů autorských práv (včetně jiných vydavatelů, autorů, umělců, dodavatelů softwaru třetích stran), což může vydavatelům ztížit udělování práv na uchování knihovnám a dalším subjektům. Pokud se však v důsledku kopírování změní „vzhled“ nebo funkčnost publikace, autoři a tvůrci se mohou domnívat, že byla porušena jejich práva, může být obtížné prokázat, že uchovávané kopie publikací jsou pouze kopiemi a ne zcela nové verze [126] . Mezi možná řešení tohoto problému výzkumníci uvádějí potenciální zavedení licenčních smluv, které konkrétně vysvětlují podmínky ochrany [127] .
Mezi obtíže patří také lidský faktor , počítačové viry, přírodní katastrofy, selhání médií a softwaru [128] [27] .