Digital Dark Age je koncept, který popisuje potenciální mizení historických dat v informačním věku kvůli ztrátě přístupu k elektronickým dokumentům. K tomuto scénáři může vést nedostatek postupů elektronické archivace , zastaralost formátů souborů a paměťových médií . Termín „digitální temný věk“ je odkazem na termín „ temný věk “, který se často používá k popisu středověku .
O problému se začalo diskutovat již na konci 90. let, kdy již nebyly dostupné soubory uložené ve starých formátech a začaly se zhoršovat magnetické pásky a disky, což vedlo k zániku mnoha velkých databází. Postupem času byl také ztracen přístup k jednotkám a médiím, které postupně odešly z oběhu, včetně disket , zip mechanik a CD . Jako odkaz na zmizení informací v roce 1997 na konferenci Mezinárodní federace knihovnických asociací a institucí bylo navrženo použít termín „digitální temný věk“.
Aby se zabránilo nástupu „doby temna“, vědci navrhují rozvinout praxi elektronické archivace a vytvořit papírové kopie digitálních dat.
Tradičně se na archivaci a uchovávání informací podíleli mniši a kláštery. Jejich práce zajistila uchování informací o dědictví řecké , římské a arabské kultury . S rozšířením tisku v 15. století [1] přešly tyto povinnosti postupně na knihovníky a archiváře soukromých i veřejných knihoven [2] , kteří evidovali informace o vlastnických právech, daňových dokladech, dovozech a vývozech . Až do začátku informačního věku na konci 20. století byla naprostá většina materiálů uložena na papíře. Navzdory nebezpečí zežloutnutí stránky a potenciální zranitelnosti vůči ohni, vodě a zničení v důsledku času byly takové dokumenty všeobecně dostupné [3] [4] .
S nástupem „ informačního věku “ se výměna dat stala převážně digitální [4] . Stále více badatelů se proto začalo ptát, co by se stalo v případě úplného přechodu na elektronický formát, zatímco neexistovaly fyzické kopie, jako jsou tištěné dokumenty a fotografie. Podle jejich názoru hrozí, že se mnoho dat jednoho dne ztratí a další generace se k nim nedostanou [2] .
Koncem 90. let se ukázaly nedostatky archivace elektronických dokumentů. Takže soubory uložené ve starých formátech již nebyly dostupné a magnetické pásky a disky se začaly zhoršovat, což vedlo k zániku mnoha velkých databází [5] . Postupem času se ztratil přístup k jednotkám a médiím, které postupně odešly z oběhu, včetně disket , zip mechanik a CD [6] [7] .
V roce 1997 na konferenci Mezinárodní federace knihovnických asociací a institucí vědci poprvé navrhli k popisu tohoto problému použít termín Digital Dark Age . Slovní spojení „doba temna“ je odkazem na středověk – období, které se vyznačovalo téměř úplnou absencí písemných důkazů [4] [8] . Jiní odborníci nazývají 21. století „informační černou dírou“ z obavy, že software a počítače budoucnosti nebudou schopny reprodukovat data vytvořená v naší době [9] . V roce 2015 americký vědec a viceprezident společnosti Google Vinton Cerf učinil prohlášení, že lidstvo směřuje k „digitálnímu temnému věku“. Ve svém projevu v National Press Club of Washington vyjádřil znepokojení nad obecným stavem uchovávání elektronických materiálů a obhajoval rozvoj postupů pro archivaci elektronických informací v souladu s autorským zákonem [10] [11] [12] [13] .
Archivace digitálních dat ve 21. století má dvě hlavní výzvy. Prvním je potřeba udržovat fyzické médium v provozuschopném stavu. Politické krize, stejně jako přírodní katastrofy, jako jsou povodně a zemětřesení, mohou zasahovat do údržby a údržby zařízení [4] .
Druhý důvod souvisí se zastaralostí formátů – řada z nich se může v budoucnu ukázat jako nečitelná. Je to dáno vývojem softwaru, vznikem nových formátů souborů a ukončením podpory starých [14] [15] .
V roce 1986 BBC spustila projekt BBC Domesday (nebo Doomsday) na oslavu 900. výročí Domesday Book , souboru materiálu napsaného v roce 1086 na příkaz Williama Dobyvatele . Král nechal provést podrobný průzkum pozemkového majetku svého království a sestavil poznatky do pětidílného vydání, které se v současné době nachází v Národním archivu Velké Británie . Projektu BBC se zúčastnilo více než milion lidí, včetně dětí z přibližně 9 000 škol po celé Velké Británii, které byly požádány, aby zdokumentovaly svá rodná města. Informace získané davem byly kombinovány s profesionálními fotografiemi, mapami, videoprohlídkami historických míst a celým sčítáním v roce 1981. Následně byla všechna data nahrána na několik laserových disků. Na počátku 21. století se však ukázalo, že téměř všechna fyzická média projektu Domesday byla rozbita nebo ztracena a data byla nenávratně ztracena [6] .
Dalším příkladem je program Lunar Or od NASA , který pořídil detailní fotografie měsíčního povrchu . Všechny snímky byly zaznamenány na magnetické pásky , které bylo možné číst pouze pomocí vzácného modelu LTO [16] . Z tohoto důvodu byl přístup k materiálům na několik desetiletí ztracen, obnoven byl až po dlouhodobém rozboru dat a studiu mechanismu činnosti strojů, které zaznamenávají informace na magnetické pásky [4] .
V roce 1995 americká vláda téměř ztratila přístup k některým údajům ze sčítání lidu kvůli zastaralé technologii vyhledávání dat [5] .
V roce 2019 vyšlo najevo, že sociální síť Myspace odstranila veškerou hudbu nahranou na web v letech 2003 až 2015. Bylo smazáno přibližně 53 milionů souborů. Nenávratná ztráta dat způsobila širokou veřejnou reakci [17] [18] .
V prosinci 2018 vláda Maine oznámila ztrátu velkého množství dokumentace vytvořené v letech 2005-2011 administrativou guvernérů Anguse Kinga a Johna Baldacciho . Ztracená data zahrnovala většinu e-mailů odeslaných jménem státní vlády před rokem 2008 [3] .
V roce 2019 přestala fungovat sociální síť Google+ , která smazala profily zakladatelů a vedoucích zaměstnanců společnosti - Sundara Pichaie , Erica Schmidta , Sergeye Brina a Larryho Page [19] . To mělo za následek ztrátu dat o některých klíčových rozhodnutích v historii Google, jako je vyjasnění firemní politiky týkající se programu PRISM v roce 2013 [20] .
Jednou z hlavních podmínek pro široké zavedení postupů elektronické archivace je vytvoření společných standardů pro uchovávání digitálních materiálů. Mezinárodní standard Open Archival Information System (OAIS) , poprvé publikovaný v roce 1997, tak definuje přístupy a řešení v oblasti elektronické archivace [21] . OAIS obsahuje popis „archivního balíčku“ a „digitálních objektů“. Následně se standard stal prototypem pro budoucí iniciativy k vytváření elektronických úložišť , přístupu k existujícím databázím a metadatům [22] . V roce 2003 byl OAIS schválen jako mezinárodní standard IISO 14721:2003 „Základní model otevřeného archivního informačního systému“ (Open Archival Information System) l (OAIS) [23] .
Dalším základním standardem je DOD 5015.2, vytvořený jako výsledek řady mezinárodních spoluprací InterPARES Project , zahájený v letech 1994-1997 Univerzitou Britské Kolumbie ve spolupráci s Ministerstvem obrany USA a US National Archives and Records Administration [24] [25] [26] [27] .
„Digital Dark Age“ lze předejít implementací řady technických strategií pro uchovávání elektronických dokumentů. Jednou z těchto strategií je konzervace – práce s materiály v originálních formátech a na originálních médiích. Díky tomu jsou původní informace k dispozici v původním formátu [28] .
Mezi další způsoby archivace patří emulace (reprodukce funkčního systému pro zajištění přístupu k zastaralým souborům a formátům) [21] [28] , enkapsulace (začlenění technického popisu dokumentu do samotného digitálního objektu, čímž se sníží jeho závislost na vnějším prostředí) [21] [29] , stejně jako migrace (přenos elektronických dokumentů na jiná média nebo do jiného operačního systému, např. z magnetické pásky na CD). Poslední zmíněná metoda je jednou z nejoblíbenějších, protože umožňuje zachovat integritu digitálního materiálu a schopnost uživatelů vyhledávat a používat informace a nezáviset na zastarávání technologií [28] [30] [31] . V některých případech se využívá digitální archeologie nebo záchrana elektronických objektů, které se staly nedostupnými v důsledku technologického zastarávání a/nebo fyzické degradace. Vzhledem k vysokým nákladům a nedostatku záruk na vymáhání se však použití takové metody obvykle považuje za nezbytné opatření [31] [21] .
V roce 1996 americký počítačový programátor Brewster Cale založil neziskový Internet Archive v San Franciscu . Činnost „Archivu“ je zaměřena na archivaci všech informací, které byly kdy zveřejněny na internetu. Sbírka se skládá z mnoha archivovaných webových stránek, digitalizovaných knih, audio a video souborů, her, softwaru. V roce 2001 Cale spustil samostatnou službu Wayback Machine , která ukládá webové stránky pomocí vyhledávacích robotů nebo web crawlerů [32] . Archivované obrázky jsou zobrazeny ve formátu HTML , JavaScript a CSS [33] [34] . V červenci 2021 poskytoval Wayback Machine přístup k více než 591 miliardám uložených webových stránek [35] [36] .
Mezi další podobné projekty patří portál Harvard Law School Library Perma.cc [37] , archive.today [38] a WebCite [39] .
V roce 2007 oznámily National Archives of Great Britain a Microsoft zahájení spolupráce v oblasti archivace dat. V rámci společného projektu společnost spolupracovala s Britskou knihovnou na instalaci Virtual PC , sady vizualizačního softwaru, která uživatelům umožňuje spouštět více operačních systémů současně a přistupovat ke staršímu formátu Microsoft Office . Pouze v archivech Velké Británie je tedy asi 580 terabajtů dat zaznamenaných na starších verzích Office [40] .
V roce 2018 bylo po výsledcích každoročního Světového ekonomického fóra v Davosu rozhodnuto o spuštění Globálního centra pro kybernetickou bezpečnost. Činnost centra je zaměřena na prevenci nástupu digitálního temného věku [41] . Služby digitálního uchovávání jako LOCKSS , HathiTrust a Portico [42] pracují na dlouhodobé kontrole a údržbě elektronických materiálů .
V rámci boje proti ztrátě digitálních dat mnoho publikací archivuje svá vlastní vydání. Například The Economist poskytuje elektronické kopie každého čísla od svého prvního vydání v roce 1843 [43] a The New York Times zahájily projekt na zachování online obsahu. Oficiální web novin obsahuje kopii HTML stránek od okamžiku, kdy byly poprvé publikovány, se zachováním designu [44] .
Jednou z prvních organizací, která vyvinula postupy uchovávání e-mailů, byl Smithsonian Institution Archives . Archivy ve svých sbírkách ukládají e-mailové záznamy z 80. let 20. století vytvořené pomocí ELM [45] . Pod vedením Kongresové knihovny byl program National Digital Information Infrastructure and Preservation Program archivním programem , který šířil informace o problémech uchovávání digitálních dat [46] .
Na archivaci vědeckých prací se podílejí projekty jako Jstor , DSpace [47] , arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [48] . Od října 2021 je v Adresáři časopisů s otevřeným přístupem uvedeno více než 16 900 časopisů s otevřeným přístupem a více než 5 milionů článků [49] .
Jednotliví výzkumníci a novináři poukazují na to, že každodenní digitální data nepotřebují další archivaci kvůli skutečnosti, že internet je již plný informací, které lidé přidávají na své účty na sociálních sítích. Další generace tedy nebudou mít problémy s přístupem k informacím [50] . Jiní kritizovali termín pro jeho předpokládanou „alarmistickou“ povahu. Podle zastánců této teorie již v oblasti uchovávání dat došlo k výraznému pokroku a používání takové rétoriky problém pouze zveličuje a záměrně překrucuje situaci [51] .