Digitální doba temna

Digital Dark Age je koncept, který popisuje potenciální mizení historických dat v informačním věku kvůli ztrátě přístupu k elektronickým dokumentům. K tomuto scénáři může vést nedostatek postupů elektronické archivace , zastaralost formátů souborů a paměťových médií . Termín „digitální temný věk“ je odkazem na termín „ temný věk “, který se často používá k popisu středověku .

O problému se začalo diskutovat již na konci 90. let, kdy již nebyly dostupné soubory uložené ve starých formátech a začaly se zhoršovat magnetické pásky a disky, což vedlo k zániku mnoha velkých databází. Postupem času byl také ztracen přístup k jednotkám a médiím, které postupně odešly z oběhu, včetně disket , zip mechanik a CD . Jako odkaz na zmizení informací v roce 1997 na konferenci Mezinárodní federace knihovnických asociací a institucí bylo navrženo použít termín „digitální temný věk“.

Aby se zabránilo nástupu „doby temna“, vědci navrhují rozvinout praxi elektronické archivace a vytvořit papírové kopie digitálních dat.

Charakteristika

Tradičně se na archivaci a uchovávání informací podíleli mniši a kláštery. Jejich práce zajistila uchování informací o dědictví řecké , římské a arabské kultury . S rozšířením tisku v 15. století [1] přešly tyto povinnosti postupně na knihovníky a archiváře soukromých i veřejných knihoven [2] , kteří evidovali informace o vlastnických právech, daňových dokladech, dovozech a vývozech . Až do začátku informačního věku na konci 20. století byla naprostá většina materiálů uložena na papíře. Navzdory nebezpečí zežloutnutí stránky a potenciální zranitelnosti vůči ohni, vodě a zničení v důsledku času byly takové dokumenty všeobecně dostupné [3] [4] .

S nástupem „ informačního věku “ se výměna dat stala převážně digitální [4] . Stále více badatelů se proto začalo ptát, co by se stalo v případě úplného přechodu na elektronický formát, zatímco neexistovaly fyzické kopie, jako jsou tištěné dokumenty a fotografie. Podle jejich názoru hrozí, že se mnoho dat jednoho dne ztratí a další generace se k nim nedostanou [2] .

Koncem 90. let se ukázaly nedostatky archivace elektronických dokumentů. Takže soubory uložené ve starých formátech již nebyly dostupné a magnetické pásky a disky se začaly zhoršovat, což vedlo k zániku mnoha velkých databází [5] . Postupem času se ztratil přístup k jednotkám a médiím, které postupně odešly z oběhu, včetně disket , zip mechanik a CD [6] [7] .

V roce 1997 na konferenci Mezinárodní federace knihovnických asociací a institucí vědci poprvé navrhli k popisu tohoto problému použít termín Digital Dark Age . Slovní spojení „doba temna“ je odkazem na středověk – období, které se vyznačovalo téměř úplnou absencí písemných důkazů [4] [8] . Jiní odborníci nazývají 21. století „informační černou dírou“ z obavy, že software a počítače budoucnosti nebudou schopny reprodukovat data vytvořená v naší době [9] . V roce 2015 americký vědec a viceprezident společnosti Google Vinton Cerf učinil prohlášení, že lidstvo směřuje k „digitálnímu temnému věku“. Ve svém projevu v National Press Club of Washington vyjádřil znepokojení nad obecným stavem uchovávání elektronických materiálů a obhajoval rozvoj postupů pro archivaci elektronických informací v souladu s autorským zákonem [10] [11] [12] [13] .

Důvody

Archivace digitálních dat ve 21. století má dvě hlavní výzvy. Prvním je potřeba udržovat fyzické médium v ​​provozuschopném stavu. Politické krize, stejně jako přírodní katastrofy, jako jsou povodně a zemětřesení, mohou zasahovat do údržby a údržby zařízení [4] .

Druhý důvod souvisí se zastaralostí formátů – řada z nich se může v budoucnu ukázat jako nečitelná. Je to dáno vývojem softwaru, vznikem nových formátů souborů a ukončením podpory starých [14] [15] .

Příklady

V roce 1986 BBC spustila projekt BBC Domesday (nebo Doomsday) na oslavu 900. výročí Domesday Book , souboru materiálu napsaného v roce 1086 na příkaz Williama Dobyvatele . Král nechal provést podrobný průzkum pozemkového majetku svého království a sestavil poznatky do pětidílného vydání, které se v současné době nachází v Národním archivu Velké Británie . Projektu BBC se zúčastnilo více než milion lidí, včetně dětí z přibližně 9 000 škol po celé Velké Británii, které byly požádány, aby zdokumentovaly svá rodná města. Informace získané davem byly kombinovány s profesionálními fotografiemi, mapami, videoprohlídkami historických míst a celým sčítáním v roce 1981. Následně byla všechna data nahrána na několik laserových disků. Na počátku 21. století se však ukázalo, že téměř všechna fyzická média projektu Domesday byla rozbita nebo ztracena a data byla nenávratně ztracena [6] .

Dalším příkladem je program Lunar Or od NASA , který pořídil detailní fotografie měsíčního povrchu . Všechny snímky byly zaznamenány na magnetické pásky , které bylo možné číst pouze pomocí vzácného modelu LTO [16] . Z tohoto důvodu byl přístup k materiálům na několik desetiletí ztracen, obnoven byl až po dlouhodobém rozboru dat a studiu mechanismu činnosti strojů, které zaznamenávají informace na magnetické pásky [4] .

V roce 1995 americká vláda téměř ztratila přístup k některým údajům ze sčítání lidu kvůli zastaralé technologii vyhledávání dat [5] .

V roce 2019 vyšlo najevo, že sociální síť Myspace odstranila veškerou hudbu nahranou na web v letech 2003 až 2015. Bylo smazáno přibližně 53 milionů souborů. Nenávratná ztráta dat způsobila širokou veřejnou reakci [17] [18] .

V prosinci 2018 vláda Maine oznámila ztrátu velkého množství dokumentace vytvořené v letech 2005-2011 administrativou guvernérů Anguse Kinga a Johna Baldacciho . Ztracená data zahrnovala většinu e-mailů odeslaných jménem státní vlády před rokem 2008 [3] .

V roce 2019 přestala fungovat sociální síť Google+ , která smazala profily zakladatelů a vedoucích zaměstnanců společnosti - Sundara Pichaie , Erica Schmidta , Sergeye Brina a Larryho Page [19] . To mělo za následek ztrátu dat o některých klíčových rozhodnutích v historii Google, jako je vyjasnění firemní politiky týkající se programu PRISM v roce 2013 [20] .

Prevence

Tvorba společných norem

Jednou z hlavních podmínek pro široké zavedení postupů elektronické archivace je vytvoření společných standardů pro uchovávání digitálních materiálů. Mezinárodní standard Open Archival Information System (OAIS) , poprvé publikovaný v roce 1997, tak definuje přístupy a řešení v oblasti elektronické archivace [21] . OAIS obsahuje popis „archivního balíčku“ a „digitálních objektů“. Následně se standard stal prototypem pro budoucí iniciativy k vytváření elektronických úložišť , přístupu k existujícím databázím a metadatům [22] . V roce 2003 byl OAIS schválen jako mezinárodní standard IISO 14721:2003 „Základní model otevřeného archivního informačního systému“ (Open Archival Information System) l (OAIS) [23] .

Dalším základním standardem je DOD 5015.2, vytvořený jako výsledek řady mezinárodních spoluprací InterPARES Project , zahájený v letech 1994-1997 Univerzitou Britské Kolumbie ve spolupráci s Ministerstvem obrany USA a US National Archives and Records Administration [24] [25] [26] [27] .

Technické strategie

„Digital Dark Age“ lze předejít implementací řady technických strategií pro uchovávání elektronických dokumentů. Jednou z těchto strategií je konzervace – práce s materiály v originálních formátech a na originálních médiích. Díky tomu jsou původní informace k dispozici v původním formátu [28] .

Mezi další způsoby archivace patří emulace (reprodukce funkčního systému pro zajištění přístupu k zastaralým souborům a formátům) [21] [28] , enkapsulace (začlenění technického popisu dokumentu do samotného digitálního objektu, čímž se sníží jeho závislost na vnějším prostředí) [21] [29] , stejně jako migrace (přenos elektronických dokumentů na jiná média nebo do jiného operačního systému, např. z magnetické pásky na CD). Poslední zmíněná metoda je jednou z nejoblíbenějších, protože umožňuje zachovat integritu digitálního materiálu a schopnost uživatelů vyhledávat a používat informace a nezáviset na zastarávání technologií [28] [30] [31] . V některých případech se využívá digitální archeologie nebo záchrana elektronických objektů, které se staly nedostupnými v důsledku technologického zastarávání a/nebo fyzické degradace. Vzhledem k vysokým nákladům a nedostatku záruk na vymáhání se však použití takové metody obvykle považuje za nezbytné opatření [31] [21] .

Internetová archivace

V roce 1996 americký počítačový programátor Brewster Cale založil neziskový Internet Archive v San Franciscu . Činnost „Archivu“ je zaměřena na archivaci všech informací, které byly kdy zveřejněny na internetu. Sbírka se skládá z mnoha archivovaných webových stránek, digitalizovaných knih, audio a video souborů, her, softwaru. V roce 2001 Cale spustil samostatnou službu Wayback Machine , která ukládá webové stránky pomocí vyhledávacích robotů nebo web crawlerů [32] . Archivované obrázky jsou zobrazeny ve formátu HTML , JavaScript a CSS [33] [34] . V červenci 2021 poskytoval Wayback Machine přístup k více než 591 miliardám uložených webových stránek [35] [36] .

Mezi další podobné projekty patří portál Harvard Law School Library Perma.cc [37] , archive.today [38] a WebCite [39] .

Projekty

V roce 2007 oznámily National Archives of Great Britain a Microsoft zahájení spolupráce v oblasti archivace dat. V rámci společného projektu společnost spolupracovala s Britskou knihovnou na instalaci Virtual PC , sady vizualizačního softwaru, která uživatelům umožňuje spouštět více operačních systémů současně a přistupovat ke staršímu formátu Microsoft Office . Pouze v archivech Velké Británie je tedy asi 580 terabajtů dat zaznamenaných na starších verzích Office [40] .

V roce 2018 bylo po výsledcích každoročního Světového ekonomického fóra v Davosu rozhodnuto o spuštění Globálního centra pro kybernetickou bezpečnost. Činnost centra je zaměřena na prevenci nástupu digitálního temného věku [41] . Služby digitálního uchovávání jako LOCKSS , HathiTrust a Portico [42] pracují na dlouhodobé kontrole a údržbě elektronických materiálů .

V rámci boje proti ztrátě digitálních dat mnoho publikací archivuje svá vlastní vydání. Například The Economist poskytuje elektronické kopie každého čísla od svého prvního vydání v roce 1843 [43] a The New York Times zahájily projekt na zachování online obsahu. Oficiální web novin obsahuje kopii HTML stránek od okamžiku, kdy byly poprvé publikovány, se zachováním designu [44] .

Jednou z prvních organizací, která vyvinula postupy uchovávání e-mailů, byl Smithsonian Institution Archives . Archivy ve svých sbírkách ukládají e-mailové záznamy z 80. let 20. století vytvořené pomocí ELM [45] . Pod vedením Kongresové knihovny byl program National Digital Information Infrastructure and Preservation Program archivním programem , který šířil informace o problémech uchovávání digitálních dat [46] .

Na archivaci vědeckých prací se podílejí projekty jako Jstor , DSpace [47] , arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [48] . Od října 2021 je v Adresáři časopisů s otevřeným přístupem uvedeno více než 16 900 časopisů s otevřeným přístupem a více než 5 milionů článků [49] .

Kritika

Jednotliví výzkumníci a novináři poukazují na to, že každodenní digitální data nepotřebují další archivaci kvůli skutečnosti, že internet je již plný informací, které lidé přidávají na své účty na sociálních sítích. Další generace tedy nebudou mít problémy s přístupem k informacím [50] . Jiní kritizovali termín pro jeho předpokládanou „alarmistickou“ povahu. Podle zastánců této teorie již v oblasti uchovávání dat došlo k výraznému pokroku a používání takové rétoriky problém pouze zveličuje a záměrně překrucuje situaci [51] .

Viz také

Poznámky

  1. Tim Harford. Jak vynález papíru změnil svět . BBC (13. března 2017). Staženo: 2. října 2021.
  2. 1 2 Kuny, 1997 .
  3. 1 2 Richard Ovenden. Musíme bojovat za zachování digitálních informací . The Economist (21. února 2019). Staženo: 28. září 2021.
  4. 1 2 3 4 5 Giaretta, 2011 .
  5. 1 2 Digital Domesday Book trvá 15 let, ne 1000 . The Guardian (3. března 2002). Staženo: 27. září 2021.
  6. 12 Veronique Greenwoodová. Digitální doba temna . Yale Alumni Magazine (červen 2020). Staženo: 27. září 2021.
  7. Dan Greene. Eroze osobního vlastnictví . Vox (21. dubna 2021). Staženo: 28. září 2021.
  8. Panos, 2003 .
  9. Adam Wernick. Vědci varují, že možná vytváříme „digitální dobu temna“ . Svět (1. ledna 2018). Staženo: 26. září 2021.
  10. Aby se předešlo době digitálního temna, musí všechny zúčastněné strany dát hlavy dohromady . The Times of India (17. září 2020). Staženo: 27. září 2021.
  11. Lauren Maffeo. Vint Cerf z Googlu o tom, jak předcházet době digitálního temna . The Guardian (29. května 2015). Staženo: 27. září 2021.
  12. Dave Smith. Otec internetu: „Pokud se teď nepohneme, riskujeme ztrátu všech dat, která jsme vytvořili v 21. století“ . Business Insider (20. února 2015). Staženo: 28. září 2021.
  13. Nikolaj Udincev. Citát dne: Proč může začít „digitální temný věk “ Podívej se na mě (13. února 2015). Staženo: 28. září 2021.
  14. Jeffrey, 2012 , str. 553-570.
  15. Kurt Bollacker. Vyhýbání se době digitálního temna . Americký vědec. Staženo: 26. září 2021.
  16. Bollacker, 2010 .
  17. Damon Krukowski. Historie zmizela, když Myspace ztratil 12 let hudby a bude se to opakovat . Pitchfork (19. března 2019). Staženo: 28. září 2021.
  18. Zoe Klenman. MySpace přiznává, že přišel o 12 let nahrávání hudby . Zprávy BBC (18. března 2019). Staženo: 28. září 2021.
  19. Molly Woodová. Pokud je online, není to trvalé. Internetové archivy mohou zmizet . PROČ PBS (9. dubna 2019). Staženo: 28. září 2021.
  20. Daniel Van Boo. Vypnutí Google Plus znamená, že klíčové momenty Google jsou ztraceny v éteru . C Net (3. dubna 2019). Staženo: 28. září 2021.
  21. 1 2 3 4 Balasanyan V.E. Uchovávání elektronických dokumentů: Problémy a řešení . Domácí archivy (2019). Datum přístupu: 5. srpna 2021.
  22. Baucom, 2019 , str. 6-7.
  23. Khramtsovskaya, 2012 , str. 68-78.
  24. Fan, 2018 , str. 387-297.
  25. Pozadí projektu . Projekt InterPARES. Staženo: 7. srpna 2021.
  26. Baucom, 2019 , str. 7-8.
  27. Duranti, 2008 .
  28. 1 2 3 Lee, 2002 , str. 93-106.
  29. Zapouzdření . PADI. Staženo: 23. července 2021.
  30. Samiei, 2020 .
  31. 12 Formenton , 2020 , str. 1-26.
  32. Arora, 2015 .
  33. Lerner, 2017 , str. 1741-1755.
  34. Michael Bryant. Co je Wayback Machine a proč je užitečný? . Groovy Post (22. dubna 2021). Staženo: 29. května 2021.
  35. Wayback Machine . wayback stroj. Datum přístupu: 7. června 2021.
  36. Panos, 2003 , str. 343-347.
  37. Perkel, 2015 , str. 111-112.
  38. Martin Brinkmann. Vytvářejte veřejně dostupné archivy webových stránek pomocí Archive.is . G Hacks (22. dubna 2015). Staženo: 2. listopadu 2021.
  39. [​​ https://www.webcitation.org/faq WebCite] . webová stránka. Datum přístupu: 4. listopadu 2021.
  40. Maev Kennedy. Projekt Národního archivu k odvrácení digitálního temného věku . The Guardian (4. července 2007). Staženo: 26. září 2021.
  41. Obavy z digitální doby temna , které vyvolala davoská elita , neřeší kybernetickou bezpečnost . Rozhovor (6. února 2018). Staženo: 28. září 2021.
  42. Kdo brání době digitálního temna? . Blog Deakin Library (15. ledna 2019). Staženo: 27. září 2021.
  43. Ztraceni v kyberprostoru . Ekonom. Staženo: 28. září 2021.
  44. Shan Wang. Archiv New York Times . NiemanLab (12. dubna 2018). Staženo: 8. února 2021.
  45. Ochrana e-mailu – DArcMail . Smithsonian Institution Archives. Staženo: 4. srpna 2021.
  46. Digitální ochrana . Knihovna Kongresu. Staženo: 4. srpna 2021.
  47. Smith, 2003 .
  48. Liesegang, 2013 , str. 423-432.
  49. Najděte časopisy a články s otevřeným přístupem . DOAJ. Datum přístupu: 3. října 2021.
  50. Larry Cebula. Otevřený dopis historikům 22. století . Břidlice (22. července 2013). Staženo: 28. září 2021.
  51. Harvey, 2018 .

Literatura

Odkazy