Gutmanova metoda je algoritmus pro bezpečné mazání dat (například souborů ) z pevného disku počítače . Metodu vyvinuli Peter Gutman a Collin Plumb . Metoda se skládá z 35 průchodů orientovaných na mazání záznamů kódovaných metodami MFM a různými modifikacemi RLL .
Výběr průchodu předpokládá, že uživatel nezná mechanismus kódování používaný diskem, a proto zahrnuje průchody navržené speciálně pro tři různé typy jednotek. Pokud uživatel ví, jaký typ kódování disk používá, může vybrat pouze průchody, které jsou určeny pro jeho disk. Disk s různými mechanismy kódování vyžaduje různé průchody.
Většina průchodů byla navržena pro disky s kódováním MFM a RLL. Relativně moderní disky tyto staré metody kódování nepoužívají, takže mnoho průchodů Gutmannovy metody je nadbytečných [1] . Zhruba od roku 2001 jsou navíc pevné disky ATA IDE a SATA navrhovány tak, aby podporovaly standard „Secure Erase“, což eliminuje potřebu Gutmanovy metody při mazání celého disku [2] .
Metoda byla poprvé představena v práci „Bezpečné mazání dat z magnetických a SSD disků“ v červenci 1996.
Jednou ze standardních metod obnovy dat zapsaných na pevný disk je zachycení a zpracování analogového signálu přijatého z jednotky pro čtení/zápis před digitalizací signálu. Tento analogový signál je blízký digitálnímu, ale rozdíly odhalují důležité informace. Výpočtem digitálního signálu a následným odečtením od skutečného analogového signálu lze signál zbylý po odečtení zesílit a použít k určení toho, co bylo dříve zapsáno na disk.
Například:
Analogový signál: +11,1 -8,9 +9,1 -11,1 +10,9 -9,1 Ideální digitální signál: +10,0 -10,0 +10,0 -10,0 +10,0 -10,0 Rozdíl: +1,1 +1,1 -0,9 -1,1 +0,9 +0,9 Předchozí signál: +11 +11 -9 -11 +9 +9Tento postup lze opakovat, abyste viděli dříve zaznamenaná data:
Obnovený signál: +11 +11 -9 -11 +9 +9 Ideální digitální signál: +10,0 +10,0 -10,0 -10,0 +10,0 +10,0 Rozdíl: +1 +1 +1 -1 -1 -1 Předchozí signál: +10 +10 -10 -10 +10 +10I při opakovaném přepisování disku náhodnými daty je teoreticky možné obnovit předchozí signál. Permitivita prostředí se mění s frekvencí magnetického pole . To znamená, že nízká frekvence pole proniká hlouběji do magnetického materiálu na disku než jeho vysoká frekvence. Nízkofrekvenční signál lze tedy teoreticky detekovat i poté, co bylo přepsáno stokrát provedeno. při vysoké frekvenci signálu.
Použité průchody jsou navrženy tak, aby na povrch disku působilo střídavé magnetické pole různých frekvencí a různých fází, čímž se aproximovala demagnetizace materiálu pod povrchem disku [3] .
Složení přepisovatelné relace je následující: v prvních 4 průchodech jsou náhodně vybrané znaky zapsány do každého bajtu každého sektoru, od 5 do 31 průchodů je zapsána určitá sekvence znaků (viz řádky z tabulky níže), v posledních 4 průchodech se opět zapisují náhodně vybrané znaky [4] .
Každý průchod 5 až 31 byl navržen s ohledem na specifické schéma magnetického kódování, tj. jako cílový průchod. Všechny stopy jsou zaznamenány na disk, i když tabulka ukazuje pouze bitové průchody pro stopy, které jsou specificky zaměřeny na každé schéma kódování. Konečný výsledek by měl zakrýt veškerá data na disku, takže jakákoliv data pravděpodobně dokážou obnovit pouze ty nejpokročilejší techniky fyzického skenování (například mikroskopem magnetické síly ) disku [4] .
Série průchodů vypadá takto:
složit | Záznam | Vzorek | |||
---|---|---|---|---|---|
V binárním zápisu | V hexadecimálním zápisu | (1.7) RLL | (2.7) RLL | MFM | |
jeden | (Náhodou) | (Náhodou) | |||
2 | (Náhodou) | (Náhodou) | |||
3 | (Náhodou) | (Náhodou) | |||
čtyři | (Náhodou) | (Náhodou) | |||
5 | 01010101 01010101 01010101 | 55 55 55 | 100… | 000 1000… | |
6 | 10101010 10101010 10101010 | AA AA AA | 00 100… | 0 1000… | |
7 | 10010010 01001001 00100100 | 92 49 24 | 00 100 000… | 0 100… | |
osm | 01001001 00100100 10010010 | 49 24 92 | 0 0 00 100 000… | 1 00 100… | |
9 | 00100100 10010010 01001001 | 24 92 49 | 100 000… | 00 100… | |
deset | 00000000 00000000 00000000 | 00 00 00 | 101 000… | 1000... | |
jedenáct | 00010001 00010001 00010001 | 11 11 11 | 0 100 000… | ||
12 | 00100010 00100010 00100010 | 22 22 22 | 0 0 0 00 100 000… | ||
13 | 00110011 00110011 00110011 | 33 33 33 | deset… | 1 000 000… | |
čtrnáct | 01000100 01000100 01000100 | 44 44 44 | 0 00 100 000… | ||
patnáct | 01010101 01010101 01010101 | 55 55 55 | 100… | 000 1000… | |
16 | 01100110 01100110 01100110 | 66 66 66 | 0 000 100 000… | 0 0 0000 1 000 000… | |
17 | 01110111 01110111 01110111 | 77 77 77 | 100 010… | ||
osmnáct | 10001000 10001000 10001000 | 88 88 88 | 00 100 000… | ||
19 | 10011001 10011001 10011001 | 99 99 99 | 0 100 000… | 00 10000000… | |
dvacet | 10101010 10101010 10101010 | AA AA AA | 00 100… | 0 1000… | |
21 | 10111011 10111011 10111011 | BB BB BB | 00 101 000… | ||
22 | 11001100 11001100 11001100 | CC CC CC | 0 10… | 0000 10000000… | |
23 | 11011101 11011101 11011101 | DD DD DD | 0 101 000… | ||
24 | 11101110 11101110 11101110 | EE EE EE | 0 100 010… | ||
25 | 11111111 11111111 11111111 | FF FF FF | 0 100… | 000 100 000… | |
26 | 10010010 01001001 00100100 | 92 49 24 | 00 100 000… | 0 100… | |
27 | 01001001 00100100 10010010 | 49 24 92 | 0 0 00 100 000… | 1 00 100… | |
28 | 00100100 10010010 01001001 | 24 92 49 | 100 000… | 00 100… | |
29 | 01101101 10110110 11011011 | 6D B6 DB | 0 100… | ||
třicet | 10110110 11011011 01101101 | B6 DB 6D | 100… | ||
31 | 11011011 01101101 10110110 | DB 6D B6 | 00 100… | ||
32 | (Náhodou) | (Náhodou) | |||
33 | (Náhodou) | (Náhodou) | |||
34 | (Náhodou) | (Náhodou) | |||
35 | (Náhodou) | (Náhodou) |
Tučné písmo označuje zakódované bity, které by měly být zastoupeny v ideálním modelu, ale kvůli kódování extra bitů jsou ve skutečnosti na začátku.
Funkce odstranění na většině operačních systémů jednoduše odstraní ukazatel souboru, aniž by okamžitě smazal jeho obsah. V tomto okamžiku je soubor snadno identifikován mnoha aplikacemi pro obnovu. Jakmile je však prostor přepsán jinými daty, není znám žádný způsob, jak smazané informace obnovit. To nelze provést pouze pomocí softwaru, protože úložné zařízení vrací aktuální obsah prostřednictvím svého běžného rozhraní. Gutman tvrdí, že zpravodajské agentury mají sofistikované nástroje, včetně mikroskopů magnetické síly, které spolu s analýzou obrazu dokážou detekovat předchozí bitové hodnoty na postižených oblastech média (například na pevném disku).
Národní úřad pro ekonomický výzkum reaguje na Gutmannova tvrzení tím, že zpravodajské agentury budou pravděpodobně schopny číst přepisy dat [5] . Dosud nejsou zveřejněny žádné údaje týkající se schopnosti zpravodajských agentur obnovit soubory, jejichž sektory byly přepsány, ačkoli vládní bezpečnostní postupy považují přepsaný disk za zranitelný [6] .
Společnosti, které se specializují na obnovu poškozených úložných médií (jako jsou média poškozená požárem nebo jinak), nemohou obnovit zcela poškozené soubory. Žádná soukromá společnost pro obnovu dat netvrdí, že by byla schopna obnovit zcela přepsaná data.
Gutman sám odpověděl na některé z těchto kritik [4] :
Od doby, kdy byl tento dokument publikován, někteří lidé považovali techniku 35-pass přepisování spíše za jakési voodoo kouzlo k vymítání zlých duchů než za výsledek technické analýzy metod kódování disku. Výsledkem je, že obhajují Voodoo pro disky PRML a EPRML, i když Voodoo by mělo menší účinek než prosté vymazání náhodných dat. Opravdu nedává smysl provádět úplný 35průchodový přepis pro každý disk, protože je zaměřen na kombinaci scénářů zahrnujících všechny tři typy kódovacích technologií, které pokrývají všechny více než 30 let staré metody MFM. Pokud používáte disk, který používá technologie kódování X, nemusíte provádět všech 35 průchodů, ale pouze některé. To nejlepší, co můžete pro jakýkoli moderní PRML/EPRML disk udělat, je několik náhodných čisticích průchodů. Jak píší noviny: „Dobré náhodné vyčištění dat bude fungovat tak dobře, jak byste očekávali.“ To platilo v roce 1996 a platí to dodnes.