Statistická kryptoanalýza

Statistická kryptoanalýza je metoda kryptografické analýzy . Lze s ním prolomit mnoho typů šifer .

Popis metody

Obecně se statistická analýza provádí takto:

Podle zachyceného kryptogramu se vypočítávají nějaké statistiky . Tato statistika je taková, že pro všechny smysluplné zprávy nabývá hodnot trochu odlišných od hodnoty, která závisí pouze na použitém soukromém klíči . $E$ $M$ $S_k$
Takto získaná hodnota slouží ke zvýraznění těch možných klíčů, u kterých hodnota leží v těsné blízkosti sledované hodnoty. $S_k$

Statistika, která nezávisí na , nebo se liší od , stejně jako u , nemůže být relevantní pro identifikaci podmnožiny klíčů. Takže v transpozičních šifrách nedává počítání četností písmen žádnou informaci o - pro všechny zůstává tato statistika stejná. Z počtu frekvencí pro dešifrování transpozičních šifer tedy nelze odvodit žádnou výhodu. Přesněji řečeno, této statistice lze přičíst určitou "rozlišovací schopnost" . Pro každou hodnotu existuje podmíněná nespolehlivost klíče (nespolehlivost při pevné hodnotě ) a to je vše, co je o klíči známo. Aritmetický vážený průměr těchto hodnot udává průměrnou nespolehlivost klíče, kdy , kde je apriorní pravděpodobnost konkrétní hodnoty . Rozdíl mezi velikostí klíče a touto průměrnou nejistotou měří „rozlišovací schopnost“ statistiky . V přísně ideální šifře jsou všechny statistiky daného kryptogramu nezávislé na použitém soukromém klíči. To vyplývá z vlastnosti zachování míry transformací v prostoru nebo v prostoru . $K$ $M$ $K$ $K$ $K$ $S$ $S$ $H_{s}(K)$ $S$ $\sum p(S)H_{S}(K)$ $S$ $p(S)$ $S$ $H(K)$ $S$ $T_{j}T_{k}^{-}1$ $E$ $T_{j}^{-}1T_{k}$ $M$

Existují dobré a špatné statistiky, stejně jako existují dobré a špatné metody pokusu a omylu. Ve skutečnosti je testování hypotézy metodou pokusu a omylu určitým typem statistiky a obecně platí to, co bylo řečeno výše o nejlepších typech pokusů.

Vlastnosti dobré statistiky

Dobrá statistika pro řešení systému by měla mít následující vlastnosti:

Mělo by to jen počítat;
Musí záviset na klíči více než na zprávě, pokud má být použit k nalezení klíče. Změny na nesmí maskovat změny na . Hodnoty statistiky, které lze „rozlišit“, i přes „rozmazanost“ vytvořenou změnou v , by měly rozdělit klíčový prostor do několika podmnožin, jejichž pravděpodobnosti jsou co do velikosti srovnatelné, a statistika bude podmnožinu charakterizovat v kde leží správný klíč; $M$ $K$ $M$
Statistiky by měly poskytovat informace o významných klíčových objemech, nikoli o objemech, které tvoří malý zlomek celkového počtu bitů;
Informace poskytované statistikou by měly být jednoduché a snadno použitelné. Tedy podmnožiny, na které statistiky rozdělují klíčový prostor, musí mít v klíčovém prostoru jednoduchou strukturu.