Statistická kryptoanalýza

Statistická kryptoanalýza  je metoda kryptografické analýzy . Lze s ním prolomit mnoho typů šifer .

Popis metody

Obecně se statistická analýza provádí takto:

  1. Podle zachyceného kryptogramu se vypočítávají nějaké statistiky . Tato statistika je taková, že pro všechny smysluplné zprávy nabývá hodnot trochu odlišných od hodnoty, která závisí pouze na použitém soukromém klíči .
  2. Takto získaná hodnota slouží ke zvýraznění těch možných klíčů, u kterých hodnota leží v těsné blízkosti sledované hodnoty.

Statistika, která nezávisí na , nebo se liší od , stejně jako u , nemůže být relevantní pro identifikaci podmnožiny klíčů. Takže v transpozičních šifrách nedává počítání četností písmen žádnou informaci o  - pro všechny zůstává tato statistika stejná. Z počtu frekvencí pro dešifrování transpozičních šifer tedy nelze odvodit žádnou výhodu. Přesněji řečeno, této statistice lze přičíst určitou "rozlišovací schopnost" . Pro každou hodnotu existuje podmíněná nespolehlivost klíče (nespolehlivost při pevné hodnotě ) a to je vše, co je o klíči známo. Aritmetický vážený průměr těchto hodnot udává průměrnou nespolehlivost klíče, kdy , kde je apriorní pravděpodobnost konkrétní hodnoty . Rozdíl mezi velikostí klíče a touto průměrnou nejistotou měří „rozlišovací schopnost“ statistiky . V přísně ideální šifře jsou všechny statistiky daného kryptogramu nezávislé na použitém soukromém klíči. To vyplývá z vlastnosti zachování míry transformací v prostoru nebo v prostoru .

Existují dobré a špatné statistiky, stejně jako existují dobré a špatné metody pokusu a omylu. Ve skutečnosti je testování hypotézy metodou pokusu a omylu určitým typem statistiky a obecně platí to, co bylo řečeno výše o nejlepších typech pokusů.

Vlastnosti dobré statistiky

Dobrá statistika pro řešení systému by měla mít následující vlastnosti:

  1. Mělo by to jen počítat;
  2. Musí záviset na klíči více než na zprávě, pokud má být použit k nalezení klíče. Změny na nesmí maskovat změny na . Hodnoty statistiky, které lze „rozlišit“, i přes „rozmazanost“ vytvořenou změnou v , by měly rozdělit klíčový prostor do několika podmnožin, jejichž pravděpodobnosti jsou co do velikosti srovnatelné, a statistika bude podmnožinu charakterizovat v kde leží správný klíč;
  3. Statistiky by měly poskytovat informace o významných klíčových objemech, nikoli o objemech, které tvoří malý zlomek celkového počtu bitů;
  4. Informace poskytované statistikou by měly být jednoduché a snadno použitelné. Tedy podmnožiny, na které statistiky rozdělují klíčový prostor, musí mít v klíčovém prostoru jednoduchou strukturu.