Kódová stránka ( anglicky code page ) - tabulka, která přiřazuje každé hodnotě bytu určitý znak (nebo jeho absenci). Znakový kód má obvykle velikost 8 bitů , takže kódová stránka může obsahovat maximálně 256 znaků, což znamená, že jakákoli 8bitová kódová stránka je pro reprezentaci vícejazyčných textů velmi nedostatečná. Některé znaky se navíc používají jako řídicí znaky, proto počet vytištěných znaků jen zřídka přesáhne 223 [1] .
Historicky byl termín kódová stránka zaveden společností IBM Corporation ; výměnné kódové stránky byly použity pro podporu různých jazyků (se systémy abecedního psaní). V poslední době dochází k záměně mezi pojmem „kódová stránka“ a obecnějším pojmem znaková sada (kódování).
V současnosti se používají především dva typy kódování: ASCII kompatibilní a EBCDIC kompatibilní [2] , přičemž první z nich drtivě převládá. V kódování kompatibilním s ASCII jsou kódy pro 95 tisknutelných znaků a 33 řídicích znaků pevně dané a zbývajících 128 kódových bodů se používá pro různé znaky mimo ASCII.
Pro kódování textů v ruštině (tj. písmen azbuky ) se nejčastěji používají následující kódové stránky:
Používání různých kódových stránek vytváří mnoho nepříjemností pro uživatele i programátory. Při pokusu o čtení textového souboru pomocí kódové stránky, která není kompatibilní s tou, ve které byl vytvořen, se vyskytují chyby . V posledních letech se Unicode rozšířil jako alternativa k tradičním kódovým stránkám.
V systémech Microsoft Windows jsou kódové stránky důležitou součástí lokalizace , která se nastavuje v klíčích registru HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\ [3] .
Historicky (v systémech Windows 3.xa Windows 9x ) existovaly dva typy kódových stránek. Kódové stránky ANSI [4] (angl. ANSI code page , v registru: ACP ), také nazývané Windows [5] jsou nativní kódové stránky Windows. Obsahují mnoho typografických znaků , ale téměř žádnou pseudografiku, protože jsou určeny pro použití v grafickém prostředí. Microsoft následně uznal, že použití názvu ANSI bylo způsobeno nedorozuměním. [6] Mezi kódování "ANSI"/Windows patří zejména Windows-1252 a výše zmíněný Windows-1251 . Microsoft také označuje kódové stránky jako kódové tabulky, jejichž některé pozice vyžadují k vytvoření znaku druhý (koncový) bajt, tedy takové, které umožňují dvoubajtovou reprezentaci některých znaků [7] , i když přísně vzato jsou již kódování znaků s proměnnou délkou.
Kódování OEM (angl. kódová stránka OEM , v registru: OEMCP ) jsou založena na CP437 a obsahují pseudografiku kompatibilní s VGA . Výše uvedené alternativní kódování je v systému Windows známé jako CP866 .
Počínaje Windows NT se objevila třetí třída kódových stránek: Macintosh encodings (anglicky Macintosh code page , v registru: MACCP ), kompatibilní s MacOS .
Kódování znaků | |
---|---|
Historická kódování | doplňková komp. semafor (Makarov) morse Bodo MTK-2 komp. 6bitový SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderní 8bitová reprezentace | symboly ASCII non-ASCII 8bitové kódové stránky cyrilice KOI-8 Základní kódování MacCyrillic ISO 8859 1 (lat.) 2 3 čtyři 5 (kir.) 6 7 osm 9 deset jedenáct 12 13 čtrnáct 15 (€) 16 Okna 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM a DOS 437 850 852 855 866 "alternativní" MIC |
Vícebajtové | tradiční DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 seznam postav cyrilice |
uživatelské rozhraní rozložení klávesnice národní prostředí překlad řádků písmo přepis vlastní písma utility iconv záznam |
Typová slévárna a typový design | |||||||||
---|---|---|---|---|---|---|---|---|---|
Koncepty | |||||||||
Struktura písma |
| ||||||||
Vlastnosti písma | |||||||||
Klasifikace abecedních písem |
| ||||||||
Styly písma | |||||||||
Jednotky | |||||||||
počítačová typografie | |||||||||
viz také nakladatelství Tiskárna Typografie Kit Rozložení Tisk |