ISO/IEC 8859-1 (také známá jako ISO 8859-1 a Latin-1 ) je kódová stránka pro západoevropské jazyky; je založen na znakové sadě terminálů VT220 , které byly populární v minulosti . Kódové pozice 0-31 (0x0-0x1F) a 127-159 (0x7F-0x9F) nejsou definovány. Všechna ostatní kódování v řadě ISO 8859 jsou modelována podle ISO 8859-1 .
ISO-8859-1 je kódování registrované IANA v roce 1992. Na rozdíl od ISO/IEC 8859-1 jsou kódové pozice 0-31 a 127-159 vyplněny řídicími znaky (z nichž většina se používá zřídka). V HTML je výchozí kódování ISO-8859-1 (v XHTML je však výchozí kódování UTF-8 ).
IANA povoluje následující varianty názvů: ISO_8859-1:1987 , ISO_8859-1 , ISO-8859-1 , iso-ir-100 , sISOLatin1 , latin1 , l1 , IBM819 , CP819 .
V Unicode je prvních 256 bodů kódu stejných jako ISO-8859-1.
Microsoft Windows pro západoevropské jazyky používá kódování Windows-1252 , které se liší od ISO-8859-1 tím, že pozice 128-159 (0x80-0x9F) jsou vyplněny různými užitečnými typografickými znaky. Většina prohlížečů nerozlišuje mezi ISO-8859-1 a Windows-1252 – ve skutečnosti v obou případech zobrazují text jako Windows-1252.
Tato záměna mezi těmito dvěma kódováními vedla k tomu, že mnoho programů generovalo soubory HTML, které chybně pojmenovávaly znaky pomocí kódů Windows-1252 namísto kódů Unicode (za předpokladu, že číslo znaku v ISO-8859-1 se rovná jeho číslu Unicode): např. místo správného byla uvedena pomlčka (—), místo správného —elipsa atd .; vzhledem k rozšířenosti tohoto jevu se moderní prohlížeče nadále zobrazují například jako pomlčka, ačkoli ve skutečnosti jde o řídicí znak „konec hlídané oblasti“ , jehož použití v HTML postrádá smysl.—……——
Návrh standardu HTML 5 nařizuje, aby se ISO-8859-1 zobrazovalo jako Windows-1252. [jeden]
Spodní část (0-127) kódovacích tabulek není zobrazena, protože je plně konzistentní s běžným ASCII . Čísla pod písmeny představují hexadecimální kód Unicode písmene .
.0 | .jeden | .2 | .3 | .čtyři | .5 | .6 | .7 | .osm | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
osm. |
PAD 80 |
HOP 81 |
B.P.H. 82 |
NBH 83 |
IND 84 |
NEL 85 |
SSA 86 |
ESA 87 |
HTS 88 |
HTJ 89 |
VTS 8A |
PLD 8B |
PLU8C _ |
RI 8D |
SS28E _ |
SS38F _ |
9. |
DCS 90 |
PU1 91 |
PU2 92 |
STS 93 |
CCH 94 |
MW 95 |
SPA 96 |
EPA 97 |
SOS 98 |
SGCI 99 |
SCI 9A |
CSI 9B |
ST 9C |
OSC 9D |
PM9E _ |
APC9F _ |
A. |
A0 |
A1 _ |
¢ A2 |
A3 £ |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨A8 _ |
© A9 |
ªAA _ |
AB _ |
¬ AC |
INZERÁT |
®AE _ |
¯AF _ |
b. |
° B0 |
± B1 |
²B2 _ |
³B3 _ |
" B4 ." |
u B5 |
¶B6 _ |
B7 _ |
¸ B8 |
¹ B9 |
BA _ |
» BB |
¼ před naším letopočtem |
½ BD |
¾ BÝT |
¿ BF |
C. |
A C0 |
Á C1 |
V C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Z C7 |
È C8 |
E C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
О CE |
Ï CF |
D. |
Р D0 |
Ñ D1 |
Ň D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
DE _ |
ß DF |
E. |
E0 _ |
E1 _ |
â E2 |
ã E3 |
E4 _ |
å E5 |
æ E6 |
ç E7 |
a E8 |
e E9 |
ê EA |
ë EB |
Р EC |
a ED |
îEE _ |
EF _ |
F. |
ð F0 |
ñ F1 |
ò F2 |
o F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
FA _ |
û FB |
FC _ |
ý FD |
þ FE |
ÿ FF |
Zajímavé je umístění znaků × a ÷ uprostřed písmen: původně se plánovalo umístit tam ligaturu Œœ , ale nakonec se rozhodlo, že to není potřeba, a uvolněná dvě místa zaplnili non -abecední znaky. [2]
V původní verzi tohoto kódování nebyly žádné znaky: € (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).
.0 | .jeden | .2 | .3 | .čtyři | .5 | .6 | .7 | .osm | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
osm. |
20 € AC |
‚ 201A |
ƒ 192 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
ˆ 2C6 |
‰ 2030 |
Š 160 |
‹ 2039 |
Œ 152 |
Z 17D |
|||
9. |
' 2018 |
' 2019 |
“ 201C |
“ 201D |
• 2022 |
– 2013 |
— 2014 |
˜2DC _ |
™ 2122 |
S 161 |
› 203A |
-153 _ |
§ 17E |
Ÿ 178 | ||
A. |
A0 |
A1 _ |
¢ A2 |
A3 £ |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨A8 _ |
© A9 |
ªAA _ |
AB _ |
¬ AC |
INZERÁT |
®AE _ |
¯AF _ |
b. |
° B0 |
± B1 |
²B2 _ |
³B3 _ |
" B4 ." |
u B5 |
¶B6 _ |
B7 _ |
¸ B8 |
¹ B9 |
BA _ |
» BB |
¼ před naším letopočtem |
½ BD |
¾ BÝT |
¿ BF |
C. |
A C0 |
Á C1 |
V C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Z C7 |
È C8 |
E C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
О CE |
Ï CF |
D. |
Р D0 |
Ñ D1 |
Ň D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
DE _ |
ß DF |
E. |
E0 _ |
E1 _ |
â E2 |
ã E3 |
E4 _ |
å E5 |
æ E6 |
ç E7 |
a E8 |
e E9 |
ê EA |
ë EB |
Р EC |
a ED |
îEE _ |
EF _ |
F. |
ð F0 |
ñ F1 |
ò F2 |
o F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
FA _ |
û FB |
FC _ |
ý FD |
þ FE |
ÿ FF |
ISO 8859 | Tabulky kódů znaků v|
---|---|
Windows | Tabulky kódů znaků ve|
---|---|
Kódování znaků | |
---|---|
Historická kódování | doplňková komp. semafor (Makarov) morse Bodo MTK-2 komp. 6bitový SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderní 8bitová reprezentace | symboly ASCII non-ASCII 8bitové kódové stránky cyrilice KOI-8 Základní kódování MacCyrillic ISO 8859 1 (lat.) 2 3 čtyři 5 (kir.) 6 7 osm 9 deset jedenáct 12 13 čtrnáct 15 (€) 16 Okna 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM a DOS 437 850 852 855 866 "alternativní" MIC |
Vícebajtové | tradiční DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 seznam postav cyrilice |
uživatelské rozhraní rozložení klávesnice národní prostředí překlad řádků písmo přepis vlastní písma utility iconv záznam |