ISO 8859

ISO 8859  je rodina kódových stránek kompatibilních s ASCII , vyvinutá společně ISO a IEC . Od roku 2006 se tato rodina skládala z 15 kódových stránek.

Obecné informace

Vzhledem k tomu, že kódování ISO 8859 bylo navrženo jako prostředek komunikace a nikoli jako prostředek k poskytování vysoce kvalitní typografie , neobsahují znaky jako dvojité uvozovky , pomlčky různých délek, ligatury atd. (ačkoli takové znaky stále existují , jako znak nezlomitelné mezery a měkké pomlčky). Ale poměrně hodně místa (oblast 0x80-0x9F) je vyhrazeno pro "horní řídicí znaky ", určené k ovládání terminálů .

Vzhledem k tomu, že různé stránky ISO 8859 byly vyvinuty společně, mají určitou vzájemnou kompatibilitu. Například všech sedm znaků rozšířené latinky používaných v němčině je na stejné pozici na všech kódových stránkách, které tyto znaky obsahují. Stránky Latin-1-Latin-4 mají ještě větší stupeň kompatibility: každý znak přítomný na kterékoli z těchto stránek se na nich objeví na stejné pozici.

Aplikace

Kódování řady ISO 8859 se používá hlavně na systémech podobných Unixu a také pro kódování webových stránek (protože většina webových serverů používá UNIX).

Systémy Microsoft Windows používají kódování Windows, z nichž některá jsou kompatibilní s ISO 8859, ale obsahují více grafických znaků díky použití oblasti 0x80-0x9F.

Části ISO 8859

ISO 8859-1 (Latin-1) Rozšířená latinka , včetně znaků z většiny západoevropských jazyků ( angličtina , dánština , irština , islandština , španělština , italština , němčina , norština , portugalština , rétorománština , faerština , švédština , skotština (gaelština) a části holandštiny , finštiny , francouzštiny ) a také některé východoevropské ( albánština ) a africké jazyky ( afrikánština , svahilština ). Latin-1 postrádá znak eura a velké písmeno Ÿ . Tato kódová stránka je považována za výchozí kódování dokumentů HTML a e-mailových zpráv . Této kódové stránce odpovídá také prvních 256 znaků Unicode . ISO 8859-2 (Latin-2) Rozšířená latinka o znaky ze středoevropských a východoevropských jazyků ( bosenština , maďarština , polština , slovenština , slovinština , chorvatština , čeština ). Latin-2, stejně jako Latin-1, postrádá znak eura. ISO 8859-3 (Latin-3) Rozšířená latinka o znaky z jihoevropských jazyků ( maltština , turečtina a esperanto ). ISO 8859-4 (Latin-4) Rozšířená latinka o znaky ze severoevropských jazyků ( grónština , estonština , lotyština , litevština a sámština ). ISO 8859-5 (latinka/cyrilice) Cyrilice , obsahující znaky ze slovanských jazyků ( běloruština , bulharština , makedonština , ruština , srbština a částečně ukrajinština ). ISO 8859-6 (latinka/arabština) Symboly používané v arabštině . Znaky z jiných jazyků založených na arabštině nejsou podporovány. Správné zobrazení textu ISO 8859-6 vyžaduje podporu pro obousměrné psaní a kontextově citlivé formy znaků. ISO 8859-7 (latinka/řečtina) Symboly novořečtiny . Může být také použit k psaní starověkých řeckých textů v monotónním pravopisu. ISO 8859-8 (latinka/hebrejština) Moderní hebrejské symboly . Používá se ve dvou verzích: s logickým pořadím znaků (vyžaduje obousměrnou podporu) as vizuálním pořadím znaků. ISO 8859-9 (Latin-5) Varianta Latin-1, která nahrazuje zřídka používané islandské znaky tureckými. Používá se pro turečtinu a kurdštinu . ISO 8859-10 (Latin-6) Varianta Latin-4 vhodnější pro skandinávské jazyky . ISO 8859-11 (latinka/thajština) Thajské jazykové symboly . ISO 8859-12 (latinka/dévanágarí) Symboly písma dévanágarí . V roce 1997 byly práce na ISO 8859-12 oficiálně ukončeny a toto kódování nebylo nikdy přijato jako standard. ISO 8859-13 (Latin-7) Latina-4 varianta vhodnější pro baltské jazyky . ISO 8859-14 (Latin-8) Rozšířená latinka o znaky z keltských jazyků , jako je skotština (gaelština) a bretonština . ISO 8859-15 (latinka-9) Varianta Latin-1, která nahrazuje zřídka používané znaky znaky potřebnými pro plnou podporu finštiny , francouzštiny a estonštiny . Kromě toho byl k latince-9 přidán znak eura. ISO 8859-16 (Latin-10) Rozšířená latinka o znaky z jižní a východní Evropy ( albánština , maďarština , italština , polština , rumunština , slovinština , chorvatština ) a také některé západoevropské jazyky ( irština v novém pravopisu, němčina , finština , francouzština ). Stejně jako Latin-9 byl k Latin-10 přidán znak eura.