Letadlo (Unicode)

Ve standardu Unicode je rovina  souvislý rozsah 65 536 ( 216 ) kódových bodů. Existuje 17 rovin číslovaných od 0 do 16, které odpovídají možným hodnotám 00-10 16 prvních dvou hexadecimálních číslic v šestimístném formátu čísla pozice kódu (U+ hh hhhh ). Poslední kódový bod Unicode je posledním kódovým bodem v rovině 16, U+10FFFF. Rovina 0 se nazývá Základní vícejazyčná rovina ( BMP ) a obsahuje nejčastěji používané znaky. Zbývající roviny (1-16) se nazývají "další" [1] . Unicode verze 14.0 používá kódové body pro sedm rovin, z nichž dvě jsou pro soukromé použití.

Omezení na 17 rovin je způsobeno kódováním UTF-16 , ve kterém lze zakódovat 220 ( 1048576 ) kódových pozic (16 rovin) a BMP [2] . Kódování UTF-8 bylo navrženo s mnohem větším limitem 2 31 ( 2 147 483 648 ) kódových bodů ( 32 768 rovin) a mohlo používat 2 21 ( 2 097 152 ) kódových bodů (32 rovin) i s limitem 4 bajtů [3] .

Unicode letadla:

Základní vícejazyčná rovina

Rovina 0 ( Basic Multilingual Plane , BMP ) je vyhrazena pro znaky většiny moderních skriptů a velké množství speciálních znaků .  Většinu tabulky zabírají ideogramy KJK a korejské slabiky .

V Unicode 14.0 jsou v této rovině reprezentovány následující bloky:

  • OCR (2440-245F)
  • Zarámovaná písmena a číslice (2460-24FF)
  • Pseudo Graphics (2500-257F)
  • Blokové prvky (2580-259F)
  • Geometrické tvary (25A0–25FF)
  • Různé postavy (2600–26FF)
  • Dingbats (2700–27BF)
  • Různé matematické symboly – A (27C0-27EF)
  • Další handy - A (27F0-27FF)
  • Braillovo písmo (2800–28FF)
  • Další ruce – B (2900-297F)
  • Různé matematické symboly – B (2980-29FF)
  • Další matematické operátory (2A00-2AFF)
  • Různé symboly a šipky (2B00–2BFF)
  • hlaholice (2C00-2C5F)
  • Rozšířená latina – C (2C60-2C7F)
  • koptské písmo (2C80–2CFF)
  • Dodatek ke gruzínskému dopisu (2D00—2D2F)
  • Starověké libyjské písmo (2D30–2D7F)
  • Etiopské rozšířené (2D80-2DDF)
  • Rozšířená azbuka – A (2DE0–2DFF)
  • Další interpunkce (2E00-2E7F)
  • Doplněk ke klíčům KKJ (2E80-2EFF)
  • Keys of Kangxi (2F00–2FDF)
  • Ideografické vysvětlující znaky (2FF0–2FFF)
  • Symboly a interpunkce CJK (3000-303F)
  • Hiragana (3040-309F)
  • Katakana (30A0–30FF)
  • Zhuyin fuhao (3100-312F)
  • Kompatibilní položky Hangul (3130-318F)
  • Kambun (3190-319F)
  • Rozšířené zhuyin fuhao (31A0–31BF)
  • Vlastnosti KKJ (31C0–31EF)
  • Katakana fonetické rozšíření (31F0-31FF)
  • Zarámované dopisy a měsíce KJK (3200-32FF)
  • Kompatibilní prvky CJK (3300-33FF)
  • CJK Unified Ideograms – Extension A (3400-4DBF)
  • Hexagramy Knihy proměn (4DC0–4DFF)
  • Jednotné ideogramy ČJK (4E00-9FFF)
  • Slabikář a (A000-A48F)
  • Klávesy písmen a (A490—A4CF)
  • Lisu (A4D0–A4FF)
  • Vai (A500–A63F)
  • Rozšířená azbuka – B (A640–A69F)
  • Bamum (A6A0–A6FF)
  • Symboly změny tónu (A700–A71F)
  • Rozšířená latinka – D (A720-A7FF)
  • Sylhet Nagari (A800–A82F)
  • Společné indické číselné formuláře (A830-A83F)
  • Mongolské čtvercové písmo (A840–A87F)
  • Saurashtra (A880-A8DF)
  • Devanagari Extended (A8E0–A8FF)
  • Kaya-li (A900–A92F)
  • Rejang (A930–A95F)
  • Rozšířené prvky Hangul – A (A960–A97F)
  • jávština (A980–A9DF)
  • Rozšířená barmština – B (A9E0-A9FF)
  • Cham skript (AA00-AA5F)
  • Barmská rozšířená – A (AA60-AA7F)
  • Thajský Vietnam (AA80-AADF)
  • Manipuri Extensions (AAE0-AAFF)
  • Ethiopian Extended – A (AB00-AB2F)
  • Rozšířená latina – E (AB30-AB6F)
  • Cherokee Supplement (AB70—ABBF)
  • Manipuri (ABC0–ABFF)
  • Hangulský slabikář (AC00–D7AF)
  • Rozšířené prvky Hangul – B (D7B0–D7BF)
  • Horní část náhradních párů (D800-DB7F)
  • Nejlepší náhradní páry pro soukromé použití (DB80-DBFF)
  • Spodní část náhradních párů (DC00-DFFF)
  • Oblast pro soukromé použití (E000-F8FF)
  • Kompatibilní ideogramy CJK (F900-FAFF)
  • Abecední prezentační formuláře (FB00-FB4F)
  • Arabské formuláře – A (FB50-FDCF, FDF0-FDFF)
  • Voliče variant (FE00-FE0F)
  • Vertikální formuláře (FE10–FE1F)
  • Kombinované poloviční znaky (FE20-FE2F)
  • Kompatibilní formuláře CJC (FE30-FE4F)
  • Malé varianty formuláře (FE50-FE6F)
  • Arabské formuláře – B (FE70-FEFF)
  • Formuláře poloviční a plné šířky (FF00-FFEF)
  • Speciální znaky (FFF0-FFFF)

Další vícejazyčná rovina

Rovina 1 (Supplementary Multilingual Plane, anglicky  Supplementary Multilingual Plane , SMP ) je vyhrazena především pro historické písmo, ale zahrnuje také konvenční symboly, jako jsou hudební a matematické symboly.

V Unicode 14.0 jsou v této rovině zastoupeny následující znakové sady:

  • Lineární B slabiky (10000-1007F)
  • Lineární B ideogramy (10080-100FF)
  • Egejské číslice (10100-1013F)
  • Starověké řecké číslice (10140-1018F)
  • Starověké symboly (10190-101CF)
  • Phaistos Disc (101D0–101FF)
  • lýkijské písmo (10280-1029F)
  • Carian (102A0–102DF)
  • Koptské epaktní číslice (102E0-102FF)
  • Stará kurzíva ( 10300-1032F )
  • gotické písmo (10330-1034F)
  • staré permské písmo (10350-1037F)
  • Ugaritské písmo (10380-1039F)
  • Staré perské písmo (103A0-103DF)
  • Deseret Letter (10400-1044F)
  • Shaw Alphabet (10450-1047F)
  • Somálské písmo (10480-104AF)
  • Osage (104B0–104FF)
  • Elbasan skript (10500-1052F)
  • Agvan skript (10530-1056F)
  • Vitkut dopis (10570-105BF)
  • Lineární A (10600-1077F)
  • Rozšířená latina – F (10780-107BF)
  • kyperské písmo (10800-1083F)
  • Imperial Aramaic (10840-1085F)
  • Palmyrénový dopis (10860-1087F)
  • Nabatejský dopis (10880-108AF)
  • Hatran (108E0–108FF)
  • Fénické písmo (10900–1091F)
  • Lydické písmo (10920–1093F)
  • Meroitské hieroglyfy (10980-1099F)
  • Meroitská kurzíva (109A0-109FF)
  • Kharosthi (10A00–10A5F)
  • Starověké jihoarabské písmo (10A60–10A7F)
  • Starověké severoarabské písmo (10A80-109FF)
  • Manichejské písmo (10AC0–10AFF)
  • Avestan script (10B00–10B3F)
  • Parthské epigrafické písmo (10B40-10B5F)
  • epigrafické písmo Pahlavi (10B60-10B7F)
  • Pahlavi žaltář ( 10B80-10BAF )
  • Staré turkické runové písmo (10C00–10C4F)
  • maďarské runy (10C00–10C4F)
  • Hanifi (10D00–10D3F)
  • Rumi čísla (10E60–10E7F)
  • skript Yezidi (10E80–10EBF)
  • Staré sogdické písmo (10F00–10F2F)
  • sogdské písmo (10F30–10F6F)
  • Staré ujgurské písmo (10F70–10FAF)
  • Khwarezmské písmo (10FB0–10FBF)
  • Elimaic letter (10FE0–10FFF)
  • brahmi (11000–1107F)
  • Kaithi (11080-110CF)
  • Sorang sompeng (110D0–110FF)
  • Chakma (11100–1114F)
  • Mahajani (11150–1117F)
  • Šaráda (11180-111DF)
  • Sinhálské archaické číslice (111E0-111FF)
  • Hojiki (11200-1124F)
  • Multani (11280-112AF)
  • Khudabadi (112B0–112FF)
  • Grantha (11300-1137F)
  • Neva (11400–1147F)
  • Tirhuta (11480-114DF)
  • Siddhamatrika (11580–115FF)
  • Modi (11600-1165F)
  • Doplněk ke starému mongolskému písmu (11660-1167F)
  • Takri (11680-116CF)
  • Ahom (11700–1174F)
  • Dogra (11800–1184F)
  • Varang-kshiti (118A0-118FF)
  • Dives akuru (11900-1195F)
  • Nandinagari (119A0-119FF)
  • Zanabazar Square Script (11A00–11A4F)
  • Soyombo (11A50–11AAF)
  • Rozšířený kanadský slabikář – A (11AB0-11ABF)
  • Po Chin Ho (11AC0–11AFF)
  • Bhaikshukas (11C00-11C6F)
  • Marchen (11C70–11CBF)
  • Gondi Masarama (11D00–11D5F)
  • Gunjal Gondi (11D60–11DAF)
  • Makassar skript (11EE0–11EFF)
  • Fox doplněk (11FB0–11FBF)
  • Tamilský doplněk (11FC0-11FFF)
  • klínové písmo ( 12000–123FF )
  • Klínové písmo a interpunkce (12400-1247F)
  • Raně dynastické klínové písmo (12480-1254F)
  • Kypro-Minojské písmo (12F90-12FFF)
  • Egyptské hieroglyfy (13000-1342F)
  • Ovládací znaky formátování egyptských hieroglyfů (13430-1343F)
  • Anatolské hieroglyfy (14400-1467F)
  • Přídavek Bamum (16800-16A3F)
  • Mro (16A40–16A6F)
  • Tangsa (16A70–16ACF)
  • Baskytara (16AD0–16AFF)
  • Pahau (16B00–16B8F)
  • Medefidrin (16E40-16E9F)
  • Miao (16FE0–16FFF)
  • Ideografické znaky a interpunkce (16F00-16F9F)
  • Tangut skript (17000–187FF)
  • Prvky tangutského psaní (18800-18AFF)
  • Malé khitanské písmo (18B00–18CFF)
  • Doplněk ke skriptu Tangut (18D00-18D8F)
  • Rozšířená kana - B (1AFF0–1AFFF)
  • Dodatek Kana (1B000–180FF)
  • Rozšířená kana - A (1B100–1B12F)
  • Malé rozšíření kana (1B130—1B16F)
  • Nu Shu (blok Unicode) (1B170–1B2FF)
  • Duploier těsnopis (1BC00-18C9F)
  • Znaky pro zkrácené formátování (1BCA0-1BCAF)
  • Znamenny notace (1CF00—1CFCF)
  • Byzantské hudební symboly (1D000–1D0FF)
  • Hudební symboly (1D100–1D1FF)
  • Starověká řecká notace (1D200–1D24F)
  • Mayská čísla (1D2E0–1D2FF)
  • Symboly „Kánonu velkého tajemství“ (1D300-1D35F)
  • Počty počítacích tyčinek (1D360—1D37F)
  • Matematická písmena a čísla (1D400-1D7FF)
  • SignWriting (1D800-1DAAF)
  • Rozšířená latinka – G (1DF00-1DFFF)
  • Dodatek k hlaholice (1E000–1E02F)
  • Nyekeng Puecim Hmong (1E100–1E14F)
  • Toto (1E290–1E2BF)
  • Wancho (1E2C0–1E2FF)
  • Ethiopian Extended – B (1E7E0–1E7FF)
  • Kikakui (1E800–1E8DF)
  • Adlam (1E900–1E95F)
  • Siyacké indické číslice (1EC70–1ECBF)
  • Osmanské sijakové číslice (1ED00–1ED4F)
  • Arabské matematické abecední symboly (1EE00-1EEFF)
  • Mahjongové kostky (1F000–1F02F)
  • Domino kosti (1F030–1F09F)
  • Hrací karty (1F0A0—1F0FF)
  • Dodatek k zarámovaným písmenům a číslům (1F100-1F1FF)
  • Rámovaný doplněk ideografických znaků (1F200–1F2FF)
  • Různé symboly a piktogramy (1F300-1F5FF)
  • Emotikony (1F600–1F64F)
  • Okrasné znaky (1F650-1F67F)
  • Dopravní a grafové symboly (1F680-1F6FF)
  • Alchymistické symboly (1F700-1F77F)
  • Rozšířené geometrické tvary (1F780-1F7FF)
  • Další ruce - C (1F800-1F8FF)
  • Další symboly a piktogramy (1F900-1F9FF)
  • Šachové symboly (1FA00-1FA6F)
  • Rozšířené symboly a piktogramy – A (1FA70-1FAFF)
  • Symboly pro starší výpočetní techniku ​​(1FB00-1FBFF)

Další ideografická rovina

Rovina 2 (Suplementary Ideographic Plane, angl.  Supplementary Ideographic Plane , SIP ) je vyhrazena pro málo používané hieroglyfy KKJ .

V Unicode 14.0 jsou v této rovině zastoupeny následující znakové sady:

Terciární ideografická rovina

Rovina 3 ( terciární ideografická rovina , TIP ) obsahuje zřídka používané čínské znaky , předpokládá se také, že zahrnuje historické formy čínského písma . 

Terciární ideografická rovina je rozdělena do následujících rozsahů [4] :

V budoucnu se také očekává, že bude zahrnovat postavy Shang a Zhou ( jinwen , 金文) nalezené v rituálních nápisech na bronzových nádobách a hudebních nástrojích a soubory postav z období válčících států [4] .

Specializované přídavné letadlo

Plane 14 (Specialized Additional Plane, eng.  Supplementary Special-purpose Plane , SSP ) vyhrazená pro postavy používané pro speciální účely.

V Unicode 14.0 jsou v této rovině reprezentovány následující bloky:

Oblasti pro soukromé použití

Některé rozsahy Unicode jsou vyhrazeny pro soukromé použití a experimentování. Tyto zahrnují:

Viz také

Poznámky

  1. Unicode Consortium Glossary—Suplementary Planes . Staženo 30. září 2018. Archivováno z originálu 24. září 2018.
  2. Viz tabulka 3.5 „UTF-16 Bit Distribution“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivováno 31. března 2019 na Wayback Machine
  3. Viz tabulka 3.6 „UTF-8 Bit Distribution“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivováno 31. března 2019 na Wayback Machine
  4. 1 2 3 4 Plán k TIP  ( PDF) (12. března 2020). Získáno 17. března 2020. Archivováno z originálu dne 29. února 2020.
  5. Návrh na kódování Small Seal Script v UCS  (anglicky) (PDF) (20. června 2019). Získáno 17. března 2020. Archivováno z originálu dne 30. listopadu 2019.
  6. Žádost o komentář ke kódování Oracle Bone Script  ( PDF) (21. října 2015). Získáno 20. listopadu 2017. Archivováno z originálu 14. června 2019.

Odkazy