Letadlo (Unicode)
Ve standardu Unicode je rovina souvislý rozsah 65 536 ( 216 ) kódových bodů. Existuje 17 rovin číslovaných od 0 do 16, které odpovídají možným hodnotám 00-10 16 prvních dvou hexadecimálních číslic v šestimístném formátu čísla pozice kódu (U+ hh hhhh ). Poslední kódový bod Unicode je posledním kódovým bodem v rovině 16, U+10FFFF. Rovina 0 se nazývá Základní vícejazyčná rovina ( BMP ) a obsahuje nejčastěji používané znaky. Zbývající roviny (1-16) se nazývají "další" [1] . Unicode verze 14.0 používá kódové body pro sedm rovin, z nichž dvě jsou pro soukromé použití.
Omezení na 17 rovin je způsobeno kódováním UTF-16 , ve kterém lze zakódovat 220 ( 1048576 ) kódových pozic (16 rovin) a BMP [2] . Kódování UTF-8 bylo navrženo s mnohem větším limitem 2 31 ( 2 147 483 648 ) kódových bodů ( 32 768 rovin) a mohlo používat 2 21 ( 2 097 152 ) kódových bodů (32 rovin) i s limitem 4 bajtů [3] .
Unicode letadla:
- Rovina 0 (0000-FFFF): Základní vícejazyčná rovina ( BMP )
- Rovina 1 (10 000-1FFFF): Doplňková vícejazyčná rovina ( SMP )
- Plane 2 ( 20000-2FFFF): Supplementary Ideographic Plane (SIP )
- Rovina 3 ( 30000-3FFFF): Terciární ideografická rovina (TIP )
- Roviny 4-13 (40000-DFFFF) nejsou použity
- Letadlo 14 (E0000—EFFFF): Doplňkové letadlo pro zvláštní účely ( SSP )
- Letadlo 15 ( F0000-FFFFF) Dodatečná oblast pro soukromé použití-A, SPUA - A
- Letadlo 16 (100000-10FFFF) Dodatečná oblast pro soukromé použití-B ( SPUA - B )
Základní vícejazyčná rovina
Rovina 0 ( Basic Multilingual Plane , BMP ) je vyhrazena pro znaky většiny moderních skriptů a velké množství speciálních znaků . Většinu tabulky zabírají ideogramy KJK a korejské slabiky .
V Unicode 14.0 jsou v této rovině reprezentovány následující bloky:
|
- OCR (2440-245F)
- Zarámovaná písmena a číslice (2460-24FF)
- Pseudo Graphics (2500-257F)
- Blokové prvky (2580-259F)
- Geometrické tvary (25A0–25FF)
- Různé postavy (2600–26FF)
- Dingbats (2700–27BF)
- Různé matematické symboly – A (27C0-27EF)
- Další handy - A (27F0-27FF)
- Braillovo písmo (2800–28FF)
- Další ruce – B (2900-297F)
- Různé matematické symboly – B (2980-29FF)
- Další matematické operátory (2A00-2AFF)
- Různé symboly a šipky (2B00–2BFF)
- hlaholice (2C00-2C5F)
- Rozšířená latina – C (2C60-2C7F)
- koptské písmo (2C80–2CFF)
- Dodatek ke gruzínskému dopisu (2D00—2D2F)
- Starověké libyjské písmo (2D30–2D7F)
- Etiopské rozšířené (2D80-2DDF)
- Rozšířená azbuka – A (2DE0–2DFF)
- Další interpunkce (2E00-2E7F)
- Doplněk ke klíčům KKJ (2E80-2EFF)
- Keys of Kangxi (2F00–2FDF)
- Ideografické vysvětlující znaky (2FF0–2FFF)
- Symboly a interpunkce CJK (3000-303F)
- Hiragana (3040-309F)
- Katakana (30A0–30FF)
- Zhuyin fuhao (3100-312F)
- Kompatibilní položky Hangul (3130-318F)
- Kambun (3190-319F)
- Rozšířené zhuyin fuhao (31A0–31BF)
- Vlastnosti KKJ (31C0–31EF)
- Katakana fonetické rozšíření (31F0-31FF)
- Zarámované dopisy a měsíce KJK (3200-32FF)
- Kompatibilní prvky CJK (3300-33FF)
- CJK Unified Ideograms – Extension A (3400-4DBF)
- Hexagramy Knihy proměn (4DC0–4DFF)
- Jednotné ideogramy ČJK (4E00-9FFF)
- Slabikář a (A000-A48F)
- Klávesy písmen a (A490—A4CF)
- Lisu (A4D0–A4FF)
- Vai (A500–A63F)
- Rozšířená azbuka – B (A640–A69F)
- Bamum (A6A0–A6FF)
- Symboly změny tónu (A700–A71F)
- Rozšířená latinka – D (A720-A7FF)
- Sylhet Nagari (A800–A82F)
- Společné indické číselné formuláře (A830-A83F)
- Mongolské čtvercové písmo (A840–A87F)
- Saurashtra (A880-A8DF)
- Devanagari Extended (A8E0–A8FF)
- Kaya-li (A900–A92F)
- Rejang (A930–A95F)
- Rozšířené prvky Hangul – A (A960–A97F)
- jávština (A980–A9DF)
- Rozšířená barmština – B (A9E0-A9FF)
- Cham skript (AA00-AA5F)
- Barmská rozšířená – A (AA60-AA7F)
- Thajský Vietnam (AA80-AADF)
- Manipuri Extensions (AAE0-AAFF)
- Ethiopian Extended – A (AB00-AB2F)
- Rozšířená latina – E (AB30-AB6F)
- Cherokee Supplement (AB70—ABBF)
- Manipuri (ABC0–ABFF)
- Hangulský slabikář (AC00–D7AF)
- Rozšířené prvky Hangul – B (D7B0–D7BF)
- Horní část náhradních párů (D800-DB7F)
- Nejlepší náhradní páry pro soukromé použití (DB80-DBFF)
- Spodní část náhradních párů (DC00-DFFF)
- Oblast pro soukromé použití (E000-F8FF)
- Kompatibilní ideogramy CJK (F900-FAFF)
- Abecední prezentační formuláře (FB00-FB4F)
- Arabské formuláře – A (FB50-FDCF, FDF0-FDFF)
- Voliče variant (FE00-FE0F)
- Vertikální formuláře (FE10–FE1F)
- Kombinované poloviční znaky (FE20-FE2F)
- Kompatibilní formuláře CJC (FE30-FE4F)
- Malé varianty formuláře (FE50-FE6F)
- Arabské formuláře – B (FE70-FEFF)
- Formuláře poloviční a plné šířky (FF00-FFEF)
- Speciální znaky (FFF0-FFFF)
|
Další vícejazyčná rovina
Rovina 1 (Supplementary Multilingual Plane, anglicky Supplementary Multilingual Plane , SMP ) je vyhrazena především pro historické písmo, ale zahrnuje také konvenční symboly, jako jsou hudební a matematické symboly.
V Unicode 14.0 jsou v této rovině zastoupeny následující znakové sady:
Další ideografická rovina
Rovina 2 (Suplementary Ideographic Plane, angl. Supplementary Ideographic Plane , SIP ) je vyhrazena pro málo používané hieroglyfy KKJ .
V Unicode 14.0 jsou v této rovině zastoupeny následující znakové sady:
Terciární ideografická rovina
Rovina 3 ( terciární ideografická rovina , TIP ) obsahuje zřídka používané čínské znaky , předpokládá se také, že zahrnuje historické formy čínského písma
.
Terciární ideografická rovina je rozdělena do následujících rozsahů [4] :
- Sjednocené ideogramy CJK - rozšíření G (30000-3134F) - další zřídka používané čínské ideogramy;
- Zhuanshu (31400-342FF) - hieroglyfy ve stylu "malá pečeť" (xiaozhuan, 小篆) a "velká pečeť" (dazhuan, 大篆) [5] [4] ;
- Jiaguwen (34400-35BFF) jsou nejstarší čínské znaky éry Shang ( jiaguwen , 甲骨文), nalezené ve věšteckých nápisech na lasturách, lebkách a zvířecích kostech [6] [4]
V budoucnu se také očekává, že bude zahrnovat postavy Shang a Zhou ( jinwen , 金文) nalezené v rituálních nápisech na bronzových nádobách a hudebních nástrojích a soubory postav z období válčících států [4] .
Specializované přídavné letadlo
Plane 14 (Specialized Additional Plane, eng. Supplementary Special-purpose Plane , SSP ) vyhrazená pro postavy používané pro speciální účely.
V Unicode 14.0 jsou v této rovině reprezentovány následující bloky:
- Štítky (E0000—E007F)
- Dodatek k voličům variant (E0100—E01EF)
Oblasti pro soukromé použití
Některé rozsahy Unicode jsou vyhrazeny pro soukromé použití a experimentování. Tyto zahrnují:
- Soukromá oblast v základní vícejazyčné rovině (E000-F8FF)
- Další letadla 15 (F0000-U+FFFFF) a 16 (100000-10FFFF)
Viz také
Poznámky
- ↑ Unicode Consortium Glossary—Suplementary Planes . Staženo 30. září 2018. Archivováno z originálu 24. září 2018. (neurčitý)
- ↑ Viz tabulka 3.5 „UTF-16 Bit Distribution“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivováno 31. března 2019 na Wayback Machine
- ↑ Viz tabulka 3.6 „UTF-8 Bit Distribution“ ve standardu Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivováno 31. března 2019 na Wayback Machine
- ↑ 1 2 3 4 Plán k TIP ( PDF) (12. března 2020). Získáno 17. března 2020. Archivováno z originálu dne 29. února 2020.
- ↑ Návrh na kódování Small Seal Script v UCS (anglicky) (PDF) (20. června 2019). Získáno 17. března 2020. Archivováno z originálu dne 30. listopadu 2019.
- ↑ Žádost o komentář ke kódování Oracle Bone Script ( PDF) (21. října 2015). Získáno 20. listopadu 2017. Archivováno z originálu 14. června 2019.
Odkazy
Unicode bloky _ _ |
---|
Základní vícejazyčná rovina (Rovina 0, BMP) [U+0000…U+FFFF] |
---|
|
|
|
Další ideografická rovina (rovina 2, SIP) [U+20000…U+2FFFF] |
---|
|
|
Terciární ideografická rovina (rovina 3, TIP) [U+30000…U+3FFFF] |
---|
- CJK Unified Ideograms - Extension G
|
|
Letadla 4-13 [U+40000…U+DFFFF] |
---|
Nezapojeno |
|
Specializované přídavné letadlo (Plane 14, SSP) [U+E0000…U+EFFFF] |
---|
- Tagy
- Doplnění selektorů variant
|
|
Oblasti pro soukromé použití (letadla 15 a 16, PUA) [U+F0000…U+10FFFF] |
---|
|
|