KOI-8

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 21. listopadu 2019; kontroly vyžadují 8 úprav .

KOI-8 ( kód pro výměnu a informace , 8 bitů), KOI8  je osmibitová kódová stránka kompatibilní s ASCII . Navrženo pro kódování písmen azbuky . Byl široce používán jako hlavní ruské kódování v operačních systémech kompatibilních s Unixem a v e-mailu , ale blíže k roku 2010 , s rozšířením Unicode , se postupně přestal používat.

Existuje také sedmibitová verze kódování, která není plně kompatibilní s ASCII- KOI-7 . KOI-7 a KOI-8 jsou popsány v dnes již neexistující GOST 19768-74.

Vývojáři KOI-8 umístili znaky ruské abecedy do horní části tabulky kódů tak, aby pozice znaků azbuky odpovídaly jejich fonetickým protějškům v anglické abecedě ze spodní části tabulky. To znamená, že pokud se v textu napsaném v KOI-8 u každého znaku odstraní jeden bit zleva, získá se relativně čitelný text, podobný transliteraci . Například slova „Ruský text“ se změní na „rUSSKIJ tEKST“. Z tohoto důvodu nejsou znaky azbuky v abecedním pořadí.

Existuje několik variant kódování KOI-8 pro různé azbuky, které rozšiřují určité kódy (celkový rozsah 192-255 s 32 ruskými písmeny ve dvou případech zůstává ve všech variantách nezměněn). Ruská abeceda je popsána v kódování KOI8-R , ukrajinská - v KOI8-U , tádžická - v KOI8-T.

V 90. letech se KOI8-R stal de facto standardem pro kódování ruské azbuky v operačních systémech typu UNIX a e- mailu . Autor tohoto kódování ( RFC 1489Andrey Chernov pracoval na počátku 90. let ve společnosti Demos ( síť Relcom ) a přímo se podílel na spuštění a úpravě prvního internetového kanálu mezi Ruskem a západními zeměmi . KOI-8 se stal prvním ruským standardizovaným kódováním na internetu.

IETF schválila několik RFC pro možnosti kódování KOI-8:

IANA zaregistrovala kódování ve svém seznamu.

Standard RFC 1489 nařizuje přítomnost „krabicových“ grafických znaků ( pseudographics ), nicméně tento požadavek je málokdy splněn.

V systému Microsoft Windows je KOI8-R přiřazen kód stránky 20866, KOI8-U je 21866.

Začátek kódovací tabulky ( latinka ) plně odpovídá kódování ASCII .

V níže uvedených tabulkách čísla pod písmeny označují hexadecimální kód Unicode písmene .

Kódování KOI8-R (ruština)

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
 
osm.
 

2500

2502
┌250C
_

2510

2514

2518

251C

2524

252C

2534

253 C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
 
A0

2321
°
B0
²B2
_
B7
_
÷
F7
 
A.
 

2550

2551

2552
jo
451

2553

2554

2555

2556

2557
#
2558

2559

255A
╛255B
_
╜255C
_
č. 255D
č. 255E
 
b.
 
╟255F
_

2560

2561
Jo
401

2562

2563

2564

2565

2566
č.
2567
╨2568
_

2569
č. 256A
Č.
256B

256C
©
A9
 
C.
 
yu
44E
430 _
b
431
c
446
d
434
e
435
f
444
g
433
x
445
a
438
439 _

43A
l
43B
m
43C
n
43D
asi
43E
 
D.
 
n
43F
i
44F
p
440
od
441
t
442
na
443
f
436
v roce
432
b
44C
s
44B
s
437
sh
448
e
44D
w
449
h
447
b
44A
 
E.
 
Yu
42E
A
410
B
411
C
426
D
414
E
415
F
424
G
413
X
425
a
418
Y
419
K
41A
L
41B
M
41C
H
41D
Asi
41E
 
F.
 
P
41F
Jsem
42F
420 R
C
421
T
422
423 _
F
416
B
412
b
42c
S
42B
W
417
SH
428
E
42D
Shch
429
Ch
427
b
42A

Další možnosti

Jsou zobrazeny pouze neodpovídající řádky tabulky, protože vše ostatní odpovídá.

Kódování KOI8-U (Rusko-Ukrajinština)

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
 
A.
 

2550

2551

2552
jo
451
454 dolarů

2554

456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
č. 255D
č. 255E
 
b.
 
╟255F
_

2560

2561
Jo
401
Є
404

2563

406
407 £

2566
č.
2567
╨2568
_

2569
č. 256A
Ґ
490

256C
©
A9

Kódování KOI8-RU (Rusko-Bělorusko-Ukrajinština)

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
 
A.
 

2550

2551

2552
jo
451
454 dolarů

2554

456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
¢
45E
č. 255E
 
b.
 
╟255F
_

2560

2561
Jo
401
Є
404

2563

406
407 £

2566
č.
2567
╨2568
_

2569
č. 256A
Ґ
490
Î
40E
©
A9

Kódování KOI8-C (Střední Asie)

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
osm.
- 493
497
_
49B
_
49D
_

n 4A3

- 4AF

- 4B1

h 4B3
ҷ
4B7

č. 4B9

h 4BB

2580
4D9
_
ӣ
4E3
4E9
_
ӯ
4E®
9. 492
_
496
_
K
49A
49C
_
Ң
4A2

- 4AE
Ұ
4B0

- 4B2

- 4B6

- 4B8
4BA
_

2321
4D8
_
Ӣ
4E2
Ө
4E8
4EE
_
A.  
A0

452 dolarů
-453
_
jo
451

454 dolarů
*
455

456
457
_

458 dolarů
459
_
њ
45A
ћ
45B
ќ
45 C
491
_
¢
45E
џ
45F
b. č.
2116

402 €
Ѓ
403
Jo
401
Є
404
S
405

406

407 £

408 £

409 £
Њ40A
_

40 miliard liber
40C
_
Ґ
490
Î
40E
Џ
40F

Kódování KOI8-O, KOI8-S (slovanský, starý pravopis)

040790}}
.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
203A}} č. 045A
Ü 045C
ћ
045B
џ
045F
Î 040E
©
00A9

Kódování ISO-IR-111, KOI8-E

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
 
A.
 
 
00A0
0452
$
- 0453
e
0451
є
0454
* 0455
i
0456
ї
0457
0458
$
љ
0459
č. 045A
ћ
045B
Ü 045C
­
00 AD
¢
045E
џ
045F
 
b.
 
č.
2116
0402
Ѓ
0403
Yo
0401
Є
0404
S
0405

0406
0407 £
0408 £
Љ
0409
Њ
040A
£ 040B
č. 040C
¤
00A4
Î 040E
P 040F

Kódování KOI8-Unified, KOI8-F

Kódování KOI8-Unified (KOI8-F) navrhl Fingertip Software [1] .

.0 .jeden .2 .3 .čtyři .5 .6 .7 .osm .9 .A .B .C .D .E .F
 
osm.
 

2500

2502
┌250C
_

2510

2514

2518

251C

2524

252C

2534

253 C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591
'
2018
'
2019

201C

201D

2022

2013

2014
©
00A9

2122
 
00A0
»
00BB
®
00AE

00AB
00B7
_
¤
00A4
 
A.
 
 
00A0
0452
$
- 0453
e
0451
є
0454
* 0455
i
0456
ї
0457
0458
$
љ
0459
č. 045A
ћ
045B
Ü 045C
ґ
0491
¢
045E
џ
045F
 
b.
 
č.
2116
0402
Ѓ
0403
Yo
0401
Є
0404
S
0405

0406
0407 £
0408 £
Љ
0409
Њ
040A
£ 040B
č. 040C
Ґ
0490
Î 040E
P 040F

Necyrilické varianty KOI-8

V některých zemích RVHP byly vytvořeny modifikace KOI-8 pro národní varianty latinské abecedy . Základní myšlenka byla stejná – při „odříznutí“ osmého bitu by měl text zůstat víceméně jasný.

Poznámky

  1. KOI8 Unified // Fingertip Software

Odkazy