КОИ-8
Материал из Википедии — свободной энциклопедии
КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовый стандарт кодирования символов в информатике. Разработан для кодирования букв кириллических алфавитов.
Существует также семибитовая версия кодировки — КОИ-7. КОИ-7 и КОИ-8 описаны в ГОСТ 19768-74 (сейчас недействителен).
Разработчики КОИ-8 поместили символы русского алфавита в верхней части расширенной таблицы ASCII таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читабельный» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кирилических алфавитов. Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.
KOI8-R стал фактически стандартом для русской кириллицы в юникс-подобных операционных системах и электронной почте.
Андрей Чернов создал документ RFC 1489 («Registration of a Cyrillic Character Set»), который, однако, не относится к категории RFC-стандартов. Существует RFC 2319 на KOI8-U.
По набору символов KOI8-R соответствует одному из вариантов альтернативной кодировки. Стандарт RFC 1489 также предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.
Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в уникоде.
[править] Кодировка KOI8-R (русская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9. |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
² B2 |
· B7 |
÷ F7 |
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
╜ 255C |
╝ 255D |
╞ 255E |
B. |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
╫ 256B |
╬ 256C |
© A9 |
C. |
ю 44E |
а 430 |
б 431 |
ц 446 |
д 434 |
е 435 |
ф 444 |
г 433 |
х 445 |
и 438 |
й 439 |
к 43A |
л 43B |
м 43C |
н 43D |
о 43E |
D. |
п 43F |
я 44F |
р 440 |
с 441 |
т 442 |
у 443 |
ж 436 |
в 432 |
ь 44C |
ы 44B |
з 437 |
ш 448 |
э 44D |
щ 449 |
ч 447 |
ъ 44A |
E. |
Ю 42E |
А 410 |
Б 411 |
Ц 426 |
Д 414 |
Е 415 |
Ф 424 |
Г 413 |
Х 425 |
И 418 |
Й 419 |
К 41A |
Л 41B |
М 41C |
Н 41D |
О 41E |
F. |
П 41F |
Я 42F |
Р 420 |
С 421 |
Т 422 |
У 423 |
Ж 416 |
В 412 |
Ь 42C |
Ы 42B |
З 417 |
Ш 428 |
Э 42D |
Щ 429 |
Ч 427 |
Ъ 42A |
[править] Другие варианты
(показаны только несовпадающие строки таблиц, поскольку всё остальное совпадает)
[править] Кодировка KOI8-U (украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
╝ 255D |
╞ 255E |
B. |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
╬ 256C |
© A9 |
[править] Кодировка KOI8-RU (русско-белорусско-украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
ў 45E |
╞ 255E |
B. |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
Ў 40E |
© A9 |
[править] Кодировка KOI8-C (кавказская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 |
җ 497 |
қ 49B |
ҝ 49D |
ң 4A3 |
ү 4AF |
ұ 4B1 |
ҳ 4B3 |
ҷ 4B7 |
ҹ 4B9 |
һ 4BB |
▀ 2580 |
ҝ 49D |
ӣ 4E3 |
ө 4E9 |
ӯ 4EF |
9. | Ғ 492 |
Җ 496 |
Қ 49A |
Ҝ 49C |
Ң 4A2 |
Ү 4AE |
Ұ 4B0 |
Ҳ 4B2 |
Ҷ 4B6 |
Ҹ 4B8 |
Һ 4BA |
⌡ 2321 |
Ә 4D8 |
Ӣ 4E2 |
Ө 4E8 |
Ӯ 4EE |
A. | A0 |
ђ 452 |
ѓ 453 |
ё 451 |
є 454 |
ѕ 455 |
і 456 |
ї 457 |
ј 458 |
љ 459 |
њ 45A |
ћ 45B |
ќ 45C |
ґ 491 |
ў 45E |
џ 45F |
B. | № 2116 |
Ђ 402 |
Ѓ 403 |
Ё 401 |
Є 404 |
Ѕ 405 |
І 406 |
Ї 407 |
Ј 408 |
Љ 409 |
Њ 40A |
Ћ 40B |
Ќ 40C |
Ґ 490 |
Ў 40E |
Џ 40F |
[править] Кодировка KOI8-T (таджикская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B |
ғ 493 |
‚ 201A |
Ғ 492 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
‰ 2030 |
ҳ 4B3 |
‹ 2039 |
Ҳ 4B2 |
ҷ 4B7 |
Ҷ 4B6 |
||
9. | Қ 49A |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
™ 2122 |
› 203A |
||||||
A. | ӯ 4EF |
Ӯ 4EE |
ё 451 |
¤ A4 |
ӣ 4E3 |
¦ A6 |
§ A7 |
« AB |
¬ AC |
AD |
® AE |
|||||
B. | ° B0 |
± B1 |
² B2 |
Ё 401 |
Ӣ 4E2 |
¶ B6 |
· B7 |
№ 2116 |
» BB |
© A9 |
[править] Кодировка KOI8-O, KOI8-C (славянская, старая орфография)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
Ђ 0402 |
Ѓ 0403 |
¸ 00B8 |
ѓ 0453 |
„ 201E |
… 2026 |
† 2020 |
§ 00A7 |
€ 20AC |
¨ 00A8 |
Љ 0409 |
‹ 2039 |
Њ 040A |
Ќ 040C |
Ћ 040B |
Џ 040F |
9. |
ђ 0452 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
£ 00A3 |
· 00B7 |
љ 0459 |
› 203A |
њ 045A |
ќ 045C |
ћ 045B |
џ 045F |
A. |
00A0 |
ѵ 0475 |
ѣ 0463 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
® 00AE |
™ 2122 |
« 00AB |
ѳ 0473 |
ґ 0491 |
ў 045E |
´ 00B4 |
B. |
° 00B0 |
Ѵ 0474 |
Ѣ 0462 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
№ 2116 |
¢ 00A2 |
» 00BB |
Ѳ 0472 |
Ґ 0490 |
Ў 040E |
© 00A9 |
[править] Кодировка ISO-IR-111, koi8-e
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
00AD |
ў 045E |
џ 045F |
B. |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
¤ 00A4 |
Ў 040E |
Џ 040F |
[править] Кодировка KOI8-Unified, koi8-f
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9. |
░ 2591 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
· 00B7 |
¤ 00A4 |
A. |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
ў 045E |
џ 045F |
B. |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
Ґ 0490 |
Ў 040E |
Џ 040F |
[править] Некириллические варианты KOИ-8
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным. Например, в чешском варианте КОИ-8 буквы Čč должны превращаться в cC, Žž — в zZ и т. д. В настоящее время эти кодировки не используются.