Любой текст состоит из символов: букв, цифр, знаков препинания и т.д. Все символы при вводе кодируются числами – кодами соответствующих кодовых таблиц, текст представляется в виде набора кодов. Коды преобразуются в соответствующие символы (выполняется декодирование) при выводе их на устройства вывода. Все кодовые таблицы подчиняются международным стандартам кодирования символов. Традиционно для кодирования одного символа используется 1 байт=8 битам. При этом общее количество различных символов составляет 28=256, а коды символов имеют значения от 0 по 255. Основой для кодовых таблиц является американский стандартный код для обмена информацией ASCII из 128 символов (таблица 2). Из них первые 33 кода управляющие и соответствуют не символам, а действиям (перевод строки, удаление символа и т.д.), остальные коды – являются интернациональными и содержат символы латинского алфавита, цифры, знаки арифметических операций и препинания.
Таблица 2 - Базовая таблица кодировки ASCII
32 пробел | 48 0 | 64 @ | 80 Р | 96 ` | 112 p |
33! | 49 1 | 65 А | 81 Q | 97 а | 113 q |
34 “ | 50 2 | 66 В | 82 R | 98 b | 114 r |
35 # | 51 3 | 67 С | 83 S | 99 с | 115 s |
36 $ | 52 4 | 68 D | 84 Т | 100 d | 116 t |
37 % | 53 5 | 69 Е | 85 U | 101 е | 117 u |
38 & | 54 6 | 70 F | 86 V | 102 f | 118 v |
39 ‘ | 55 7 | 71 G | 87 W | 103 g | 119 w |
40 ( | 56 8 | 72 Н | 88 X | 104 h | 120 x |
41) | 57 9 | 73 I | 89 Y | 105 i | 121 у |
42 * | 58: | 74 J | 90 Z | 106 j | 122 z |
43 + | 59; | 75 К | 91 [ | 107 k | 123 { |
44, | 60 < | 76 L | 92 \ | 108 I | 124 | |
45 - | 61 = | 77 М | 93 ] | 109 m | 125 } |
46. | 62 > | 78 N | 94 ^ | 110 n | 126 ~ |
47 / | 63? | 79 0 | 95 _ | 111 0 |
Например, слово Time кодируется как 84, 105, 109, 101, а затем каждый код переводится в 2-ю систему счисления и записывается в разрядные сетки.
|
|
Для кодирования национальных алфавитов используются расширения таблицы ASCII, в которых с 128-й по 255-й код содержатся буквы национальных алфавитов, символов валюты и т.д. Для русского языка наиболее распространенными являются кодовые таблицы СР-866, Windows 1251(или CP-1251), КОИ-8, Мас, ISO.
Таблица 3 – Кодировка Windows 1251
128 Ђ | 144 ђ | 176 ° | 192 A | 208 Р | 224 а | 240 р | |
129 Ѓ | 145 ' | 161 Ў | 177 ± | 193 Б | 209 С | 225 б | 241 с |
130, | 146 ' | 162 ў | 178 I | 194 В | 210 Т | 226 в | 242 т |
131 ѓ | 147 " | 163 Ј | 179 i | 195 Г | 211 У | 227 г | 243 у |
132 „ | 148 " | 164 ¤ | 180 ґ | 196 Д | 212 Ф | 228 д | 244 ф |
133... | 149 • | 165 Ґ | 181 µ | 197 Е | 213 X | 229 е | 245 х |
134 † | 150 - | 166 | | 182 ¶ | 198 Ж | 214 Ц | 230 ж | 246 ц |
135 ‡ | 151 — | 167 § | 183 • | 199 3 | 215 Ч | 231 з | 247 ч |
136 € | 152 ' | 168 Ё | 184 ё | 200 И | 216 Ш | 232 и | 248 ш |
137 %o | 153 ™ | 169 © | 185 № | 201 Й | 217 Щ | 233 й | 249 щ |
138 Љ | 154 љ | 170 Є | 186 є | 202 К | 218 Ъ | 234 к | 250 ъ |
139 < | 155 > | 171 « | 187» | 203 Л | 219 Ы | 235 л | 251 ы |
140 Њ | 156 њ | 188 j | 204 М | 220 Ь | 236 м | 252 ь | |
141 Ќ | 157 ќ | 189 S | 205 Н | 221 Э | 237 н | 253 э | |
142 Ћ | 158 ћ | 174 ® | 190 s | 206 О | 222 Ю | 238 о | 254 ю |
143 Џ | 159 џ | 175 Ї | 191 ї | 207 П | 223 Я | 239 п | 255 я |
В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один, а два байта. Таким образом, можно закодировать не 256, а 216=65536 различных символов, т.е. алфавиты всех известных языков, математические символы и др.
|
|
Пример. Закодировать слово ЭВМв кодировкеWindows 1251.
Э | В | М | |||||||||||||||||||||