Особенности кодирования информации в персональном
Числовая информация внутри персонального компьютера (ПК) кодируется в двоичной или в двоично-десятичной системах счисления. При вводе и выводе любой информации в ПК используются специальные коды представления информации – коды ASCII (American Standard Code for Information Interchange), эти же коды применяются для кодирования буквенной и символьной информации и внутри ПК.
Для удобства работы введены следующие термины для обозначения совокупностей двоичных разрядов (табл. 3). Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в компьютере.
Таблица 3.Двоичные совокупности
| Количество двоичных разрядов в группе | Наименование единицы измерения |
| Бит | |
| Байт | |
| Параграф | |
| 8·10241 | Кбайт (килобайт) |
| 8·10242 | Мбайт (мегабайт) |
| 8·10243 | Гбайт (гигабайт) |
| 8·10244 | Тбайт (терабайт) |
| 8·10245 | Пбайт (пентабайт) |
Последовательность нескольких бит или байт часто называют полем данных. Биты в числе (в слове, в поле и т. п.) нумеруются справа налево, начиная с 0-го разряда. В ПК могут обрабатываться поля постоянной и переменной длины.
Поля постоянной длины:
q слово — 2 байт;
q двойное слово – 4 байт;
q полуслово – 1 байт;
q расширенное слово – 8 байт.
Числа с фиксированной запятой чаще всего имеют формат слова и полуслова; числа плавающей запятой – формат двойного и расширенного слова. Поля переменной длины могут иметь любой размер от 0 до 255 байт, но обязательно равный целому числу байт.
Пример. Структурно запись двоичного числа -110000012 равного десятичному –19310, в разрядной сетке ПК представлена на рис. 1 и 2.
| Разряд | ||||||||||||||||
| Число | ||||||||||||||||
| Знак числа | Абсолютная величина числа |
|
| Разряд | … | |||||||||||||||||||
| Число | … | |||||||||||||||||||
| Знак числа | Порядок | Мантисса |
|
Двоично-кодированные десятичные числа могут быть представлены в ПК полями переменной длины в так называемых упакованном (рис. 3) и распакованном форматах. В упакованном формате для каждой десятичной цифры отводится по четыре двоичных разряда (полбайта), при этом знак числа кодируется в крайнем правом полубайте числа (1100 – знак «+»и1101 – знак «-»).
| Цифра | Цифра | Цифра | Цифра | … | Цифра | Знак |
|
Упакованный формат используется обычно в ПК при выполнении операций сложения и вычитания двоично-десятичных чисел.
В распакованном формате (рис. 4) для каждой десятичной цифры отводится по целому байту, при этом старшие полубайты (зона) каждого байта (кроме самого младшего) в ПК заполняются кодом 0011 (в соответствии с ASCII-кодом), а в младших (левых) полубайтах обычным образом кодируются десятичные цифры. Старший полубайт (зона) самого младшего (правого) байта используется для кодирования знака числа.
| Зона | Цифра | Зона | Цифра | … | Зона | Цифра | Знак | Цифра |
|
Распакованный формат используется в ПК при вводе-выводе информации, а также при выполнении операций умножения и деления двоично-десятичных чисел.
Например, число -193(10)= -000110010011(2-10) в ПК будет представлено:
q в упакованном формате: 0001 1001 0011 1101;
q в распакованном формате: 0011 0001 0011 1001 1101 0011.
Код ASCII (American Standard Code for Information Interchange – американский стандартный код для обмена информацией) имеет основной стандарт и расширение (рис. 5). Основной стандарт для кодирования символов использует шестнадцатеричные коды 00-7F, расширение стандарта – коды 80-FF.
Основной стандарт является международным и используется для кодирования управляющих символов и букв латинского алфавита; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (естественно, в разных странах разные). Пользоваться таблицей достаточно просто. Следует приписать шестнадцатеричную цифру номера строки справа к шестнадцатеричной цифре номера столбца. Так получится шестнадцатеричный код символа.
| A | B | C | D | E | F | |||||||||||
| ► | @ | P | · | P | A | P | a | ░ | L | ╨ | P | ≡ | ||||
| ☺ | ◄ | ! | A | Q | a | q | Б | С | б | ▒ | ┴ | ╤ | С | + | ||
| ↕ | ″ | B | R | b | r | B | T | в | ▓ | t | ╥ | т | ≥ | |||
| !! | # | C | S | c | s | Г | У | г | │ | ╙ | у | ≤ | ||||
| π | $ | D | T | d | t | Д | Ф | д | ┤ | - | t | ф | ⌠ | |||
| % | E | U | e | u | Е | Х | е | ╡ | ┼ | F | X | ⌡ | ||||
| ■ | & | F | V | f | v | Ж | Ц | ж | ╢ | ╞ | ╓ | ц | ÷ | |||
| ‘ | ↨ | ’ | G | W | G | w | З | Ч | з | ╖ | ╟ | ╫ | ч | ≈ | ||
| ◘ | ↑ | ( | H | X | H | x | И | Ш | и | ╕ | ╚ | ╪ | ш | ○ | ||
| ↓ | ) | I | Y | i | y | Й | Щ | й | ╠ | ╔ | ╝ | щ | ′ | |||
| A | → | * | : | J | Z | j | z | К | Ъ | к | ║ | ± | ╔ | ъ | · | |
| B | ♂ | ← | + | ; | K | [ | k | { | Л | Ы | л | ╗ | ╦ | █ | ы | √ |
| C | ♀ | ∟ | , | < | L | \ | | | М | Ь | м | ╝ | ╠ | ■ | ь | ⁿ | |
| D | ♫ | ↔ | - | = | M | ] | m | } | Н | Э | н | = | ▐ | э | ² | |
| E | ▲ | / | > | N | ^ | n | ~ | О | Ю | о | ╛ | ╬ | ▐ | ю | ▪ | |
| F | ٭ | ▼ | / | ? | O | – | o | Δ | П | Я | п | ┐ | ╩ | ■ | я |
|
Примечание. Любой символ, представленный в этой таблице, при работе в DOS может быть введен в ПК с клавиатуры набором его десятичного кода (соответствующего шестнадцатеричному ASCII-коду) на малой цифровой клавиатуре при нажатой клавише Alt.
Наряду с кодом ASCII в компьютерных сетях, в частности в сети Интернет, используется общий для всех стран мира универсальный код – Уникод (Unicode). Этот код основан на паре байт – машинном слове. Шестнадцати бит хватает для отображения 65 535 знаков. Такого количества достаточно для всех существующих алфавитов (то есть алфавиты большинства стран мира размещаются в основном стандарте этого кода).






