Компьютере

Особенности кодирования информации в персональном

Числовая информация внутри персонального компьютера (ПК) кодируется в двоичной или в двоично-десятич­ной системах счисления. При вводе и выводе любой информации в ПК используются специальные коды представления информации – коды ASCII (American Standard Code for Information Interchange), эти же коды приме­няются для кодирования буквенной и символьной информации и внутри ПК.

Для удобства работы введены следующие термины для обозначения совокупностей двоичных разрядов (табл. 3). Эти термины обычно используются в качестве еди­ниц измерения объемов информации, хранимой или обрабатываемой в компьютере.

Таблица 3.Двоичные совокупности

Количество двоичных разрядов в группе Наименование единицы измерения
  Бит
  Байт
  Параграф
8·10241 Кбайт (килобайт)
8·10242 Мбайт (мегабайт)
8·10243 Гбайт (гигабайт)
8·10244 Тбайт (терабайт)
8·10245 Пбайт (пентабайт)

Последовательность нескольких бит или байт часто называют полем данных. Биты в числе (в слове, в поле и т. п.) нумеруются справа налево, начиная с 0-го разряда. В ПК могут обрабатываться поля постоянной и переменной длины.

Поля постоянной длины:

q слово — 2 байт;

q двойное слово – 4 байт;

q полуслово – 1 байт;

q расширенное слово – 8 байт.

Числа с фиксированной запятой чаще всего имеют формат слова и полуслова; числа плавающей запятой – формат двойного и расширенного слова. Поля переменной длины могут иметь любой размер от 0 до 255 байт, но обязатель­но равный целому числу байт.

Пример. Структурно запись двоичного числа -110000012 равного десятичному –19310, в раз­рядной сетке ПК представлена на рис. 1 и 2.

Разряд                                
Число                                
  Знак числа Абсолютная величина числа

Рис. 1. Число с фиксированной запятой формата слова со знаком

Разряд                                      
Число                                      
  Знак числа Порядок Мантисса

Рис. 2. Число с плавающей запятой формата двойного слова

Двоично-кодированные десятичные числа могут быть представлены в ПК полями переменной длины в так называемых упакованном (рис. 3) и распакованном фор­матах. В упакованном формате для каждой десятичной цифры отводится по четы­ре двоичных разряда (полбайта), при этом знак числа кодируется в крайнем пра­вом полубайте числа (1100 – знак «+»и1101 – знак «-»).

Цифра Цифра Цифра Цифра Цифра Знак

Рис. 3. Структура поля упакованного формата
{ Байт }

Упакованный формат использу­ется обычно в ПК при выполнении операций сложения и вычитания двоично-де­сятичных чисел.

В распакованном формате (рис. 4) для каждой десятичной цифры отводится по целому байту, при этом старшие полубайты (зона) каждого байта (кроме самого младшего) в ПК заполняются кодом 0011 (в соответствии с ASCII-кодом), а в млад­ших (левых) полубайтах обычным образом кодируются десятичные цифры. Стар­ший полубайт (зона) самого младшего (правого) байта используется для кодиро­вания знака числа.

Зона Цифра Зона Цифра Зона Цифра Знак Цифра

Рис. 4. Структура поля распакованного формата

Распакованный формат используется в ПК при вводе-выводе информации, а также при выполнении операций умножения и деления двоично-десятичных чисел.

Например, число -193(10)= -000110010011(2-10) в ПК будет представлено:

q в упакованном формате: 0001 1001 0011 1101;

q в распакованном формате: 0011 0001 0011 1001 1101 0011.

Код ASCII (American Standard Code for Information Interchange – американский стандартный код для обмена информацией) имеет основной стандарт и расшире­ние (рис. 5). Основной стандарт для кодирования символов использует шестнадцатеричные коды 00-7F, расширение стандарта – коды 80-FF.

Основной стандарт является международным и используется для кодирования управляющих символов и букв латинского алфавита; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (есте­ственно, в разных странах разные). Пользоваться таблицей достаточно просто. Следует приписать шестнадцатеричную цифру номера строки справа к шестнадцатеричной цифре номера столбца. Так получится шестнадцатеричный код сим­вола.

                      A B C D E F
        @ P · P A P a L P
  !   A Q a q Б С б С +
      B R b r B T в t т
    !! #   C S c s Г У г   у
    π $   D T d t Д Ф д - t ф
      %   E U e u Е Х е F X
    &   F V f v Ж Ц ж ц ÷
    G W G w З Ч з ч
  (   H X H x И Ш и ш
    )   I Y i y Й Щ й щ
A   * : J Z j z К Ъ к ± ъ ·
B + ; K [ k { Л Ы л ы
C , < L \ |   М Ь м ь
D - = M ] m } Н Э н   = э ²
E   / > N ^ n ~ О Ю о ю
F ٭ / ? O o Δ П Я п я  

Рис. 5. Таблица кодов ASCII

Примечание. Любой символ, представленный в этой таблице, при работе в DOS может быть введен в ПК с клавиатуры набором его десятичного кода (соответствующего шестнадцатеричному ASCII-коду) на малой цифровой клавиатуре при нажатой клавише Alt.

Наряду с кодом ASCII в компьютерных сетях, в частности в сети Интернет, используется общий для всех стран мира универсальный код – Уникод (Unicode). Этот код основан на паре байт – машинном слове. Шестнадцати бит хватает для отображения 65 535 знаков. Такого количества достаточно для всех существующих алфавитов (то есть алфавиты большинства стран мира размещаются в основном стандарте этого кода).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: