Представление информации в ЭВМ

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления — для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа.

Естественные человеческие языки — это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов).

Та же проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое.

Своя система существует и в вычислительной технике — она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски — binary digit, или, сокращенно, bit (бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

00 01 10 11

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе.

где N-количество кодируемых значений;

m- количество разрядов.

Все данные в компьютере обрабатываются в числовой форме в двоичной системе счисления. Каждой букве, цифре, интенсивности звука, цвету и его оттенку, каждой точке экрана, каждому ВУ (принтеру, винчестеру и др.) соответствует свой двоичный код.

Единицей информации является 1 бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Компьютер работает не с отдельными разрядами, а с машинными словами, в основном, длиной 1 байт = 8 бит, 2 байта = 16 бит и 4 байта = 32 бит (до 8 байт в спецкомпьютерах). Двухбайтная единица измерения (16 бит) называется параграф. Практически это означает, что за один такт компьютер обрабатывает не 1 байт информации, а сразу 2, 3 или 4, т.е. работает в 2, 3 или 4 раза быстрее.

В 1 байте можно закодировать 28 = 256 различных комбинаций (букв, цифр, номеров устройств и т.д.).

В информатике кроме бита и байта используются также их производные:

1К = 210 =1024 байт - килобайт, используется для измерения длины (ёмкости) файлов и каталогов (папок);

1М = 220 = 1024 К = 1 048 576 байтмегабайт, используется для измерения ёмкости ОЗУ, дискет, flash - памяти и компакт-дисков. Современные ОЗУ имеют ёмкость 128-104М, CD и DVD -700 и 900 М.;

1Г = 1024 М = 1 048 576 М – гигабайт, применяется при измерении ёмкости винчестеров. Ёмкость современных жёстких дисков 120-200 Г.

1Т = 1024Г – терабайт, применяется для измерения ёмкости памяти компьютерных систем, состоящих из группы компьютеров.

При решении задач с помощью ЭВМ исходные данные задаются обычно в десятичной системе, полученные решения также представляются в десятичной системе, а непосредственно в машине они обрабатываются только в двоичной системе счисления – машинном коде.

Если программисту нужно написать команду на машинном языке, то приходится использовать двоичную систему счисления. При этом, во время записи команды, например, двоичного числа 11011000101101011111012 легко сделать ошибку, пропустив или добавив в каком-то разряде 0 или 1. Поэтому человек заменяет двоичное число восьмеричным или шестнадцатеричным, используя простые правила перевода. В итоге двоичные числа предстают в более привычном для программиста виде, который уменьшает вероятность ошибок в записи команд и данных. Например, это же число, записанное в восьмеричной (154265758) или шестнадцатеричной (362D7D16) системах, практически исключает такие ошибки. Когда программист выполнит все операции над восьмеричными или шестнадцатеричными числами, т.е. в удобном для человека формате, он переводит результат в двоичный машинный код, понятный ЭВМ.

Таким образом, возникает необходимость перевода чисел из одной системы счисления в другую и наоборот.

Система счисления - это способ изображения чисел с помощью ограниченного числа символов.

В зависимости от способа изображения чисел системы счисления делятся на:

§ позиционные и

§ непозиционные.

В позиционной системе счисления количественное значение каждой цифры зависит от ее места (позиции) в числе. Например, в числе 252,02 первая цифра 2 стоит на позиции сотен, вторая – на позиции единиц и третья – на позиции сотых долей.

В непозиционной системе счисления цифры не меняют своего количественного значения при изменении их расположения в числе. Пример – римская система счисления: в числе XI цифра I вычитается из Х и образует число 9, а в числе VI – прибавляется к V и даёт число 6, т.е. значение цифры I не зависит от позиции в числе.

Вопрос: как от 20 отнять 88 и в остатке получить 22?

Ответ: ХХ

- 88

Вывод: нельзя в вычислениях использовать разные системы счисления, т.к. результат получается не верным

Для изображения чисел в различных системах счисления приняты следующие обозначения:

· в Российской федерации после числа ставится индекс 2, 8, 10 ил 16;

· в Европе и в мире после числа ставятся буквы: B для двоичной системы (binary), Q - для восьмеричной, D – для десятичной (decimal) и Н – для шестнадцатеричной (hexadecimal).

Например, 1010112 = 101011B = 538 = 53Q = 4310 = 43D = 2D16 = 2DH.

базис или основание системы счисления Р – это количество различных цифр, используемых для изображения числа в позиционной системе счисления. Значения цифр лежат в пределах от 0 до Р-1.

Для двоичной системы базис Р = 2 (цифры 0 и 1), для восьмеричной Р = 8 (цифры 0, 1, 2, 3, 4, 5, 6, 7), для десятичной Р = 10 (0, 1, 2, 3, 4, 5, 6, 7, 8, 9).

Поскольку арабы подарили миру только 10 цифр для изображения чисел (от 0 до 9), а для шестнадцатеричной системы нужно 16 (базис системы Р= 16), то для обозначения цифр с 10 до 15 используются буквы А, В, С, D, E, F. Таким образом, базис системы составляют цифры от 0 до 9 и буквы: А - цифра 10, В – цифра 11, С – цифра 12, D = 13, E = 14 и F = 15 – всего 16 цифр). Латинские буквы могут использоваться как строчные, так и заглавные.

В общем случае запись любого числа в системе счисления с основанием Р будет представлять собой ряд вида:

am-1Pm-1+am-2Pm-2+...+a1P1+a0P0+a-1P-1+a-2P-2+...+a-sP-s, (1)

где нижние индексы определяют местоположение цифры в числе (её разряд):

s положительные значения индексов - для целой части числа (m разрядов);

s отрицательные значения - для дробной (s разрядов).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: