Для представления в ЭВМ дискретной информации применяется алфавитный способ, основанный на использовании конечного набора символов любой природы, называемого алфавитом (алфавит естественного языка, совокупность десятичных цифр). Символы алфавита – буквы. Любая конечная последовательность букв – слово.
Системой счисления называется совокупность правил поименования и записи чисел.
Системы счисления различаются набором базисных чисел и правилами образования из них других чисел. В настоящее время используются в основном позиционные системы счисления. (Значение каждой цифры поставлено в зависимости от того места, где она стоит в изображении числа).
Десятичная запись любого числа х в виде полинома.
Х=аn*10n+an-1*10n-1+…a1*101+a0*100+a-1*10-1+…+a-m*10-m+…
Например, 445.21
4*102+4*101+5*100+2*10-1+1*10-2
Основание десятичной системы -0,1,2,3,4,5,6,7,8,9
Двоичная система счисления.
Х=an*2n+an-1*2n-1+…+a1*21+a0*20+a-1*2-1+…+a-m*2-m+…
Основание двоичной системы -0,1.
Другие системы счисления.
Восьмеричная - базисные числа- 0, 1, 2, 3, 4, 5, 6, 7
|
|
83,5=123,48
Форматы данных представляемых в ЭВМ:
1) числа с фиксированной запятой (могут занимать байт или слово) (рис. 1.5.) - последний разряд знаковый диапазон для байта от -12810 до +12 710, для слова от –32768 до +32767. При выполнении арифметических операций числа нормализуются (от –1 до +1). В универсальных ЭВМ такое представление почти не используется из-за накопления ошибок из-за нормализации;
Рис. 1.5. Представление чисел с фиксированной запятой.
2) числа с плавающей запятой (занимают два слова) (рис. 1.6.)
, где m-мантисса, P-характеристика (порядок) числа, N – основание системы. Если - то запись числа нормализована слева. Если в первое число после запятой не 0, то число нормализовано справа.
Нормализованное (справа) число одинарной точности представляется следующим образом: знак числа в бите 15 первого слова (0-положительные, 1- отрицательные числа), порядок - в битах 7-14 первого слова m-мантисса занимает остальные 23 бита в двух словах.
Рис.1.6. Представление чисел с плавающей запятой.
Нормализованное число двойной точности записывается в четыре слова. Под мантиссу отводится 55 бит.
Арифметические операции для чисел с плавающей запятой намного сложнее, чем для чисел с фиксированной запятой. Однако, накопление ошибок меньше.
1.6. Смена форм представления информации
1.6.1. Кодирование - выражение данных одного типа (например, десятичные) через данные другого типа (например, двоичные). В вычислительной технике зачастую используется двоичное кодирование. В быту азбука Морзе, система записи математических выражений.
Может применяться последовательно несколько систем кодирования. Например, названия объектов заменяются на последовательность номеров, номера (десятичные) заменяются двоичным кодом.
|
|
- Кодирование числовых данных заключается в переходе из одной системы счисления в другую.
- Кодирование текстовых данных.
Каждому символу ставится в соответствие уникальная комбинация двоичных цифр. Для избежания проблем связанных с передачей информации Американский национальный институт стандартов (ANSI)принял стандартный код для обмена информацией.
Система ASCII (American Standart Code for Information Interchange)
В этом коде комбинация двоичных разрядов используется для представления строчных и прописных букв английского алфавита, знаков пунктуации, цифр от0 до 9, а также кодов управления передачей информации.
В системе ASCII закреплены две таблицы кодирования: базовая (от 0 до 127) и расширенная (от 128 до 255) (7 бит и 8 бит соответственно0
0-31 – управляющие коды
32-127 – коды английского алфавита, знаки препинания и цифры
128-255 – национальные алфавиты
Система Windows 1251 – система кодировки русского языка (к примеру, буква А имеет в этой системе код – 192, буква Б – 193).
KOH – 8 (код обмена информацией восьмизначный).
ISO (International Standart Organization). В этой системе коды А и Б – 176 и 177 соответственно.
- Кодирование графических данных
Растровый способ – разбиение изображения на ячейки и кодирование цвета (яркости) цвета в каждой ячейки.
Векторный способ – представление контуров графического объекта последовательностью точек (их координат).
- Кодирование звуковой информации.
Метод FM ( Frequency Modulation) – звук раскладывается на последовательность простейших гармонических сигналов различных частот, каждый из которых представляет правильную синусоиду.
Метод WT (Wave Table) – таблично волновой. Основывается на таблице образцов звуков для различных музыкальных инструментов.
1.7. Меры качества и количества информации
Как мы видели из перечисления свойств информации в значительной мере определяющих ее качество можно говорить как о частных мерах качества, так и об интегрированных или общих. Примером частных мер качества информации могут служить меры точности (погрешности).
В частности применительно к числовой информации представляемой в ЭВМ различают погрешности: абсолютную D[A] = A - Am и относительную d[A] = D[А]/Аm, где А – истинное значение, Аm – машинное значение.
Меры количества информации характеризуются, как правило, либо объем ресурса (памяти) необходимого для использования (хранения) информации либо относительную полезность информации для решения конкретной задачи.
В первом случае информация отождествляется с данными, то есть рассматривается безотносительно содержания и количество ее оценивается либо в единицах измерения прикладной области (количество скважин, количество точек измерения, …), либо в единицах носителей информации, то есть реализуется объемный, структурный подход на которых она хранится. Для ЭВМ в качестве таких единиц используются биты, байты(8 бит), килобайты (1024 байта), мегабайты (1024 килобайты), гигабайты (1024 мегабайты).
Для оценки содержательной ценности информации часто используют статистический подход, разработанный К. Шенноном применительно к задачам передачи информации (теория связи).