Кодирование информации

Информатика

Лекция 3

Информация

Информатика изучает процессы передачи и обработки информации.
Информация представляет собой совокупность некоторых сведений, данных, знаний. Информация может передаваться в виде сообщения от источника информации к её потребителю. Сообщение передаётся через канал связи в форме сигнала с помощью материального носителя.
Свойства информации:

  • объективность - независимость информации от человеческого сознания;
  • полнота - достаточность информации для принятия решения;
  • достоверность - соответствие информации объективной реальности;
  • актуальность - соответствие информации текущему моменту времени.

Виды информации:

 

  • непрерывная - сигнал является непрерывным;
  • дискретная - сигнал состоит из отдельных значений.

Процедура преобразования непрерывной информации в дискретную называется дискретизацией.
Формы представления информации:

 

  • символьно-текстовая
  • графическая
  • звуковая



Измерение информации

Для количественного измерения информации используются вероятностный и объемный подходы.
В вероятностном подходе количество информации рассчитывается, как энтропия системы, которая может находится в нескольких состояниях. Если все состояния системы равновероятны, то количество информации рассчитывается по формуле Хартли:

где N - количество состояний системы. Если состояния системы не равновероятны, то количество информации рассчитывается по формуле Шеннона:

где N - количество состояний системы, Pk - вероятность k-ого состояния системы. Наименьшая единица измерения информации называется бит. Такое количество информации содержится в системе, которая может находится в двух равновероятных состояниях.
В объемном подходе количество информации рассчитывается, как количество знаков 0 и 1, необходимых для кодирования информации. Наименьшая единица измерения информации называется бит. Такое количество информации содержится в сообщении, для кодирования которого достаточно одного знака 0 или 1. Производные единицы измерения информации байт (8 бит), килобайт (1024 байта), мегабайт (1024 килобайта), гигабайт (1024 мегабайта).





Системы счисления

Под системой счисления понимается способ записи чисел с помощью знаков. Системы счисления делятся на позиционные и непозиционные. В позиционных системах счисления значение знака в числе зависит от позиции, которую занимает знак в записи числа. В непозиционных системах счисления значения знака не зависит от его положения в записи числа (например, римская, в которой семь знаков соответствуют всегда одним и тем же числам: I - один, V - пять, X - десять, L - пятьдесят, C - сто, D - пятьсот, M - тысяча).
Число различных знаков, используемых для записи чисел в позиционных системах счисления, называется основанием системы счисления и отражается в названии системы счисления. В информатике применяются двоичная, восьмеричная, десятичная и шестнадцатеричная системы счисления. В позиционных системах счисления число X в системе счисления с основанием p записывается в следующем виде:

где a - знаки числа.
Перевод целой части числа из одной системы счисления в другую осуществляется путем последовательного деления этого числа на основание той системы счисления, в которую производится перевод, при этом запоминается остаток от деления. Результат перевода записывается снизу вверх.
Перевод дробной части числа из одной системы счисления в другую осуществляется путем последовательного умножения этого числа на основание той системы счисления, в которую производится перевод, при этом запоминается и затем отбрасывается целая часть результата. Результат перевода записывается сверху вниз.





Логика высказываний

Высказывание - любое утверждение, относительно которого можно сказать истинно оно (истина, true) или нет (ложь, false). Высказывание может быть простым или составным. Простое высказывание записывается с помощью операторов отношения:

  • равно,
  • не равно,
  • больше,
  • меньше,
  • больше или равно,
  • меньше или равно.

Составное высказывание состоит из нескольких простых высказываний, соединенных с помощью логических операций:

 

  • отрицание (инверсия). Обозначение: not X, не X. Операция отрицания имеет значение "ложь", если операнд истинен, и наоборот.
  • конъюнкция (логическое И, логическое умножение). Обозначение: X and Y, X и Y. Операция конъюнкция имеет значение "истина", только если оба операнда истинны.
  • дизъюнкция (логическое ИЛИ, логическое сложение). Обозначение: X or Y, X или Y. Операция дизъюнкция имеет значение "истина", если хотя бы один из операндов истинен.

Приоритет выполнения операций при вычислении значения составных высказываний (от более высокого к более низкому):

 

1. отрицание,

2. конъюнкция,

3. дизъюнкция,

4. операторы отношений.

Порядок выполнения операций может быть изменен с помощью круглых скобок.
Тождественно истинным (ложным) называется составное высказывание, которое является истинным (ложным) при всех значениях составляющих его простых высказываний. Высказывания называются эквивалентыми, если их значения совпадают при всех значениях составляющих их простых высказываний.


Кодирование информации

Для кодирования числовой информации используется перевод числа в двоичную систему счисления. Для кодирования целых чисел со знаком используется представление целого числа в дополнительном коде. Для положительных чисел дополнительный код совпадает со значением числа. Для отрицательных чисел дополнительный код рассчитывается, как инверсия модуля исходного числа с добавлением числа 1. Для кодирования вещественных чисел используется нормализованное представление числа. Мантисса и порядок нормализованного числа сохраняются отдельно.
Для кодирования текстовой информации текст разбивается на отдельные символы (буквы, цифры, знаки препинания, разделители) и для каждого символа задается свой код, представляющий из себя положительное целое число. Информация о соответствии между символами и кодами содержится в кодовых таблицах. В настоящее время используются следующие кодовые таблицы (кодировки):

  • ASCII - кодировка, которая первоначально использовалась для представления знаков только английского языка. Для кодирования знаков других языков используются национальные варианты кодировки ASCII, в которых коды с 0 по 127 используются для кодирования символов английского алфавита, знаков препинания, цифр, а коды с 128 по 255 используются для кодирования символов соответствующего национального алфавита. В частности, для кодирования знаков русского языка используются такие варианты кодировки ASCII, как Windows-1251 и КОИ-8. Для хранения одного кода используется 1 байт (8 бит), что позволяет закодировать 256 различных символов.
  • Unicode (Юникод) - кодировка, которая позволяет представить знаки практически всех письменных языков. Набор знаков в кодировке Unicode имеет несколько форм представления, включая UTF-8, UTF-16 и UTF-32. Для хранения одного кода обычно используется 2 байта (16 бит), что позволяет закодировать 65536 различных символов.

Существует два подхода к кодированию графической информации - растровая и векторная кодировка.

 

  • растровая (точечная) - кодировка, при которой изображение представляется в виде множества одноцветных прямоугольников (пикселей), распределенных по строкам и столбцам. Каждый пиксель характеризуется целочисленными координатами (номерами строки и столбца в изображении) и цветом. Для каждого цвета задается свой код, представляющий из себя положительное целое число. При выводе на экран обычно используется RGB-кодировка (сокращение от английского Red Green Blue - красный, зеленый, синий). В этой кодировке любой цвет представляется как смешение красного, зеленого и синего цветов; интенсивность того или иного цвета задается целым числом от 0 (отсутствие данного цвета) до 255 (максимальная интенсивность данного цвета). Для хранения цвета одного пикселя используется 3 байта (по 1 байту на красный, зеленый и синий цвет). При печати для кодирования цвета обычно используется кодировка CMYK (сокращение от английского Cyan Magenta Yellow blacK - голубой, пурпурный, желтый, черный). В этой кодировке любой цвет представляется, как смешение голубого, пурпурного и желтого цветов (черный цвет используется, поскольку на практике смешение голубого, пурпурного и желтого цветов не дает черного цвета); интенсивность того или иного цвета задается целым числом от 0 (отсутствие данного цвета) до 255 (максимальная интенсивность данного цвета). Для хранения цвета одного пикселя используется 4 байта (по 1 байту на голубой, пурпурный, желтый и черный цвет).
  • векторная - кодировка, при которой изображение представляется в виде набора графических примитивов (отрезков прямых линий, окружностей и отрезков кривых). Каждый примитив характеризуется некоторыми параметрами (координаты начала и конца отрезка, координаты центра окружности и радиус, параметры уравнений, описывающих кривые) и цветом. Для кодирования цвета используется RGB или CMYK кодировка (см. выше).

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: