Кодирование информации

Единицы измерения информации.

Определить понятие «количества информации» довольно сложно. Различают синтаксическую, семантическую и прагматическую меры информации. Количество информации на синтаксическом уровне невозможно определить без понятия неопределенности состояния системы. Действительно, получение информации о какой-либо системе всегда связано с изменением неосведомленности получателя о состоянии этой системы. Рассмотрим это понятие.

Пусть до получения информации потребитель имеет некоторые сведения о системе А. Мерой его неосведомленности является функция Н(А), которая в то же время является мерой неопределенности состояния системы. После получения некоторого сообщения В получатель приобрел некоторую дополнительную информацию Iв(А), уменьшившую его неосведомленность, так, что новая неосведомленность стала Нв(А). Тогда количество информации I(А) о системе, полученной в сообщении В, определится как Iв(А)= Н(А) – Нв(А), т.е. количество информации измеряется уменьшением неопределенности состояния системы.

Количество семантической информации в сообщении, т.е. количество новых знаний, получаемых пользователем, является величиной относительной и зависит от получателя.

Прагматическая мера информации определяет полезность (ценность) информации для достижения пользователем поставленной цели и также является величиной относительной.

В двоичной системе счисления знаки 0 и 1 будем называть битами. Для удобства введены и более крупные единицы измерения информации: двоичное слово из 8 бит - байт, Кбайт, Мбайт, Гбайт.

И передается в виде сообщений и записывается с помощью некоторого конечного набора знаков, которые будем называть буквами.

В канале связи сообщение, составленное из символов одного алфавита может преобразовываться в в сообщение из символов другого языка. Правило, описывающее однозначное соответствие букв алфавитов при таком преобразовании называют кодом, а саму процедуру – кодированием и декодированием.

Вся информация в компьютере представлена в виде двоичных кодов. Каждое десятичное число представляется в компьютере в упакованном или в распакованном формате. В упакованном формате числу отводится 4 позиции (полубайт), н-ер: 7=0111, в распакованном формате отводится 8 позиций (байт), н-ер: 7=0011 0111, т.е. к каждому числу слева дописывается зона 0011, это является следствием использования в ПК ASCII-кода для представления символьной информации. Его таблицы приводятся в литературе. Этот код ASCII (American Standart Code for Information Interchange) – Американский стандарт кода для обмена информацией - является международным и имеет основной стандарт и расширение стандарта, в который входят символы псевдографики и буквы национальных языков.

Решение задач на ЭВМ реализуется программным способом, т.е. путем выполнения последовательно во времени операций над информацией.


Character Set (0 – 127)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: