Для измерения информации используется два параметра: объем данных и количество информации.
Количество информации связано с её измерением. В теории информации принят энтропийный подход, который устанавливает ценность информации, содержащейся в сообщении для его получателя.
Количество информации в сообщении определяется тем, насколько уменьшается эта мера после получения сообщения. Тривиальное сообщение не несет информации. Сообщение несет полную информацию о некотором событии если оно снимает всю неопределенность.
В технике часто используют более простой и грубый объемный способ измерения информации. Он основан на подсчете числа символов в сообщении, т.е. связан с его длиной и не учитывает содержания. В вычислительной технике применяют две стандартные единицы измерения: бит и байт.
Бит - это один символ двоичного алфавита. Одним битом могут быть выражены 2 понятия(21):
1 бит: 1;0
Если количество битов (разрядность) увеличить до 2, то уже можно выразить 4 различных понятия (2*2=4=22):
|
|
2 бита: 00;01;10;11
Если количество битов увеличить до 3, то уже можно выразить 8 различных понятия (4*2=8=23):
3 бита: 000;001;010;011;100;101;110;111.
и так далее.
Байт - это количество информации, которое можно передать с помощью 8 двоичных символов, восьмиразрядного двоичного кода. Именно 8 битов требуется для того, чтобы закодировать любой из 256 (256=28) символов базового набора символов компьютера.
00000000=0
00000001=1
…………….
11111110=254
11111111=255
В специальной компьютерной терминологии используется понятие «слово» - 16 бит или 2 байта.
С его помощью можно полностью передать информацию о реализации события, которое может иметь 28 =256 исходов. Например, нажатие одной из клавиш компьютера.
Широко используются еще более крупные единицы измерения информации:
1 Килобайт (Кбайт) = 1024 байт – 210 байт;
1 Мегабайт (Мбайт)= 1024 Кбайт – 220 байт;
1 Гигабайт (Гбайт) = 1024 Мбайт – 230 байт;
1 Терабайт (Тбайт) = 1024 Гбайт - 240 байт.
Для десятичной системы счисления единицей измерения является дит;
Дит - единица количества информации, содержащейся в сообщении о данном состоянии системы, имеющей 10 равновероятных состояний.
Например, сообщений в двоичной системе счисления - 11010011 – состоит из восьми бит, сообщение в десятичной системе счисления – 123456 – из 6 дит.
При измерении информации циркулирующей в ЭВМ используют в основном технический подход.