Единицы представления, измерения и хранения данных

Наименьшей единицей представления информации в двоичной системе является бит, который выражает логическое значение ДА или НЕТ и обозначается двоичным числом 0 или 1. Бит - очень удобная единица для хранения информации в компьютере, но не очень удобна для обработки информации.

Одним битом можно закодировать два понятия: 0 или 1 (да или нет), двумя – четыре понятия (00, 01, 10, 11), тремя – 8 значений.

Общая формула имеет вид

N=2^m,

где N – количество независимых кодируемых значений, m – разрядность двоичного кодирования, принятая в данной системе.

Для обработки и измерения информации используется байт - группа из 8 бит. Байт является минимальной единицей измерения информации. Одним байтом, как правило, кодируется один символ текстовой информации. Более крупные единицы измерения данных образуются добавлением приставок -кило, -мега, -гига, -тера, - пета:

1Кбайт = 2¹⁰ байт = 1024 байт;

1Мбайт = 2¹⁰Кбайт;

1Гбайт = 2¹⁰Мбайт;

1Тбайт = 2¹⁰Гбайт.

1Пбайт = 2¹⁰Ебайт.

Два байта образуют так называемое машинное слово.

В качестве единицы хранения данных принят объект переменной длины, называемой файлом. Файл - это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. Тип данных определяет тип файла. Хранение файлов организуется в иерархической структуре, которая называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором хранятся файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов, через которые проходит. В качестве разделителя используется символ "\". Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Пример записи полного имени файла: <имя носителя>\<имя каталога 1>\…\<имя каталога-N>\<собственное имя файла>.