Наименьшей единицей представления информации в двоичной системе является бит, который выражает логическое значение ДА или НЕТ и обозначается двоичным числом 0 или 1. Бит - очень удобная единица для хранения информации в компьютере, но не очень удобна для обработки информации.
Одним битом можно закодировать два понятия: 0 или 1 (да или нет), двумя – четыре понятия (00, 01, 10, 11), тремя – 8 значений.
Общая формула имеет вид
N=2m,
где N – количество независимых кодируемых значений, m – разрядность двоичного кодирования, принятая в данной системе.
Для обработки и измерения информации используется байт - группа из 8 бит. Байт является минимальной единицей измерения информации. Одним байтом, как правило, кодируется один символ текстовой информации. Более крупные единицы измерения данных образуются добавлением приставок -кило, -мега, -гига, -тера, - пета:
1Кбайт = 210 байт = 1024 байт;
1Мбайт = 210Кбайт;
1Гбайт = 210Мбайт;
1Тбайт = 210Гбайт.
1Пбайт = 210Ебайт.
Два байта образуют так называемое машинное слово.
В качестве единицы хранения данных принят объект переменной длины, называемой файлом. Файл - это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. Тип данных определяет тип файла. Хранение файлов организуется в иерархической структуре, которая называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором хранятся файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов, через которые проходит. В качестве разделителя используется символ "\". Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Пример записи полного имени файла: <имя носителя>\<имя каталога 1>\…\<имя каталога-N>\<собственное имя файла>.