double arrow

П. 2. Форматы файлов


П. 1. Файловые системы.

Файлы и файловая система

Всякая операционная система создает на каждом томе (дискете, диске, пакете дисков, CD-ROM и пр.) совокупность системных данных, которая называется файловой системой (файловой структурой).

Файловая система (пустая) создается при инициализации (разметке) тома, затем корректируется ОС (подсистемой управления данными) при текущей работе, в процессе создания, удаления, модификации (увеличения или уменьшения объема) файлов пользователя, содержащих программы или данные.

Файловая система включает в себя таблицу содержания и область данных — совокупность блоков на диске, идентифицируемых своими номерами / адресами. Обычно адрес блока состоит из 3 чисел — № цилиндра (совокупность дорожек, доступных при фиксированном положении блока головок считывающего устройства), № поверхности (дорожки в цилиндре), № блока на дорожке.

Все операционные системы, как правило, поддерживают следующие элементы иерархических файловых систем: обычные файлы, каталоги, специальные байт-ориентированные и блок-ориентированные файлы. Файл является массивом байтов (блоков фиксированной длины). Каталоги обеспечивают связь между именами файлов и собственно файлами. Каждый элемент каталога содержит имя файла и ссылку на конкретный файл. Для именования файлов используются корневой и текущий каталоги.




Различают следующие виды файлов:

• по типу записей:

§ файлы с записями постоянной длины,

§ файлы с записями переменной или неопределенной длины,

§ файлы, образующие байтовый или битовый поток;

• по способу выборки информации:

§ файлы последовательного доступа,

§ файлы прямого доступа,

§ файлы доступа по индексу (обычно — файлы базы данных).

В зависимости от типа и назначения файлов и возможностей ОС (методов доступа) файл может передаваться в прикладную программу как целое или блоками (физическими записями) либо логическими записями (строками, словами, символами).

В системе OS/360 основную роль играли два типа файлов:

• символьные (исходные программы или данные);

• двоичные (программы в машинных кодах).

В современных системах активно используется значительно большее разнообразие файлов, из которых мы перечислим наиболее типичные файлы данных:

текстовые файлы — обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, которые интерпретируются и обрабатываются текстовыми редакторами, процессорами, анализаторами (Lexicon, Word, TEC, анализаторы SGML, HTML);

текст без разметки (планарный) — файл, содержащий только отображаемые (воспроизводимые на всех печатающих устройствах и терминалах) символы кода ASCII, а также простейшие управляющие символы: CR — возврат каретки; LF — перевод строки; TAB — символ табуляции, иногда LF — новая страница;



текст с разметкой — планарный файл, содержащий бинарную и символьную разметку, управляющую отображением информации (программно и/или аппаратурно);

ASCII-файл — содержит только отображаемые коды левой части кодовой таблицы ASCII (латиница и служебные символы), обычно применяется для хранения документов с символьной разметкой (RTF, SGML, HTML);

• • табличный файл — содержит форматированные данные (символьные, численные и др), образующие строки и столбцы таблиц, создаваемых и обрабатываемых табличными СУБД (FoxPro, Clipper, MS Access) и/или табличными процессорами (SuperCalc, MS Excell и др.);

• графический файл — бинарный файл, содержащий графическую информацию. Форматы: TIF (Tagged Image File), BMP(Bit-Mapped Picture), а также ряд других — PCX, PIC ит. д.;

• мультимедиа файлы — бинарные файлы, содержащие оцифрованную аудио- (типы WAV или MIDI-Sequencer), видео- (формат MPEG) или смешанную информацию.







Сейчас читают про: