Описание форматов электронных книг

Существует несколько групп форматов электронных книг – графические и растровые форматы. Растровые форматы представляют объект в виде множества точек, векторные – в виде простейших геометрических фигур (точки, линии, многоугольники). Таблица внизу классифицирует их именно по этому признаку.

Однако, как и любая другая, эта классификация условна. Например, PostScript (.ps,.eps), PDF  могут быть чисто векторными. Так же DOC, PDF могут содержать только растровые отсканированные картинки или же наоборот - содержать только текст.

Существует также разделение форматов электронных книг на предназначенные для чтения текста он-лайн и для сохранения на компьютере пользователя. К первой группе относятся файлы такого формата, как HTML  и TXT, ко второй – RTF, DjVu, PDF и проч.


Графические растровые форматы

TIFF Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз.
JPEG Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации. Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место - для печати он непригоден, а для демонстрации на дисплее подходит идеально.
DjVu Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях.


Графические векторные форматы с оформлением

RTF Формат, поддерживаемый большинством текстовых редакторов, созданный для документов в среде ОС Windows. обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки и т.п.). Книги в формате RTF доступны для скачивания во многих книгообменных сайтах.
HTML Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости.
OPF FlipBook Открытый формат электронных книг - стандартная версия программы FlipAlbum создает альбомы-книги FlipBooks с расширением OPF (Open Electronic Book Package Format). Эти файлы могут быть просмотрены с помощью самой программы или бесплатной утилиты для работы с OPF-файлами.
HTMLHelp Книга - файл формата.chm. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения.
SGML Стандартный общий язык разметки для документов. Широко используется в издательском деле - рукописи зачастую передаются в электронномSGML-структурированном виде, что значительно облегчает работу наборщиков и дизайнеров.
XML XML — текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде, поэтому на его основе создан формат FictionBook
FictionBook Открытый формат, основан на XML.Основное преимущество FictionBook(.fb2) - возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг.
TEX TEX — система вёрстки, разработанная в целях создания компьютерной типографии. В неё входят средства для секционирования документов, для работы с перекрёстными ссылками и для набора сложных математических формул. Документы набираются на собственном языке разметки в виде файлов, содержащих информацию о форматировании текста или выводе изображений. Электронные книги обычно имеют расширение.tex, конвертируются специальной программой в файлы «.dvi», которые могут быть отображены на экране или напечатаны. DVI-книги можно специальными программами преобразовать в PostScript, PDF, или другой электронный формат.
PDF Формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. Обычно используется для книг с иллюстрациями (в т.ч. схемы и математические формулы). PDF - формат, позволяющий внедрять необходимые, векторные и растровые изображения, формы и мультимедиа-вставки.
Microsoft Фирменный формат Microsoft (.lit), достаточно распространенный, в том числе из-за поддержки производителя. Существует некоторое затруднение с прочтением, поскольку формат читается в основном с помощью Microsoft Reader, официального ПО. Microsoft LIT включает ряд функций, из-за которых его считают очень похожим на Adobe PDF: закладки, аннотации и масштабирование.
PostScript и EPS PostScript (.ps)- язык составления документов, главная функция - описание страниц, чтобы при выводе на печать они выглядели так же, как на экране. Формат EPS (Encapsulated PostScript) был создан для сохранения графики (содержащей изображения всех типов, контуры, текстовые поля и др. – в том числе и электронных книг), предназначенной для печати на «PostScript-принтерах». EPS, в котором, как правило, сохраняют конечный результат работы, это упрощенная версия формата PostScript.
ExeBook Книга в формате ExeBook —по сути, Win32-приложение, скомпилированное с помощью специального программного обеспечения. Основной особенностью книги в формате EXE является ее максимальная приближенность к бумажному аналогу.
RBS RBS (Radix-Tools REBUS) - это защищенный формат, основанный на HTML и включающий в себя текстовый, графический, мультимедиа-контент и интерактивные составляющие. Использование в формате HTML-языка позволяет легко конвертировать файлы практически любого формата в RBS-вид с помощью специального ПО. В электронном виде в формате RBS может быть представлено множество типов бумажных изданий, как то – учебные и контрольные тесты, анкеты – результаты опросов, картографические документы, справочники, энциклопедические материалы и художественная литература.
PRC Сжатый формат PRC – так называемый Palm-формат, использует механизм шифрования контента электронной книги, что обеспечивает защиту интеллектуальной собственности при ее продаже. Файлы с расширением PRC используются для электронных книг в формате Mobipocket Reader для чтения книг на кпк и телефонах.


Простой текст (plain text)

TXT Файлы формата TXT имеют наименьший вес, поэтому зачастую использовались в самом начале эры электронных интернет-библиотек, у посетителей которых была предельно низкая скорость скачивания, равно как и объемы жестких дисков, а также различных носителей. Для того, чтобы скачать крупное издание, создавались ZIP-архивы, объединяющие все главы книги. Основной плюсTXT – его совместимость со всеми устройствами и практически любым программным продуктом, Хотя данный формат и не поддерживает графику и сложное форматирование.

 





Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: