Среди текстовых файлов выделяют

Три типа текстовых файлов

Одной из наиболее распространенных функций современного персонального компьютера является подготовка разнообразных текстовых документов. Текстовые документы сохраняются в файлах, которые называются - текстовыми.

Текстовые файлы - наиболее наглядная форма представления алфавитно-цифровой, информации, которая разрешает сохранять, редактировать, читать на экране и печатать любые текстовые документы - письма, записи, справки, объявления, отчеты, статьи, исходные тексты программ и много другого.

Способ организации данных в файле того ли другого типа называется форматом файла. Форматы текстового файла - простейший из всех известных способов организации данных. Вся информация в таком файле представленная просто символами кодовой таблицы, которые без всяких преобразований можно вводить из клавиатуры, присылать на экран или принтер. Подобно любому документу на листе бумаги, текстовый файл состоит из набора строк разной длины (например, одна страница - 64 символа, другая - 15 символов и т.п.).

Много из текстовых файлов передаются в виде простого текста, который недостаточно привлекателен, но легко читается, потому что в нем нет шрифтов разных начертаний, графиков, заголовков, подзаголовков и др. Эти дополнительные особенности носят название разметки текста. Говоря о разметке текста, выделяют понятия физической и логической разметки. При использовании физической разметки текста указывается точный вид каждого фрагмента. Например, "центрированный текст, 14-м кеглем, жирный, гарнитура Tіmes". При логической разметке текста указывается логическое значение данного фрагмента, например "это заголовок главы".

При обмене информацией между разными машинами разметка текста может не сохраняться. Для сохранения разметки документу при передаче информации от машины к машине применяются разные способы. Текстовые процессоры и издательские системы используют специально разработанные форматы файлов, которые содержат не только текст, но и информацию о том, как он должен быть оформлен. Основная проблема здесь в несовместимости таких форматов между программами-конкурентами (например, Word и StarWrіter).

- ASCІІ- файлы - файлы, в которых символы текста и как они должны быть расположены на странице кодируются разными значениями байта или последовательностью байтов. Примерами таких файлов могут быть файлы, которые созданны редакторами типа встроенного редактора программы Mіdnіght Commander, файлы, создаваемые программой Notepad в Wіndows и vі в UNІ;

- файлы с расширенными возможностями Форматирование текста; от предыдущих отличаются числом кодов, которые используются как управляющие возможностями Форматирование текста. Примерами таких файлов являются файлы, которые создаются с помощью простых редакторов типа Лексикон, файлы в формате.html.

- файлы, которые используют собственный формат для представления текста (в которых символы текста также представленные специальными последовательностями). Это файлы MS Word с расширением. doc, файлы OpenWrіter с расширением. sxw, файлы Kword с расширением. kvd и др.

Файлы, созданные разными редакторами, имеют уникальные расширения, которые позволяют, не заглядывая в документ, догадываться о способах разметки текста. Так файлы, созданные редакторами подготовки простого текста, часто имеют расширения.txt, а подготовленные в процессоре Word.doc или.rtf. Документы, которые содержат команды разметки языка HTML, имеют расширение.html или.htm.

Текстовый файл канонического формата - это файл с расширением txt. Его можно подготовить и прочитать на любом ПК, с любой ОС.

Для просмотра некоторых типов текстовых файлов (не говоря уже про их редактирование) требуются специальные программные средства. Часто для просмотра файла пользователь применяет обычный ему текстовый редактор. Но бывают случаи, когда информация представлена в незнакомом для этого редактора формате. Существуют средства для преобразования (конвертирования) текстового документа из одного формата в другого.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: