Текст – это упорядоченный набор предложений, предназначенный для того, чтобы выразить некий смысл. В смысловой цельности текста отражаются те связи и зависимости, которые имеются в самой действительности (общественные события, явления природы, человек, его внешний облик и внутренний мир, предметы неживой природы и т.д.).
В компьютере текст кодируется в последовательность байтов, образуя текстовый файл. Каждый байт хранит отдельный символ буквы, цифры или знака препинания.
Текстовый файл – обычная форма представления текста на компьютере. Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда двух, трех и более байтов, в зависимости от используемой таблицы кодировки (ASCII, Windows 1252, ANSI и др).
Особой разновидностью текстовых данных следует считать т.н. гипертекст. Термин гипертекст был введен Тедом Нельсоном в 1965 году. Обычно гипертекст – это текст, содержащий узлы перехода (гиперссылки) от одного текста к какому-либо другому.
Пример гипертекста - веб-страницы – документы на HTML (гипертекстовом языке разметки), размещенные в Интернете.
|
|
Восприятие текста изучается в рамках таких дисциплин, как лингвистика текста и психолингвистика.
Способы создания текстовых файлов и их форматы
Способы создания текстовых документов:
- Ввод текста вручную с клавиатуры, используя текстовые редакторы или настольные издательские системы;
- Сканирование текста и ввод его с помощью программы распознавания текста. Для сканирования текста используются программы распознавания символов FineReader.
- Ввод текста с помощью система распознания речи.