Типы, структуры, форматы данных и документов в информационных системах

Лингвистическое обеспечение АИС

Лингвистическое обеспечение АС - совокупность языковых средств для формализации естественного языка, построения и сочетания информационных единиц, используемых в АС при функционировании системы.

Лингвистическое обеспечение АС включает:

- форматную базу (типы, форматы, структурыинформации - данных, записей, документов);

- лексическую базу (классификаторы, кодификаторы, словари и тезаурусы или иные лексико-лингвистические таблицы, используемые при вводе, обработке, поиске, представлении информации (данных, записей, документов);

- языковые средстваописания (ЯОД, словари данных) и манипулирования (ЯМД) данными.

Типы, структуры, форматы данных и документов в информационных системах.

Типы данных - это совокупность соглашений о программно-аппаратурной форме представления и обработки, а также ввода, контроля и вывода элементарных данных (символьные, числовые, дата и время, двоичные, логические и т.д.).

Структуры данных - способы композиции простых данных в агрегаты и операции над ними (например записи, множества, массивы).

Форматы файлов - представление информации на уровне взаимодействия операционной системы с прикладными программами.

Форматы данных - соглашения о представлении агрегатов информации при передаче (поэтому часто говорят о коммуникативных или обменных форматах), в том числе:

· библиотечных и справочных БД;

· полнотекстовых документов.

Таблица -Основные типы файлов, обрабатываемых в ПЭВМ

Тип, расширение имени Вид информации, содержащейся в файле
exe, com Программа, готовая к исполнению
bat Текстовый командный файл
sys Системный файл
ovl, ovr Оверлейный файл
pif Программно-информационный файл Windows
txt, 1st Текстовый файл в формате DOS
doc Документ (чаще всего в формате WinWord)
rtf Размеченный текстовый файл (Rich Text Format)
clot Файл формата документа (Document Type)
pdf Формат документа Adobe Acrobat
wri Документ редактора Write для Windows
wps Документ текстового процессора MS WORKS
bak, old Старая копия файла, создаваемая перед его изменением
arj, rar, zip, Izh, arc Архивные файлы
bas Текст программы на языке Basic
pas Текст программы на языке Turbo Pascal
c Текст программы на ЯП Си
bmp, pcx, gif, tif, jpg Графические файлы
dbf Файлы базы данных формата DBase, Foxpro, Cliper
wdb Базы данных формата MS WORKS
wks Электронная таблица формата MS WORKS
xls Электронные таблицы EXCEL
lib, dll Файлы библиотек
dat Файл данных
mi Файл инициализации
hlp Файл справки (подсказки, помощи)
ext Файл расширений
mnu Файл меню
wav, mid, mp3,mod Звуковые файлы
mov, mpg Файлы видеоклипов

- текстовые файлы - обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, которые интерпретируются и обрабатываются текстовыми редакторами, процессорами, анализаторами (Lexicon, Word, TEC, анализаторы SGML, HTML);

- текст без разметки (планарный) - файл, содержащий только отображаемые (воспроизводимые на всех печатающих устройствах и терминалах) символы кода ASCII, а также простейшие управляющие символы - CR - возврат каретки; LF - перевод строки; TAB - символ табуляции, иногда LF - новая страница;

- текст с разметкой - планарный файл, содержащий бинарную (таблица 3, колонки 1, 2) или символьную (остальные колонки) разметку, управляющую отображением информации (программно и/или аппаратно);

- ASCII-файл - содержит только отображаемые коды левой части кодовой таблицы ASCII (латиница и служебные символы), обычно применяется для хранения документов с символьной разметкой (RTF, SGML, HTML);

- табличный файл - содержит форматированные данные (символьные, численные и др), образующие строки и столбцы таблиц, создаваемых и обрабатываемых табличными СУБД (Foxpro, Clipper, MS Access), и/или процессорами (SuperCalc MS Excell и др.);

- графический файл - бинарный файл, содержащий графическую информацию. Форматы: tif (Tagged Image File), bmp (Bit-Mapped Picture), а также ряд других - pcx, pic и т. д.;

- мультимедиа файл - бинарный, содержащий оцифрованную аудио- (типы wav или MIDI-Sequencer) видео - (формат MPEG) или смешанную информацию.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: