Лингвистическое обеспечение АИС
Лингвистическое обеспечение АС - совокупность языковых средств для формализации естественного языка, построения и сочетания информационных единиц, используемых в АС при функционировании системы.
Лингвистическое обеспечение АС включает:
- форматную базу (типы, форматы, структурыинформации - данных, записей, документов);
- лексическую базу (классификаторы, кодификаторы, словари и тезаурусы или иные лексико-лингвистические таблицы, используемые при вводе, обработке, поиске, представлении информации (данных, записей, документов);
- языковые средстваописания (ЯОД, словари данных) и манипулирования (ЯМД) данными.
Типы, структуры, форматы данных и документов в информационных системах.
Типы данных - это совокупность соглашений о программно-аппаратурной форме представления и обработки, а также ввода, контроля и вывода элементарных данных (символьные, числовые, дата и время, двоичные, логические и т.д.).
Структуры данных - способы композиции простых данных в агрегаты и операции над ними (например записи, множества, массивы).
|
|
Форматы файлов - представление информации на уровне взаимодействия операционной системы с прикладными программами.
Форматы данных - соглашения о представлении агрегатов информации при передаче (поэтому часто говорят о коммуникативных или обменных форматах), в том числе:
· библиотечных и справочных БД;
· полнотекстовых документов.
Таблица -Основные типы файлов, обрабатываемых в ПЭВМ
Тип, расширение имени | Вид информации, содержащейся в файле |
exe, com | Программа, готовая к исполнению |
bat | Текстовый командный файл |
sys | Системный файл |
ovl, ovr | Оверлейный файл |
pif | Программно-информационный файл Windows |
txt, 1st | Текстовый файл в формате DOS |
doc | Документ (чаще всего в формате WinWord) |
rtf | Размеченный текстовый файл (Rich Text Format) |
clot | Файл формата документа (Document Type) |
Формат документа Adobe Acrobat | |
wri | Документ редактора Write для Windows |
wps | Документ текстового процессора MS WORKS |
bak, old | Старая копия файла, создаваемая перед его изменением |
arj, rar, zip, Izh, arc | Архивные файлы |
bas | Текст программы на языке Basic |
pas | Текст программы на языке Turbo Pascal |
c | Текст программы на ЯП Си |
bmp, pcx, gif, tif, jpg | Графические файлы |
dbf | Файлы базы данных формата DBase, Foxpro, Cliper |
wdb | Базы данных формата MS WORKS |
wks | Электронная таблица формата MS WORKS |
xls | Электронные таблицы EXCEL |
lib, dll | Файлы библиотек |
dat | Файл данных |
mi | Файл инициализации |
hlp | Файл справки (подсказки, помощи) |
ext | Файл расширений |
mnu | Файл меню |
wav, mid, mp3,mod | Звуковые файлы |
mov, mpg | Файлы видеоклипов |
- текстовые файлы - обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, которые интерпретируются и обрабатываются текстовыми редакторами, процессорами, анализаторами (Lexicon, Word, TEC, анализаторы SGML, HTML);
|
|
- текст без разметки (планарный) - файл, содержащий только отображаемые (воспроизводимые на всех печатающих устройствах и терминалах) символы кода ASCII, а также простейшие управляющие символы - CR - возврат каретки; LF - перевод строки; TAB - символ табуляции, иногда LF - новая страница;
- текст с разметкой - планарный файл, содержащий бинарную (таблица 3, колонки 1, 2) или символьную (остальные колонки) разметку, управляющую отображением информации (программно и/или аппаратно);
- ASCII-файл - содержит только отображаемые коды левой части кодовой таблицы ASCII (латиница и служебные символы), обычно применяется для хранения документов с символьной разметкой (RTF, SGML, HTML);
- табличный файл - содержит форматированные данные (символьные, численные и др), образующие строки и столбцы таблиц, создаваемых и обрабатываемых табличными СУБД (Foxpro, Clipper, MS Access), и/или процессорами (SuperCalc MS Excell и др.);
- графический файл - бинарный файл, содержащий графическую информацию. Форматы: tif (Tagged Image File), bmp (Bit-Mapped Picture), а также ряд других - pcx, pic и т. д.;
- мультимедиа файл - бинарный, содержащий оцифрованную аудио- (типы wav или MIDI-Sequencer) видео - (формат MPEG) или смешанную информацию.