Документальные информационные системы

Распределенные информационные системы

Технологии и модели вычислений

Модели вычислений:

· Централизованные вычисления:

- модель вычислений с использованием центральной хост-ЭВМ;

- модель с автономными персональными вычислениями;

· Распределенные вычисления:

- модель вычислений «файл-сервер»;

- модель вычислений «клиент-сервер»;

- модель «вычисление по требованию» (GRID, P2P).

· Распределенный компьютинг - удаленный доступ, высокая степень доступности ресурсов, устойчивость к сбоям и отказам, удаленное взаимодействие пользователей

· Грид компьютинг (GRID) = распределенный компьютинг + {федеративное объединение сообществ, виртуализация, стандартизация, маскирование неоднородностей}

· Мобильный компьютинг – самостоятельная параллельная GRID линии развития, с учётом мобильности устройств сети, адаптивности приложений и энергонезависимости.

· Тотальный компьютинг = мобильный компьютинг + {персональное умное пространство, невидимость, местная масштабируемость, маскирование неоднородностей}

· Глобальное умное пространство = Грид компьютинг + Тотальный компьютинг

Потребности в системах, ориентированных на накопление и эффективную обработку неструктурированной или слабоструктурированной информации привели к возникновению отдельной ветви программного обеспечения систем управления базами данных, на основе которых создаются документальные информационные системы.

Документальная информационная система — единое хранилище документов с инструментарием поиска и отбора необходимых документов.Единичным элементом данных в документальных информационных системах является неструктурированный на более мелкие элементы документ (текстовые, звуковые, графические файлы).

ИПС – информационно-поисковая система. Пертинентность - соответствие найденных документов информационным потребностям пользователя. Релева́нтность - степень соответствия найденного запросу.

Системы на основе индексирования исходные документы помещаются в базу без дополнительного преобразования, но их содержание отображается в поисковом пространстве (поисковый образ документа (ПОД)).

Семантически-навигационные системы оснащают документы специальными навигационными конструкциями.

Показатели эффективности информационного поиска:

· Полнота = число найденных пертинентных док-ов / число пертинентных док-ов в системе

· Точность = число найденных пертинентных док-ов / число релевантных док-ов по запросу

· Коэффициент информационного шума системы = (число релевантных запросу док-ов – число найденных пертинентных док-ов / число релевантных запросу док-ов.

Информационно-поисковый язык (ИПЯ) - это формализованная семантическая система, предназначенная для выражения содержания документа и запросов по поиску необходимых документов. ИПЯ включает в себя:

1. Структурную составляющую ИПЯ:

· Системы на основе индексирования:

- Информационно-поисковые каталоги (спецкод) - классификационная система знаний по определенной предметной области (библиотека, архив);

- Тезаурус - специальным образом организованная совокупность основных лексических единиц (понятий) предметной области (словарь терминов) и описание парадигматических отношений между ними;

- Генеральный указатель - перечисление всех слов (словоформ) документа хранилища, с указанием (отсылками) координатного местонахождения каждого слова.

· Семантически-навигационные системы:

- Техника смысловых отсылок в текстах документов;

- Специальный навигационный интерфейсе по отсылкам

2. Манипуляционную (поисковую) составляющую ИПЯ:

· Дескрипторные языки запросов:

- Наборы лексических единиц-дескрипторов (слов, словосочетаний), не имеющих между собой связей;

· Семантические языки запросов:

- Предикатные - многоместное отношение совокупности грамматических элементов (предложение);

- Реляционные - не многоместные бинарные (друг с другом) отношения лексических единиц высказывания.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: