Историческая справка развития АИПС

ИПЯ (продолжение)

Лекция 9

Для соединения слов тезауруса во фразы используются грамматические средства ИПЯ – это правила составления поисковых образов с помощью дескрипторов ИПТ.

Грамматики, применяемые в ИПЯ, бывают самые различные. Одни определяют порядок в дескрипторах ПОД и ПОЗ, другие же приписывают каждому дескриптору числа, характеризующие их значимость для поискового образа, третьи указывают на роль каждого дескриптора с помощью специальных указателей.

Применение грамматических средств позволяет более точно передавать содержание документа и тем самым улучшать поисковые характеристики ИПС.

Пертинетность – это соответствие содержания документов информационной потребности пользователей.

Т.о. если ИПС выдала релевантный ответ, это еще не значит, что он пертинентный.

Законы Моэрса 1960 г.

1-й закон: Потребитель уклоняется от использования ИПС всякий раз, когда для него затруднительно и хлопотно искать информацию, чем обойтись без нее.

2-й закон: Как цветовые таблицы служат средством обнаружения дальтонизма у человека, так и метод дескрипторов есть средство выявления лиц «привязанных к словам» или «невосприимчивых к идеям».

Совершенствование ИПЯ во многом зависит от достижений теории в области семантической информации и направлений лингвистики. Одной из наиболее сложных задач в этой области является обучение компьютера такой трудоемкой операции как реферирование документов.

Лингвистические средства входят в состав лингвистического обеспечения АИПС.

АИПС на базе ЭВМ появились еще в 60-х годах. 1961 г. – 121 ИПС созданы в мире и 16 из них на базе ЭВМ. В настоящее время мы переживаем 4-й или 5-й период развития ИС, который характеризуется применением интеллектуальных методов поиска информации (1-й период – 50-е годы; 2-й период – 60-е годы; 3-й период – 80-е годы; 4-й период – 90-е годы, 5-й период – с 2000 года).

В настоящее время говорят о развитии интегральных информационных систем, которые объединяют в себе выполнение сразу нескольких поисковых функций.

Например, к задачам, решаемым такими системами, относят:

- Ретроспективный поиск информации, при котором ИПС отыскивает документы с необходимыми сведениями и фактами во всем накопленном массиве документов, но делается это по разовым запросам (вопрос-ответ);

- Избирательное распространение информации – это поиск по постоянным запросам некоторого ограниченного числа пользователей (абонентов), который осуществляется через установленные промежутки времени только в массиве документов, поступивших за это время в ИПС, причем между данной системой и ее абонентами поддерживается постоянная обратная связь;

- Подготовка реферативных журналов по различными указателями;

- Подготовка бюллетеней сигнальной информации, быстро оповещающей потребителя обо всех публикациях по интересующим их вопросам, предметом и темам. Например, бесплатная рассылка прайс-листов по подпискам в Интернете.

Кроме этих основных функций ИПС выполняет вспомогательные функции, например, статистическую обработку ключевых слов с целью автоматизированного построения тезауруса; автоматический перевод на ИПЯ (автоматическое индексирование).

Некоторые проблемы поиска и хранения информации в ИПС

1. Современные ИПС тесно связаны с развитием ЭВМ, и поколение ИПС совпадает практически с развитием ЭВМ.

2. Для ИПС существует ряд проблем связанных с выполнением ее функций.

Основные функции – это организация поиска информации, для которого характерно выполнение ряда критериев: время (главный критерий), смысловое соответствие (релевантность, пертинентность, точность). Эти проблемы связаны с алгоритмичностью и методологией построения тезаурусов.

3. Проблема ввода информации. В настоящее время считается, что человечество за 1 год накапливает 2 Пбайт информации, которую требуется ввести в информационную систему.

История ввода информации первоначально была реализована на базе перфокарт и перфолент. Развитие способа ввода информации происходило одновременно с развитием архитектуры ЭВМ, которая позволила работать в режиме разделения времени. Появилась возможность одновременного доступа к системам сразу нескольких пользователей, часто удаленных от ЭВМ на большие расстояния. Начало этому процессу – начало 60-х годов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: