Применение языка запросов

Поиск информации в Интернет с помощью поисковой машины Rambler (продолжение)

Лекция 12

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Высший приоритет имеют операторы AND, NOT, а OR низший. Поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT и лишь затем по операторам OR. Изменить порядок группировки можно использованием скобок.

При формулировке запроса используются двойные кавычки. Они используются для поиска цитат. Слова в кавычках воспринимаются в том порядке и в той форме как они записаны.

Например, запрос: Самолет “Заправился” посадка. Такому запросу удовлетворяет документ, содержащий текст: самолет совершил посадку и заправился; но не удовлетворяет текст: самолет совершил посадку, чтобы заправиться.

При построении запроса возникает необходимость объединить слов запроса в группы, которые интерпретируются как аргументы некоторого оператора. Такие группы заключаются в скобки, при этом часть запроса, содержащаяся в скобках, рассматривается как самостоятельный запрос.

Рассмотрим пример:

1) машина самолет | аэродром

2) машина (самолет | аэродром)

В соответствии с правилами расстановки логических операций 1-му запросу соответствует форма: машина AND самолет OR аэродром. По этому запросу ищется документ, содержащий одновременно слова: машина и самолет; либо документ, содержащий только слово самолет. Оператор OR в данном случае имеет смысл соединительного ИЛИ, означающего, что документом, удовлетворяющему поиску, будет документ, содержащий только левую или только правую часть от OR или обе сразу. Не войдут документы, содержащие слово только самолет или только машина.

Во 2-м запросе форма будет следующая: машина AND (самолет | аэродром). OR будет выполняться первым, т.е. будут найдены документы, которые содержат слова: машина самолет, машина аэродром, машина самолет аэродром.

Документы, не содержащие слова машина, но содержащие аэродром будут найдены по первому запросу, но не найдены по второму запросу. Во всех остальных случаях поисковые образы будут совпадать.

В некоторых поисковых системах Интернет используются так называемые метасимволы при поиске запроса. В Rambler метасимволы не поддерживаются, но они зарезервированы. В качестве метасимволов используются *,?.

* - означает любая подстрока;

? – означает произвольный символ.

Каждый запрос обрабатывается в соответствии с правилами языка запроса. Некоторые слова и символы трактуются как операторы языка запросов и обрабатываются специальным образом.

Фактически языком запросов описывается некая формула, которая используется при поиске. Каждый из документов, входящих в поиск, сопоставляется с ней (формулой) и результатом поиска является только те документы, которые ей удовлетворяют.

Например, запросу самолет удовлетворяют все документы, в которых хотя бы раз встретилось слово самолет в любой форме.

Запросу, состоящему из нескольких слов, удовлетворяют документы, содержащие эти слова в любой форме. Соответствие документа более сложному запросу определяется логикой операторов и конструкцией языка запросов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: