Поисковая система Google.com

Эта система была создана в качестве учебного проекта студентами Стэнфордского университета (США) Ларри Пэйджем и Сергеем Брином. В 1996 г. они разрабатывали ПС Back Rub, а в 1998 г. на ее основе создали систему Google. В настоящее время она является единоличным лидером среди глобальных ПС по всем значимым параметрам.

Google имеет наиболее обширную базу данных – более 8 млрд. веб-страниц и статей из групп новостей по интересам. За сутки программы-роботы индексируют >5 млн. новых и обновленных страниц, причем, актуализация базы производится каждые 28 дней.

Среди основных преимуществ этой ПС можно назвать:

1) высокую скорость работы – от 1 до нескольких секунд, несмотря на огромный объем индексного файла системы;

2) способность индексировать документы в разных форматах – в виде HTML-файлов, в форматах PDF, RTF, PS, DOC, XLS, PPT, WP5 и др. При этом Google позволяет моментально конвертировать страницы в указанных форматах в обычный HTML-файл, без специального программного обеспечения для доступа к файлу;

3) предоставление достаточно точной информации – результаты поиска в большинстве случаев соответствуют совершаемым запросам;

4) высокая степень комфорта для пользователя – пользователи неанглоязычных стран автоматически переадресовываются на интерфейс на их родном языке (180 локальных доменов);

5) практически единственная ПС, в которой учитывается не только количество страниц, но и качество в результатах поиска;

6) наличие дополнительных функций – вместо привычной надписи «error 404» («ошибка 404) система позволяет ознакомиться с содержанием некоторых страниц, которые уже не существуют, правда, в том виде, в котором они были размещены в ПС;

7) предлагается также функция «Мне повезет», благодаря которой, не дожидаясь результатов поиска, пользователи сразу же попадают на сайт, который находится на 1 месте в списке результатов.

Основными особенностями Google при информационном поиске также являются:

- использование морфологического анализа слов;

- отсутствие разницы между прописными и строчными буквами в запросе.

2. Каталог Yahoo!.

Yahoo! – американская компания, которая владеет второй по популярности в мире поисковой системой и каталогом и предоставляет ряд сервисов, объединенных порталом Yahoo! Directory. Портал также включает в себя популярный сервис электронной почты – Yahoo! Mail, один из старейших и наиболее используемых в мире.

В январе 1994 г. аспиранты Стэнфордского университета Дэвид Файло и Джерри Янг создали веб-сайт, который назывался «Путеводитель Джерри –по Всемирной паутине». Он представлял собой не что иное, как каталог других сайтов.

В апреле 1994 г. сайт был переименован в Yahoo! и работал с использованием механизмов поиска Google. С февраля 2004 г. портал прекращает использование поисковой технологии ближайшего конкурента и переходит на свою собственную. В настоящее время в стадии бета-версии находится Yahoo! Next – основа будущих технологий проекта.

Yahoo! предоставляет >1,5 млн. ссылок к ресурсам Интернета, охватывая более 0,001 доли всего вэб-пространства. Данные, которые заносятся в каталог проходят «ручную обработку». Более 200 редакторов ежедневно «просматривают» пространство Интернет по наиболее популярным темам.

3. Поисковая система Yandex.

Yandex (Яндекс) – российская ИТ-компания, которая владеет одноименной системой поиска в Сети и интернет-порталом. Официально поисковая машина Yandex.ru была анонсирована 23.09.1997 г. на выставке Softool.

В настоящее время она является одним из лидеров российского поиского сервиса, демонстрирует высокие показатели как по объему проиндексированных документов (примерно 1,5 млн. российских и зарубежных русскоязычных серверов, а также серверов на территории СНГ – учтено около 200 млн. оригинальных документов), так и по релевантности поиска.

Количество обработанных запросов по состоянию на 2009 г. – 1 982 млрд. С 2014 г. Яндекс предоставляет более 30 сервисов, наиболее популярными из которых являются Яндекс. Картинки, Яндекс. Почта, Яндекс. Погода, Яндекс. Новости и др.

ПС Yandex осуществляет предварительную обработку текста и «строит» индекс, по которому потом производится поиск. Внутри себя она хранит не документы, а только их адреса.

Актуализация базы осуществляется еженедельно. Кроме того, система Yandex пока единственная российская поисковая система, индексирующая документы в форматах PDF, RTF, DOC, наряду с форматами HTML, Excel, PPT, Flash, RSS (блоги и форумы).

Рекомендации по релевантному поиску в Интернете с помощью ПС Yandex.

1. Целесообразно проверять орфографию.

Если в результате поиска не было найдено ни одного документа, то, возможно, допущена орфографическая ошибка в написании слова. Необходимо проверить правильность его написания.

Если при поиске использовалась ключевая фраза, то необходимо посмотреть на количество каждого из слов в найденных документах (перед их списком после фразы «Результаты поиска»). Если какое-то слово не встречается, оно написано неверно.

2. Необходимо использовать синонимы

Если список найденных страниц слишком мал или не содержит полезных страниц, необходимо изменить слово. Например, вместо слова «рефераты», возможно, больше подойдет фраза «курсовые работы» или слово «сочинения». Можно задать для поиска три-четыре слова синонима сразу, перечислив их через вертикальную черту (|). Например, вместо слова «фотографии» лучше использовать комбинацию «фотографии| фото| фотоснимки». Тогда будут найдены страницы, где встречается хотя одно из слов.

3. Желательно искать больше, чем по одному слову.

Слова «психология» или «продукты» дадут при поиске поодиночке большое количество бессмысленных ссылок. Необходимо добавлять одно или два ключевых слова, связанных с исковой темой. Например, «психология Фрейда» или «продажа и покупка морепродуктов». Необходимо также сужать область запроса – если ищете информацию об автомобиле ГАЗ или «Лада», то запросы «автомобиль ГАЗ» или «автомобиль Лада» выдадут более релевантные документы, чем по запросу «легковые автомобили».

4. Нежелательно писать большими буквами.

Начиная слово с большой (прописной) буквы, невозможно будет найти слова, которые написаны с маленькой (строчной) буквы, если это слово не первое в предложении. Заглавные буквы в запросе рекомендуется использовать только в именах собственных.

5. Целесообразно вести поиск без морфологии.

Можно заставить Yandex не учитывать формы слов из запроса при поиске. Например, запрос «!иванов» найдет только страницы с упоминанием этой фамилии, а не г. Иваново.

6. Необходимо искать похожие документы.

Если один из найденных документов ближе к искомой теме, чем остальные, целесообразно воспользоваться ссылкой «найти похожие документы» («еще»). Ссылка расположена под краткими описаниями найденных документов.

7. При поиске желательно использовать знаки «+» и «–».

Чтобы исключить документы, где встречается определенное слово, надо поставить перед ним знак «–» (между словом и знаком «+»/«–» не должно быть пробела). Например, если нужно описание г. Вена, имеет смысл задать в качестве запроса такую ключевую фразу «путеводитель по вене агентство –тур.

4. Поисковая система Rambler.

Этот поисковик был запущен в октябре 1996 г. и сначала предназначался для выявления материалов на серверах в пределах территории бывшего Советского Союза. К началу нового тысячелетия Rambler на время утратил лидирующие позиции, устарев практически по всем позициям.

Однако, проведенная в декабре 2012 г. модернизация всей программно-аппаратной части, позволила этой ПС вновь обрести былой авторитет. По результатам тестов Ramble rзанимает 2-е место после Yandex по величине базы данных – примерно 120 млн. страниц. Производительность поискового робота декларируется в объеме 6,9 млн. страниц в сутки. В системе также усовершенствован поиск по новостям: робот посылается на ведущие новостные сайты России каждые 2 часа.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: