Системы информационного поиска в сети Internet

Основная трудность поиска в Internet нужной информации состоит в том, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Internet разработаны специальные системы поиска. Они располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они бесплатно обслуживают огромное количество клиентов.

Для поиска в Интернете предназначены различные инструменты: поисковые машины, индексированные каталоги, метапоисковые системы, тематические списки ссылок, онлайновые энциклопедии и справочники. При этом для поиска разного рода информации наиболее эффективными оказываются различные инструменты. Рассмотрим каждый инструмент в отдельности.

Индексированные каталоги содержат информацию, иерархически структурированную по темам. Тематические разделы первого уровня определяют широко популярные темы, такие как спорт, отдых, наука, магазины и т.д. В каждом разделе есть подразделы. Таким образом, путешествуя по дереву каталога, можно постепенно сужать область поиска. Дойдя до нужного подкаталога, вы находите в нем набор ссылок. Обычно в каталоге все ссылки являются профильными, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что если вы ищете информацию по некоторой широкой теме, то целесообразно обратиться к каталогу. Если же вам необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством. Один из наиболее популярных каталогов в России – List.ru – находится по адресу http://mail.ru/.

Кроме каталогов общего назначения в Сети много специализированных каталогов. Если внутри отдельной темы каталога находится огромное количество ресурсов, возникает проблема выбора. В некоторых каталогах имеется сортировка по популярности, например в каталоге Яндекс сортировка идет по индексу цитирования.

Тематические списки ссылок – это списки, составленные группой профессионалов или коллекционерами-одиночками. Часто узкоспециализированная тема может быть раскрыта одним специалистом лучше, чем группой сотрудников крупного каталога. Тематических коллекций в Сети очень много, поэтому давать конкретные адреса не имеет смысла.

Поисковые машины. В ответ на запрос мы обычно получаем длинный список документов, многие из которых не имеют никакого отношения к теме запроса. Такие документы называются нерелевантными, т.е. не относящимися к делу. Таким образом, релевантный документ – это документ, содержащий искомую информацию. Очевидно, что от умения грамотно делать запрос зависит процент получаемых релевантных документов. Доля релевантных документов в списке всех найденных поисковой машиной документов называется точностью поиска. Если все найденные документы релевантные, то точность поиска составляет 100 %. Если найдены все релевантные документы, то полнота поиска – 100 %. Таким образом, качество поиска определяется двумя параметрами: точностью и полнотой поиска. Эти величины взаимозависимы, т.е. увеличение полноты снижает точность, и наоборот.

Поисковая машина состоит из двух частей: робота, или паука, и поискового механизма. База данных робота формируется в основном им самим (робот сам находит ссылки на новые ресурсы) и в существенно меньшей степени – владельцами ресурсов, которые регистрируют свои сайты в поисковой машине. Помимо робота, который обходит все предписанные серверы и формирует базу данных, существует программа, определяющая рейтинг найденных ссылок. Принцип работы поисковой машины сводится к тому, что она опрашивает свою базу данных по ключевым словам, которые пользователь указывает в поле запроса, и выдает список ссылок, ранжированный по релевантности.

Поиск по индексу заключается в том, что пользователь формирует запрос и передает его поисковой машине. В случае, когда у пользователя имеется несколько ключевых слов, весьма полезно использование булевых операторов. Текст, в пределах которого проверяется логическая комбинация, называется единицей поиска. Это может быть предложение, абзац или весь документ. В разных поисковых системах могут использоваться различные единицы поиска. После того, как пользователь сделал запрос, поисковая система обрабатывает синтаксис запроса и сравнивает ключевые слова со словами в индексе. После этого составляется список сайтов, отвечающих запросу, они ранжируются по релевантности, и формируется результат поиска, который и выдается пользователю.

Существует огромное количество поисковых систем. Наиболее популярная на Западе поисковая система – Google (www.google.com). Всемирно популярный каталог Yahoo! в качестве поисковой системы использует именно Google. В Рунете самыми популярными поисковыми системами являются Яндекс (www.yandex.ru) и Рамблер (www.rambler.ru).

Метапоисковые системы. Так как Интернет развивается стремительными темпами, то рост количества документов происходит быстрее, чем поисковые системы успевают их проиндексировать. Отсюда следует, что даже если в Сети и есть то, что вы ищете, вовсе не обязательно, что об этом знает та поисковая машина, к которой вы обратились. Велика вероятность, что нужный документ проиндексирован другой поисковой системой. Поэтому существуют службы, позволяющие транслировать запрос сразу в несколько поисковых систем, – это метапоисковые системы. Однако пользоваться ими во всех случаях не следует. Если документов по теме много, то метапоиск, возможно, даже вреден, поскольку смешивает разные логики ранжирования. Но если документов по теме мало, то метапоиск может быть полезен именно потому, что объединяет большое число поисковых систем.

Очень удобной в этом отношении является отечественная программа ДИСКо Искатель (www.disco.ru). Онлайновые энциклопедии и справочники. Очень часто нужно найти не документ, содержащий то или иное ключевое слово, а именно – толкование искомого слова. Одной из крупнейших онлайновых энциклопедий является ресурс Яндекс.Энциклопедии (http:// encycl.yandex.ru/). Этот проект содержит 219 968 статей из 14 энциклопедий, в том числе из БСЭ и Энциклопедии Брокгауза и Ефрона. К крупным относится и Энциклопедия Кирилла и Мефодия, которую можно найти по адресу www.km.ru. Особенно актуальным является поиск толкований терминов по информационным технологиям, которые развиваются так быстро, что уследить за появлением новых терминов очень сложно.

Единственный ресурс на русском языке, который можно назвать компьютерным энциклопедическим словарем, – это проект Компьютерная энциклопедия Кирилла и Мефодия (http://www.megakm.ru/pc/), предусматривающая поиск не только до термину, но и по тематической структуре. Объем словаря терминов – 700 статей. Объем англоязычного словаря FOLDOC (Free On-line Dictionary Of Computing; http:// wombat.doc.ic.ac.uk/) – более 13 тыс. терминов.

ЛИТЕРАТУРА

1. Политика в сфере образования и новые информационные технологии. Национальный доклад России. 2-й Международный конгресс ЮНЕСКО «Образование и информатика», Москва, 1966: – М.: ИИТО ЮНЕСКО, 1997.

2. Кузнецов, А.А. Современный курс информатики: от элементов к системе/ А.А. Кузнецов // Информатика и образование. – 2004. – № 1. – С. 2–9.

3. Ершов, А.П. Информатика: предмет и понятие/ А.П. Ершов// Кибернетика. Становление информатики. – М.: Наука, 1986. – С. 28–31.

4. Информатика. Базовый курс: учебник для вузов/ под ред. С.В. Симоновича. – Изд.2-е. – СПб.: Питер, 2005. – 640 с.

5. Брукшир, Дж.Г. Введение в компьютерные науки/ Дж.Г. Брукшир. – М.: Вильямс, 2001. – 688 с.

6. Острейковский, В.А. Информатика / В.А. Острейковский. – М.: Высшая школа, 2001. – 511 с.

7. Могилёв, А.В., Информатика/ А.В. Могилев, Н.И. Пак, Е.К. Хеннер. – М.: Академия, 2000. – 816 с.

8. Сырецкий, Г.А. Информатика. Фундаментальный курс. Том 1. Основы информационной и вычислительной техники / Г.А. Сырецкий. – Спб.: БХВ-Петербург, 2005. – 832 с.

9. Глушков, В.М. Основы безбумажной информатики / В.М. Глушков. – М.: Наука, 1982. – 552 с.

10. Зализняк, А.А. Грамматический словарь русского языка / А.А. Зализняк. – М.: Русский язык, 1977.

11. Кузнецов, А.А. Базовый курс информатики / А.А. Кузнецов // Информатика и образование. – 1997. № 1.– С. 12–17.

12. Лекции лауреатов премии Тьюринга за первые двадцать лет 1966–1985. – М.: Мир, 1993. – 560 с.

13. Моисеев, Н.Н. Информатика: новые пути познания законов природы и общества/ Н.Н. Моисеев // Вестник АН СССР. – 1985. – № 5. – С. 128–135.

14. Системы автоматизации проектирования. – М.: Мир, 1985.

15. Шеннон, К. Работы по теории информации и кибернетике / К. Шеннон. М.: Изд-во иностр. лит., 1963. – 829 с.

16. Штейнбух, К. Автомат и человек / К. Штенбух. – М.: Сов. радио, 1967. – 494 с.

17. Урсул, А.Д. Природа информации / А.Д. Урсул. – М.: Политиздат, 1968. – 288 с.

18. Винер, Н. Кибернетика или управление и связь в животном и машине / Н. Винер. – М.: Наука, 1983. – 338 с.

19. Винер, Н. Кибернетика и общество / Н. Винер. – М.: Изд-во иностр. лит., 1958. – 200 с.

20. http://umk-model.narod.ru/index.html Учебно-методический комплекс: «Моделирование и формализация».

21. Гребенюк, Е.И Технические средства информатизации / Е.И. Гребенюк, Н.А. Гребенюк. - М.: Академия, 2007.

22. Гук, М. Аппаратные средства IBM PC: энциклопедия / М. Гук. - СПб.: Питер, 2006.

23. Соболь, Б.В. Информатика: учебник / Б.В. Соболь [и др.]. – Изд. 3-е, доп. и перераб. – Ростов-н/Д: Феникс, 2007. – 446 [1] с.– (Высшее образование).

24. Магда, Ю.С. Компьютер в домашней лаборатории / Ю.С. Магда. - М.: ДМК, 2008.

25. Ваулина, Е. Ю. Термины современной информатики: Программирование, вычислительная техника, интернет: Англо-русский, русско-английский словарь / Е.Ю. Ваулина. - М.: Эксмо, 2005.

26. Фридланд, А.Я. Информатика и компьютерные технологии. Основные термины: толковый словарь / А.Я. Фридланд, Л.С. Ханамирова, И.А. Фридланд. - М.: Астрель-АСТ, 2003.

27. Воройский, Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах / Ф.С. Воройский. - М.: ФИЗМАТЛИТ, 2006.

28. Трутнева, Л.И. Информатика: учебное пособие с грифом СибРУМЦ УМО / Л.И. Трутнева, Г.И. Севодина. – Бийск: Изд-во Алт. гос. техн. ун-та, 2008.

29. Вовк, Б.Т., Самоучитель работы на компьютере / Б.Т. Вовк, С.Г. Баричев, О.А. Плотников. – Изд. 5-е, доп. - М.: КУДИЦ-ОБРАЗ, 2003.

30. Криси, Д. Собери компьютер сам / Д. Криси, К. Виченсио; пер. с англ. С.В. Корсакова. - М.: НТ Пресс, 2007.

31. Татарников, О. На краю пропасти / О. Татарников // Компьютер пресс. - 2007. - № 8. – С. 64-68.

32. Гергель, В.П. Теория и практика параллельных вычислений. – М.: Интернет-Университет, БИНОМ. Лаборатория знаний, 2007. – Лекция 1.

33. Севодина, Г.И. Основы защиты информации и компьютерной безопасности: методические рекомендации по информатике для студентов инженерных и экономических специальностей всех форм обучения / Г.И. Севодина. – Бийск: Изд-во Алт. гос. техн. ун-та, 2006.

34. Новиков, Ю.В. Локальные сети: архитектура, алгоритмы, проектирование / Ю.В. Новиков, С.В. Кондратенко. – М.: ЭКОМ, 2001.

35. Спортак, Марк. Компьютерные сети и сетевые технологии: пер. с англ. / Марк Спортак [и др.]. – Киев: ООО «ТИД» «ДС», 2002.

36. Столингс, В. Современные компьютерные сети: пер. с англ. / В. Столлингс. – 2-e изд. – СПб.: Питер, 2003.

37. Таненбаум, Э. Компьютерные сети: пер. с англ. / Э. Таненбаум. – 4-е изд. – СПб.: Питер, 2003.

38. Иртегов, Д.В. Введение в сетевые технологии: учебное пособие / Д.В. Иртегов. - СПб.: БХВ-Санкт-Петербург, 2004.

39. Гук, М. Аппаратные средства локальных сетей: Энциклопедия / М. Гук. - СПб.: Питер, 2000.

40. Домарев, В.В. Защита информации и безопасность компьютерных систем: учебник / В.В. Домарев. - Киев: ДиаСофт, 1999.

41. Прокофьев, И.В. Защита информации в информационных системах: учебное пособие / И.В. Прокофьев. - М.: Европейский центр по качеству, 2002.

42. Олифер, В.Г. Компьютерные сети. Принципы, технологии, протоколы: учебник для вузов / В.Г. Олифер, Н.А. Олифер. - СПб.: Питер, 2006.


Учебное издание

Галенко Юрий Анатольевич

Севодина Галина Ивановна

Смирнов Виталий Васильевич

Трутнева Лариса Ивановна

Царегородцева Валентина Всеволодовна

Павлова Наталья Валерьевна

Лисица Владимир Дмитриевич


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: