Занятие 67: Поиск информации с использование ключевых фраз
Цели занятия:
· Образовательные: формирование навыков поиска информации в сети Интернет с использование ключевых фраз;
· Развивающие: развитие у обучающихся умения ориентироваться в логических уровнях организации информации, развитие познавательного интереса, логического мышления и внимания обучающихся.
· Воспитательные: формирование у обучающихся творческого подхода к решению задач, четкости и организованности, воспитание чувства коллективизма, умения работать в группе.
Существуют три основных способа поиска информации в Интернет:
- Указание адреса страницы.
- Передвижение по гиперссылкам.
- Обращение к поисковой системе (поисковому серверу).
О последнем пункте и поговорим дальше. Речь пойдет об известных поисковиках, о принципах их работы и о расширенных возможностях поисковых систем. Вы узнаете некоторые интересные способы поиска и получите массу полезных советов, которые непременно облегчат вам поиск нужной информации в интернете.
|
|
Как работают системы веб-поиска
По данным сервиса статистики LiveInternet.ru распределение поисковых систем в России примерно следующее:
- Яндекс — 53.9%
- Гугл — 35.0%
- Поиск Mail.ru — 8.3%
- Рамблер — 0.9%
- Яндекс (картинки) — 0.6%
- Гугл (картинки) — 0.2%
Теперь, чтобы лучше понять, как работают поисковые системы, сделаем краткий обзор механизма работы. Поисковая система работает в следующем порядке:
- Сбор данных поисковым роботом пауком (Web crawling)
- Индексация найденных данных (Indexing)
- Поиск по индексированным данным (Searching)
Сбор данных поисковым роботом пауком
Обычно делится на 2 этапа – скачивание веб-страницы и анализ ссылок. Первый этап выполняет Spider (быстрый поисковый паук) – программа для последовательного перебора и скачивания веб-страниц для анализа. Она получает веб-страницы с сайтов по определенному алгоритму и отдает их другой программе Crawler-у. После этого в дело вступает Crawler (медленный паук анализатор), который находит все ссылки и составляет дальнейший маршрут для spider-а. У spider-а есть определенный список сайтов для посещения, заранее подготовленный другими подсистемами поиска. Из этого списка spider получает все необходимые данные.
Индексация найденных данных
После того, как проходит первый этап, в дело вступает вторая подсистема – подсистема индексации. Она размещает найденную пауками информацию так, чтобы было удобно в дальнейшем к ней обращаться. Для этого программа Индексатор разбирает страницу на различные ее части и анализирует их. Из страницы выделяются заголовки страниц, ссылки, текст, структурные элементы и т.д. Все полученные данные структурируются по определенному алгоритму и затем полученные данные заносятся в базу данных.
|
|
Поиск по индексированным данным
Эта подсистема выдачи результатов, которая использует сформированную индексатором базу данных. Она определяет, какие страницы удовлетворяют запросу пользователя и показывает результаты поиска. Когда вы вводите ключевое слово и делаете поиск, поисковая система отбирает результаты на основании следующих критериев:
- Title (заголовок): Есть ли ключевое слово в заголовке?
- Domain/URL (Домен/адрес): Есть ли ключевое слово в имени домена или в адресе страницы?
- Style (стиль): Анализ стиля текста на страницы. Используется ли Жирный текст или Курсив, используются ли заголовки H1, H2 и т.д.
- Density (плотность): Как часто употреблено ключевое слово на странице? Какова величина плотности ключевого слова?
- MetaInformation (мета данные) – поиск совпадений в метаданных.
- Outbound Links (ссылки наружу): Есть ли ссылки на странице и на кого они ведут, а также встречается ли ключевое слово в тексте ссылки?
- Inbound Links (внешние ссылки): Кто ссылается на искомую страницу? Каков текст ссылки?
- Insite Links (ссылки внутри страницы): На какие страницы данного сайта содержит ссылки эта страница?
В результате этого сравнения подсистема поиска выбирает нужные веб-страницы и показывает их пользователю, который осуществляет поиск.
Что можно найти через поисковики
Технически найти можно любую информацию, которая проиндексирована поисковиком, находиться в общем доступе в сети интернет и не запрещена политикой поисковой системы. При поиске в интернете имейте ввиду следующее:
- Большая часть информации в интернете не контролируется и любой человек с компьютером и доступом в интернет может публиковать информацию. Поэтому нужно понимать, что данные могут быть недостоверными.
- Не всегда легко узнать кто автор найденной информации.
- Вы не всегда знаете откуда приходит информация.
- Информация может быть предвзятой, специально вводящей в заблуждение или просто неверной.
- Дата публикации данных может быть не указано и будет трудно понять, является ли информация актуальной.
Чаще всего люди ищут через поиск (расположено примерно по убыванию):
- Всевозможные социальные сети – Вконтакте, Instagram, Одноклассники, mail.ru и т.д
- Порно
- Фильмы
- Картинки
- Музыку
- Интернет
- Авто
- Youtube
- Игры онлайн
- Компьютеры
- Деньги, финансы
- Отдых
- Недвижимость
- Спорт
- Реклама
- Строительство
- Здоровье
- Информацию о знаменитостях
- Приготовление еды, кулинария
- Логистика
- Заработок в интернете
Примерно 2-3% от всех введенных запросов обычно сформулированы как вопрос. Больше всего вопросительных запросов начинаются с:
- какой
- сколько
- кто
В последнее время все больше запросов (около 10%) стали содержать прямое указание – купить, продать или получить что-то. Самые распространённые уточнения сегодня в рунете – это скачать и бесплатно. Примерно 4% от всех запросов. Самыми часто встречающимися ошибками при поиске – ошибки, возникающие из-за неверной раскладки клавиатуры, недописанные запросы и синтаксические ошибки.]
Методы поиска информации в интернете
полезных способов поиска в Google
Итак, давайте рассмотрим несколько хитрых способов поиска информации через поисковую систему. Для примера, используем Google
Ситуация 1 – Поиск по изображению: Есть изображение или логотип какой-то программы или компании и вы хотите найти подробную информацию о нем.
Ситуация 2 – Поиск внутри файлов с определенным расширением. Для того, чтобы искать текст в файлах, нужно ввести в поисковую строку следующую команду: filetype:xls искомый текст. Xls в данном случае – это расширение файлов Excel. Т.е. поисковая машина будет искать текст внутри файлов с указанным расширением. Например: filetype:xls отчет. В итоге получаем все Excel файлы, в которых встречается слово отчет:
|
|
Для поиска доступны следующие типы файлов:
· pdf – поиск указанного текста внутри pdf файлов
- dwf – файлы программы AutoCAD
- ps – файлы Adobe Post Script, специальные сценарии для вывода высококачественной векторной графики на принтеры и плоттеры
- kml и kmz – файлы программы Гугл Планета Земля(Google earth)
- xls – файлы программы Microsoft Office Excel
- ppt – файлы программы Microsoft Office Power Point
- doc – файлы программы Microsoft Office Word
- rtf – файлы Rich Text Format, поддерживаемые большинством текстовых редакторов
- swf – файлы проигрывателя флеш-плеера Shockwave Flash
- txt – поиск внутри обычных текстовых файлов
Ситуация 3 – Ищем точное вхождение поисковой фразы. Иногда нужно найти точное вхождение фразы в каком то тексте. В принципе здесь два пути. Первый подход – вводите в поисковую строку точную и достаточно длинную поисковую фразу и поисковик найдет текст, который наиболее точно содержит то, что мы ищем. Чем больше и точнее будет поисковый запрос, тем более точное совпадение найдет поисковая машина (если конечно такая информация присутствует в сети интернет).
Второй подход – обрамлять кавычками поисковую фразу. В этом случае фраза может состоять из небольшого количества слов. Например, вводим – “Большие города”, получаем:
Поиск по точному вхождению фразы
Но если мы попытаемся ввести между этими двумя словами в кавычках что-то бессмысленное, то поиск не даст результатов. И даже если вставить одну бессмысленную букву, поиск не даст результатов, хотя поисковая система и попытается предложить нам подходящие варианты.
Ситуация 4 – Поиск информации только по одному определенному сайту или домену. Если вам нужно найти информацию по определенному сайту, то… можно воспользоваться поиском, который есть на сайте ну или попробовать найти что-то при помощи поисковый системы Google. Глядишь, и найдется что-то, что не хотел (или не смог) искать встроенный в сайт поиск. Для этого вводим в поисковую строку следующее выражение: Разное site:livejournal.ru Разное – это текст, который вы ищете, все что после site: это доменное имя сайта, на котором нужно искать.
|
|
Ситуация 5 – Поиск информации по электронной почте. Иногда необходимо найти информацию по человеку или организации, но на руках есть только адрес электронного почтового ящика (email). Если ввести в поисковую строку адрес почтового ящика, то можно найти все сайты и ресурсы, где человек оставлял свой email. Можно также найти домены, которые зарегистрированы на этот ящик.
7 полезных советов при поиске информации
- Составлять поисковый запрос нужно так, чтобы максимально сузить количество вариантов в выдаче
- Используйте фильтрацию по времени – это позволит найти более-менее актуальную информацию. Благо сейчас все крупные поисковые системы предоставляют расширенный поиск, в котором можно установить диапазон дат.
- Корректный вопрос, задаваемый поисковику, должен состоять как минимум из двух ключевых слов тогда поисковику будет гораздо проще отыскать нужную информацию
- Для поиска информации используйте разные поисковые машины. Несмотря на то, что все поисковики построены на общих принципах, алгоритмы у них могут различаться. Поэтому может случиться так, что то, что не смог найти Yandex, выдаст Google
- Если вы ищете какие-либо товары или услуги в вашем городе, уточняйте регион поиска(например Москва). Это уменьшит количество результатов, но найденные результаты будут более релеванты вашим поисковым запросам
- Используйте больше существительных для поиска.
- Используйте синонимы, если по запросу не было найдено то, что нужно
Главный фактор успешного и быстрого поиска – это формулировка запроса для поисковой системы. Если вы умеете сообразить, какие нужны ключевые слова для устраивающего вас результата – вы король поиска!
«Горячий» расширенный поиск от Google. 16 способов