Информационно-поисковые системы (ИПС)

Описание занятия

1. Прочитать и законспектировать теоретическую часть.

2. Выполнить контрольные задания.

3. Ответить на контрольные вопросы.

4. Полученные результаты отправить на электронный адрес radaev1964@gmail.com (или в личку VK)

Теоретические сведения:

       Введение основы работы в Интернет

Поиск информации.

Информационно-поисковые системы (ИПС).

Поисковые технологии информационных систем.

Примеры поисковых систем и сервисов.

5. Поиско́вые систе́мы в Интернете

Введение в основы работы в Интернет

Поиск информации или информационный поиск представляет один из основных информационных процессов.

Служба World Wide Web (WWW) – это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов.

Отдельные документы, составляющие пространство Web, называют Web-страницами.

Группы тематически объединенных Web-страниц называют Web-узлами (сайтами).

Программы для просмотра Web-страниц называют браузерами (обозревателями).

К средствам поисковых систем относится язык запросов.

Используя различные приёмы можно добиться желаемого результата поиска.

Самые популярные браузеры:

 Google Chrome

Одна из самых быстрых, понятных и популярных программ такого рода. Обновления выходят практически каждую неделю и включают в себя самые лучшие и передовые инновации. Именно на основе Chrome сейчас делаются многие другие веб-обозреватели, например такие как, Opera, Yandex.Browser, Orbitum и т.д. Славится огромным количеством приложений, расширений, тем и игр в своем маркете.

Mozilla Firefox

Не менее популярный браузер, чем Google Chrome, так же быстр и красив. Имеет свой уникальный интерфейс и возможность расширения функционала за счет установки множества различных расширений. Именно Файрфокс в свое время сломал ход истории и преломил монополию Internet Explorer на рынке. Программа работает на всевозможных операционных системах и постоянно обновляется.

Opera

Один из самых общеизвестных и востребованных браузеров в России и странах СНГ. Опера появилась более 20 лет назад, и, в процессе своего развития, сменила полностью движок на котором она до этого разрабатывалась. Opera обладает понятным и красивыми интерфейсом, очень быстрой скоростью работы, возможностью установления различных расширений и виджетов. Программа постоянно обновляется и имеет множество своих уникальных особенностей. Имеет в своем арсенале функцию «Turbo», которая значительно уменьшает время загрузки страниц.

Safari

Браузер, который специально разрабатывался для операционной системы Mac OS, корпорацией гигантом Apple. В свое время была выпущена его версия и для ОС Windows, но, с 2012 года новые версии для этой ОС больше не выходили. Сафари обладает самыми инновационными технологиями, уникальным интерфейсом и очень быстрой скоростью работы. Так же, отличительной его особенностью является «глянцевый интерфейс».

5) Internet Explorer

Данный браузер был разработан компанией Microsoft. Последней версией является Internet Explorer 11. В Windows 10 Microsoft, в связи с нелюбовью пользователей, решила прекратить его дальнейшую разработку и выпустила уже полностью новый проект под названием Microsoft Edge.

Поиск информации

Поиск информации или информационный поиск представляет один из основных информационных процессов.

Знаменитая фраза «Кто владеет информацией, тот владеет миром» принадлежит Ротшильдам. Они ещё в 19 веке прекрасно ориентировались в информационных потоках. Ротшильды подготовили все, чтобы информация попадала в первую очередь к ним и на этом приобрели не только информацию и деньги, но и «неограниченную» власть. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска. «Если Вы думаете, что всё понимаете, значит Вам не обо всём говорят» - Герберт Франке книга "Манипулируемый человек".

Конец XX - начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоев социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.

Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается нахождении требуемых сведений, знаний для работы, повышения своих компетенций для собственного профессионального, культурного роста; принятия управленческих решений, агрегации (взаимодействие со сращиванием, делегированием) с разнообразными структурами как на предприятии так и со смежными отраслями, как в производственном, так и в управленческом плане.

По оценке специалистов в Интернете работает 7,75 миллиарда пользователей. Аудитория интернета растет со скоростью 1 000 000 новых пользователей в день, так говорится в новом пакете отчетов о состоянии глобальной отрасли digital на 2020 год (агентство We Are Social и сервис Hootsuite) *.

* - Подробную информацию и статистику можете посмотреть в ПРИЛОЖЕНИИ в конце документа.

Для начала вот самые важные данные, которые можно найти в отчетах We Are Social и Hootsuite о глобальном состоянии цифровых технологий на 2020 год (https://datareportal.com/reports/digital-2020-global-digital-overview):

  • Сегодня в мире 7,75 миллиарда уникальных мобильных пользователей, что на 100 миллионов (2%) больше, чем в прошлом году.
  • В 2019 году аудитория интернета насчитывает 5,19 миллиарда человек, что на 366 миллионов (9%) больше, чем в январе 2019 года.
  • В социальных сетях зарегистрировано 3,8 миллиарда пользователей. По сравнению с данными на начало прошлого года этот показатель вырос на 288 миллионов (9%).
  • Сегодня 3,26 миллиарда человек заходят в социальные сети с мобильных устройств. Это на 10% больше, чем в прошлом году, когда с мобильных в соцсетях сидело на 297 миллионов человек меньше.

 

 Из них десятки тысяч - в режиме онлайн (англ. "on-line" - интерактивный доступ в любой момент времени) и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.

Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию, что на сегодняшний день уже частично реализовано в поиковых системах. Для создания таких ИПС требуются интеллект и знания конкретных пользователей ИПС или их посредников. Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью.

Существуют различные толкования термина "поиск информации" или "информационный поиск".

Термин " информационный поиск " (англ. "information retrieval") ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.).  В  профессиональной отечественной печати данный термин используется с 1970-х годов.

Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.

С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.

" Релевантность " - устанавливаемое при информационном поиске соответствие содержания документа информационному запросу или поискового образа документа поисковому предписанию.

Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации.

Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.

В 1945 годы американский ученый и инженер В. Буш в статье "Возможный механизм нашего мышления" впервые широко поставил вопрос о необходимости механизации информационного поиска. Начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска.

" Поисковые системы " осуществляют поиск среди документов базы данных (БД) или иных массивов машиночитаемых данных, содержащих заданные слова.

Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.

Информационно-поисковые системы (ИПС)

ПС с большим набором функций и возможностей обычно входят в состав Системы Управления Базами Данных (СУБД) и именуются информационно-поисковыми системами. Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Интернете.

"Информационно-поисковая система " (англ. " information retrieval system", IRS) - представляет систему, предназначенную для поиска и хранения информации; пакет программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных.

Информационно-поисковая система трактуется и как система, обеспечивающая поиск и отбор необходимых данных на основе информационно-поискового языка и соответствующих правил поиска, а база данных - как совокупность средств и методов описания, хранения и манипулирования данными, облегчающих сбор, накопление и обработку больших информационных массивов. Организация различных БД отличается видом объектов данных и отношений между ними.

Функционирование современных ИПС основано на двух предположениях:

1) документы, необходимые пользователю, объединены наличием некоторого признака или комбинации признаков;

2) пользователь способен указать этот признак.

Оба эти предположения на практике не выполняются, и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.

Автоматизированные ИПС (АИПС), используют компьютерные программно- технические средства и технологии и предназначаются для нахождения и выдачи пользователям информации по заданным критериям. Определяющими для понимания методов автоматизации поиска являются два следующих фактора:

1) сравниваются не сами объекты, а описания - так называемые "поисковые образы";

2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций.

Стратегия поиска - общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными "стратегическими" решениями - архитектурой БД, методами и средствами поиска в конкретной АИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значительной степени он определяется искусством достижения компромисса между практическими потребностями и возможностями имеющихся средств.

Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса (ПОЗ), отбора документов (сопоставление поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.

Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на поисковый запрос.

Средства поиска, с одной стороны, - взаимозависимый комплекс информационно- поисковых языков (ИПЯ) и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов конкретной АИПС.

Поисковые технологии - унифицированные (оптимизированные в рамках конкретной АИПС) последовательности эффективного использования отдельных средств поиска в процессе взаимодействия пользователя с системой для устойчивого получения конечного и промежуточных результатов.

Навигация как реализация процесса поиска по запросу в выбранной БД - целенаправленная, определяемая стратегией, последовательность использования методов, средств и технологий конкретной АИПС для получения и оценки результата.

Средства навигации позволяют пользователю осуществлять управление процессом поиска. Они предоставляются пользователю в виде интерфейса, позволяющего организовать более или менее эффективный процесс взаимодействия с БД. При этом "дружественность" интерфейса характеризуется не только эргономичностью и понятностью, но и вариантностью выбора операционных объектов.

Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. Так как пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, то оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь лишь на внешних оценках или на промежуточных результатах и обобщениях, сопоставляя их, например, с предыдущими.

Процесс поиска можно представить в виде следующих основных компонент:

1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;

2) проведение поиска в одной или нескольких поисковых системах;

3) обзор полученных результатов (ссылок);

4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;

5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: