Код – условное обозначение объекта в виде одного или нескольких знаков. Набор методов и правил условного обозначения — система кодирования.
Классификационная схема — систематизированный перечень наименований объектов, каждому из которых в соответствие дан уникальный код.
Кодирование — это процесс присвоения условных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где
· А — алфавит (множество символов, используемых при записи кода)
· L — длина (число позиций в коде);
· S — структура кода (порядок расположения в коде символов).
Индексирование – на специальном формализованном языке отражаются соответствующие выбранной тематике признаки.
Координатное индексированиесостоит в том, что суть документа и необходимой потребности может быть отражена с помощьюх ключевых слов, содержащихся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания.
|
|
В фактографических ИС регистрируются факты – конкретные значения данных об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы.
Документальные ИС обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги и т.д.), снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям (может выдать ненужное и может не выдать нужное).
17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
Рассмотрим обобщенную схему воспроизводства информации,.С точки зрения задач управления потоками можно различить две совокупности процессов: формирование потока информации (документов) в соответствии с заданными характеристиками и распределение входных и выходных потоков и их составляющих в соответствии с информационными потребностями. По характеру преобразований информации в совокупной системе можно выделить три следующих уровня.
Первый уровень — это основная деятельность, где объектами являются предметы реального мира, а результатами — новое знание. Носителем информации этого уровня является человеческое сознание, для которого характерны системность организации и ассоциативность выборки, а коммуникационным объектом является сообщение — знание, адресно отраженное на систему понятий предполагаемого приемника-потребителя информации.
|
|
Второй уровень— создание общественно-полезной информации — одна из форм овеществления знаний через обобществление результатов, обычно, в документальной форме. Средством представления знаний здесь является язык, а носителем — документ как функционально ориентированное сообщение, структурирующее информацию и идентифицирующее ее.
Третий уровень — собственно информационная деятельность — управление потоками информации для обеспечения основной деятельности. Здесь информация (поисковый образ документа) — это хорошо структурированный материал, компактно и системно отражающий содержание документа, а также обеспечивающий идентифицируемость документа как в целом, так и на уровне отдельных элементов данных.
18 Типологии информационных потребностей. Реальная информационная потребность.
Это потребность в информации, еще не вполне осознанная, но отражающая проблемную ситуацию пользователя, характерная для начальной стадии основной деятельности.(т.е когда у человека есть только какая то цель типа «как завоевать мир»,но он еще не знает какая конкретно ему нужна для этого информация).
Осознанная ИПП. В процессе понимания проблемной ситуации реальная ИПП преобразовывается в осознанную ИПП, представленную в виде вопроса или задачи, которую пользователь выражает на привычном ему языке, формируя запрос на естественном языке и затемпереводя его в поисковый запрос, представленный в терминах ИПЯ(в нашем примере он уже осознает что ему надо для завоевания мира и составляет запрос сначала на обычном языке «где нанять армию» потом преобразует запрос в терминах ИПЯ). Для запроса характерно то, что вопросы типа «как» и «почему» должны быть преобразованы в вопрос типа «ли», поскольку именно такая форма представления потребности является наиболее адекватной теоретико-множественой модели поиска.
19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
Есть некоторая среда взаимодействия человека и машины. Например работа человека с АИПС Ирбис.) Представление информации на разных уровнях этой среды порождает ряд неопределенностей. Тогда мы можем определить процесс поиска как последовательность шагов. А цель этих шагов это последовательно снимать неопределенности.
Семантическая неопределенность. Составляя запрос, пользователь специально или случайно, создает информацию которую и ищет. Как говорят в хорошо составленном вопросе имеется 75 процентов ответа. То есть пользователь уже заранее как бы определяет понятия и связи между ними. То есть пользователь обозначает связь известного знания с неизвестным.
Лингвистическая неопределенность. Формируя запрос пользователь должен понимать что его представление об информативности термина вовсе не факт что совпадет с представлением об этом термине системы.
Метаинформационная неопределенность. Связанна с тем что пользователь сам должен иметь адекватное представление о системе и о представление информации в этой системе. Например как и по каким полям проводить поиск.
Уровневая модель представления информации и информационных потребностей представляет соотношение информационных объектов, форм и средств их представления. У информации есть разные формы ее отображения. Преобразование этих форм на нашей схеме есть некоторая фильтрация информации, путем уменьшения разнообразия этих форм и отбрасывания части смысла. Например, сообщение предполагает фиксацию (ограничение) предметной области; документ – фиксацию вариантов способа представления через выделение семантически однородных полей и, соответственно, определение характера и способа их наполнения; поисковый образ фиксирует способы указания значения отдельного элемента (типа данных).
|
|