Кодирование информации

Код – условное обозначение объекта в виде одного или нескольких знаков. Набор методов и пра­вил условного обозначения — система кодирования.

Классификационная схема — систематизированный перечень наименований объектов, каждому из которых в соответствие дан уникальный код.

Кодирование — это процесс присвоения ус­ловных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где

· А — алфавит (множество символов, используемых при запи­си кода)

· L — длина (число позиций в коде);

· S — структура кода (порядок расположения в коде символов).

Индексирование – на специальном формализованном языке отражаются соответствующие выбранной тематике признаки.

Координатное индексированиесостоит в том, что суть документа и необходимой потребности может быть отражена с помощьюх ключевых слов, содержащихся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания.

В фактографических ИС регистрируются факты – конкретные значения данных об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы.

Документальные ИС обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги и т.д.), снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям (может выдать ненужное и может не выдать нужное).


17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.

Рассмотрим обобщенную схему воспроизводства информа­ции,.С точки зрения задач управления потоками можно раз­личить две совокупности процессов: формирование потока инфор­мации (документов) в соответствии с заданными характеристика­ми и распределение входных и выходных потоков и их составляющих в соответствии с информационными потребностями. По характеру преобразований информации в совокупной системе можно выделить три следующих уровня.

Первый уровень это основная деятельность, где объектами являются предметы реального мира, а результатами — новое зна­ние. Носителем информации этого уровня является человеческое сознание, для которого характерны системность организации и ассоциативность выборки, а коммуникационным объектом явля­ется сообщение — знание, адресно отраженное на систему поня­тий предполагаемого приемника-потребителя информации.

Второй уровень— создание общественно-полезной информа­ции — одна из форм овеществления знаний через обобществле­ние результатов, обычно, в документальной форме. Средством представления знаний здесь является язык, а носителем — доку­мент как функционально ориентированное сообщение, структу­рирующее информацию и идентифицирующее ее.

Третий уровень собственно информационная деятель­ность — управление потоками информации для обеспечения ос­новной деятельности. Здесь информация (поисковый образ доку­мента) — это хорошо структурированный материал, компактно и системно отражающий содержание документа, а также обеспе­чивающий идентифицируемость документа как в целом, так и на уровне отдельных элементов данных.


18 Типологии информационных потребностей. Реальная информационная потребность.

Это потребность в информации, еще не вполне осознанная, но отражающая проблемную ситуацию пользователя, характерная для начальной стадии основной деятельности.(т.е когда у человека есть только какая то цель типа «как завоевать мир»,но он еще не знает какая конкретно ему нужна для этого информация).

Осознанная ИПП. В процессе понимания проблемной ситуации реальная ИПП преобразовывается в осознанную ИПП, представленную в виде вопроса или задачи, которую пользователь выражает на привычном ему языке, формируя запрос на естественном языке и затемпереводя его в поисковый запрос, представленный в терминах ИПЯ(в нашем примере он уже осознает что ему надо для завоевания мира и составляет запрос сначала на обычном языке «где нанять армию» потом преобразует запрос в терминах ИПЯ). Для запроса характерно то, что вопросы типа «как» и «почему» должны быть преобразованы в вопрос типа «ли», поскольку именно такая форма представления потребности является наиболее адекватной теоретико-множественой модели поиска.


19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.

Есть некоторая среда взаимодействия человека и машины. Например работа человека с АИПС Ирбис.) Представление информации на разных уровнях этой среды порождает ряд неопределенностей. Тогда мы можем определить процесс поиска как последовательность шагов. А цель этих шагов это последовательно снимать неопределенности.

Семантическая неопределенность. Составляя запрос, пользователь специально или случайно, создает информацию которую и ищет. Как говорят в хорошо составленном вопросе имеется 75 процентов ответа. То есть пользователь уже заранее как бы определяет понятия и связи между ними. То есть пользователь обозначает связь известного знания с неизвестным.

Лингвистическая неопределенность. Формируя запрос пользователь должен понимать что его представление об информативности термина вовсе не факт что совпадет с представлением об этом термине системы.

Метаинформационная неопределенность. Связанна с тем что пользователь сам должен иметь адекватное представление о системе и о представление информации в этой системе. Например как и по каким полям проводить поиск.

Уровневая модель представления информации и информационных потребностей представляет соотношение информационных объектов, форм и средств их представления. У информации есть разные формы ее отображения. Преобразование этих форм на нашей схеме есть некоторая фильтрация информации, путем уменьшения разнообразия этих форм и отбрасывания части смысла. Например, сообщение предполагает фиксацию (ограничение) предметной области; документ – фиксацию вариантов способа представления через выделение семантически однородных полей и, соответственно, определение характера и способа их наполнения; поисковый образ фиксирует способы указания значения отдельного элемента (типа данных).



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: