Обсуждаемые основные определения в области интеллектуализации имеют многопрофильный характер. В силу этой причины далее приводятся типовые определения, которыми пользуются IT-специалисты.
Данные – это информация, полученная в результате наблюдения или измерения отдельных свойств или атрибутов, характеризующих объекты, процессы и явления в предметной области. Наряду с этим, данные определяются как совокупность объективных сведений.
Информация – сведения, неизвестные ранее получателю информации, пополняющие его знания, подтверждающие или опровергающие положения и соответствующие убеждения.
Знания – это совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача. В развёрнутом виде определение формулируется следующим образом: знания – это связи и закономерности предметной области (принципы, модели, методы, законы, методологии, методики, технологии), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать научные, научно-методические, научно-технические, научно-практические и практические задачи. В альтернативном определении знания понимаются как структурированные определённым образом данные, т. е. данные о данных (метаданные). Наука о знании именуется как когнитология. Знания делятся на глубинные и поверхностные.
Поверхностные знания – знания о видимых взаимосвязях между отдельными событиями или фактами предметной области.
Глубинные знания – это абстракции, формализации, аналогии, схемы, которые отражают структуру и природу процессов, протекающих в предметной области.
Знания объясняют явления и могут использоваться для прогнозирования поведения объектов (например, понимание принципов работы интеллектуальных информационных систем).
Современные интеллектуальные системы в основном работают с поверхностными знаниями. Это связано с тем что пока не существует универсальных методик, которые позволяли бы выявлять глубинные структуры знаний и работать с ними.
Знания подразделяются на процедурные и декларативные.
Сначала появились процедурные знания – знания, выраженные в алгоритмах, которые предназначались для управления данными. Для их изменения требовалось изменять текст программы. Однако с развитием информатики и программирования все большая часть знаний сосредотачивалась на структурах данных (таблицы, списки). При этом увеличилась роль декларативного знания.
Знания в настоящее время всё чаще представляются в декларативной форме. В этом представлении знанием считаются предложения, записанные на языках представления знаний, приближенных к естественному языку и понятных не только специалистам, но и пользователям.
Степень использования языков отображается на рис. 1.
Наиболее часто применяются следующие модели представления знаний:
1) Продукционная модель;
2) Семантические сети;
3) Фреймы;
4) Формальные логические модели.
Выделяются две группы языков: модульные и сетевые. Связь языков представления знаний с типовыми видами моделей знаний раскрывается на рис. 2. Модульные языки оперируют отдельными несвязными элементами знаний. Элементами являются правила или аксиомы.
Сетевые языки предусматривают возможность связать элементы через отношения в семантические сети (или сети фреймов).
Рисунок 1 – Таблица Ньюэлла
Рисунок 2 – Классификация моделей
Одна из образных гипотез связи правого и левого полушарий головного мозга и моделей описания знаний приводится на рис.3.
Фрагмент, выделенный из окружающего мира, называется областью экспертизы или предметной областью (рис. 4).
Существует множество задач и проблем, которые необходимо решать, используя сущности и отношения из предметной области. В связи с этим используется более широкое понятие – проблемная область или проблемная среда. Проблемная среда трактуется как взаимосогласованная совокупность предметной области и решаемой задачи.
Рисунок 3 – Модель восприятия человека
В понятийной структуре проблемной области используется три источника знаний:
первый источник (первого рода) – человек, второй источник (второго рода) – книги, справочники, инструкции и т.д., третий источник (третьего рода) – базы данных и другие носители.
Процесс формирования понятийной структуры поясняется на рис. 5.
Рисунок 4 – Понятия предметной области
Рисунок 5 – Процесс формирования понятийной структуры
По мере развития научно-технических достижений появилось новое направление профессиональной деятельности, называемое инженерией знаний.
Инженерия знаний занимается проблемами представления, хранения, тиражирования, извлечения, обработки и генерации знаний. В настоящее время разрабатывается широкий класс систем, основанных на знании и применяемых в различных областях профессиональной и социальной деятельности.
В основе деятельности специалиста (инженера по знаниям) находятся процессы концептуализации – способы отображения понятийной структуры на платформы информатизации.
Основная задача инженера по знаниям связанна с построением модели проблемной области. Любая система, обладающая базой знаний о некоторой предметной области, может рассматриваться как интеллектуальная система.
Онтология – система, состоящая из набора понятий, на основе которых строятся отношения, функции, классы, объекты и теории предметной области. Онтология описывается следующим кортежем:
O = < A, B, C >,
где А – конечное множество понятий, терминов (концепций) предметной области, которые представляют данную онтологию.
В – конечное множество отношений между концепциями (понятиями) данной предметной области.
С – конечное множество функций интерпретации, заданной на A и B.
Онтологии рассматриваются как базы знаний специального типа, которые могут читаться, пониматься, физически разделяться или отчуждаться от разработчиков. По мере развития инженерии знаний выделяется отдельная ветвь профессиональной деятельности, именуемая онтологически инжинирингом.