Лекция 12. Системы искусственного интеллекта. Основные понятия

 

План

1. Направления использования систем искусственного ин­теллекта (ИИ): системы понимания естественного языка, распознавание образов, системы символьных вычислений, системы с нечеткой логикой, генетические алгоритмы, тео­рия игр и т.д.

2. Математические модели и аппаратно-программная реа­лизация систем ИИ. Модель нейрона, алгоритм ее работы. Искусственные нейронные сети. Примеры применения нейронных сетей для решения экономических задач.

3. Использование ИИ в экономике. Интеллектуальный ана­лиз данных. Управление знаниями

 

1. Направления использования систем искусственного ин­теллекта (ИИ): системы понимания естественного языка, распознавание образов, системы символьных вычислений, системы с нечеткой логикой, генетические алгоритмы, тео­рия игр и т.д.

«Интеллект – совокупность всех познавательных функций индивида: от ощущений и восприятия до мышления и воображения; в более узком смысле – мышление. И. – основная форма познания человеком действительности. Существуют три разновидности в понимании функции И.: 1) способности к обучению; 2) оперирование символами; 3) способность к активному овладению закономерностей окружающей нас действительности» (Рапацевич Е.С. Словарь-справочник по научно-техническому творчеству. – Мн.: ООО «Этоним», 1995. – 384 с. – С. 51-52.). (Сл 2)

«Интеллект искусственный – 1) условное обозначение кибернетических систем и их логико-математического обеспечения, предназначенных для решения нек-рых задач, обычно требующих использования интеллектуальных способностей человека; 2) совокупность функциональных возможностей электронно-вычислительной машины (ЭВМ) решать задачи, ранее требовавшие обязательного участия человека» (Там же, с. 54). (Сл 3)

Искусственный интеллект – одна из новейших наук, появившихся в середине 60-х г.г. ХХ в. на базе вычислительной техники, математической логики, программирования, психологии, лингвистики, нейрофизиологии и других отраслей знаний. Искусственный интеллект – это образец междисциплинарных исследований, где соединяются профессиональные интересы специалистов разного профиля. Само название новой науки возникло в конце 60-х гг,. а в1969 г. в Вашингтоне (США) состоялась первая Всемирная конференция по искусственному интеллекту.

Когда в конце 40-х – начале 50-х гг. появились ЭВМ, стало ясно, что инженеры и математики создали не просто быстро работающее устройство для вычислений, а нечто более значительное. Оказалось, что с помощью ЭИМ можно решать различные головоломки, логические задачи, играть в шахматы, создавать игровые программы. ЭВМ стали принимать участие в творческих процессах: сочинять музыкальные мелодии, стихотворения и даже сказки (см. Машинная музыка, Синтез текстов). Появились программы для перевода с одного языка на другой, для распознавания образов, доказательства теорем. Это свидетельствовало о том, что с помощью ЭВМ и соответствующих программ можно автоматизировать такие виды человеческой деятельности, которые называются интеллектуальными и считаются доступными лишь человеку. Несмотря на большое разнообразие невычислительных программ, созданных к началу 60-хгг., программирование в сфере интеллектуальной деятельности находилось в гораздо худшем положении, чем решение расчетных задач. Причина очевидна. Программирование для задач расчетного характера опиралось на соответствующую теорию – вычислительную математику. На основе этой теории было разработано много методов решения задач. Эти методы стали основой для соответствующих программ. Ничего подобного для невычислительных задач не было. Любая программа была здесь уникальной, как произведение искусства. Опыт создания таких программ никак не обобщался, умение их создавать не формализовалось.

Никто не станет отрицать, что в отличие от искусства, у науки должны быть методы решения задач. С помощью этих методов все однотипные задачи должны решаться единообразным способом. И «набив руку» на решении задач определенного типа, легко решать новые задачи, относящиеся к тому же типу. Но именно таких методов и не смогли придумать те, кто создавал первые программы невычислительного характера.

Когда программист создавал программу для игры в шахматы, то использовал собственные знания о процессе игры. Он вкладывал их в программу, а компьютер лишь технически выполнял эту программу. Можно сказать, что компьютер «не отличал» вычислительные программы от невычислительных. Он одинаковым образом находил корни квадратного уравнения или писал стихи. В памяти компьютера не было знаний о том, что он на самом деле делает.

Об интеллекте компьютера можно было бы говорить, если бы он сам, на основании знаний о том, как протекает игра в шахматы и как играют в эту игру люди, сумел составить шахматную программу или синтезировал программу для писания несложных вальсов и маршей.

Об интеллекте компьютера можно было бы говорить, если бы он сам, на основании собственных знаний о том, как протекает игра в шахматы и как играют в эту игру люди, сумел составить шахматную программу или синтезировал программу для писания несложных вальсов и маршей.

Не сами процедуры, с помощью которых выполняется та или иная интеллектуальная деятельность, а понимание того, как их создать, как научиться новому виду интеллектуальной деятельности, - вот где скрыто то, что можно назвать интеллектом (Сл 5). Специальные метапроцедуры обучения новым видим интеллектуальной деятельности отличают человека от компьютера. Следовательно, в создании искусственного интеллекта основной задачей становится реализация машинными средствами тех метапроцедур, которые используются в интеллектуальной деятельности человека. Что это за процедуры?.

Можно сформулировать основные цели и задачи искусственного интеллекта. Объектом изучения искусственного интеллекта являются метапроцедуры, используемые при решении человеком задач, традиционно называемых интеллектуальными, или творческими. Но если психология мышления изучает эти метапроцедуры применительно к человеку, то искусственный интеллект создает программные (а сейчас уже и программно-аппаратные) модели таких метапроцедур.

Цель исследований в области искусственного интеллекта – создание арсенала метапроцедур, достаточного для того, чтобы ЭВМ (или другие технические системы, например роботы) могли находить по постановкам задач их решения. Иными словами, стали автономными программистами, способными выполнять работу профессиональных программистов – прикладников (создающих программы для решения задач в определенной предметной области). Разумеется, сформулированная цель не исчерпывает всех задач, которые ставит перед собой искусственный интеллект. Это цель ближайшая. Последующие цели связаны с попыткой проникнуть в области мышления человека, которые лежат вне сферы рационального и выразимого словесно (вербально) мышления. Ибо в поиске решения многих задач, особенно сильно отличающихся от ранее решенных, большую роль играет та сфера мышления, которую называют подсознательной, бессознательной, или интуитивной.

Основными методами, используемыми в искусственном интеллекте, являются разного рода программные модели и средства, эксперимент на ЭВМ и теоретические модели. Однако современные ЭВМ уже мало удовлетворяют специалистов по искусственному интеллекту. Они не имеют ничего общего с тем, как устроен человеческий мозг, поэтому идет интенсивный поиск новых технических структур, способных лучше решать задачи, связанные с интеллектуальными процессами. Сюда относятся исследования по нейроподобным искусственным сетям, попытки построить молекулярные машины, работы в области голографических систем и многое другое.

Существуют несколько основных проблем, изучаемых в искусственном интеллекте.

1. Представление знаний – разработка методов и приемов для формализации и последующего ввода в память интеллектуальной системы знаний из различных проблемных областей, обобщение и классификация накопленных знаний при решении задач.

2. Моделирование рассуждений – изучение и формализация различных схем человеческих умозаключений, используемых в процессе решения разнообразных задач, создание эффективных программ для реализации этих схем в вычислительных машинах.

3. Диалоговые процедуры общения на естественном языке, обеспечивающие контакт между интеллектуальной системой и человеком-специалистом в процессе решения задач.

4. Планирование целесообразной деятельности – разработка методов построения программ сложной деятельности на основании тех знаний о проблемной области, которые хранятся в интеллектуальной системе.

5. Обучение интеллектуальных систем в процессе их деятельности, создание комплекса средств для накопления и обобщения умений и навыков, накапливаемых в таких системах.

Кроме этих проблем исследуются многие другие, составляющие тот задел, на который будут опираться специалисты на следующем витке развития теории искусственного интеллекта.

В практику человеческой деятельности интеллектуальные системы уже внедряются. Это и наиболее известные широкому кругу специалистов экспертные системы, передающие опыт более подготовленных специалистов менее подготовленным, и интеллектуальные информационные системы (например, системы машинного перевода), и интеллектуальные роботы, другие системы, имеющие полное право называться интеллектуальными. Без таких систем современный научно-технических прогресс уже невозможен.

В настоящее время ИИ – мощная ветвь информатики, имеющая как фундаментальные, чисто научные основы, так и весьма развитые технические, прикладные аспекты, связанные с созданием и эксплуатацией работоспособных образцов интеллектуальных систем. Именно от результатов этих работ зависит появление ЭВМ 5 поколения.

Любая задача, алгоритм решения которой не известен, может быть отнесена к сфере ИИ (игра в шахматы, медицинская диагностики, резюме текста, перевод на иностранный язык). Характерные черты задач ИИ – использование информации в символьной форме и наличие выбора из множества вариантов в условиях неопределенности.

ИНТЕГРАЛЬНЫЕ ОБУЧАЮЩИЕ СИСТЕМЫ (Сл 6)

Наиболее перспективным направлением развития систем компьютерного обучения является технология искусственного интеллекта (ИИ). Системы, использующие методику ИИ, называют интеллектуальными обучающими системами (ИОС). ИОС реализует адаптивное и двухстороннее взаимодействие, направленное на эффективную передачу знаний. Под адаптивностью понимается то, что система дает пояснения, подходящее каждому обучаемому, с помощью динамического управления, зависящего от процесса обучения. Двухстороннее взаимодействие – это взаимодействие со смешанной инициативой, при которой обучаемый может задать вопросы или просить систему решить задачу. ИОС отличаются друг от друга прежде всего методологиями представлений знаний о предметной области, об обучаемом и о процессе обучения.

Наиболее перспективным путем развития ИОС является, по-видимому, путь создания самообучающихся систем, приобретающих знания в диалоге с человеком. Общая архитектура системы совместного обучения человека и компьютера может определяться следующими компонентами:

-микромир;

-учащийся-человек;

-учащийся-компьютер;

-интерфейс между двумя учащимися и микромиром;

-интерфейс между двумя учащимися;

В основе разработки компьютерного «соученика» в центре внимания должно быть соотношение между управлением и коммуникацией. Прототипом такого рода системы можно считать MEMOLAB – обучающую среду с искусственным интеллектом по методологии экспериментальной психологии и человеческой памяти.

Другое направление развития систем искусственного интеллекта – распределенные системы, связывающие два и более компьютеров так, что ученики могут обучаться, сотрудничая или соревнуясь, каждый на своем компьютере. В этом случае возникает некое подобие «классного» обучения, но на совершенно ином более эффективном и интересном уровне, чем обучение в одиночку.

Недостатком многих существующих ИОС является ориентация на специальные знания в рамках определенного предмета, так что в них не предусмотрена возможность простой адаптации к другой предметной области. Более общий подход состоит в развитии интеллектуального окружения (оболочки), из которого затем можно получить много ИОС   путем наполнения различным содержанием, как баз знаний. Пример такой системы – EEPS, обучающая среда для решения задач, обеспечивающая обучение решению задач в качественных областях науки.

Система реализует модель преподавания, основанную на трех режимах:

- режим вопросов (обучаемый расспрашивает компьютер с целью получения ответов на задачи и их объяснений);

- режим исследования (решение задачи совместными усилиями обучаемого с компьютером, обучаемый поставляет требуемую информацию для решения задачи);

- режим решения (обучаемый решает задачу самостоятельно, получая минимальную помощь и советы компьютера).

Система диагностики представляет стратегию решения задач студентом в виде одного из следующих стилей:

- дефектный стиль (студент, зная материал, допускает одну или более концептуальных ошибок);

- стиль «вокруг да около» (студент пытается найти решение многими неверными путями, задает много не относящихся к делу вопросов);

- рефлексивный стиль (когда студент знает материал, но решает задачу постепенно, иногда проходя через множество промежуточных этапов);

- импульсивный стиль (когда студент спешит прийти к заключению без достаточных оснований);

- смешанный стиль - комбинация двух или более перечисленных выше стилей.

Основанные на знаниях модели обучаемых могут быть построены с использованием различных видов дифференциального анализа, когнитивной диагностики.

В современных интеллектуальных обучающих системах, в основном, используются знания о качественных (количественных) аспектах процесса обучения. Мотивационные аспекты обучения можно классифицировать в соответствии с такими явлениями, как соревновательность, заинтересованность, самоконтроль, уверенность и удовлетворение.

Обучающая система должна:

- определять мотивационное состояние обучаемого

- реагировать с целью мотивации рассеянных, менее уверенных или недовольных учеников или поддержки уже мотивированных учеников.

Примеры мотивационной тактики:

- если менее уверенный ученик правильно решает задачу, система может предложить ему подобную задачу для закрепления;

- внимание рассеянных или неактивных обучаемых может быть привлечено неожиданными эффектами или вводными комментариями;

- интерес может быть повышен головоломками, вопросами или знакомством с новыми темами.

1. Распознавание образов – технические системы, воспринимающие визуальную и звуковую информацию, (кодируют и размещают ее в памяти), проблемы понимания и логического рассуждения в процессе обработки визуальной и речевой информации.

Новейший российский истребитель оснастят системами искусственного интеллекта (Сл 10).

Гораздо более радикальные изменения будут внесены в бортовые электронные системы самолета. В результате введения многоканальной цифровой электродистанционной системы управления самолетом, включающей системы искусственного интеллекта, Су-37, по сравнению с Су-35, получит дополнительные беспрецедентные возможности:

Возможность нанесения упреждающих ударов по любому воздушному противнику (в том числе и малозаметному самолету); Многоканальность и алгоритмическую защищенность всех информационных и прицельных систем; Атаку наземных целей без входа в зону ПВО противника; Маловысотный полет с облетом и обходом наземных препятствий, в том числе и в автоматическом режиме; Автоматизированные групповые действия по воздушным и наземным целям; Противодействие радиоэлектронным и оптико-электронным средствам противника; Автоматизацию всех этапов полета и боевого применения

Компания Panasonic объявляет о начале поставок нового проектора pt AE500E с искусственным интеллектом (Сл 11)

Встроенный искусственный интеллект, автоматически управляющий яркостью лампы в зависимости от входного видеосигнала, обеспечивающий уровень контраста 1300:1.

1. Системы символьных вычислений

2. Системы с нечеткой логикой

3. Понимание естественного языка – анализ и генерация текстов, их внутреннего представления.

Предложения на естественном языке:

- неполнота

- неточность

- нечеткость

- грамматическая некорректность

- избыточность

- зависимость от контекста

- неоднозначность.

4. Экспертные системы – системы, использующие знания специалистов в конкретных видах деятельности.

(Косарева с. 288).

5. Интеллектуальные системы (машинный перевод).

6. Интеллектуальные роботы.

7. Игры – игры, характеризующиеся конечным числом ситуаций и четко определенными правилами, в них превзойден уровень человека средних способностей; но уровень лучших специалистов не достигнут.

8. Решение задач – постановка, анализ и представление конкретных жизненных ситуаций, для решения которых требуется изобретательность, способность обобщать.

9.

КИТ пытаются применить для реализации интеллектуальных процессов поиска решения, когда конечный результат непредсказуем, является плодом логических заключений и выводов, к которым приходит самостоятельно.

Под системами, обладающими ИИ, понимаются устройства или программы, имеющие такие характеристики, присущие человеческому интеллектуальному поведению как понимание и использование языка, причинная обусловленность поведения, способность к решению проблем, способность гибко реагировать на ситуацию, использовать преимущество благоприятных ситуаций, находить решение в неоднозначных или противоречивых ситуациях, распознавать относительную важность различных элементов ситуаций, находить сходство между ними несмотря на их различие.

Программные системы, основанные на естественно-научных теориях о природных процессах и математических методах, не относятся к ИИ.

Программные системы, реализующие алгоритмы, для которых не существует формальной модели решения, называются эвристическими и относятся к ИИ.

Задачи ИИ – это такие задачи, в которых формализуется не процесс решения, а процесс поиска решения.

 

3. Связь ИИ с другими науками. Использование в сфере экономики

• Биология – устройство и деятельность мозга

• Информатика – программные модели и средства, эксперимент на ЭВМ

• Лингвистика – восприятие языка, выражение мысли посредством языка

• Математика – математический аппарат и методы решения задач, логика

• Психология – модели мышления (ассоциативная, модельная гипотеза)

• Робототехника – возможности построения систем управления поведением

 

                        БАЗА ЗНАНИЙ

Всякая интеллектуальная деятельность опирается на знания. В эти знания включаются характеристики текущей ситуации, оценки возможности выполнения тех или иных действий, законы и закономерности того мира, в котором совершается деятельность, и многое другое. В программах, которые стали создаваться, когда появились компьютеры, необходимые знания хранились в памяти программистов, которые писали программы. Компьютер ее механически выполнял заложенную в его память последовательность команд программы. Никаких знаний для этого компьютеру не требовалось.

Принципиальное отличие систем искусственного интеллекта, как об этом говорилось в статье «Искусственный интеллект», состоит в том, что для такого рода систем программист не готовит конкретные программы для исполнения. Человек лишь дает машине нужное задание, а программу, выполняющую это задание, система должна построить сама. Для этого нужны знания как о предметной области, к которой относится задание, так и о том, как строятся программы. Все эти знания хранятся в интеллектуальных системах в специальном блоке, называемом базой знаний.

Знания, хранящиеся в базе знаний, записываются в специальной формализованной форме (см. Представление знаний). В базе знаний могут реализоваться процедуры обобщения корректировки хранимых знаний, а также процедуры, создающие новые знания на основании тех, которые уже там имеются (см. Моделирование рассуждений). Знания, хранимые в базе, отличаются от данных, хранящихся в базе данных, несколькими особенностями. Во-первых, структуры данных (см. Семантические сети, Продукция Фрейм). Во-вторых, знания обладают свойством внутренней активности.

Чтобы пояснить это принципиальное свойство знаний, вспомним, что при обычной работе с компьютером данные всегда играют пассивную роль Данные – это то, с чем работает программа, реализуемая на компьютере: программа вызывает базу данных. Смена данных оставляет базу «равнодушной» к происшедшим изменениям.

В базе знаний ситуация прямо противоположная. Изменения в хранимых в ней знаниях могут активизировать те или иные программы, связанные с этими знаниями. Точно так ее действия человека целиком связаны с его знаниями, которые служат побудительным мотивом для совершения тех или иных действий или программ действий. Аналогичную роль играют знания в роботах и других интеллектуальных системах.

       МАШИННЫЙ ИНТЕЛЕКТ

Под понятием «машинный интеллект» подразумевают совокупность аппаратных и программных средств ЭВМ, с помощью которых обеспечивается такое общение человека с машиной (интерфейс), которое по своему уровню приближается к общению между собой специалистов, решающих совместную задачу.

Машинный интеллект предполагает наличие средств, определяющих восприимчивость ЭВМ к языкам программирования высокого уровня, близким к естественному языку выдачи заданий на решение задач, а также средств, позволяющих выполнить эти задания за счет знаний о предметной области, в которой решается данная задача.

Основой машинного интеллекта является так называемый структурный способ обработки информации. Его альтернатива – программный способ обработки информации. В обоих способах, естественно, используется и аппаратное оборудование, и программы выполнения заданий на нем. Но по отношению к конкретной работе машины эти способы принципиально различаются. Если выполнение данного задания не требует никаких программных указаний о промежуточных действиях, то такой способ будет структурным. В этом случае машина знает, как выполнять задание, поскольку в ее внутреннем математическом обеспечении заложена соответствующая информация, которая активизируется по имени полученного машиной задания. Другими словами, в состав базовых операций машины, не требующих программирования, входит операция по выполнению данного задания. Если же такая операция (как самостоятельная) в машине отсутствует, то для получения требуемого результата необходимо ее реализовать в виде соответствующей программы из последовательности имеющихся базовых операций над компонентами векторов и промежуточными результатами вычислений. Это и будет программный способ выполнения задания.

Оба эти способа обработки информации можно реализовать на любой из ЭВМ, но степень развития ее машинного интеллекта зависит от соотношения между этими способами. Чем более сложные Действия может выполнять машина без их детализации со стороны пользователя (в виде последовательностей программных указаний),т.е. чем больше знает машина, как делать (что делать – задает пользователь), тем более высоким является ее интеллект. Следовательно, пользователю на не легче работать и вычислительный процесс становится более эффективным.

Вторая черта машинного интеллекта – способность выполнять набор операций с данными и знаниями, хранящимися в базах данных и базах знаний в памяти ЭВМ без специального программирования этих операций. Этими операциями являются процедуры поиска информации, необходимой для решения задачи, моделирование рассуждений с привлечением знаний, корректировка содержимого баз и т.п. Наличие таких встроенных в ЭВМ операций позволяет говорить о них не только как о вычислительных, но и как о рассуждающих машинах.

Уровень машинного интеллекта отражается и на том, как внутри ЭВМ организован процесс поиска решения задачи.

Организация вычислительного процесса основана на выполнении совокупности служебных процедур, входящих в состав операционной системы машины, без которой вообще невозможно организовать вычислительный процесс. Как правило, эти процедуры не подлежат программированию со стороны пользователя. Это означает, что они представлены во внутреннем языке и по мере вызова эти стандартные программы извлекаются из памяти и выполняются. Если выполнение таких процедур будет происходить на специально предназначенном для них оборудовании, а не на универсальных обрабатывающих процессорах, то это будет соответствовать более высокой степени машинного интеллекта и обеспечит большую эффективность процесса обработки информации в ЭВМ

Еще один путь повышения машинного интеллекта связан с возможностью непосредственного выполнения операций со сложно организованными данными (векторами, таблицами, списками и т.п.). Чем сложнее структура данных, тем более сложными будут операции, производимые над ними. Но они будут заменять собой большие участки программ, которые до этого должен был писать пользователь. Теперь же вместо того, чтобы выполнять эту работу, пользователю достаточно лишь указать имя соответствующей процедуры.

В этом случае, когда структуры данных допускают параллельную однотипную обработку элементов, достигается резкое повышение производительности ЭВМ. Такая обработка меняет сам процесс, реализуемый в ЭВМ, и стимулирует появление новых типов ЭВМ, ориентированных на параллельные модели вычислений.

Машинный интеллект, развиваясь, постепенно приближает ЭВМ к настоящим системам искусственного интеллекта.

МОДЕЛИРОВАНИЕ РАССУЖДЕНИЙ

Любой вид человеческой деятельности так или иначе связан с рассуждением. В таком разделе науки, как искусственный интеллект, этот термин используется в его общечеловеческом смысле, как понятие естественного языка, нестрогое и неоднозначное. Но есть один вид рассуждений, являющихся объектом изучения специальной науки – логики, который определяется научно. Поскольку такие (логические) рассуждения широко используются в интеллектуальных системах, рассмотрим сначала их.

Пусть имеется некая формальная система F = <T,P,A,П>. Множество Т может быть конечным или счетным. Его элементы имеют произвольную природу. Это могут быть числа, символы, слова, предметы реального мира и т.д. Все они называются базовыми элементами формальной системы и попарно различимы между собой. Множество Т обладает разрешимостью, т.е. о любом элементе из некоторого универсума всех возможных элементов всегда можно однозначно сказать, является он базовым или нет.

Предположим, что формальная система описывает игру в шахматы. В этом случае белые и черные фигуры, стоящие на определенных полях игрового поля образующие шахматную позицию, представляют собой множество базовых элементов Т. Пары «фигура – игровое поле» различимы между собой. Если же на некотором игровом поле находится не шахматная фигура, а посторонний предмет, то это легко обнаруживается и такая «пара» не учитывается в шахматной позиции.

Множество Р состоит из синтаксических правил, помощью которых из базовых элементов можно получить новые элементы формальной системы, которые называются производными. Например, если пары «фигура – игровое поле» являются базовыми элементами, то шахматные позиции – производные элементы. Эти позиции образуются из базовых элементов по определенным правилам, учитывающим пространственные отношения типа: быть слева, быть на одной линии, находиться под ударом и т.п. Все производные элементы, получаемые из базовых с помощью правил из множества Р, считаются синтаксически правильными.

Множество АРМ есть произвольное подмножество синтаксически правильных элементов. Элементы множества АРМ называются аксиомами. Они характеризуют изначально заданные синтаксически правильные элементы формальной системы. Применительно к шахматам из всех позиций шахматной игры имеется лишь одна изначально заданная – это начальная позиция, она и является аксиомой.

Наконец, множество П представляет собой совокупность правил вывода. Эти правила позволяют из аксиом получать другие синтаксически правильные элементы.

Такие элементы называют выводимыми. В шахматной игре выводимыми являются все позиции, (аксиомы) с помощью последовательности ходов, состоящих из полуходов белых серых. Сами правила, по которым совершаются полуходы, и есть правила вывода.

Заданная таким образом формальная система обладает свойством автоматически порождать из системы аксиом все выводимые из них элементы формальной системы.

С понятием формальной системы связано важное понятие интерпретации. Для интерпретации задается специальное множество Н, элементы которого называются оценками. Это могут быть например, значения истинности (истинно, правдоподобно, сомнительно, полезно, бесполезно, вредно), оценки доверия (абсолютное доверие, вера на 50%, невозможно поверить) и многие другие.

Формальная система обладает интерпретацией, если существуют такие правила К, при которых любой синтаксически правильный элемент получает однозначную оценку при условии, что все базовые элементы, из которых состоит данный производный элемент, получили некоторую оценку из множества Н. Правила К называются правилами интерпретации.

При создании программ для игры в шахматы можно ввести понятие оценки фигуры в данной позиции. Сила фигуры оценивается в очках в зависимости от ее возможностей вообще и возможностей в данной позиции. Оценка позиции складывается из суммы оценок фигур в данной позиции. Таким образом, задавая оценки силы (выигрышности) для базовых элементов, можно вычислить однозначным образом оценку всей позиции (производного элемента, являющегося для шахмат синтаксически правильным).

Кроме того исчисления высказываний в классической логики изучается исчисление предикатов. В этом исчислении утверждения содержат свободные переменные. Поэтому их истинность или ложность зависит от того, как означены эти переменные. Примером утверждения, содержашего две независимые переменные, может служить фраза; «Х старше У». Эта фраза не является высказыванием. Ей нельзя априорно приписать какое-либо значение истинности. Она становится высказыванием только тогда, когда вместо Х и У будут подставлены конкретные значения. Например, фраза «Ломоносов старше Петра Великого» уже является высказыванием, правда ложным.

После этого экскурса в логику вернемся к моделированию человеческих рассуждений. Можно ли считать достоверный вывод формальной моделью, в которую можно уложить человеческие способы рассуждений? Отрицательный ответ напрашивается сам собой. Приводимые ниже примеры типичных рассуждений подкрепляют эту мысль.

1. «Молнией – один только голый вывод без посылок (предпосылок я не знаю и сейчас): «Нельзя ни за что – чтобы он меня увидел» (Е.Замятин. «Мы»).

2. «Нет, не из-за фамилии погиб Лазик. Всему виной вздох. АРМ может быть, и не вздох, но режим экономии, или жаркая погода, или даже какие-нибудь высокие проблемы. Кто знает, отчего гибнут гомельские портные?» (И.Эренбург. Бурная жизнь Лазика Ройтшванеца»).

3. «Не сомневайся, мудрый правитель, ты достигнешь согласия с собой и будешь во всем прав» (Ч.Айтматов. «Плаха»).

В первом примере показана часто встречающаяся особенность человеческих рассуждений – замена полного вывода только его заключительной частью. В жизни такие «усеченные» выводы мы предпочитаем полным, так как часто полный вывод мы не сможем воспроизвести и основываемся на некоторой уверенности, что в принципе он возможен.

Что лежит в основе таких псевдовыводов?

Иногда вера в то, что основания для такого вывода должны найтись. В других случаях ссылка на авторитетный источник (например, на аналогичное утверждение, которое принадлежит видному ученому, политику и т. п.). Иногда то, что подобные выводы и вытекающие из них действия делались неоднократно и раньше, и это не приводило к плохим последствиям (эмпирический опыт). Во всяком случае, когда рассуждение челове6ка является по форме «усеченным» выводом, значит, он не видит в своих знаниях чего-нибудь противоречащего этому выводу.

Такие нестандартные рассуждения относят в искусственном интеллекте к широкому кругу немонотонных рассуждений. Для пояснения этого термина вернемся к формальной системе. Вывод в такой системе является монотонным рассуждением.Под монотонностью понимается следующее: если некоторое утверждение получено в цепочке вывода, ведущей от исходной системы аксиом, то, что бы ни происходило потом, данное утверждение остается выведенным. В связи с этим говорят, что формальная система описывает полностью некоторый замкнутый в себе и неизменный мир утверждений.

В реальной жизни такого не бывает – человек не обладает полными, исчерпывающими знаниями об окружающем его мире. Следовательно, он не располагает полной системой аксиом, описывающих закономерности этого мира. Частичные знания порождают и неполную систему правил вывода. А если учесть, что мир динамичен, та утверждения, в данный момент принимаемые как истинные, при получении новых утверждений могут оказаться ложными. Классическим примером такой ситуации может служить знаменитый силлогизм, считавшийся истинным до открытия Австралии. Он звучал так:

Все лебеди белые.

Эта птица – лебедь.

Следовательно: эта птица – белая.

И пока не были известны австралийские черные лебеди, никто не сомневался в верности этого рассуждения. Но лишь появилось новое утверждение: «В Австралии водятся черные лебеди», как монотонность нарушилась и факт: «Все лебеди белые» - перестал быть истинным.

Второй приведенный нами пример рассуждения, демонстрирует иной класс рассуждений, называемый правдоподобными. В человеческом языке имеется богатый арсенал средств для маркирования рассуждений подобного типа. К ним относятся, например, слова и словосочетания следующего вида: вероятно, можно предположить, часто, бывает, что, время от времени и т. п. Кэтому классу рассуждений относятся индуктивные, вероятностные рассуждения или рассуждения о гипотезах. Их важность в обучении, поиске решения или в накоплении информации о проблемной области несомненна.

Классы немонотонных и правдоподобные рассуждений пересекаются. Большинство правдоподобных рассуждений принадлежат к немонотонным, но не все.

Третий из приведенных примеров человеческих рассуждений демонстрирует еще одну их особенность. Очень часто люди ре доказывают то или иное положение, не аргументируют его истинность, а оправдывают его той системой внутренних нравственных ценностей и представлений, которой руководствуются в жизни. Процесс оправдания никак не укладывается в прокрустово ложе формальной системы и представляет собой поле исследований, почти не затронутое специалистами.

Имеются и другие классы человеческих рассуждений. Их изучение в искусственном интеллекте только начинается, но без создания формальных моделей для таких рассуждений очень трудно производить в интеллектуальных системах все особенности рассуждений специалистов, решающих те задачи, которые мы хотим сделать доступными для искусственных систем. В созданных уже сегодня экспертных системах реализуются не только достоверные логические выводы, но и правдоподобные рассуждения и ряд иных немонотонных рассуждений. Появились первые программы для рассуждений по аналогии и ассоциации.

 

                               НЕЧЕТКИЙ ВЫВОД

Вид вывода, часто встречающийся при моделировании рассуждений, опирающихся на человеческую практику. Конечно, в реальной жизни при обосновании своих утверждений люди вряд ли придерживаются законов математической логики. Они делают это иными способами. Вот например такого вывода:

      Я часто хожу гулять вечером, если нет дождя.

      К сожалению, в последнее время дожди идут очень часто.

 


      В последнее время я редко выхожу вечером гулять

Два высказывания, написанные над чертой, отражают посылки, на которых основывается вывод, написанный под чертой. Три словосочетания важны в этом переводе: «часто», «очень часто» и «редко». Если отвлечься от содержательной части нашего примера, то вывод можно представить схемой: «Если Х часто, когда нет У, и У очень часто, то Х редко». Эта схема – пример нечеткого вывода.

Вместо двух сов: «истина» и «ложь», используемых в традиционном выводе и отражающих значения переменной «истина», в нечетком выводе используются переменные, принимающие ряд значений. В нашем примере мы имели дело с переменной «частота». Приведем еще один пример, в котором используется переменная «расстояние».

       Дом стоит недалеко от озера.

          Озеро примыкает своей дальней стороной к лесу.

      Дом находится не очень далеко от леса.

Используемая здесь схема имеет вид: «Если Х недалеко от У и У примыкает к Z, то Х не очень далеко от Z».

Переменные, значениями которых являются некоторые словесные оценки, называются лингвистическими переменными. Именно они характерны для нечеткого вывода. Кроме того, нечеткий вывод является не достоверным, а лишь правдоподобным. Люди могут соглашаться или не соглашаться с его схемами. К тому же сами схемы могут оправдываться или не оправдываться в конкретных условиях. Например, последняя из приведенных нами схем может оказаться совершенно неприемлемой, если озеро, о котором идет речь, - это какое-то очень большое озеро (например, Байкал). Тогда, конечно, в выводе должно использоваться не «не очень далеко» а «очень далеко».

Несмотря на сказанное, нечеткий вывод используется очень широко, ибо он отражает суму человеческих знаний о многих явлениях реального мира. При планировании поведения в роботах и других системах искусственного интеллекта, действующих в не полностью описанных средах, при принятии решений в условиях отсутствия исчерпывающей информации, в экспертных системах при частичных знаниях о предметной области и во многих других ситуациях без нечеткого вывода не обойтись.

    

                   ПЛАНИРОВАНИЕ ПОВЕДЕНИЯ

Планирование поведения – одно из направлений исследований по искусственному интеллекту. Основная задача этого направления – поиск процедур, которые могли бы автоматически предлагать наикратчайший путь к достижению поставленной цели, исходя из данной ситуации.

Задачи такого типа оказались наиболее актуальными для роботов, действующих автономно. Решая поставленную перед ним задачу, робот должен составить план ее решения и постараться его выполнить. Если в процессе реализации этого плана робот убедится, что имеются непреодолимые препятствия, то он должен построить другой план, в котором этих препятствий не существует.

Приведем пример. На рис. 1 показано исходное положение робота и цель, которую он должен достичь. Но датчики робота сигнализируют, что его аккумуляторы нуждаются в подзарядке, без чего достичь цели невозможно. В базе знаний робота хранится план помещений, из которого он узнает координаты, определяющие местоположение зарядного устройства. Зная свои исходные координаты, робот по довольно простым алгоритмам (предлагаем читателю самому их построить, для этого вполне достаточно знаний из школьного курса геометрии) прокладывает свой путь из комнаты АРМ через комнату Б в комнату В, где находится зарядное устройство (этот план-маршрут показан на рисунке пунктирной линией). Но план этот нереализуем, так как дверь из комнаты Б в комнату В загородили шкафом. Вероятно, это случилось недавно. По данным, которыми пользовался робот при составлении траектории своего движения, эта дверь была свободной. Находясь же в комнате АРМ, робот даже с прекрасным зрением за стенами помещения не может увидеть возникшее препятствие.

Итак, выработав план действий, робот начинает его осуществлять. Он перемещается из комнаты АРМ в комнату Б и тут обнаруживает шкаф, закрывающий ему путь в комнату В. В этой ситуации поведение робота может быть различным. Например, робот может быть запрограммирован на устранение препятствия, перемещение его в другое место. Ну а если такой программы нет? В этом случае роботу придется искать другой план-маршрут, не связанный с перемещением препятствия.

Робот составляет новый план и находит путь через комнаты Г и Д, ведущий в желанную комнату В. Этот маршрут из комнаты АРМ (исходной ситуации) робот мог бы найти сразу, но он предпочел кратчайший путь через дверь между комнатами Б и В. Необходимость экономии ресурса, связанного с энергопитанием, определила для робота выбор кратчайшего маршрута кА наиболее приемлемого. Но теперь делать нечего, робот начинает движение по новому маршруту.

Из описанного примера следуют два важных вывода.

Первый вывод. Планирование, если оно выполняется в условиях отсутствия части информации, требует корректировки при появлении дополнительной информации, которая сказывается на ранее выработанном плане. Но часто не приблизительное планирование идут сознательно, не желая тратить много времени на выработку точного плана. Например, собираясь в туристский поход, можно заранее по карте наметить предполагаемый маршрут, хотя карта и не позволяет спланировать его во всех деталях. Уточнить маршрут проще в походе с учетом местных условий. Это означает, что планирование желательно сделать иерархическим, многоуровневым, например трехуровневым, как это показано на рис.2. На уровне стратегического планирования робот решает «задачу вообще», пользуясь лишь глобальной информацией, имеющейся на карте. Он должен прежде всего убедиться, что поставленная задача имеет хотя бы одно решение. Если задача разрешима, то он может начать уточнять ее с помощью более детальных карт и планов. На этом этапе планирования, выбирают наиболее приемлемый маршрут и уточняют временные, энергетические и прочие затраты на его реализацию, Потом наступает этап оперативного планирования, когда план тактического уровня уже реализуется и корректируется лишь при появлении новой информации.

В процессе планирования возможны возвраты с нижнего уровня планирования на верхний. На уровне тактического планирования может, например, выясниться, что стратегический план неприемлем из-за недостаточных энергетических ресурсов у робота, так как этот план при движении к цели предусматривает преодоление горного перевала, но на такие энергозатраты робот пойти не может. Тогда находят новый стратегический план, предусматривающий движение по более длинному пути, но зато без крутых подъемов, Аналогичная ситуация может сложиться и на оперативном уровне планирования, когда потребуется изменение тактического плана.

И второй важный вывод из рассмотренного нами примера. В процессе планирования робот должен уметь решать оптимизационные задачи, связанные с выбором одного варианта из множества возможных.. Особенности решения таких задач описаны в статье «Выбор».

Более сложное планирование поведения связно с решением задач, для которых нет процедур прямого поиска траекторий, ведущих к решению. На уроках математики и физики вы постоянно сталкиваетесь с такими задачами. Известны исходные данные задачи и то, что требуется найти. Но неизвестно, как определить путь движения от исходных данных к искомому результату.

Более сложная задача планирования – организация человекоподобного поведения. Эта задача возникает при совместной деятельности людей и искусственных систем. Частный аспект этой проблемы, связанный с организацией человекоподобного диалога, описан в статье «Диалоговая система».

Одна из психологических проблем общения человека с искусственными системами (с теми же роботами) – это их излишняя рациональность, логичность, непредсказуемость поведения на основе опыта общения, накопленного в человеческом обществе. Общение с интеллектуальными системами вызывает в людях настороженность и боязнь, и поэтому надо, чтобы искусственные системы вали себя «по-человечески».

В области планирования поведения все большее внимание уделяют проблемам формализации таких понятий, связанных с человеческим поведением, как мотив, поступок, принятая норма и т.п. Создается новая область исследований – теория поведения, которая, возможно, скоро станет одной из центральных в искусственном интеллекте. Чтобы хоть немного рассказать, об этом направлении, приведем пример. В любом естественном языке существует определенное множество слов для обозначения поступков людей. Примерами их могут служить такие слова, как смелый, коварный, добрый и многие другие. Возникают вопросы: что понимают под этими словами люди, когда употребляют их для оценки поведения какого-нибудь человека? Одинаково ли они понимают их? И как должна вести себя интеллектуальная система (например, робот), чтобы заслужить такую ее оценку своего поступка? На рис 3 показано, как можно формализовать понятие «смелый поступок». На этом рисунке сплошные дуги соответствуют положительным действиям, а пунктирные – отрицательным воздействиям. Исследователи установили, что, сохраняя все вершины этого графо, соответствующего смелому поступку, и меняя дуги и веса на них, можно описать все множество поступков, имеющих словесные оценки.

Подобная формализация основного элемента, из которого сгладывается поведение, позволяет рассчитывать, что модели нормативного поведения можно вложить в искусственные системы. Это даст возможность планировать свое поведение, опираясь на нормы, принятые в данном человеческом социуме.

 

 

                           ПОИСК ПО ОБРАЗЦУ

Одна из основных операций в базах данных и знаний – это поиск информации по запросу. Запрос к базе знаний оформляется в виде некоторого стандартного образца.

В более формальном виде использование операции поиска по образцу можно продемонстрировать на базах знаний, в которых для представления знаний используются семантические сети. На нашем рис.1 изображена семантическая сеть, в которой имеются шесть вершин, обозначенных большими буквами, между которыми имеются отношения трех типов, фиксируемые малыми буквами. Вершины сети соответствуют некоторым порциям информации.

Запрос показан в средней части рисунка, Буква Х означает, что имя вершины в этом месте образца роли не играет. Такую же роль играет буква У на дуге, входящей в образец. Поиск по такому образцу приводит к двум возможным ответам, показанным в нижней части рисунка.

Распознавание по образцу широко используется в экспертных системах и других системах искусственного интеллекта.

Наиболее широкое применение методы ИИ нашли в программах, названных экспертными системами. В них накапливается опыт специалистов в узкой предметной области. Затем при помощи знаний, накопленных в ЭС, специалисты с не очень высокой квалификацией могут решать сложные задачи на столь же высоком уровне, как и эксперты.

Таким образом, экспертные системы – это программы, моделирующие образ мышления человека–эксперта на основе механизмов логического вывода и эвристических методов.

2. Математические модели и аппаратно-программная реа­лизация систем ИИ. Модель нейрона, алгоритм ее работы. Искусственные нейронные сети. Примеры применения нейронных сетей для решения экономических задач

«Научное направление, основная задача которого – изучение организации и функционирования нервной системы живых организмов, которая управляет всеми процессами, протекающими в них, чтобы использовать эти знания для построения технических интеллектуальных систем» - нейрокибернетика (Информатика: Энциклопедический словарь для начинающих / Сост. Д.А. Поспелов. – М.: Педагогика-Пресс, 1994 – 352 с. – С. 193). Выделяют три направления:

1) Изучение реальных нейронных структур с целью полного описания их функций, чтобы затем формализовать эти описания. В 50-х гг. 20 в. исследования в этом направлении привели к появлению понятия формальный нейрон, моделируюший основные свойства реальных нейронов.

2) разработка теории нейронных сетей, в рамках которой можно было бы построить методы синтеза сетей, функционирующих заданным образом. Например, решить задачи посредством параллельного протекания процессов. Которые нельзя решить последовательным путем.

3) Создание нейрокомпьютера (ЭВМ, архитектура которых отличается от стандартной, посредством широкого использования сети из формальных нейронов). В нейрокомпьютере решение задачи получают не посредством выполнения программы, а путем перенастройки сети за счет адаптивных формальных нейронов и специальных процедур самоорганизации сети. В этом нейрокомпьютеры близки к аналоговым компьютерам и подобно им имеют огромную скорость работы, недоступную обычным ЭВМ. Проблемы: отсутствие теории. Позволяющей программировать процессы самоорганизации нейронных сетей для решения нужной задачи.

Модель нейрона

Нервная система и мозг, как ее часть, состоят в основном из особых нервных клеток – нейронов, значительно отличающихся от других клеток живых организмов. В конце 50-х гг. 20 в. американские ученые У. Маккалок и У. Питс предложили формальную модель нейрона, отображающую основные свойства реальных нейронов и названную формальным нейроном. Формальный нейрон – элемент с n входами, имитирующими синаптические контакты на теле реального нейрона, и одним выходом, сигнал на котором задается функцией. Каждый вход характеризуется целым числом – весом входа (могут быть положительные – возбуждающий вход и отрицательные – тормозящий вход).

Алгоритм работы нейрона

Работа нейрона (наличие или отсутствие сигнала на выходе) задается функцией (называется пороговая функция):

                  1, при

у=            0, при

 

То есть, это пороговый элемент.

Искусственные нейронные сети

Соединяя выходы одних нейронов с входами других, формируют нейронные сети.

Формальные нейроны реализуют свойства реальных нейронов очень приблизительно. Поэтому разработаны усложненные модификации – пластичные нейроны, у которых сигналы могут иметь непрерывный характер, и модели, у которых могут изменяться веса входов и пороги.

Нейронная сеть – «образованная совокупностью взаимосвязанных нейронов или их моделей – формальных нейронов» (Там же, с. 124). Рассматривают два типа сетей:

1) нейроны объединяются посредством соединения выходов нейронов с входами других нейронов при условии, что на каждый вход нейрона поступает не более 1 сигнала.

 

Х1
Х2

Формальный нейрон – пороговый элемент. Если сумма значений входных сигналов, взвешенных весами входов, больше или равна пороговому значению, то на выходе возникает выходной сигнал. Будем считать все входные сигналы 0 или 1. Тогда сеть1 выдает сигнал, когда:

 х1 отсутствует

х2 присутствует

обязательно присутствует х3 или х4 (или оба вместе).

2) на вход нейрона могут одновременно поступать несколько сигналов, которые могут и перед входом взаимодействовать между собой.

Непрерывные линии – информационные сигналы, пунктирные – корректирующие. Если на вход нейрона поступают оба сигнала, то информационный сигнал усиливается или ослабляется в зависимости от знака и веса корректирующей связи. Если корректирующий сигнал поступает на тело нейрона, то корректируется его порог. Сеть 2 – схема оборонительного рефлекса на раздражение, характерная для простейших организмов. Раздражение, поступающее на сенсорный нейрон СН. С его выхода передается на корректирующий нейрон (КРН) и командный нейрон (КН). КРН усиливает связь между СН и КН, что приводит к усиленной активизации мотонейрона (МН), непосредственно воздействующего на органы, реализующие оборонительную реакцию.

Сторонники бионического подхода к построению интеллектуальных систем предполагают, что структуры нейронных сетей, моделирующие структуры живых организмов, быстрее приведут к системам ИИ, чем традиционный путь, связанный с использованием обычных ЭВМ.

3. Использование ИИ в экономике. Интеллектуальный ана­лиз данных. Управление знаниями

В последнее десятилетие наблюдается устойчивый рост популярности технического анализа - набора эмпирических правил, основанных на различного рода индикаторах поведения рынка. Технический анализ сосредотачивается на индивидуальном поведении данного финансового инструмента, вне его связи с остальными ценными бумагами (Pring, 1991).

Такой подход психологически обоснован сосредоточенностью брокеров именно на том инструменте, с которым они в данный момент работают. Согласно Александру Элдеру (A.Elder), известному специалисту по техническому анализу (по своей предыдущей специальности - психотерапевту), поведение рыночного сообщества имеет много аналогий с поведением толпы, характеризующимся особыми законами массовой психологии. Влияние толпы упрощает мышление, нивелирует индивидуальные особенности и рождает формы коллективного, стадного поведения, более примитивного, чем индивидуальное. В частности, стадные инстинкты повышают роль лидера, вожака. Ценовая кривая, по Элдеру, как раз и является таким лидером, фокусируя на себе коллективное сознание рынка. Такая психологическая трактовка поведения рыночной цены обосновывает применение теории динамического хаоса. Частичная предсказуемость рынка обусловлена относительно примитивным коллективным поведением игроков, которые образуют единую хаотическую динамическую систему с относительно небольшим числом внутренних степеней свободы.

Согласно этой доктрине, для предсказания рыночных кривых необходимо освободиться от власти толпы, стать выше и умнее ее. Для этого предлагается выработать систему игры, апробированную на прошлом поведении временного ряда и четко следовать этой системе, не поддаваясь влиянию эмоций и циркулирующих вокруг данного рынка слухов. Иными словами, предсказания должны быть основаны на алгоритме, т.е. их можно и даже должно перепоручить компьютеру (LeBeau, 1992). За человеком остается лишь создание этого алгоритма, для чего в его распоряжении имеются многочисленные программные продукты, облегчающие разработку и дальнейшее сопровождение компьютерных стратегий на базе инструментария технического анализа.

Следуя этой логике, почему бы не использовать компьютер и на этапе разработки стратегии, причем не в качестве ассистента, рассчитывающего известные рыночные индикаторы и тестирующего заданные стратегии, а для извлечения оптимальных индикаторов и нахождения оптимальных стратегий по найденным индикаторам. Такой подход - с привлечением технологии нейронных сетей - завоевывает с начала 90-х годов все больше приверженцев (Beltratti, 1995, Бэстенс, 1997), т.к. обладает рядом неоспоримых достоинств.

Во-первых, нейросетевой анализ, в отличие от технического, не предполагает никаких ограничений на характер входной информации. Это могут быть как индикаторы данного временного ряда, так и сведения о поведении других рыночных инструментов. Недаром нейросети активно используют именно институциональные инвесторы (например, крупные пенсионные фонды), работающие с большими портфелями, для которых особенно важны корреляции между различными рынками.

Во-вторых, в отличие от теханализа, основанного на общих рекомендациях, нейросети способны находить оптимальные для данного инструмента индикаторы и строить по ним оптимальную опять же для данного ряда стратегию предсказания. Более того, эти стратегии могут быть адаптивны, меняясь вместе с рынком, что особенно важно для молодых активно развивающихся рынков, в частности, российского.

Нейросетевое моделирование в чистом виде базируется лишь на данных, не привлекая никаких априорных соображений. В этом его сила и одновременно - его ахиллесова пята. Имеющихся данных может не хватить для обучения, размерность потенциальных входов может оказаться слишком велика. Далее в этой главе мы покажем как для преодоления этих типичных в области финансовых предсказаний трудностей можно воспользоваться опытом, накопленным технического анализом.

Для начала обрисуем общую схему нейросетевого предсказания временных рядов.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: