Неопределенности

Полная неопределенность означает от­сутствие информа­ции о вероятностных состояниях среды (“природы”), например, о вероятностях тех или иных вариантов ре­альной ситуации; в лучшем случае известны диапазоны значений рассматриваемых величин. Неопределенность, связанную с отсутствием информации о вероятностях состояния среды, называют «безнадежной», или «дурной». Рекомен­дации по принятию наилучших решений в таких ситуациях сформулированы в виде определенных правил (критериев). К основным критериям относятся следующие:

1) критерий оптимизма (критерий максимакса) соответствует оптимистической наступательной стратегии; здесь не принимается во внимание никакой возможный результат, кроме наилучшего;

2) критерий гарантированного результата (максиминный критерий Вальда) – пессимистический, по сути, критерий, т.к. во внимание принимается только наихудший результат каждой альтернативы. Этот подход устанавливает гарантированный минимум, фактический результат может быть лучше;

3) критерий минимаксного риска Сэвиджа, или критерий наименьшего вреда, который определяет худшие возможные последствия для каждой альтернативы и выбирает альтернативу с лучшим из плохих значений;

4) критерий обобщенного максимина (пессимизма – оптимизма) Гурвица позволяет учитывать состояние между крайним пессимизмом и крайним оптимизмом;

5) критерий пессимизма характеризуется выбором худшей альтернативы с худшим из всех худших значений окупаемости.

При сравнительном анализе критериев эффективности нецелесообразно останавливаться на выборе единственного критерия, т.к. в ряде случаев это может привести к неоправданным решениям, ведущим к потерям экономического и иного содержания. В большинстве ситуаций имеется необходимость применения нескольких критериев в совокупности. Например, наряду с критерием гарантированного результата Вальда может быть использован критерий минимаксного риска Сэвиджа и т.п.

1. Критерий (правило) максимакса. При использовании критерия, ЛПР ориентируется на то, что условия функционирования анализируемых систем будут для него наиболее благоприятными. Вследствие этого оптимальным решением является стратегия, максимизирующая максимальные выигрыши - например, доходы – для каждого варианта ситуации. Это критерий крайнего (“розового”) оптимизма, предполагающий максимальный выигрыш, равный наибольшему значению критерия оптимальности в платежной матрице . Критерий целесообразно применять в тех случаях, когда имеется принципиальная возможность повлиять на функции противоположной стороны. Если анализируется матрица эффекта того или иного вида, то выбор управляемых факторов осуществляется таким образом, чтобы обеспечить максимум эффекта. В этом случае критерий оптимизма записывается в виде

Рассматривая i- е решение, предполагают самую хорошую ситуацию, приносящую доход , а затем выбирают решение с наибольшим ai.

Рассмотрим пример (2.2). Для матрицы последствий в примере 2.1 выбрать вариант решения по критерию максимакса.

Решение. Находим последовательность значений : a1=8, a2=12, a3=10, a4=8. Из этих значение находим наибольшее: a2=12. Следовательно, критерий максимакса рекомендует принять второе решение (i=2).

2. Правило Вальда (правило максимина, или критерий крайнего пессимизма). Сущность критерия состоит в следующем. ЛПР располагает множеством стратегий решения проблемы: . Указанные стратегии считаются контролируемыми (управляемыми) факторами. В качестве этих факторов могут быть: технические параметры проектируемых систем, экономические показатели состояния предприятия, различные варианты решения поставленных задач и т.п. Наряду с управляемыми действуют и неуправляемые (неконтролируемые) факторы: П= { Пj }, j= 1 ,…n. В качестве этих факторов могут быть: уровень спроса на товары, предлагаемые фирмой, рыночные цены, условия эксплуатации технических и производственных систем, действия конкурентов и т.д.

Для оценки эффективности принимаемых решений вводим показатель эффективности и считаем, что функция является известной. Так как факторы Р и П является дискретными, то и эффективность также представляет собой множество дискретных чисел. таким образом, каждой точке контролируемых и неконтролируемых факторов ставится в соответствие значение эффективности . Следовательно можно построить матрицу эффективности:

Таблица 1

Матрица эффективности

  Пj Pi   П1   П2   …   Пn  
Р1
Р2
Рm

Дл каждого контролируемого фактора (строки) находится , в результате чего определяется набор значений показателя эффективности , ,…, . Сравнивая полученные величины, выбирают управляемый фактор, при котором обеспечивается максимальное значение . Другими словами, рас­сматривая i-e решение, будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход: bi = min qij. Затем выбираем решение i0 с наибольшим . Итак, правило Вальда рекомендует при­нять решение i0 такое, что = = . Таким образом, критерий гарантированного результата (максиминный критерий Вальда) записывается в виде:

Данный критерий обеспечивает максимизацию минимального выигрыша, или минимизацию максимальных потерь, которые могут быть при реализации одной из стратегий. Критерий консервативен, т.к. ориентирует ЛПР на слишком осторожную линию поведения. Величина, соответствующая максимальному критерию, наз. нижней ценой игры, под которой понимается максимальный выигрыш, гарантируемый в игре с данным противником одной из своих стратегий при минимальных результатах. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.

Рассмотрим пример (2.3). Для матрицы последствий в примере 2.1 выбрать вариант решения по критерию Вальда.

Решение. В примере 2.1 имеем b1 = 2, b2 = 2, b 3 = 3, b4 = 1. Теперь из этих значений выбираем максимальное b 3 = 3. Значит, правило Валь­да рекомендует принять 3-е решение (i=3).

3. Правило Сэвиджа (критерий минимаксного риска). Этот критерий аналогичен предыдущему критерию Вальда, но ЛПР принимает решение, руководствуясь не матрицей последствий Q, а матрицей рисков R = (rij). Возможны ситуации, кгда неконтролируемые факторы будут действовать более благоприятным образом по сравнению с наихудшим состоянием, на которое ориентировалось ЛПР. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей , а матрицей рисков . Критерий Сэвиджа формулируется следующим образом:

По этому критерию лучшим является решение, при котором максимальное значение риска будет наименьшим, т.е. равным . Рассматривая i-e решение, предполагают ситуацию максимального риска ri = и выбирают вариант решения i0 с наименьшим = = .

Рассмотрим пример (2.4). Для исходных данных в примере 2.1 выбрать вариант решения в соответствии с критерием Сэвиджа.

Решение. Рассматривая матрицу рисков R, находим последовательность величин ri = : r1 = 8, r2 = 6, r3 = 5, r4 = 7. Из этих величин выбираем наименьшую: r3 = 5. Значит, правило Сэвиджа реко­мендует принять 3-е решение (i=3). Заметит, что это совпадает с выбором по критерию Вальда.

4. Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Критерий Гурвица позволяет учитывать комбинации наихудших состояний. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и крайним оптимизмом. В соответствии с этим компромиссным критерием определяется линейная комбинация минимального и максимального выигрышей

Qi = {λ qij + (1 – λ) qij},

где - коэффициент, рассмтариваемый как показатель оптимизма (0 λ 1),

и предпочтение отдается варианту решения, для которого максимальным окажется показатель , т.е.:

Таким образом, этот критерий рекомендует руководствоваться некоторым средним результатом между крайним оптимизмом и крайним пессимизмом. При λ=0 критерий Гурвица совпадает с максимаксным критерием, т.е. ориентирует на предельный риск; при λ=1 он совпадает с критерием Вальда, т.е. ориентирует на осторожное поведение. Значения λ между 0 и 1 являются промежуточными между риском и осторожностью и выбираются из субъективных (интуитивных) сооб­ражений в зависимости от конкретной обстановки и склонности к риску ЛПР.

Рассмотрим пример (2.5). Для приведенной в примере 2.1 матрицы последствий выбрать наилучший вариант решения на основе критерия Гурвица при значении коэффициента оптимизма λ =1/2.

Решение. Рассматривая матрицу последствий Q по строкам, для каждого i вычисляем значения ci= 1/2minqij + 1/2maxqij. Например, с1=1/2*2+1/2*8=5; аналогично находятся с2=7; с3=6,5; с4= 4,5. Наибольшим является с2=7. Следовательно, критерий Гурвица при заданном λ =1/2 рекомендует выбрать второй вариант (i=2).

5. Критерий пессимизма. При использовании принципа пессимизма предполагается, что управляемые факторы могут быть использованы неблагоприятным образом:

,

где - функция эффективности принимаемых решений.

В реальных ситуациях в ряде задач оказывается невозможным контроль за неконтролируемыми факторами, принадлежащими множеству P. особенно это относится к задачам, связанным с необходимостью учета фактора времени, например: социально-экономическое прогнозирование, долгосрочное планирование, проектирование сложных объектов и др.

Например, издержки производства являются контролируемыми факторами на коротких временных интервалах. Однако, при анализе длительных процессов, которые составляют несколько лет, некоторые элементы указанных издержек становятся неконтролируемыми. К таким элементам можно отнести: стоимость электроэнергии, стоимость материалов и покупных изделий и т.п.

Другим примером является определение объемов производства продукции предприятия. Данный показатель также считается управляемым фактором. Но он зависит от факторов производства, которые относятся к внутренней среде предприятия: уровень конструкторской и технологической подготовки производства, тип используемого оборудования, квалификация работающих и пр.

Рассмотрим пример (2.6). Для матрицы последствий примера 2.1 выбираем вариант решения по критерию пессимизма.

Решение. В примере 2.1 имеем: при стратегии 1 минимальный доход = 2, стратегия 2 – 2, стратегия 3 – 3, стратегия 4 – 1. Критерий пессимизма рекомендует принять 4-е решение i= 4.

Лекция 2 (Тема 2)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: