При анализе вариантов УР возникает необходимость реализации ЭИП практически во всех шкалах. Использование каждой из шкал имеет свою специфику.
Одна из проблем применения рассмотренных в предыдущем разделе методов состоит в том, что участвующие в них в качестве источников информации специалисты (ЛПР, эксперты, консультанты, советники) разных предметных областей могут использовать принятую в этих областях терминологию, в значительной степени не совпадающую. Это относится и к случаям использования виртуальных экспертов в виде всевозможных литературных источников. Поэтому возникает необходимость определить, являются ли тождественными те или иные используемые термины. Эта задача представляет собой пример задачи измерения в номинальной шкале. Другие примеры – классификация работников, поставщиков, изделий и т.п. по некоторой совокупности свойств или признаков.
Пусть имеется множество A =(a 1,…, aj,…,am) некоторых терминов (обозначений, наименований и т.п.) и некоторое множество объектов S = (s 1,…, si,…,sn) способов действий, технических средств, методов алгоритмов и т.п. задача состоит в том, чтобы каждому объекту si Î S поставить в соответствие конкретный термин aj Î A. Далее пусть существует группа экспертов (ГЭ), каждый участник которой, ориентируясь на свои знания, может объектам множества A (не обязательно всем) поставить в соответствие термины из множества A. Формальным результатом работы t -го участника ГЭ является оценка отношения rtij, с некоторой вероятностью p определяющая истинное отношение rij. Из-за возможных ошибок участников процедуры их оценки в общем случае могут не совпадать с rij. Цель рассматриваемой ЭИП состоит в таком агрегировании полученных оценок, чтобы минимизировать вероятность несовпадения агрегированной оценки Rij с истинным значением rij. Как и следовало ожидать, это условие выполняется, если агрегированная оценка совпадает с не менее чем половиной используемых оценок и процент этих оценок превосходит ожидаемую среднюю вероятность ошибки участников процедуры.
|
|
Возможность индивидуальных ошибок в оценках участников ЭИП вызывает необходимость анализа их согласованности, которая, в свою очередь, является мерой достоверности используемых оценок. ЭИП в номинальной шкале является разновидностью операции ранжирования, отличающейся тем, что число ранжируемых объектов равно единице. Поэтому для анализа согласованности используемых оценок можно применить критерий, известный в теории порядковых статистик как коэффициент согласия, с проверкой статистической значимости получаемых результатов. Подробнее эти методы рассматриваются далее.
|
|
Таким образом, рассмотренная ЭИП включает в себя получение первичной измерительной информации (оценок значений rtij) от членов ГЭ, анализ согласованности этих оценок и построение агрегированной оценки Rij. При этом лишь первая операция является эвристической, анализ согласованности и построение агрегированной оценки осуществляются алгоритмически и могут быть реализованы соответствующими средствами СППР.
Очень часто при анализе УР используются ЭИП в порядковой шкале. Их применяют для упорядочения каких–либо объектов (вариантов, свойств, показателей, шансов и т.д.) по различным признакам. В терминах порядковой шкалы, например, в баллах, как уже отмечалось, можно оценить значения различных показателей. Порядковая шкала является весьма привычной, и поэтому представляется достаточно легкой для применения. Однако ее неправильное использование может привести к значительным искажениям информации для принятия УР.
Итак, пусть A =(a 1,…, ad,…, aq,…, am) – подлежащие упорядочению объекты, S =(s 1,…, si,…,sj,…,sn) – множество упорядоченных чисел, которые будем называть рангами. Задача рассматриваемой ЭИП заключается в том, чтобы каждому объекту aq Î A приписать ранг si Î S, соответствующий месту данного объекта на множестве A по степени выраженности некоторого общего для всех этих объектов свойства (или совокупности таких свойств).
Как уже отмечалось, ЭИП состоит из трех частей – получения первичной эвристической измерительной информации, ее формализации и оценки точности и достоверности.
Для получения первичной измерительной информации об отношениях от членов ГЭ используются, в основном, два метода – непосредственное упорядочение или парные сравнения, рассмотренные в 3.3. Задача каждого члена ГЭ состоит в определении для каждого объекта его места (ранга) в упорядочении на основе предоставленной информации и тех индивидуальных знаний об объектах и требованиях к ним, которые у него имеются.
Оценка точности и достоверности результатов ранжирования, как и всех остальных ЭИП, вытекает из предположения о том, что согласованное мнение высококвалифицированных специалистов с высокой вероятностью является правильным. Так как действительное значение оцениваемых с помощью ЭИП показателей неизвестно, нельзя получить какие-либо оценки точности. Поэтому при использовании ЭИП используются оценки согласованности мнения участников процедуры, и, если она достаточно высока, результаты признаются правильными. В рассматриваемой процедуре ранжирования согласованность мнений членов ГЭ характеризуется значением коэффициента конкордации
где xij ранг j -го объекта в ранжировании i -го члена ГЭ, tij -число повторений j -го ранга у i -го члена ГЭ
При одинаковом ранжировании всеми членами ГЭ W =1, а при полной несогласованности W =0. Так как коэффициент конкордации является случайной величиной, далее стандартными методами математической статистики может быть определена его значимость.
При недостаточной согласованности можно, поочередно исключая полученные от каждого из членов ГЭ оценки, найти те, которые являются причиной этой несогласованности. Получив от члена ГЭ, давшего эти оценки, содержательную аргументацию и доведя ее до остальных участников процедуры, проводят следующий тур ЭИП.
Один из распространенных вариантов реализации ЭИП в порядковой шкале – использование балльных оценок для выражения интенсивности выраженности ранжирующего свойства. Основная особенность порядковой балльной шкалы состоит в том, что в ней интервалы между баллами не являются фиксированными. Операция сложения баллов в этой шкале формально не определена, поэтому некорректно использование таких оценок, как среднее арифметическое и дисперсия. Для оценки средней величины можно использовать значение медианы Me, вычисление которой основано на операциях, разрешенных порядковой шкале. В качестве меры рассеяния по тем же причинам следует использовать полуинтерквартильный размах Q распределения оценок. Напомним, что медиана распределения оценок отмечает на порядковой шкале точку, ниже которой находится 50% оценок. Поэтому, если полученные балльные оценки расположить в порядке не убывания, то при нечетном их числе медиане будет соответствовать балл, находящийся в середине такой последовательности, а при четном числе оценок – балл с номером 0.5 n +1. Полуинтерквартильный размах характеризует не отклонение от какой-либо средней величины, как дисперсия, а общую величину рассеяния, и вычисляется по формуле
|
|
Q =(Q 3 – Q 1)/2,
где Q 1 – первый квартиль, т.е. точка на шкале, ниже которой расположено 25% оценок, а Q 3 – третья квартиль, т.е. точка, ниже которой расположено 75% оценок.
Основной характеристикой балльной шкалы является ее диапазон (балльность) - число градаций, которое содержит шкала, т.е. число оценочных точек. Диапазон шкалы не всегда совпадает с числом баллов, так как в процессе оценивания могут использоваться доли балла (например, школьные оценки «4 с плюсом» или «5 с минусом») или не все баллы (баллы 20, 40, 60, 80 и 100 в 100-балльной шкале). Шкала с максимальной оценкой 5 баллов с градацией через 0.5 балла имеет тот же диапазон, что и 10-ти балльная шкала с градацией через 1 балл или шкала с максимальной оценкой 100 баллов с градацией через 10 баллов. Все эти шкалы, при исключении оценки 0, являются 10-балльными.
Выбор числа градаций шкалы определяется характером конкретной задачи оценивания и возможностями членов ГЭ, но учитывая «магическое число Миллера" 7 плюс-минус 2. Желательно использовать шкалы с нечетным числом градаций, в которых наряду с верхним и нижним есть средний (удовлетворительный) уровень выраженности ранжирующего свойства.
|
|
Результаты ЭИП удобно представлять в виде таблицы, число строк которой равно числу ранжируемых объектов, а число столбцов – количеству баллов применяемой шкалы. Элемент ij этой таблицы равен числу членов, приписавших i -му объекту j -ю оценку. На основе такой таблицы вычисляются медиана и полуинтерквартильный размах оценок каждого объекта.
Отметим, что оценки в баллах часто используются и в ЭИП, реализуемых в интервальной шкале. Это возможно, если интервалы между баллами одинаковы.
ЭИП в интервальных шкалах используются при анализе вариантов УР очень широко. Однако достаточно часто для получения первичной эвристической информации применяют операции, не учитывающие возможности человека как измерительного прибора – а именно в таком качестве выступают участники ЭИП. Как показывают результаты психологических исследований, при разработке ЭИП следует ориентироваться на две операции эвристического оценивания – упорядочение и назначение вероятного диапазона значений показателя. Первая из этих операций рассмотрена выше. Сформируем основной принцип, реализуемый далее при осуществлении второй операции.
Оцениваемые значения тех или иных показателей, характеризующих качество принимаемых УР, представляют собой случайные величины, исчерпывающей характеристикой которых являются законы распределения. Конкретный вид закона распределения определяется физическими, экономическими или другими объективными закономерностями, а параметры обычно оцениваются на основе статистических данных. В рассматриваемой задаче вследствие большого разнообразия ситуаций принятия УР и свойств, степень выраженности которых требуется оценить, могут встречаться различные законы распределения. Выбор конкретного закона – задача, решаемая в каждом конкретном случае специалистами. Вместо необходимых для оценки параметров этих законов статистических данных можно использовать эвристическую информацию. В этом и состоит особенность ЭИП в интервальных шкалах.
Информация о значениях показателей, заменяющая отсутствующую статистику, может быть получена от членов ГЭ и обработана различными методами. Наиболее простой и потому, наверное, часто применяемый, заключается в том, что членов ГЭ просят оценить ожидаемое значение показателя в единицах его измерения. Пусть n членов ГЭ оценивают значение показателя x, определяющего последствия принятия УР. Поскольку значение этого показателя является случайной величиной, полученные оценки x 1, x 2,…, xi,…, xn можно рассматривать как отдельные независимые реализации этой случайной величины. Используя известные методы математической статистики, на основе полученной информации можно получить такие характеристики, как выборочное среднее, среднеквадратическое отклонение и др. Такой подход, при всей его простоте, имеет два недостатка: требует привлечения достаточно большого числа экспертов и вызывает трудности сам процесс получения оценок. Обычно специалисты с большой неохотой дают «точечные» оценки значений показателей, предпочитая оценивать некий «доверительный интервал», вероятность попадания в который искомого значения показателя, по их мнению, достаточно велика. При обработке таких интервальных оценок можно исходить из различных предположений о законе распределения прогнозируемой величины. Чаще всего предполагаются равномерное и нормальное распределения, что позволяет использовать достаточно простой и хорошо известный математический аппарат для получения оценок средней величины и погрешности. Вместе с тем, желательно иметь некоторую обобщенную типовую модель распределения, которую можно использовать в большом числе случаев.
При выборе формы типового распределения необходимо учитывать следующие соображения, вытекающие из особенностей УР:
- значения показателей ограничены сверху и снизу, и, если рассматривать их как случайные величины, имеют ограниченную по абсциссе непрерывную, одномодальную функцию распределения;
- значение показателя зависит от различных случайных факторов, каждый из которых в отдельности оказывает на него несущественное влияние. Вместе с тем, имеются факторы, число которых невелико, а влияние существенно. Именно эти факторы приводят к различию значений одноименных показателей в разных случаях принятия УР, и их влияние приводит к асимметрии распределения.
Таким образом, типовое распределение должно быть непрерывным, одномодальным, асимметричным и ограниченным слева и справа по абсциссе. Среди практически применяемых распределений такого класса наибольшей гибкостью обладает b-распределение, которое и целесообразно принять в качестве типового. Математическое ожидание и дисперсия случайной величины, управляемой b-распределением, определяются выражениями M [ x ]=(x min+4 Mo [ x ]+ x max)/6 и D [ x ]=(x max- x min)2/36, в которых x max, x min, Mo [ x ] – соответственно максимальное, минимальное и модальное (наиболее вероятное) значения прогнозируемого показателя. Таким образом, если члены ГЭ могут указать эти значения оцениваемого показателя, то можно определить его математическое ожидание и дисперсию. Если члены ГЭ затрудняются указать модальное значение, можно использовать для определения среднего значения выражение M [ x ]=0.2(3 x min+2 x max) в случаях, когда большее значение показателя соответствует большей выраженности измеряемого им свойства, и выражение M [ x ]=0.2(2 x min+3 x max) – в противоположном случае. Для оценки дисперсии в обоих случаях можно использовать выражение D [ x ]=0.04(x max – x min)2.
Приведенные выражения используются как для обработки информации от каждого члена ГЭ, так и для построения агрегированной оценки показателя. В последнем случае возможны два подхода. В одном в качестве указанных в формулах граничных и модальных оценок используются соответствующие средние значения этих параметров, в другом находят средние значения полученных оценок математического ожидания и дисперсии.
Рассмотренные методы могут быть использованы при реализации ЭИП во всех видах интервальной шкалы, т.е. для прогнозирования значений очень большого числа показателей, отражающих степень выраженности самых разных последствий принимаемых УР или определяющих состояния управляемых процессов.