Эта формула относится к случаю, когда обследование проводится по комплексу признаков K, включающему признаки k1,k2..., kv. Каждый из признаков kj имеет тj разрядов (kj1 kj2..., kjS..., kjm). В результате обследования становится известной реализация признака kj* = kjs (3.6) и всего комплекса признаков K*. Индекс *, как и раньше, означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид
Р (Di/K*) = Р (Di) Р (K*/Di)/P (K*) (i = 1, 2,...,n), (3.7)
где Р ( Di/K*) — вероятность диагноза D после того, как стали известны результаты обследования по комплексу признаков K, Р (Di) — предварительная вероятность диагноза D (по предшествующей статистике).
Формула (3.7) относится к любому из п возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому
(3.8)
В практических задачах нередко допускается возможность существования нескольких состояний А1... An, причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов Di следует рассматривать отдельные состояния Di = А 1,..., Dr = Аr и их комбинации
|
|
Dr+i = A1ΛA2 ••• и т. п.
В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.
Вероятность появления комплекса признаков K*
. (3.11)
Обобщенная формула Байеса может быть записана так:
(3.12)
где Р (K*/Di) определяется равенством. Из обобщенной формулы Байеса (3.12) вытекает что, разумеется,
(3.13)
и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.
Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления 1-го диагноза и данной реализации комплекса признаков и затем апостериорную вероятность диагноза
Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (3.12).
Если реализация некоторого комплекса признаков K* является детерминирующей (детерминирующая - определяющая направленность, избирательность в зависимости от поставленной задачи.) для диагноза Dp, то этот комплекс не встречается при других диагнозах:
Тогда, в силу равенства (3.12)
Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть — непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.
|
|