Обобщенная формула Байеса

Эта формула относится к случаю, когда обследование проводится по комплексу признаков K, включающему признаки k1,k2..., k_v. Каждый из признаков kj имеет т_j разрядов (k_j₁ k_j₂..., k_jS..., k_jm). В результате обследования становится известной реализация признака kj* = k_js (3.6) и всего комплекса признаков K*. Индекс *, как и раньше, означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид

Р (D_i/K*) = Р (Di) Р (K*/D_i)/P (K*) (i = 1, 2,...,n), (3.7)

где Р ( Di/K*) — вероятность диагноза D после того, как стали известны результаты обследования по комплексу признаков K, Р (Di) — предварительная вероятность диагноза D (по предшествующей статистике).

Формула (3.7) относится к любому из п возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому

(3.8)

В практических задачах нередко допускается возможность существования нескольких состояний А1... An, причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов D_i следует рассматривать отдельные состояния D_i = А 1,..., D_r = А_r и их комбинации

Dr+i = A1ΛA2 ••• и т. п.

В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.

Вероятность появления комплекса признаков K*

. (3.11)

Обобщенная формула Байеса может быть записана так:

(3.12)

где Р (K*/Di) определяется равенством. Из обобщенной формулы Байеса (3.12) вытекает что, разумеется,

(3.13)

и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.

Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления 1-го диагноза и данной реализации комплекса признаков и затем апостериорную вероятность диагноза

Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (3.12).

Если реализация некоторого комплекса признаков K* является детерминирующей (детерминирующая - определяющая направленность, избирательность в зависимости от поставленной задачи.) для диагноза Dp, то этот комплекс не встречается при других диагнозах:

Тогда, в силу равенства (3.12)

Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть — непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.

1 2 3 4

Подборка статей по вашей теме: