Обобщённая формула Байеса

Обобщённая формула Байеса относится к случаю, когда обследование проводится по комплексу признаков K,включающему признаки k 1 ,k 2 ,…,kv. Каждый из признаков kj имеет mj разрядов (kj 1, kj 2 ,…, kjs,…, kjm). В результате обследования становится известной реализация признака

k*j=kjs, (1.6)

и всего комплекса признаков K*. Индекс * означает конкретное значение признака. Формула Байеса для комплекса признаков имеет вид

, (1.7)

где P (Di /K*) вероятность диагноза Di после того, как стали известны результаты обследования по комплексу признаков K; P (Di) – предварительная вероятность диагноза Di (по предшествующей статистике).

Формула (1.7) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний, и потому

. (1.8)

В практических задачах нередко допускается возможность существования нескольких состояний А 1 ,…,Аr, причём некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов Di следует рассматривать отдельные состояния D 1 =A 1 ,…, Dr=Ar и их комбинации Dr+ 1 =A 1 ∩A 2.

Перейдём к определению P (Di/K*). Если комплекс признаков состоит из v признаков, то

, (1.9)

где k*j = kjs – разряд признака, выявившийся в результате обследования.

Для диагностирования по независимым признакам:

. (1.10)

В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними. Вероятность появления комплекса признаков K*

. (1.11)

Это равенство часто называют формулой полной вероятности события К *, происходящего вместе с полной группой событий. Формула полной вероятности является фундаментальной во многих вопросах теории вероятности потому, что она отражает следующий принцип: если система имеет несколько возможных несовместных путей перехода в другое состояния, то вероятность перехода равна сумме вероятностей осуществления каждого из них. Несовместные пути (или события) – это пути (события), которые не могут реализовываться одновременно.

Пример. Применение формулы полной вероятности. Прибор может иметь два режима работы, при этом в нормальном режиме работы прибор может находиться с вероятностью P (D 1)=0,8, а в ненормальном – с вероятностью P (D 2)=0,2. Вероятность поломки прибора в течение заданного интервала времени t при его работе в нормальном режиме составляет P (t / D 1)=0,1, а в ненормальном – P (t / D 2)=0,7. Найти полную вероятность выхода из строя прибора за указанный интервал времени t.

По формуле (1.11) определяем

.

Следовательно, вероятность поломки прибора при его работе в нормальном или ненормальном режимах за интервал времени t составляет 0,22.

 

Обобщённую формулу Байеса можно записать в следующем виде:

, (1.12)

где P (Di / K*)определяется равенством (1.9) и (1.10). Из соотношения (1.12) вытекает

, (1.13)

что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.

Следует обратить внимание на то, что знаменатель обобщённой формулы Байеса одинаков для всех диагнозов. Это позволяет сначала определить вероятности совместного появления данной реализации комплекса признаков и i -го диагноза

. (1.14)

И затем апостериорную вероятность диагноза

. (1.15)

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.

Пример. Применение формулы Байеса. Известно, что 90% подшипников качения вырабатывают ресурс в исправном состоянии. Признак k 1 – повышение температуры масла выше нормальной на 40оС – встречается у исправных подшипников в 5% случаев. Необходимо определить вероятность исправного состояния подшипника при появлении признака k 1. Примем, что D 1 – исправное состояние, а D 2 – неисправное. Положим, что известно: P (D 1)=0,9; P (D 2)=1– P (D 1)=0,1, P (k 1/ D 1)=0,05; P (k 1/ D 2)=0,95. По формуле (1.12)

.

Таким образом, если в процессе наблюдения за состоянием подшипника зафиксировано повышение температуры масла выше нормальной на 40оС, то вероятность исправного состояния подшипника составляет 0,32.

Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза Dp, то этот комплекс не встречается при других диагнозах:

.  

Тогда, в силу равенства (1.12)

. (1.16)

Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть — непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчётном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: