Метод Отса (определение оптимального порога)

С помощью данного метода вычисляется порог t, минимизирующий среднюю ошибку сегментации, т.е. среднюю ошибку от принятия решения о принадлежности пикселей изображения объекту или фону. Значения яркостей пикселей изображения можно рассматривать как случайные величины, а их гистограмму – как оценку плотности распределения вероятностей. Если плотности распределения вероятностей известны, то можно определить оптимальный (в смысле минимума ошибки) порог для сегментации изображения на два класса c0 и c 1 (объекты и фон).

В дальнейших рассуждениях предполагаем, что:

· изображение представляется с помощью L уровней яркости;

· hi – число элементов изображения, имеющих яркость i, i = 0, 1,..., L- 1;

· H – общее число пикселей на изображении;

· гистограмма изображения является нормализованной и ее можно рассматривать как распределение вероятностей

· элементы изображения делятся на два класса c0 и c 1 с помощью порогового значения t, где класс c0 содержит пиксели с яркостями из множества (0, 1,..., t), а класс c 1 – пиксели с яркостями из множества (t, t +1,..., L – 1). Вероятности каждого из этих двух классов и средние значения их яркости описываются выражениями:

где  означает среднюю яркость всего изображения.

Можно легко проверить, что для любого t справедливо следующее соотношение:

Дисперсии каждого из классов определяются формулами:

Определение оптимального порога можно осуществить на основе оптимизации одной из следующих функций, зависящих от порога t:

где

– дисперсия межклассовая,

– дисперсия внутриклассовая,

– дисперсия совокупная, причем  не зависит от величины порога t и выражается формулой

Стоит отметить, что  требует использования статистик 2-го порядка (дисперсии классов), в то время как – статистик 1-го порядка (средние классов). Поэтому  является наиболее простой мерой, зависящей от величины порога t. Исходя из этого, оптимальный порог  можно вычислить по формуле:

.

Поскольку дисперсия является мерой разброса уровней яркости вокруг среднего значения, то большое ее значение свидетельствует о большом отклонении от среднего. В связи с этим операция нахождения максимума в формуле для определения порога означает увеличение изолированности двух классов на бинаризированном изображении. Итак, для бимодального изображения рассмотренный метод помещает порог между средними значениями яркости объектов и фона так, чтобы максимизировать межклассовую дисперсию .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: