Пусть — оценка плотности распределения при-
чем, как и раньше, под подразумевается .
Необходимо найти такую оценку, которая обеспечила бы минимизацию среднеквадратичной ошибки (интегрального квадратичного показателя качества), определяемой как
(4.6.47)
где — весовая функция.
Воспользуемся разложением оценки в ряд
где —коэффициенты, подлежащие определению, а —
множество заданных базисных функций.
Подстановка (4.6.48) в соотношение (4.6.47) дает
(4.6.49)
Требуется найти такие коэффициенты которые обеспечат
минимизацию интеграла вероятности ошибки R. Необходимое условие минимальности интеграла вероятности ошибки R заключается в том, что
(4.6.50)
Взяв частную производную, получим
Взглянув на правую часть уравнения (4.6.51), нетрудно убедиться в том, что она по определению равна математическому ожиданию функции . В соответствии с нашим предыдущим анализом математическое ожидание можно аппроксимировать выборочным средним, т. е.
(4.6.52)
Подстановка этой аппроксимирующей оценки в уравнение (4.6.51) дает
|
|
(4.6.53)
Если базисные функции выбраны таким образом, что
они ортогональны весовой функции , то из определения
ортогональности следует
Подстановка (4.6.54) в уравнение (4.6.53) приводит к следующему соотношению, позволяющему вычислить искомые коэффициенты:
Если базисные функции ортонормированны, то
для всех Кроме того, поскольку члены не зависят от
и, следовательно, для всех коэффициентов одинаковы, то их можно исключить из аппроксимирующего выражения без всякого ущерба для классификационной мощности коэффициентов. В таком случае
После того как коэффициенты определены, с помощью формулы (4.6.48) формируется оценка плотности распределения
Для того чтобы применение выражений (4.6.48) и (4.6.55) или (4.6.56) приводило к успеху, необходимо иметь в виду два существенных обстоятельства. Во-первых, следует полностью отдавать себе отчет в том, что качество аппроксимации с помощью выбранной системы базисных функций зависит от числа m членов разложения. Поскольку, по всей вероятности, вид плотности распределения нам не известен, оценить
качество аппроксимации при помощи непосредственного
сравнения невозможно. С другой стороны, так как оценка
отыскивается для того, чтобы построить байесовский классификатор, то заботиться следует только о качестве распознавания, доступном этому классификатору. Последнее можно установить непосредственно в эксперименте с обучающей выборкой. Если при некоторой оценке качество классификации оказывается неудовлетворительным, следует попробовать увеличить число базисных функций и посмотреть, приводит ли улучшение качества оценки к улучшению качества классификатора.
|
|
Эту процедуру можно продолжать вплоть до наступления «насыщения» (когда введение дополнительных членов не производит никакого либо очень малый эффект) или до тех пор, пока число членов не начнет превосходить допустимую величину.
Вторым важным моментом является выбор базисных функций. Так, например, если плотность распределения имеет синусоидальный характер, а для разложения оценки использован степенной ряд, то очевидно, что число членов будет значительно больше, чем при выборе синусоидальных базисных функций. Естественно, при отсутствии априорных сведений о характере плотности распределения базисные функции в первую очередь должны выбираться исходя из простоты реализации. Все, что можно было бы сказать об общих правилах выбора базисных функций, сводится к тому, что при выполнении условия линейной независимости и некоторых других не очень жестких ограничений на вид плотности распределения можно доказать сходимость при и . Отметим, что ортогональность является частным случаем линейной независимости.