Основная цель - используется для принятия решения о том, какие переменные различают (дискриминируют) две или более возникающие совокупности (группы).
Пример:
1) Исследование в области образования - какие переменные относят выпускника средней школы к одной из трех категорий:
(1) поступающий в колледж;
(2) поступающий в профессиональную школу;
- (3) отказывающийся от дальнейшего образования.
Собираются данные о различных переменных, связанных с учащимися школы.
В начале осени учащиеся естественно должны попасть в одну из названных категорий.
Результаты Дискриминантного анализа можно использовать для определения того, какие переменные дают наилучшее предсказание выбора учащимися дальнейшего пути.
2) Медик может регистрировать различные переменные, относящиеся к состоянию больного, чтобы выяснить, какие переменные лучше предсказывают, что пациент:
выздоровел полностью (группа 1);
частично (группа 2);
- не выздоровел (группа 3).
Основная идея (Д.А.) - определить, отличаются ли совокупности по среднему какой-либо переменной, а затем использовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе.
|
|
Вычислительный подход
Дисперсионный анализ.
1) Задача о функции дискриминации может быть перефразирована как задача одновходового дисперсионного анализа (АNOVА): являются ли две или более совокупности значимо отличающимися одна от другой по среднему значению какой-либо конкретной переменной (если среднее значение определенной переменной значимо различно для двух совокупностей, то можно сказать, что переменная разделяет данные совокупности).
Многомерные переменные: обычно имеются несколько переменных, и задача состоит в том, чтобы установить, какие из переменных вносят свой вклад в дискриминацию между совокупностями.
2) В этом случае будем иметь матрицу общих дисперсий и внут-ригрупповых дисперсий. Для того, чтобы определить, имеются ли значимые различия между группами (с точки зрения всех переменных) применяется процедура Многомерного дисперсионного анализа (МАNOVА): в случае обнаружения статистической значимости, выясняем - какие из переменных имеют значимо различные средние для каждой из совокупностей.
Основное правило - если производится дискриминация между совокупностями, то должно быть заметно различие между средними.
Построение модели
Наиболее общее применение дискриминантного анализа включение в исследование многих переменных с целью определения тех из них, которые наилучшим образом разделяют совокупности между собой.
Модель: - хотим построить "модель", позволяющую лучше всего предсказать, к какой совокупности будет принадлежать тот или иной элемент (объект).