Дискриминантный анализ

Дискриминантный анализ — анализ различий заранее заданных групп объектов исследования (потребителей, товаров, брендов и т.п.). Переменная, разделяющая совокупность объектов исследования на группы, называется группирующей.

С помощью дискриминантного анализа изучаются различия между двумя или более группами по определенным признакам. Признаки, используемые для выявления различий между группами, называются дискриминационными переменными.

С точки зрения теории статистики группирующая переменная должна быть номинальной, т.е. измеряться по номинальной шкале, а зависимые переменные — метрическими (см. подраздел 2.3 «Типы шкал измерения переменных»). Соблюдение этого условия обеспечивает высокую точность статистических расчетов. Однако на практике при использовании SPSS допускается, что группирующая переменная может быть номинальной или порядковой, а дискриминационные переменные могут измеряться по шкале любого типа.

Дискриминантный анализ схож с множественно-регрессионным анализом, однако существует различие: при регрессионном анализе зависимая переменная является количественной, а в дискретном анализе - качественной.

ДЛЯ ЧЕГО ЭТО НУЖНО?

· Поиск наиболее сильных различий между сегментами.

· Оценка устойчивости сегментации.

· Воспроизведение сегментации с помощью обучения новой выборки по данным прошлых волн.

· Восстановление пропущенных значений.

КАК ЭТО РАБОТАЕТ?

На входе анализа – категориальная переменная, содержащая принадлежность к классам (например, сегментация, или потребление продуктов или брендов), и набор независимых переменных, измеренных по интервальным или дихотомическим шкалам. При этом категориальная переменная может иметь пропуски, т.е. не для всех респондентов будет заполнена: алгоритм самостоятельно предскажет эти значения.

С помощью статистического критерия (чаще всего используют критерий Фишера) алгоритм ищет такую комбинацию линейных уравнений (дискриминантных функций), которая наилучшим образом опишет различия между группами.

Первая дискриминантная функция отделяет первую группу от групп 2, 3, … N, вторая – вторую группу от групп 3, 4, … N и т.д. В итоге все N групп получаются отделёнными друг от друга дискриминантными функциями. Это даёт возможность определить вероятность принадлежности респондента к тому или иному классу.