Каковы преимущества метода

Вкупе с кластерным анализом служит эффективным средством сегментирования, позволяет более четко понять различия между сегментами.

Может использоваться для определения силы влияния независимых переменных на зависимую. В этом задача дискриминантного анализа в целом похожа на задачу регрессионного анализа, при этом дискриминантный анализ не имеет такого количества ограничений.

Факторный анализ.

Факторный анализ. Совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволяют выявлять латентные (или скрытые) обобщающие характеристики изучаемых явлений и процессов.

 

ДЛЯ ЧЕГО ЭТО НУЖНО?

· Выявление и анализ латентных переменных, определяющих наблюдаемые признаки.

· Построение агрегированных характеристик (“факторов”), необходимых для дальнейшего использования в задачах сегментирования, моделирования и прогнозирования данных.

 

КАК ЭТО РАБОТАЕТ?

На входе анализа – группа переменных, измеренных по интервальным или дихотомическим шкалам. В случае если в анализ необходимо включить порядковые переменные (например, степень согласия с рядом высказываний, измеренную по 5-балльной шкале), их необходимо предварительно оцифровать (с помощью статистического метода перекодировать в интервальные).

Анализ базируется на предпосылке, что измеряемые эмпирические показатели (переменные) являются следствием некоторых других, глубинных, скрытых от непосредственного измерения характеристик – латентных переменных. Например, когда человек отмечает степень своего согласия с рядом психографических высказываний (об образе жизни), то его ответы обусловлены рядом факторов, в числе которых, к примеру, консерватизм/современность, склонность/несклонность к риску, нацеленность на семью/карьеру, рассудительность/беззаботность и т.д.

Задача анализа – выявить эти факторы. Число выделяемых анализом главных компонент совпадает с числом переменных, включённых в анализ, но для снижения размерности необходимо отобрать лишь некоторые из них, которые наилучшим образом определяют структуру данных.

В задаче отбора главных компонент помогают факторные нагрузки – числа, свидетельствующие о том, насколько лучше/хуже, чем в среднем, данный фактор определяет структуру данных. Чаще всего отбираются главные компоненты с факторными нагрузками большими 1, т.е. те, которые определяют больший процент дисперсии, чем в среднем. Однако часто число факторов выбирается вручную исследователем с учётом теоретических предпосылок и понимания предмета исследования.

 

ЧТО ПОЛУЧАЕМ В ИТОГЕ?

Набор наиболее важных факторов, определяющих ответы на вопросы, включённые в анализ.

Например, фактор «Консерватизм» в большой степени определяет степень согласия с такими высказываниями как «Я не вижу смысла в освоении новых технологий, когда есть старые, проверенные», «Я буду вкладывать деньги только в проверенные банки», «Я уверенно пользуюсь техническими новинками» (в последнем случае люди, обладающие консерватизмом, чаще будут отвечать отрицательно). Фактор «Рассудительность будет определять ответы на вопросы «Я умею экономить», «Я люблю рисковать», «Я живу сегодняшним днем, не заботясь о завтрашнем» – для рассудительных людей будет иметь место склонность к согласию с первым высказыванием и несогласию со вторым.

 

КАКОВЫ ПРЕИМУЩЕСТВА МЕТОДА?

Метод позволяет облегчить работу с данными, уменьшив число факторов, требующих внимания, а также выявлять глубинные критерии потребительского поведения и потребительского выбора.

 

 

Кластерный анализ.

Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается неким набором переменных.

ДЛЯ ЧЕГО ЭТО НУЖНО?

· Сегментация потребителей

· Определение групп связанных признаков (при кластеризации переменных)

Применение методов кластеризации к сегментированию основано на следующих предположениях:

ü во-первых, считается, что по значениям переменных, которыми описываются свойства потребителей, можно выделить группы схожих потребителей.

ü во-вторых, считается, что на выделяемом сегменте можно достигнуть лучших маркетинговых результатов по продвижению продукции. полагается, что более значимо для маркетингового результата, объединение потребителей в группу с учетом мер близости друг к другу. Для обоснования данных предположений используется метод дисперсионного анализа.

КАК ЭТО РАБОТАЕТ?

На входе анализа – набор переменных, описывающих совокупность респондентов. Метод работает с интервальными (например, возраст, доход, оценка степени согласия по 10-балльной шкале и т.д.) и дихотомическими переменными (например, пол, наличие/отсутствие руководящих функций) переменными.

Совокупность из n значений по всем n переменным определяет положение объекта в неком n-мерном пространстве. Исходя из этих координат определяются расстояния между объектами. Для расчёта расстояний чаще всего используется Евклидово расстояние, однако метод расчёта расстояний может варьироваться в зависимости от специфики данных.

Метод группирует схожие (расположенные близко друг к другу) объекты, в результате чего формируется набор из нескольких кластеров.

Число кластеров может определяться автоматически на основе выбранного критерия либо выбираться вручную исследователем с учётом теоретических предпосылок и понимания предмета исследования.

Существует несколько процедур кластеризации, но все они базируются на использовании мер или критериев близости. Наиболее распространенным критерием близости является среднеквадратическая разность.

Евклидово расстояние - расстояние между объектами

d (Xi; Xj) = [å (Xik - Xjk)2 ]2

 

Суть в том, что последовательно объединяются объекты сначала более близкие, а затем все более отдаленные друг от друга. Работа алгоритма заканчивается, когда все объекты будут объединены в один класс. Результатом обычно является графическое изображение, иллюстрирующее вид иерархического дерева (дендрограмма).

Описанный алгоритм не имеет четких правил остановки на каком-то этапе кластеризации. Обычно исследователи принимают во внимание устойчивость групп на протяжении нескольких шагов алгоритма. В кластерном анализе не рекомендуется использовать большое количество факторов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: