Дискриминантный анализ — анализ различий заранее заданных групп объектов исследования (потребителей, товаров, брендов и т.п.). Переменная, разделяющая совокупность объектов исследования на группы, называется группирующей.
С помощью дискриминантного анализа изучаются различия между двумя или более группами по определенным признакам. Признаки, используемые для выявления различий между группами, называются дискриминационными переменными. Дискриминантный анализ, как и кластерный, относится к классификационным видам анализа.
Результатом дискриминантного анализа является построение дискриминантной модели (дискриминантной функции), которая имеет вид:
d = а + b1x1 + b2x2 +… + bnxn,
где d — группирующая (зависимая) переменная;
bn — коэффициенты дискриминантной функции;
а — свободный член (константа);
xn — дискриминационные (независимые) переменные.
С помощью этой модели, зная характеристики объекта исследования, можно с определенной степенью уверенности определить его принадлежность к одной из исследованных групп.
|
|
Для того чтобы построить дискриминантную модель, следует сначала выяснить, все ли выбранные дискриминационные переменные в действительности служат отличительными признаками исследуемых групп. Только после этого можно построить дискриминантную модель.
Информация по группирующей переменной в нашем исследовании формируется из ответов респондентов на вопрос анкеты «Как часто Вы покупаете питьевой йогурт?» В качестве ответа на этот вопрос респондентам предлагается выбрать один или нескольких вариантов из 5 предложенных ответов.
Для дискриминантного анализа за независимые необходимо принимать социально-демографические характеристики опрошенных, такие как пол, возраст, среднемесячный доход, количество членов семьи, род занятий. Т.к. из такого рода переменных в нашем исследовании можно выделить только пол, возраст и среднемесячный доход.
Процедура выполнения дискриминантного анализа состоит из следующих этапов:
1.Определение зависимой и независимой переменной(переменных);
2. Выбор метода дискриминационного анализа;
3. определение коэффициентов дискриминантной функции;
4. Определение значимости дискриминантной функции;
5.Интерпретация полученных результатов.
6. Оценка достоверности дискриминационного анализа.
В целом при выполнении дискриминационного анализа решаются следующие задачи:
-оценивается выбор дискриминационных переменных.
-строится дискриминационная модель.
-оценивается точность прогнозов на основе построенной дискриминационной модели.
Оценка выбора дискриминационных переменных
|
|
Оценка выбора дискриминационных переменных представляет собой первый этап интерпретации результатов дискриминационного анализа.
Нулевая гипотеза Но звучит следующим образом: частота покупки питьевого йогурта не зависит от пола, возраста и уровня доходов респондентов.
В таблице 1 представлен обзор действительных и пропущенных значений.
Сводка результатов обработки наблюдений | |||
Невзвешенные наблюдения | N | Процент | |
Валидные | 99,5 | ||
Исключенные | Пропущенные или лежащие вне диапазона коды группирующей переменной | ,0 | |
По крайней мере одна пропущенная дискриминантная переменная | ,5 | ||
Оба групповых кода пропущены или лежат вне диапазона, и отсутствует по крайней мере одна дискриминантная переменная. | ,0 | ||
Итого искл. | ,5 | ||
Всего набл. | 100,0 |
Исходя из данных, представленных в таблице, число респондентов принявших участие в опросе, составляет 204 человека; из этих данных 203 анкет являются действительными, т.е. только эти наблюдения используются при расчетах для построения дискриминантной функции. Данные по остальным респондентам исключены из анализа в виду отсутствия данных по ответам на нужные вопросы. У нас была исключена 1 анкета.
Далее рассмотрим статистические показатели в группах. Они дают общее представление о том, являются ли дискриминационные переменные отличительными признаками исследуемых групп.
Групповые статистики | |||||
Как часто вы покупаете питьевые йогурты? | Среднее | Стд.отклонение | Кол-во валидных (искл.целиком) | ||
Невзвешенные | Взвешенные | ||||
покупаю ежедневно | Пол | 1,83 | ,389 | 12,000 | |
возраст | 2,17 | 1,467 | 12,000 | ||
Укажите ваш доход | 1,83 | ,835 | 12,000 | ||
покупаю несколько раз в неделю | Пол | 1,79 | ,407 | 68,000 | |
возраст | 2,09 | 1,301 | 68,000 | ||
Укажите ваш доход | 2,35 | 1,019 | 68,000 | ||
покупаю изредка | Пол | 1,72 | ,454 | 67,000 | |
возраст | 2,36 | 1,215 | 67,000 | ||
Укажите ваш доход | 2,99 | 1,066 | 67,000 | ||
покупаю редко, но в большом количестве | Пол | 1,25 | ,500 | 4,000 | |
возраст | 3,75 | 1,500 | 4,000 | ||
Укажите ваш доход | 3,25 | ,957 | 4,000 | ||
покупаю без особой периодичности | Пол | 1,67 | ,474 | 52,000 | |
возраст | 2,33 | 1,279 | 52,000 | ||
Укажите ваш доход | 2,56 | 1,243 | 52,000 | ||
Итого | Пол | 1,73 | ,446 | 203,000 | |
возраст | 2,28 | 1,291 | 203,000 | ||
Укажите ваш доход | 2,60 | 1,127 | 203,000 |
Т. к. зависимая переменная имеет 5 категорий, то был выбран метод множественного дискриминантного анализа. Используя данный метод, можно вычислить несколько дискриминантных функций.
(*********здесь вставить те 5 групп, которые ты писала в документе у себя, когда мы делали. Я просто не скинула его себе*************)
Таблица – Тест на равенство средних значений в группах
Критерий равенства групповых средних | |||||
Лямбда Уилкса | F | ст.св1 | ст.св2 | Знч. | |
Пол | ,962 | 1,937 | ,004 | ||
возраст | ,965 | 1,802 | ,003 | ||
Укажите ваш доход | ,911 | 4,854 | ,001 |
Примечание – Источник: Собственная разработка на основе программы SPSS.
Для проведения теста на равенство средних значений в группах в качестве тестовой величины используется лямбда Уилкса. Проанализировав полученные значения, можно сделать вывод о том, что значение 0,05 не превышает ни одна из заявленных переменных. Это означает, что различия между средними значениями дискриминационных переменных в исследуемой группе являются статистически значимыми, т.е. они могут выступать в качестве дискриминационной переменной.
После изменения состава дискриминационных переменных и вновь проведённого анализа число действительных значений 204 и значения величины лямбды Уилкса остались без изменений.
Критерий равенства групповых средних | |||||
Лямбда Уилкса | F | ст.св1 | ст.св2 | Знч. | |
Пол | ,962 | 1,937 | ,004 | ||
возраст | ,965 | 1,802 | ,003 | ||
Укажите ваш доход | ,911 | 4,854 | ,001 |
Примечание – Источник: Собственная разработка на основе программы SPSS.
|
|
Таблица
Объединенные внутригрупповые матрицы | ||||
Пол | возраст | Укажите ваш доход | ||
Корреляция | Пол | 1,000 | -,034 | -,110 |
возраст | -,034 | 1,000 | ,466 | |
Укажите ваш доход | -,110 | ,466 | 1,000 |
Примечание – Источник: Собственная разработка на основе программы SPSS.
В этой таблице представленное осреднённое значение коэффициента корреляции между независимыми переменными дискриминантной функции для обеих исследуемых групп. По данным этой таблицы коэффициент корреляции между переменными составляет -0,034 и -0,110, что меньше 0,5. Это доказывает отсутствие корреляционной связи между этими переменными.