double arrow

Дискриминантный анализ

1


Дискриминантный анализ — анализ различий заранее заданных групп объектов исследования (потребителей, товаров, брендов и т.п.). Переменная, разделяющая совокупность объектов исследования на группы, называется группирующей.

С помощью дискриминантного анализа изучаются различия между двумя или более группами по определенным признакам. Признаки, используемые для выявления различий между группами, называются дискриминационными переменными. Дискриминантный анализ, как и кластерный, относится к классификационным видам анализа.

Результатом дискриминантного анализа является построение дискриминантной модели (дискриминантной функции), которая имеет вид:

d = а + b1x1 + b2x2 +… + bnxn,

где d — группирующая (зависимая) переменная;

bn — коэффициенты дискриминантной функции;

а — свободный член (константа);

xn — дискриминационные (независимые) переменные.

С помощью этой модели, зная характеристики объекта исследования, можно с определенной степенью уверенности определить его принадлежность к одной из исследованных групп.

Для того чтобы построить дискриминантную модель, следует сначала выяснить, все ли выбранные дискриминационные переменные в действительности служат отличительными признаками исследуемых групп. Только после этого можно построить дискриминантную модель.

Информация по группирующей переменной в нашем исследовании формируется из ответов респондентов на вопрос анкеты «Как часто Вы покупаете питьевой йогурт?» В качестве ответа на этот вопрос респондентам предлагается выбрать один или нескольких вариантов из 5 предложенных ответов.
Для дискриминантного анализа за независимые необходимо принимать социально-демографические характеристики опрошенных, такие как пол, возраст, среднемесячный доход, количество членов семьи, род занятий. Т.к. из такого рода переменных в нашем исследовании можно выделить только пол, возраст и среднемесячный доход.
Процедура выполнения дискриминантного анализа состоит из следующих этапов:
1.Определение зависимой и независимой переменной(переменных);

2. Выбор метода дискриминационного анализа;

3. определение коэффициентов дискриминантной функции;

4. Определение значимости дискриминантной функции;

5.Интерпретация полученных результатов.

6. Оценка достоверности дискриминационного анализа.

В целом при выполнении дискриминационного анализа решаются следующие задачи:

-оценивается выбор дискриминационных переменных.

-строится дискриминационная модель.

-оценивается точность прогнозов на основе построенной дискриминационной модели.

Оценка выбора дискриминационных переменных

Оценка выбора дискриминационных переменных представляет собой первый этап интерпретации результатов дискриминационного анализа.

Нулевая гипотеза Но звучит следующим образом: частота покупки питьевого йогурта не зависит от пола, возраста и уровня доходов респондентов.

В таблице 1 представлен обзор действительных и пропущенных значений.

Сводка результатов обработки наблюдений
Невзвешенные наблюдения N Процент
Валидные   99,5
Исключенные Пропущенные или лежащие вне диапазона коды группирующей переменной   ,0
По крайней мере одна пропущенная дискриминантная переменная   ,5
Оба групповых кода пропущены или лежат вне диапазона, и отсутствует по крайней мере одна дискриминантная переменная.   ,0
Итого искл.   ,5
Всего набл.   100,0

Исходя из данных, представленных в таблице, число респондентов принявших участие в опросе, составляет 204 человека; из этих данных 203 анкет являются действительными, т.е. только эти наблюдения используются при расчетах для построения дискриминантной функции. Данные по остальным респондентам исключены из анализа в виду отсутствия данных по ответам на нужные вопросы. У нас была исключена 1 анкета.

Далее рассмотрим статистические показатели в группах. Они дают общее представление о том, являются ли дискриминационные переменные отличительными признаками исследуемых групп.

Групповые статистики
Как часто вы покупаете питьевые йогурты? Среднее Стд.отклонение Кол-во валидных (искл.целиком)
Невзвешенные Взвешенные
покупаю ежедневно Пол 1,83 ,389   12,000
возраст 2,17 1,467   12,000
Укажите ваш доход 1,83 ,835   12,000
покупаю несколько раз в неделю Пол 1,79 ,407   68,000
возраст 2,09 1,301   68,000
Укажите ваш доход 2,35 1,019   68,000
покупаю изредка Пол 1,72 ,454   67,000
возраст 2,36 1,215   67,000
Укажите ваш доход 2,99 1,066   67,000
покупаю редко, но в большом количестве Пол 1,25 ,500   4,000
возраст 3,75 1,500   4,000
Укажите ваш доход 3,25 ,957   4,000
покупаю без особой периодичности Пол 1,67 ,474   52,000
возраст 2,33 1,279   52,000
Укажите ваш доход 2,56 1,243   52,000
Итого Пол 1,73 ,446   203,000
возраст 2,28 1,291   203,000
Укажите ваш доход 2,60 1,127   203,000

Т. к. зависимая переменная имеет 5 категорий, то был выбран метод множественного дискриминантного анализа. Используя данный метод, можно вычислить несколько дискриминантных функций.

(*********здесь вставить те 5 групп, которые ты писала в документе у себя, когда мы делали. Я просто не скинула его себе*************)


Таблица
– Тест на равенство средних значений в группах

Критерий равенства групповых средних
  Лямбда Уилкса F ст.св1 ст.св2 Знч.
Пол ,962 1,937     ,004
возраст ,965 1,802     ,003
Укажите ваш доход ,911 4,854     ,001

Примечание – Источник: Собственная разработка на основе программы SPSS.

Для проведения теста на равенство средних значений в группах в качестве тестовой величины используется лямбда Уилкса. Проанализировав полученные значения, можно сделать вывод о том, что значение 0,05 не превышает ни одна из заявленных переменных. Это означает, что различия между средними значениями дискриминационных переменных в исследуемой группе являются статистически значимыми, т.е. они могут выступать в качестве дискриминационной переменной.

После изменения состава дискриминационных переменных и вновь проведённого анализа число действительных значений 204 и значения величины лямбды Уилкса остались без изменений.

Критерий равенства групповых средних
  Лямбда Уилкса F ст.св1 ст.св2 Знч.
Пол ,962 1,937     ,004
возраст ,965 1,802     ,003
Укажите ваш доход ,911 4,854     ,001

Примечание – Источник: Собственная разработка на основе программы SPSS.

Таблица

Объединенные внутригрупповые матрицы
  Пол возраст Укажите ваш доход
Корреляция Пол 1,000 -,034 -,110
возраст -,034 1,000 ,466
Укажите ваш доход -,110 ,466 1,000

Примечание – Источник: Собственная разработка на основе программы SPSS.

В этой таблице представленное осреднённое значение коэффициента корреляции между независимыми переменными дискриминантной функции для обеих исследуемых групп. По данным этой таблицы коэффициент корреляции между переменными составляет -0,034 и -0,110, что меньше 0,5. Это доказывает отсутствие корреляционной связи между этими переменными.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  


1

Сейчас читают про: