Проверка гипотез в маркетинговых исследованиях

Гипотеза – это утверждение о наличие связи или различий между параметрами генеральной совокупности.

Целью проверки гипотезы является получение возможности распространения выводов выборочного исследования на всю генеральную совокупность. Гипотезы проверяются только в том случае, если использовался вероятностный метод выборки.

Различают 2 типа гипотез:

1. Гипотезы о различиях между параметрами генеральной совокупности.

2. Гипотезы о наличии связи между параметрами генеральной совокупности.

Вторая группа гипотез требует перед их проверкой построения таблиц сопряженности признаков (таблиц кросс-табуляции).

Таблицы сопряженности признаков (таблицы кросс-табуляции) отражают совместное распределение частот двух или более переменных с ограниченным числом категорий и позволяют выявить наличие сопутствующей вариации между ними.

Например, рабочей гипотезой маркетингового исследования была гипотеза о наличии связи между частотой посещения фитнес клуба и возрастом респондентов. Для проверки данной гипотезы на основании полученных в ходе исследования данных была построена таблица кросс-табуляции (таблица 2.1).

Таблица 2.1

Связь частоты посещения фитнес клуба с возрастом

Частота посещения фитнес клуба возраст Всего (чел.)
До 30 30-40 Старше 40
Часто        
Редко        
Всего (чел.)        

Анализ распределений частот по двум переменным позволяет выявить наличие сопутствующей вариации между частотой посещения фитнес клуба и возрастом и выдвинуть гипотезу о том, что наиболее часто посещают фитнес клуб молодые люди. Далее данная гипотеза должна пройти процедуру статистической проверки.

Проверка любой гипотезы представляет собой процесс, состоящий из последовательных этапов. Рассмотрим этапы проверки гипотезы более подробно.

1. Формулировка нулевой (Но) и альтернативной (Н1) гипотез.

Нулевая гипотеза (Но) – это утверждение о том, что между определенными параметрами генеральной совокупности (средними или долями) отсутствует связь или различия.

Альтернативная гипотеза (Н1) противоположена нулевой, и представляет собой утверждение о том, что между определенными параметрами генеральной совокупности (средними или долями) существует связь или различия.

Необходимо помнить, что проверяется всегда нулевая гипотеза.

Если нулевую гипотезу отклоняют, то принимают альтернативную гипотезу и наоборот.

Например: рабочей гипотезой маркетингового исследования была гипотеза о том, что средняя частота покупки модной одежды в сезон выше в группе респондентов с высоким доходом (μ1) по сравнению с группой респондентов со средним доходом (μ2). Формулировку нулевой и альтернативной гипотез можно записать следующим образом:

Но: μ1 = μ2

Н1: μ1 ≠ μ2

В рассматриваемом примере для проверки гипотезы используют двусторонний критерий, так как альтернативная гипотеза не имеет четко выраженной направленности: средняя частота покупки модной одежды в группе респондентов с высокими доходами отличается (не равна, может быть как больше, так и меньше) средней частоты покупки модной одежды в группе респондентов со средними доходами.

Гипотезу о различиях можно сформулировать по-другому с использованием одностороннего критерия проверки:

Но: μ1 = μ2

Н1: μ1 > μ2

Односторонний критерий является более мощным критерием, и в практике маркетинговых исследований используется чаще.

2. Выбор подходящего метода проверки нулевой гипотезы.

Методов проверки гипотез (статистических критериев) очень много, задача выбрать из них подходящий. Выбор критерия главным образом определяется:

· количеством выборок (одна выборка, две выборки, три выборки и больше); если выборка одна, то в этом случае параметр генеральной совокупности сравнивается с условной величиной;

· типом выборок (зависимые и независимые);

· размером выборки (различают большие выборки (n>30 респондентов) и малые (n<30);

· сущностью проверяемой гипотезы: выделяют гипотезы о связях и гипотезы о различиях;

· другими факторами.

Чаще всего для проверки гипотез используются: z-критерий, t-критерий, F-критерий, χ2-критерий.

На данном этапе необходимо выбрать формулу расчета критерия проверки и рассчитать его значение.

3. Выбор уровня значимости.

Необходимо помнить, что какой бы выбор не был сделан, всегда существует вероятность совершения ошибки. Различают ошибку первого рода (α -ошибку) – это ошибка имеет место тогда, когда по результатам выборочного исследования нулевую гипотезу отклоняет, а она на самом деле оказывается верной. Вероятность совершения ошибки первого рода называют уровнем значимости. Он устанавливается исследователем самостоятельно. В маркетинговых исследованиях принято устанавливать уровень значимости равным 0,01 или 0,05. Таким образом, если гипотеза принимается, то говорят, что она принимается на уровне значимости равном α (альфа), то есть с вероятностью совершения ошибки первого рода, равном α.

4. Нахождение критического значения критерия проверки гипотезы

Критическое значение определяют в соответствие с заданным уровнем значимости по соответствующей критерию проверки таблице распределения. Например, если критерием проверки нулевой гипотезы являлась z-статистика, тогда критическое значение определяем по таблице z-распределения.

5. Сравнение расчетного значения критерия проверки гипотезы с критическим значением и формулировка соответствующего вывода

Если расчетное значение критерия проверки гипотезы больше его критического значения, тогда нулевая гипотеза отклоняется, она неверна. Если расчетное значение критерия проверки гипотезы меньше его критического значения, тогда нулевая признается верной, отклоняется альтернативная гипотеза.

Рассмотрим пример проверки гипотезы о наличии связи: одной из рабочих гипотез проводимого маркетингового исследования была гипотеза о существовании статистически значимой связи между полом респондентов и частотой посещения салона красоты. В процессе исследования были получены данные, сведенные в таблицу кросс-табуляции (таблица 2.2).

Таблица 2.2

Связь частоты посещения салонов красоты с полом респондентов

Частота посещения салона красоты пол Всего (чел.)
мужчины женщины
Часто (1)      
Редко (2)      
Всего (чел.)      

В данном случае нулевая гипотеза (Но) утверждает о том, что между двумя переменными (частотой посещения салона красоты и полом) не существует никакой связи.

Проверка нулевой гипотезы осуществляется с помощью χ2-критерия, который рассчитывается по формуле [5]:

 
 

где fo - фактическая частота распределения признаков для ячеек таблицы кросс-табуляции,

fe - теоретическая частота распределения признаков для ячеек таблицы кросс-табуляции.

Теоретическая частота рассчитывается по формуле:

 
 

где nr- итоговое число в строке,

nc- итоговое число в столбце,

n - полный размер выборки.

 
 

Рассчитаем значения теоретических частот для ячеек таблицы кросс-табуляции 2.2.

Рассчитаем значение χ2-критерия:

 
 

Найдем по таблице χ2-распределения критическое значение χ2. Последнее определяется уровнем значимости α и числом степеней свободы df (χ2крит.(α, df)). Зададим уровень значимости α=0,05.

Для критерия хи-квадрат число степеней свободы таблицы сопряженности признаков равно произведению количества строк минус единица на количество столбцов за минусом единицы, т.е. df=(с-1)(r-1). В нашем примере: df=(2-1)(2-1)=1.

Таким образом, по таблице χ2-распределения находим χ2крит.(0,05;1)=3,841.

На последнем этапе сравним расчетное значение χ2-критерия с его критическим значением (Приложение 2): 92,137 > 3,841. Расчетное значения критерия больше его критического значения, следовательно, нулевая гипотеза об отсутствии связи между переменными отвергается. Верна альтернативная гипотеза: между частотой посещения салона красоты и полом респондентов существует статистически значимая связь.

Контрольные вопросы:

1. Назовите основные группы статистических методов анализа данных.

2. Дайте определение одномерным и многомерным методам анализа данных.

3. Назовите основные методы многомерного анализа данных.

4. Что включает в себя предварительный анализ данных?

5. Что включает в себя анализ данных с помощью статистических рядов распределения?

6. Назовите группы обобщающих статистических показателей.

7. Приведите формулы расчета показателей центра распределения.

8. Приведите формулы расчета показателей вариации.

9. Приведите формулы расчета показателей формы распределения.

10.Чем отличается таблица распределения частот от таблицы сопряженности признаков? С какой целью и строят?

11.Представьте классификацию методов проверки гипотез.

12.Опишите обычную процедуру для выполнения проверки гипотезы с помощью t-критерия.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: