Модели регрессии с переменной структурой

Изучаемый вопрос:

§ модели регрессии с переменной структурой.

При работе с теоретическим материалом следует разобрать пример решения задачи и ответить на контрольные вопросы, приведенные в конце темы.

Как правило, в регрессионных моделях в качестве объясняющих рассматривают количественные переменные. Однако в некоторых случаях возникает необходимость учесть влияние качественных признаков на результативную переменную. К качественным переменным можно отнести пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т. д.

Для учета влияния качественных признаков необходимо исследовать регрессионные модели с переменной структурой. В таких моделях влияние качественных факторов учитывается путем введения так называемых фиктивных переменных.

Фиктивные переменные – это переменные с дискретным множеством значений, которые количественным образом описывают качественные признаки. Как правило, фиктивные переменные принимают два значения: единица, если данный признак присутствует, и ноль при его отсутствии.

Если включаемый в рассмотрение качественный признак имеет не два, а несколько значений, то используют несколько фиктивных переменных, число которых должно быть на единицу меньше числа значений признака.

Парная регрессионная модель с фиктивной переменной имеет вид

,

где – параметры модели, – значение факторной переменной в наблюдении i, z – фиктивная переменная:

Значение фиктивной переменной называется базовым.

Для того чтобы дать интерпретацию параметру d, определим условное математическое ожидание зависимой переменной:

,

.

Таким образом, величина d представляет собой среднее изменение изучаемого признака при переходе из одной категории в другую при неизменных значениях остальных параметров.

Проверка статистической значимости параметра d показывает, влияет ли данный качественный признак на зависимую переменную или нет.

Из модели, включающей фиктивные переменные, можно вывести частные уравнения регрессии для различных частей полной выборочной совокупности.ию модели, если качественная переменная имеет

Введение в регрессию фиктивных переменных существенно улучшает качество ее оценки.

Пример 2.3.1

Имеются следующие данные о заработной плате 12 сотрудников фирмы (тыс. руб.) в зависимости от их стажа работы x (лет).

№ п/п y x z № п/п y x z
               
               
               
               
               
               

Есть основание полагать, что на размер заработной платы влияет не только стаж работы, но и фактор наличия (z =1) или отсутствия (z =0) высшего образования.

Требуется построить уравнение парной регрессии y от x, а также уравнение множественной регрессии с использованием фиктивной переменной для фактора “образование”. Для каждого уравнения регрессии рассчитать выборочный коэффициент детерминации и проверить его значимость. Оценить статистическую значимость параметра регрессии при фиктивной переменной.

Решение. Результат оценивания парной регрессии y от x с использованием функции ЛИНЕЙН MS Excel:

, F= 5,25.

Под коэффициентами в скобках указаны их стандартные отклонения.

Величина коэффициента детерминации показывает, что лишь 34,4 % вариации зависимой переменной объясняется факторной переменной.

Спецификация модели с фиктивной переменной z, учитывающей наличие высшего образования, имеет вид:

.

Величина d имеет смысл среднего изменения зарплаты при переходе из одной категории (без высшего образования) в другую (с высшим образованием).

Оцененная модель принимает вид:

, F= 35,45.

При уровне значимости Fкр=F (0,05; k1=m= 2; k2=n-m- 1=9)=4,26. Поскольку F>Fкр, то коэффициент детерминации признается статистически значимым.

Для проверки гипотезы о несущественном различии в зарплате между категориями H0: d= 0вычислим t -статистику . Значение критической точки найдем с помощью функции СТЬЮДРАСПОБР:

Поскольку , то нулевая гипотеза отвергается и наличие высшего образования оказывает существенное влияние на уровень зарплаты сотрудника фирмы.

Из оцененного уравнения регрессии можно получить частные уравнения регрессии, для каждой из категорий сотрудников:

при z =0 (для сотрудников без высшего образования);

при z =1 (для сотрудников с высшим образованием).

Вопросы для самопроверки

1. При каких условиях строится уравнение множественной регрессии с фиктивными переменными?

2. Что представляет собой фиктивная переменная?

3. Каков смысл значения параметра модели при фиктивной переменной?

4. Сколько фиктивных переменных следует ввести в спецификацию модели, если качественная переменная имеет k альтернативных значений?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: