Фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Например, в результате опроса группы людей 0 может означать, что опрашиваемый — мужчина, а 1 — женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд.
Фиктивные переменные (ФП) в уравнении множественной регрессии (МР).
Иногда необходимо включить в модель фактор, имеющий качественную характеристику (пол, профессия). Т.к. эти переменные не поддаются количественной оценке им нужно присвоить им цифровые метки, т.е. преобразовать качественные переменные в количественные = «Фиктивные переменные», или «структурные переменные».
|
|
Если (С2= «Москвич»;1; если (С2= «Жигули»;2;…()))). В новом столбце названия заменяются цифрами.
Сервис/анализ данных/регрессия – Находим У теор.
У теор (x1i,x2i) = a*+b1**x1i+b2**x2i…
Можно улучшить качество уравнения за счет введения дополнительных фиктивных переменных. Количество переменных = число градаций -1. Т.е. пусть марок машин 4. Тогда вводим 4-1 = 3 фиктивные переменные.
Х22i = 1,если марка=2, = 0, в противном случае;
Х23i=1,если марка = 3, =0, в противном случае;
Х24i = 1, если марка =4, = 0, в противном случае.
Т.е. вместо столбца «С» вводим три новых столбца Х22i Х23i Х24i. Т.е. вместо второй переменной вводим три фиктивные переменные.
Y teor = a*+b1**x1i+b22**x22i+b23**x23i+b24**x24i.
Чтобы модель была хорошая, нужно, чтобы Fфакт был больше Fтабл, при?=0,05 и 1-?=0,95 при v1=m, v2=n-m-1
Если в регрессии получаются такие данные:
Р значения
У пересечение a* 0,02
Переменная 1 b1* 0,54
Переменная 2 b2* 0,06
Переменная 3 b3* 0,08
Переменная 4 b4*
То 1му коэффициенту можно верить с вероятностью 1-0,02= 0,98, 2й коэффициент незначим, т.к. вероятность очень низкая 1-0,54 = 0,46. Если все коэффициенты меньше 0,05, то модель хорошая.
Также для улучшения модели включаем логарифмы: вместо У теор находим ln У теор по той же формуле. Еще более точное значение можно получить:
ln У теор = a*+b1**x1i+b2**x2i+b3**x3+b4*x2i^2
Модель улучшается, когда значение Rквадрат (из таблицы регрессии) улучшается (приближается к 1), При этом значения У теор при фиктивных переменных приближены к реальным значениям.
Среди моделей с ФП наибольшими прогностическими возможностями обладают модели, в которых зависимая переменная у рассматривается как функция ряда экономических факторов xi и фиктивных переменных zi (отражают различия в формировании результативного признака по отдельным группам единиц совокупности, т.е. в результате неоднородной структуры пространственного или временного характера.)
|
|
Перечислите виды фиктивных переменных. (Сезонные ФП, ФП наклона, ФП взаимодействия).Примеры.
- Обычные(ФП совокупности, качественные, имеющие 2 градации)
- ранговые (имеющ несколько градаций, могут быть введены в уравнение сами или заменены на к-1 ФП)
- сезонные (спрос на путевки, сезонный спрос на товары)
- можно комбинировать виды ФП, создавая переменные взаимодействия соответствующих эффектов(ФП для наклона) - комбинация качественной и количественной ФП, взаимосвязь возраста и зп
Дайте классификацию моделей с дискретными заивисимыми переменными.
Некоторая эк. Единица(субъект) делает выбор между 2мя и более возможными альтернативами: внедрять новую технологию или нет, работать или нет, покупать или нет, выбор профессии, голосование. В бинарную модель входят зависимые переменные.
В чем состоит суть моделей бинарного выбора?
Модели бинарного выбора используются, когда субъект совершает
выбор между двумя возможными альтернативами. Выбор основывается на
наборе некоторых входных факторов, характеризующих альтернативы и
субъект. Обозначим сделанный выбор переменной Y, которая принимает
значение 0, когда выбрана первая альтернатива, иначе значение 1.
Входные факторы могут выражать и качественные, и количественные
признаки. социологический опрос или маркетинговые исследования, где выбор
между альтернативами зависит от предпочтений выбирающего и
характеристик объекта исследования.