double arrow

Лабораторная работа № 2. Бинарные переменные в моделях множественной регрессии


Имеются данные по однокомнатным квартирам, выставлявшимся на продажу в Москве:

Region район;
Distc удаленность от центра, км.;
Distm удаленность от метро, мин.;
Totsq общий метраж, кв.м.;
Kitsq площадь кухни, кв.м.;
Livsq площадь комнаты, кв.м.;
Floor этаж (0,1) 0 – первый или последний, 1 – средний;
Cat категория дома (0,1), 1–кирпичный, 0 – панельный;
Price цена, тыс. USD.

Задание 1.(Линейная модель множественной регрессии)

1. Скопировать из файла данные для своего варианта. Значения объясняющих переменных для всех вариантов одинаковы. Значения объясняемой переменной Price – по вариантам.

1. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме.

Если не знаете как, вернитесь к описанию лабораторной 1, там все написано.

2. Оцените значимость полученного уравнения.

Если не знаете как, вернитесь к описанию лабораторной 1, там все написано.

3. Определите, какие факторы значимо воздействуют на формирование цены квартиры в этой модели.

Если не знаете как, вернитесь к описанию лабораторной 1, там все написано.

4. С учетом выполненного задания 3 ответьте на вопрос: верно ли утверждение, что этаж влияет на стоимость квартиры.?

5. С учетом выполненного задания 3 ответьте на вопрос: верно ли утверждение, что квартиры в кирпичных домах при прочих равных факторах стоят дороже, чем квартиры в панельных домах.

6. Постройте линейную модель формирования цены квартиры за счет только значимых факторов.

Оставшиеся факторы должны располагаться в соседних столбцах, если это не так, то перед вызовом Пакета анализа скопируйте данные на отдельный лист.

7. Дайте интерпретацию коэффициентов построенной модели со значимыми факторами.

Для количественных факторов интерпретация дается также, как в лабораторной 1. Интерпретацию переменной при качественном факторе рассмотрим на примере. Пусть мы получили таблицу

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение -13,74 5,34 -2,57 0,01 -24,45 -3,02
totsq 1,09 0,20 5,52 0,00 0,69 1,48
kitsq 1,00 0,55 1,82 0,07 -0,10 2,10
floor 5,22 1,62 3,22 0,00 1,96 8,47
cat 10,31 1,61 6,41 0,00 7,08 13,54

 

Делаем вывод: квартиры на средних этажах стоят в среднем на 5,22 тыс. USD дороже, чем квартиры на средних этажах (при прочих равных факторах). Аналогично интерпретируется коэффициент при переменной cat (обратите внимание в каких случаях cat принимает значения 0 и 1).

 

Задание 2.(Степенная модель множественной регрессии)

1. Прологарифмируйте все переменные, кроме бинарных. Почему нельзя логарифмировать бинарные переменные?

2. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в степенной форме. Окончательное уравнение регрессии должно иметь вид:

Это уравнеие легко можно сделать линейным, прологарифмировав. Если затрудняетесь это сделать, посмотрите построение степенной модели в первой лабораторной работе.

3. Оцените значимость полученного уравнения.

4. Определите, какие факторы значимо воздействуют на формирование цены квартиры в этой модели.

5. С учетом выполненного задания 4 ответьте на вопрос: верно ли утверждение, что этаж влияет на стоимость квартиры.?

6. С учетом выполненного задания 4 ответьте на вопрос: верно ли утверждение, что квартиры в кирпичных домах при прочих равных факторах стоят дороже, чем квартиры в панельных домах.

7. Постройте степенную модель формирования цены квартиры за счет значимых факторов.

8. Дайте интерпретацию коэффициентов построенной модели со значимыми факторами.

Для количественных факторов интерпретация дается также, как в лабораторной 1. Интерпретацию переменной при качественном факторе рассмотрим на примере. Пусть мы получили таблицу

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение -0,21 0,55 -0,38 0,71 -1,31 0,90
ln(totsq) 0,91 0,19 4,79 0,00 0,53 1,29
ln(kitsq) 0,22 0,11 2,00 0,05 0,00 0,44
cat 0,23 0,04 5,97 0,00 0,15 0,31
floor 0,13 0,04 3,21 0,00 0,05 0,21

 

Этой таблице соответствует уравнение

Делаем вывод: квартиры на средних этажах стоят в среднем в раза дороже, чем квартиры на средних этажах (при прочих равных факторах). Иными словами, квартиры на средних этажах в среднем на 26% дороже, чем квартиры на крайних этажах. Аналогично интерпретируется коэффициент при переменной cat (обратите внимание в каких случаях cat принимает значения 0 и 1).

Задание 3.

1.Выберите лучшую модель. Обоснуйте свой выбор.

2. Используя выбранную модель, осуществите прогноз цены однокомнатной квартиры, находящейся на расстоянии 10 км от центра, 5 мин. ходьбы до метро, общей площадью 35 кв.м, площадью кухни 8 кв.м, жилой площадью 33 кв.м, расположенной на 1-м этаже кирпичного дома.


Сейчас читают про: