Анализ матрицы коэффициента корреляции.
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | FLOOR | TIME | |
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | 0.12 | -0.24 | |
SPACE | 0.81 | 0.89 | 0.66 | 0.11 | -0.01 | ||
KITCHENSPACE | 0.73 | 0.81 | 0.65 | 0.70 | 0.02 | 0.02 | |
LIVINGSPACE | 0.62 | 0.89 | 0.65 | 0.52 | -0.03 | -0.03 | |
MAXFLOOR | 0.62 | 0.66 | 0.70 | 0.52 | 0.28 | 0.02 | |
FLOOR | 0.12 | 0.11 | 0.02 | -0.03 | 0.28 | 0.12 | |
TIME | -0.24 | -0.01 | 0.02 | -0.03 | 0.02 | 0.12 |
Шаг 1 А. Анализ первой строчки
Ищем коэффициенты по модулю меньше 0,15 (Слабо связанные с Y).
Если находим такой коэффициент – то полностью его вычёркиваем (и столбец и строчку).
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | ||
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | ||
SPACE | 0.77 | 0.81 | 0.89 | 0.66 | -0.01 | ||
KITCHENSPACE | 0.73 | 0.81 | 0.65 | 0.70 | 0.02 | ||
LIVINGSPACE | 0.62 | 0.89 | 0.65 | 0.52 | -0.03 | ||
MAXFLOOR | 0.62 | 0.66 | 0.70 | 0.52 | 0.02 | ||
TIME | -0.24 | -0.01 | 0.02 | -0.03 | 0.02 |
Шаг 1 Б. Анализируем логичность знаков
Анализируем логику каждого знака. Нелогичными могут быть как плюсы, так и минусы.
Например, чем ближе от метро (переменная меньше), тем стоимость выше (переменная больше), соответственно знак коэффициента должен быть отрицательным. В нашем случае так и есть. Следовательно, знак логичен.
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
LIVINGSPACE | 0.52 | -0.03 | ||||
MAXFLOOR | 0.02 | |||||
TIME |
Шаг 2. Анализ тела матрицы
Тело матрицы – это всё что ниже первой строчки и до диагонали единиц.
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
LIVINGSPACE | 0.52 | -0.03 | ||||
MAXFLOOR | 0.02 | |||||
TIME |
Между факторами не должно быть тесной линейной связи.
Ищем коэффициенты по модулю меньше, чем 0,8.
Если находим факторы по модулю больше 0,8 (мультиколлинеальные), то разводим их в разные модели.
У нас такие пары:
SPACE и KITCHENSPACE
SPACE и LIVINGSPACE
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
LIVINGSPACE | 0.52 | -0.03 | ||||
MAXFLOOR | 0.02 | |||||
TIME |
Ищем коэффициенты по модулю от 0,6 до 0,8.
PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
LIVINGSPACE | 0.52 | -0.03 | ||||
MAXFLOOR | 0.02 | |||||
TIME |
Первая пара SPACE и MAXFLOOR связаны на 0.66
Связь MAXFLOOR и PRICE составляет 0,62
Зависимость переменных от X должна быть сильнее, чем между собой, тогда разводим.
Шаг 3. Выбороптимальныхмоделей
1) PRICE = f (SPACE; TIME)
2) PRICE = f (KITCHENSPACE; TIME)
3) PRICE = f (LIVINGSPACE; MAXFLOOR; TIME)
4) PRICE = f (MAXFLOOR; TIME)
2017 декабрь 8
Временные ряды
Стационарные и нестационарные временные ряды
Стационарный временной ряд – это ряд, в котором основные характеристики временного ряда (дисперсия и математическое ожидание) не зависят от времени.
А ковариация между двумя соседними уровнями ряда равна нулю (0).
Тренд (T) – это тенденция к росту или к падению. Тренд может быть как линейный, так и нелинейный.
Вторая составляющая временного ряда – сезонность (S). Она может быть квартальная, месячная, суточная и т.д.
Цикл (C). Например, временной ряд погоды из года в год.
Случайная компонента (E).
Случайная компонента во временном ряду присутствует всегда.
Цикличность и сезонность – по сути схожие компоненты.
Аддитивный временной ряд представляет собой сумму компонент.
«Коридор», в котором он колеблется всегда одинаковый.
В аддитивном ряду сумма сезонных компонент равна нулю (0).
Мультипликативный временной ряд представляет собой произведение компонент.
В нем динамика либо нарастает, либо убывает, т.е. он не постоянен.
В мультипликативном временном ряду:
1) Сумма сезонных компонент равна числу периодов.
2) Произведение сезонных компонент равно единице (1).
Champagne sin(0,52n) cos(0,52n)