Анализ матрицы коэффициента корреляции.
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | FLOOR | TIME | |
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | 0.12 | -0.24 | |
| SPACE | 0.81 | 0.89 | 0.66 | 0.11 | -0.01 | ||
| KITCHENSPACE | 0.73 | 0.81 | 0.65 | 0.70 | 0.02 | 0.02 | |
| LIVINGSPACE | 0.62 | 0.89 | 0.65 | 0.52 | -0.03 | -0.03 | |
| MAXFLOOR | 0.62 | 0.66 | 0.70 | 0.52 | 0.28 | 0.02 | |
| FLOOR | 0.12 | 0.11 | 0.02 | -0.03 | 0.28 | 0.12 | |
| TIME | -0.24 | -0.01 | 0.02 | -0.03 | 0.02 | 0.12 |
Шаг 1 А. Анализ первой строчки
Ищем коэффициенты по модулю меньше 0,15 (Слабо связанные с Y).
Если находим такой коэффициент – то полностью его вычёркиваем (и столбец и строчку).
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | ||
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | ||
| SPACE | 0.77 | 0.81 | 0.89 | 0.66 | -0.01 | ||
| KITCHENSPACE | 0.73 | 0.81 | 0.65 | 0.70 | 0.02 | ||
| LIVINGSPACE | 0.62 | 0.89 | 0.65 | 0.52 | -0.03 | ||
| MAXFLOOR | 0.62 | 0.66 | 0.70 | 0.52 | 0.02 | ||
| TIME | -0.24 | -0.01 | 0.02 | -0.03 | 0.02 |
Шаг 1 Б. Анализируем логичность знаков
Анализируем логику каждого знака. Нелогичными могут быть как плюсы, так и минусы.
Например, чем ближе от метро (переменная меньше), тем стоимость выше (переменная больше), соответственно знак коэффициента должен быть отрицательным. В нашем случае так и есть. Следовательно, знак логичен.
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
| SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
| KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
| LIVINGSPACE | 0.52 | -0.03 | ||||
| MAXFLOOR | 0.02 | |||||
| TIME |
Шаг 2. Анализ тела матрицы
Тело матрицы – это всё что ниже первой строчки и до диагонали единиц.
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
| SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
| KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
| LIVINGSPACE | 0.52 | -0.03 | ||||
| MAXFLOOR | 0.02 | |||||
| TIME |
Между факторами не должно быть тесной линейной связи.
Ищем коэффициенты по модулю меньше, чем 0,8.
Если находим факторы по модулю больше 0,8 (мультиколлинеальные), то разводим их в разные модели.
У нас такие пары:
SPACE и KITCHENSPACE
SPACE и LIVINGSPACE
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
| SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
| KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
| LIVINGSPACE | 0.52 | -0.03 | ||||
| MAXFLOOR | 0.02 | |||||
| TIME |
Ищем коэффициенты по модулю от 0,6 до 0,8.
| PRICE | SPACE | KITCHENSPACE | LIVINGSPACE | MAXFLOOR | TIME | |
| PRICE | 0.77 | 0.73 | 0.62 | 0.62 | -0.24 | |
| SPACE | 0.81 | 0.89 | 0.66 | -0.01 | ||
| KITCHENSPACE | 0.65 | 0.70 | 0.02 | |||
| LIVINGSPACE | 0.52 | -0.03 | ||||
| MAXFLOOR | 0.02 | |||||
| TIME |
Первая пара SPACE и MAXFLOOR связаны на 0.66
Связь MAXFLOOR и PRICE составляет 0,62
Зависимость переменных от X должна быть сильнее, чем между собой, тогда разводим.
Шаг 3. Выбороптимальныхмоделей
1) PRICE = f (SPACE; TIME)
2) PRICE = f (KITCHENSPACE; TIME)
3) PRICE = f (LIVINGSPACE; MAXFLOOR; TIME)
4) PRICE = f (MAXFLOOR; TIME)
2017 декабрь 8
Временные ряды
Стационарные и нестационарные временные ряды
Стационарный временной ряд – это ряд, в котором основные характеристики временного ряда (дисперсия и математическое ожидание) не зависят от времени.
А ковариация между двумя соседними уровнями ряда равна нулю (0).
Тренд (T) – это тенденция к росту или к падению. Тренд может быть как линейный, так и нелинейный.
Вторая составляющая временного ряда – сезонность (S). Она может быть квартальная, месячная, суточная и т.д.
Цикл (C). Например, временной ряд погоды из года в год.
Случайная компонента (E).
Случайная компонента во временном ряду присутствует всегда.
Цикличность и сезонность – по сути схожие компоненты.
Аддитивный временной ряд представляет собой сумму компонент.

«Коридор», в котором он колеблется всегда одинаковый.
В аддитивном ряду сумма сезонных компонент равна нулю (0).
Мультипликативный временной ряд представляет собой произведение компонент.

В нем динамика либо нарастает, либо убывает, т.е. он не постоянен.
В мультипликативном временном ряду:
1) Сумма сезонных компонент равна числу периодов.
2) Произведение сезонных компонент равно единице (1).








Champagne sin(0,52n) cos(0,52n)









