Регрессия и корреляция данных

 

Для начала нам следует убедиться, что цена на золото и указанные выше параметры действительно взаимосвязаны. Для этого нам придется построить матрицу парных корреляций, чтобы понять, нет ли лишних данных среди тех, которые мы собираемся использовать.

С помощью программы Statistica 6.1 построим матрицу парных корреляций:

 

Рисунок 2 –Матрица парных корреляций

Как видно из рисунка 2 – практически все выбранные нами параметры статистически значимы при построении данной модели. Также можно заметить и то, что из входных данных наиболее сильно между собой связаны изменения курсов платины и палладия, но, в свою очередь, эти два показателя имеют достаточно сильную связь с результатирующим признаком.

Чтобы избавиться от сильной корреляции между признаками, сделаем преобразования: сложим изменения цен на платину и палладий, и также найдем их относительное изменение. Также видно, что переменные «число», «месяц» и «серебро» имеют слабую связь с изменением цены на золото, исключим эти переменные. Для проверки необходимо построить еще одну матрицу парных корреляций. Она приведена на рисунке 3.


Рисунок 3 – Матрица парных корреляций

Таким образом, для нашей модели входными данными будут служить переменные:

1. Относительное изменение курса доллара;

2. Относительное изменение курса евро;

3. Изменение курсов платины и палладия, объединенные в одну переменную путем сложения.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: