Корреляционный анализ. Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов

Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов. Принцип корреляционного анализа состоит в поиске таких значений, которые в наименьшей степени коррелированы (взаимосвязаны) с выходным результатом. Такие факторы могут быть исключены из результирующего набора данных практически без потери полезной информации. Критерием принятия решения об исключении является порог значимости. Если корреляция (степень взаимозависимости) между входным и выходным факторами меньше порога значимости, то соответствующий фактор отбрасывается как незначащий.

1) Рассмотрим применение обработки на примере данных из файла region.txt. В данном примере определим степень влияния экономических показателей региона на среднедушевой доход жителей.

В новом проекте импортируем данные из указанного файла.

2) Устранение незначащих входных факторов

В Мастере обработки выбираем Корреляционный анализ и задаем входные и выходные поля (рис. 1.41). Входными факторами будут являться все экономические показатели региона, а выходным будет Среднедушевой денежный доход.

3) На следующем шаге необходимо выбрать метод, на основе которого будет происходить расчет коэффициентов корреляции, выберем метод Коэффициент корреляции Пирсона (рис. 1.42).

4) После выполнения предварительных настроек запускаем процесс корреляционного анализа, по результатам которого предлагается выбрать, какие факторы оставить для дальнейшей работы. Это делается либо вручную, основываясь на значениях матрицы ковариации, либо путем указания порога значимости (по умолчанию порог значимости равен 0,05) (рис. 1.43).


Рисунок 1.41 – Корреляционный анализ при помощи Мастера обработки

Рисунок 1.42 – Выбор метода корреляции


Рисунок 1.43 – Изменение порога значимости

5) По полученной матрице корреляции видно, какие факторы влияют сильнее других, и какие можно не учитывать при построении всевозможных моделей (рис. 1.44).

Рисунок 1.44 – Матрица корреляции

Результат сохранить в файле L1_8.ded.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: