Корреляционный анализ

Корреляционный анализ применяется для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде. Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине. Коэффициент корреляции, всегда обозначаемый латинской буквой r, используется для определения наличия взаимосвязи между двумя свойствами.

Связь между признаками (по шкале Чеддока) может быть сильной, средней и слабой. Тесноту связи определяют по величине коэффициента корреляции, который может принимать значения от -1 до +1 включительно. Критерии оценки тесноты связи показаны на рис.


Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона r, который является безразмерным индексом в интервале от -1,0 до 1,0 включительно, отражает степень линейной зависимости между двумя множествами данных.

Пример: определить, существует ли взаимосвязь между следующими признаками:

Войдем в пункт меню «Сервис» и выберем команду «Анализ данных». В появившемся окне выберем раздел «Корреляция». После входа в него появиться следующее окно:

Аналогично предыдущему примеру вводим входной интервал ячеек с исходными данными. В нашем примере мы должны проверить взаимосвязь между жирностью молока и удоем коров. Поэтому мы выделяем интервал ячеек с этими данными. Так как у нас данные расположены в столбцах, то мы должны поставить флажок в разделе «группирование» по столбцам. Далее поставим флажок в разделе выходной интервал и укажем адрес ячейки E1 b и щелкнем по кнопке «ОК».

Полученный результат говорит о том, что между признаками существует очень высокая отрицательная корреляция, то есть при увеличении жирности молока удой наоборот, будет уменьшаться.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: