Коэффициент корреляции Пирсона

Использование коэффициента корреляции Пирсона для оценки степени связи между двумя признаками предполагает выполнение следующих двух обязательных условий:

1. Значения обоих анализируемых признаков распределены нормально.

2. Связь между признаками является линейной.

Предположим, необходимо выяснить наличие связи между индексом реального валового внутреннего продукта (ВВП) на душу населения и остальными индексами, в представленных экспериментальных данных.

Для расчета коэффициента корреляции Пирсона необходимо выполнить следующее:

1. Запустить модуль анализа из меню «Statistics/Basic Statistics/Tables/Correlation Matrices (Корреляционные матрицы).

2. В появившемся окне выбрать переменные, которые должны участвовать в анализе. Для этого нужно нажать либо кнопку «One variable list» (Один список переменных) либо «Two lists (rect. matrix)» (Два списка (прямоугольная матрица)). В первом случае анализируемые переменные последовательно выбираются из одного списка, а во втором – из двух.

3. Проверить условия применимости коэффициента Пирсона. Для визуальной оценки выполнения этих условий можно нажать кнопку «Scatterplot matrix for selected variables» (Диаграмма рассеяния для выбранных переменных). В результате программа построит точечный график, по осям которого будут отложены значения соответствующих переменных (рис.5.11). Диагональная линия на этом графике служит для оценки линейности связи между анализируемыми признаками. Если точки-наблюдения укладываются вдоль этой линии на близком расстоянии, можно говорить о существовании прямолинейной зависимости. Вместе с диаграммой рассеяния программа строит также распределения значений анализируемых признаков в виде гистограмм, по форме которых можно проверить условие о нормальности распределения.

Примечание
В рассматриваемом примере условие нормальности распределения явно не выполняется у некоторых факторов (ID_EDUCATION, ID_DEVELOPMENT), однако в учебных целях продолжен расчет коэффициента корреляции Пирсона.

Рисунок 5.11. Диаграмма рассеяния для выбранных переменных

4. Нажать на кнопку «Summary: Correlations» (Результат: Корреляционная матрица). В результате появится таблица, содержащая рассчитанный программой коэффициент корреляции (рис.5.12). Статистически значимые коэффициенты корреляции Пирсона в ППП Statistica выделяются красным цветом (Р > 0,05).

Рисунок 5.12. Корреляционная матрица по критерию Пирсона


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: