Корреляционный анализ

Если признак измерен в шкале интервалов, вычисление коэффициентов корреляции целесообразно предварять регрессионным анализом, устанавливающим форму зависимости между случайной величиной Y и значениями переменной (или нескольких переменных) величины X. Здесь достаточно ограничиться наглядной формой регрессионной модели, представленной диаграммой рассеивания. Диаграмма рассеивания или корреляционное поле представляет собой совокупность точек на графике, где оси абсцисс и ординат представляют собой значения двух сопоставляемых статистических признаков. Форма распределения точек на таком графике выступает наглядным показателем тесноты связи между двумя сопоставляемыми признаками.

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0,05 и 0,01. Критические значения коэффициентов линейной корреляции Пирсона и ранговой корреляции Спирмена приведены в Приложении 1 (Таблицы №__ и №__ соответственно). Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0,05 одной чертой или отметить одной звездочкой, а с достоверностью 0,01 – двумя. Удобно использовать и цветное кодирование.

Если после этого выделения обнаружилось, что значимых коэффициентов корреляции, (превышающих уровень 0,05 или 0,01) довольно много, то для дальнейшего анализа более удобна полная матрица интеркорреляций. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то её надо восстановить до полного вида.

Матрица интеркорреляций – это матрица типа «признак х признак», поэтому она оцифрована только номерами признаков и содержит коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в таблице исходных данных в ней не представлены.

Поскольку матрица интеркорреляций симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо «опрокинуть», повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем написана 1.0 – это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками.

Если матрица большая, то даже выделение значимых коэффициентов не создаст достаточной наглядности. Тогда к нижней части матрицы можно добавить еще несколько строк и записать в соответствующих клетках число значимых коэффициентов в данном столбце: значимых на уровне 0.05, значимых на уровне 0.01, суммарное число значимых коэффициентов. Это лучше позволит увидеть иерархию признаков по числу значимых корреляционных связей.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: