Корреляционный анализ

 

Вопросы описания порядка проведения корреляционного анализа в «STATGRAPHICS» представлены в учебном пособии [2].

Для обнаружения связи между переменными, исследования ее силы, направленности служит совокупность методов, называемая корреляционным анализом, в рамках которого оцениваются и анализируются различные показатели связи и их значимость. Цель показателя (меры) связи состоит в том, чтобы дать простой численный ответ на вопрос о степени корреляционной зависимости между двумя переменными. Для изучения связи между двумя признаками номинального типа применяются таблицы сопряженности, статистика Фишера-Пирсона χ2, различные меры связи признаков (коэффициенты Крамера, Юля, Чупрова и др.).

Для признаков, измеренных в порядковой шкале, при исследовании связи применяются коэффициенты корреляции рангов, например Спирмена или Кендола.

При исследовании связи двух количественных переменных применяются коэффициенты корреляции, корреляционное отклонение, коэффициенты корреляции рангов. Коэффициент корреляции нашел широкое применение в практике, но важно помнить, что он характеризует линейную форму связи (в отличие от корреляционного отклонения). Для качественных признаков и количественных данных, которые не показывают «нормального» распределения, корректным является использовать коэффициент корреляции рангов.

В «STATGRAPHICS» расчет коэффициентов корреляции реализован в пункте главного меню Discrible\Numeric Datа\Multi-Variable Analysis, при выборе которого появляется стандартный диалог для определения анализируемых данных. В строке «Data» можно задать две и более переменных, между которыми необходимо оценить показатели связи. В окне результата первоначально выводится список анализируемых переменных и объем многомерной выборки. Для расчета коэффициентов корреляции необходимо активировать опцию - «Tаbular Options», а в появившемся окне (рисунок 17) выбрать пункты «Correlations» и\или «Rank Correlations».

При этом нужно помнить о типе анализируемых данных и корректно выбрать оцениваемые показатели связи, а также интерпретировать получаемые результаты.

Результаты оценки коэффициентов корреляции будут представлены в виде корреляционных матриц (рисунок 18).

 

 

Рисунок 17 – Окно выбора параметров корреляционного анализа

 

Для каждой пары переменных выводятся три значения. Первое – это оценка коэффициента корреляции. Второе значение – объем выборки. Третье значение – это достигаемый уровень значимости (p-value) полученной оценки коэффициента корреляции. Если p-value меньше 0,05, то это говорит о наличии статистически значимой ненулевой корреляции между этими двумя переменными с 95 %-й надежностью.

 

 

Рисунок 18 – Окно оценки корреляционной матрицы

 

Контрольные вопросы

 

1 Какие есть возможности программы для статистического анализа?

2 Как выбрать переменную для статистического анализа?

3 Как происходит отбор данных?

4 Правила выбора опций статистического анализа.

5 Как происходит группировка данных?

 

Регрессионный анализ


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: