Шкалы измерения и техника корреляционного анализа

Классификация статистических связей

Ø По тесноте связи (трактовка производится в соответствии со значением коэффициента корреляции (см. шкалу Чеддока))

Значения коэффициента корреляции До ׀0,3׀ ׀0,3׀-׀0,5׀ ׀0,5׀- ׀0,7׀ ׀0,7׀- ׀0,9׀ До ׀0,99׀
Характеристика тесноты связи слабая умеренная заметная высокая (сильная) достаточно высокая

Ø По направлению:
прямая или обратная

Ø По аналитическому выражению:
линейная или нелинейная

Виды корреляционной зависимости

· Парная корреляция – линейная зависимость между двумя переменными

· Частная корреляция – линейная зависимость между двумя переменными при исключении влияния других

· Множественная корреляция - линейная зависимость между набором переменных

Шкалы измерения и техника корреляционного анализа

Возможность измерения связей и их содержательная интерпретация во многом зависит от того, в каких шкалах измерены исследуемые переменные.

Как уже было рассмотрено ранее, выделяют следующие шкалы:

• номинальные (классификационные, атрибутивные) шкалы

• порядковые (ранговые, ординальные) шкалы

• количественные (метрические) шкалы

Для каждого типа переменных разработана своя логика корреляционного анализа, существуют свои коэффициенты корреляции и специфические особенности интерпретации.

Пример корреляционного анализа для данных, измеренных на количественной шкале:

Пусть имеются данные по 9 студентам:

Ø Признак (x) – количество пропущенных студентом занятий по дисциплине

Ø Признак (y) – количество заданий, верно решенных студентом на экзамене

Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене
A B C D E F G H I
(X)                  
(Y)                  

Пример

Исследуем зависимость среднего значения (y) от признака (x)

Ясно, что такая объективная зависимость может существовать
(хотя и не функциональная)

Для анализа будет использовано 3 метода:

Пример

Метод 1. Метод приведения параллельных данных заключается в упорядочивании значений признаков по переменной x и анализе того, как соответственно меняются значения признака y. Это позволяет сделать предварительный вывод о направлении связи.

Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене
C D G A I B H F E
(X)                  
(Y)                  

Преимущества метода 1:

  1. Простота исполнения.
  2. Дает представление о направлении связи.

Недостатки метода 1:

  1. Пригоден лишь для небольших массивов данных.
  2. Не дает представления о силе взаимосвязи.

Пример

Метод 2. Построение поля корреляции - графического изображения анализируемых данных в прямоугольной системе координат, где по оси располагается ОХ – независимая переменная, по ОУ – зависимая переменная.

Преимущества метода 2:

  1. Простота исполнения.
  2. Наглядность.
  3. Пригоден для любого числа наблюдений.
  4. Дает представление о направлении связи.
  5. Позволяет визуально диагностировать проблемы в исходной информации.

Недостатки метода:

  1. Не дает представления о силе взаимосвязи.

Пример

Метод 3. Расчет коэффициентов корреляции.

В случае линейной взаимосвязи между двумя КОЛИЧЕСТВЕННЫМИ переменными рассчитывают линейный коэффициент парной корреляции Пирсона (выписать доп. формулы коэффициента со стр. 197-198):

Пример

Пример

Делать выводы о тесноте и направлении связи пока преждевременно: нужно проверить значимость коэффициента корреляции (r)

• Гипотеза H0: истинное значение коэффициента корреляции (r) равно «0»

• Гипотеза H1: истинное значение коэффициента корреляции (r) отлично от «0», т.е. коэффициент статистически значим

• Для проверки значимости коэффициента корреляции (r) применяется T -критерий Стьюдента

Пример

Так как число наблюдений меньше 30, а коэффициент корреляции меньше 0,9 выберем следующую формулу::

Расчет коэффициента корреляции позволил выявить, что между числом пропущенных занятий и количеством верно решенных заданий существует:

Ø Обратная (коэффициент корреляции (r) отрицательный)

Ø Сильная - смотрим таблицу Чеддока)

Ø Статистически значимая корреляционная взаимосвязь.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: