Классификация статистических связей
Ø По тесноте связи (трактовка производится в соответствии со значением коэффициента корреляции (см. шкалу Чеддока))
Значения коэффициента корреляции | До ׀0,3׀ | ׀0,3׀-׀0,5׀ | ׀0,5׀- ׀0,7׀ | ׀0,7׀- ׀0,9׀ | До ׀0,99׀ |
Характеристика тесноты связи | слабая | умеренная | заметная | высокая (сильная) | достаточно высокая |
Ø По направлению:
прямая или обратная
Ø По аналитическому выражению:
линейная или нелинейная
Виды корреляционной зависимости
· Парная корреляция – линейная зависимость между двумя переменными
· Частная корреляция – линейная зависимость между двумя переменными при исключении влияния других
· Множественная корреляция - линейная зависимость между набором переменных
Шкалы измерения и техника корреляционного анализа
Возможность измерения связей и их содержательная интерпретация во многом зависит от того, в каких шкалах измерены исследуемые переменные.
|
|
Как уже было рассмотрено ранее, выделяют следующие шкалы:
• номинальные (классификационные, атрибутивные) шкалы
• порядковые (ранговые, ординальные) шкалы
• количественные (метрические) шкалы
Для каждого типа переменных разработана своя логика корреляционного анализа, существуют свои коэффициенты корреляции и специфические особенности интерпретации.
Пример корреляционного анализа для данных, измеренных на количественной шкале:
Пусть имеются данные по 9 студентам:
Ø Признак (x) – количество пропущенных студентом занятий по дисциплине
Ø Признак (y) – количество заданий, верно решенных студентом на экзамене
Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене | |||||||||
№ | A | B | C | D | E | F | G | H | I |
(X) | |||||||||
(Y) |
Пример
Исследуем зависимость среднего значения (y) от признака (x)
Ясно, что такая объективная зависимость может существовать
(хотя и не функциональная)
Для анализа будет использовано 3 метода:
Пример
Метод 1. Метод приведения параллельных данных заключается в упорядочивании значений признаков по переменной x и анализе того, как соответственно меняются значения признака y. Это позволяет сделать предварительный вывод о направлении связи.
Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене | |||||||||
№ | C | D | G | A | I | B | H | F | E |
(X) | |||||||||
(Y) |
Преимущества метода 1:
- Простота исполнения.
- Дает представление о направлении связи.
Недостатки метода 1:
|
|
- Пригоден лишь для небольших массивов данных.
- Не дает представления о силе взаимосвязи.
Пример
Метод 2. Построение поля корреляции - графического изображения анализируемых данных в прямоугольной системе координат, где по оси располагается ОХ – независимая переменная, по ОУ – зависимая переменная.
Преимущества метода 2:
- Простота исполнения.
- Наглядность.
- Пригоден для любого числа наблюдений.
- Дает представление о направлении связи.
- Позволяет визуально диагностировать проблемы в исходной информации.
Недостатки метода:
- Не дает представления о силе взаимосвязи.
Пример
Метод 3. Расчет коэффициентов корреляции.
В случае линейной взаимосвязи между двумя КОЛИЧЕСТВЕННЫМИ переменными рассчитывают линейный коэффициент парной корреляции Пирсона (выписать доп. формулы коэффициента со стр. 197-198):
Пример
Пример
Делать выводы о тесноте и направлении связи пока преждевременно: нужно проверить значимость коэффициента корреляции (r)
• Гипотеза H0: истинное значение коэффициента корреляции (r) равно «0»
• Гипотеза H1: истинное значение коэффициента корреляции (r) отлично от «0», т.е. коэффициент статистически значим
• Для проверки значимости коэффициента корреляции (r) применяется T -критерий Стьюдента
Пример
Так как число наблюдений меньше 30, а коэффициент корреляции меньше 0,9 выберем следующую формулу::
Расчет коэффициента корреляции позволил выявить, что между числом пропущенных занятий и количеством верно решенных заданий существует:
Ø Обратная (коэффициент корреляции (r) отрицательный)
Ø Сильная - смотрим таблицу Чеддока)
Ø Статистически значимая корреляционная взаимосвязь.