Выборочный парный коэффециент корреляции (формула для расчета, интерпретация)

Выборочный коэффициент корреляции является одним из основных показателей тесноты связи между двумя переменными. При изучении зависимости переменной Y от переменной Х выборочный коэффициент корреляции обозначается как rxy. При изучении зависимости переменной Х от переменной Y выборочный коэффициент корреляции обозначается как ryx.

Выборочный коэффициент корреляции является оценкой коэффициента корреляции Pxy генеральной совокупности.

Выборочный парный коэффициент корреляции ryx:

где ух – среднее арифметическое произведения факторной и результативной переменных:

S y – выборочное среднеквадратическое отклонение результативной переменной у, показывающее, на сколько единиц в среднем отклоняются значения результативной переменной у от ее среднего значения y–:

у 2 – среднее значение из квадратов значений результативной переменной у:

Выборочный коэффициент корреляции обладает следующими свойствами:

1) по абсолютной величине выборочный коэффициент корреляции не превосходит единицы: | r yx | ≤ 1, или –1 ≤ ryx ≤ 1;

2) если ryx = 0, т. е. выборочный коэффициент корреляции равен нулю, то переменные Y и Х не связаны статистической зависимостью. В этом случае проведение регрессионного анализа между исследуемыми переменными считается нецелесообразным;

3) если |ryx| = 1, т. е. выборочный коэффициент корреляции по абсолютной величине равен единице, то наблюдаемые значения исследуемых переменных связаны линейной функциональной зависимостью;

4) `если выборочный коэффициент корреляции принадлежит интервалу от нуля до единицы, то связь между исследуемыми переменными прямая; если же выборочный коэффициент корреляции принадлежит интервалу от нуля до минус единицы, то связь между исследуемыми переменными обратная.

7.процедура проверки на значимость парных коэффициентов корреляции (t-статистика.) для статистического вывода о на­личии или отсутствии корреляционной связи между исследуемыми пе­ременными необходимо произвести проверку значимости выборочного коэффициента корреляции. В связи с тем что надежность статистиче­ских характеристик, в том числе и коэффициента корреляции, зависит от объема выборки, может сложиться такая ситуация, когда величина коэффициента корреляции будет целиком обусловлена случайными колебаниями в выборке, на основании которой он вычислен. При существенной связи между переменными коэффициент корреляции должен значимо отличаться от нуля. Если корреляционная связь меж­ду исследуемыми переменными отсутствует, то коэффициент корреля­ции генеральной совокупности ρ равен нулю. При практических ис­следованиях, как правило, основываются на выборочных наблюдениях. Как всякая статистическая характеристика, выборочный коэффициент корреляции является случайной величиной, т. е. его значения случай­но рассеиваются вокруг одноименного параметра генеральной совокуп­ности (истинного значения коэффициента корреляции). При отсутствии корреляционной связи между переменными у и х коэффициент корре­ляции в генеральной совокупности равен нулю. Но из-за случайного характера рассеяния принципиально возможны ситуации, когда не­которые коэффициенты корреляции, вычисленные по выборкам из этой совокупности, будут отличны от нуля. Процедура проверки значимости начинается с формулировки ну­левой гипотезы H0. В общем виде она заключается в том, что между па­раметром выборки и параметром генеральной совокупности нет каких- либо существенных различий. Альтернативная гипотеза H1 состоит в том, что между этими параметрами имеются существенные различия. Например, при проверке наличия корреляции в генеральной совокуп­ности нулевая гипотеза заключается в том, что истинный коэффициент корреляции равен нулю (Н0: ρ = 0). Если в результате проверки ока­жется, что нулевая гипотеза не приемлема, то выборочный коэффи­циент корреляции rух значимо отличается от нуля (нулевая гипотеза отвергается и принимается альтернативная Н1). Другими словами, предположение о некоррелированности случайных переменных в ге­неральной совокупности следует признать необоснованным. И нао­борот, если на основе критерия значимости нулевая гипотеза прини­мается, т. е. rух лежит в допустимой зоне случайного рассеяния, то нет оснований считать сомнительным предположение о некоррелиро­ванности переменных в генеральной совокупности.

8.доверительный интервал коэффициента корреляции (формула для расчета). Доверительный интервал для коэффициента корреляции

r(-1;-0.64)

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл <tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| >tкрит — нулевую гипотезу отвергают.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=13 находим tкрит:

tкрит (n-m-1;α/2) = (13;0.025) = 2.16

где m = 1 - количество объясняющих переменных.

Если tнабл >tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл >tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.


9.выборочное корреляционное отношение (формула для расчета).

Y к Х называется отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению переменной Y:

где Gмежгр – это межгрупповое среднее квадратическое отклонение переменной Y:

G общ – это общее среднее квадратическое отклонение переменной Y:

где n – объем выборки (сумма всех частот);

m х – частота значениях переменной X;

m – частота значения у переменной Y;

у – среднее значение переменной Y;

у х – условная средняя переменной Y.

Выборочным корреляционным отношением X

к Y называется отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению переменной Х:

Выборочное корреляционное отношение обладает следующими свойствами:

1) значение выборочного корреляционного отношения принадлежит интервалу от нуля до единицы включительно:

0 ≤ η yx ≤ 1;

2) если η yx = 0, т. е. значение выборочного корреляционного отношения равно нулю, то между исследуемыми переменными Y и Х корреляционная зависимость отсутствует; 3) если η yx = 1, т. е. значение выборочного корреляционного отношения равно единице, то между исследуемыми переменными Y и Х существует функциональная зависимость;

4) выборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции:

5) если выборочное корреляционное отношение равно абсолютной величине выборочного коэффициента корреляции, т. е. если

то между исследуемыми переменными существует точная линейная корреляционная зависимость. Основным достоинством выборочного корреляционного отношения η yx по сравнению с выборочным коэффициентом корреляции r yx является то, что показатель выборочного корреляционного отношения можно использовать как меру тесноты любой формы связи.


10.проверка значимости корреляционного отношения F-критерий.
Для проверки значимости коэффициентов корреляции чаще всего используют распределение Стьюдента и условие:

, f = N - 2, б = 0,05.

Если условие выполняется, то гипотеза об отсутствии корреляционной связи принимается. Для проверки значимости коэффициента парной корреляции нужно сравнить его значение с табличным (критическим) значением r, которое приведено в таблице 3. Для пользования этой таблицей нужно знать число степеней свободы f = N - 2 и выбрать определенный уровень значимости, например равный 0,05. Такое значение уровня значимости называют еще 5%-ным уровнем риска, что соответствует вероятности верного ответа при проверке нашей гипотезы Р = 1 - б = 0,95, или 95%. Это значит, что в среднем только в 5% случаев возможна ошибка при проверке гипотезы.

В практических исследованиях 5%-ный уровень риска применяется наиболее часто. Но экспериментатор всегда свободен в выборе уровня значимости, и возможны ситуации, в которых, например, требуется 1%-ный уровень риска. При этом возрастает надежность ответа. Проверка гипотезы сводится к сравнению абсолютной величины коэффициента парной корреляции с критическим значением. Если экспериментально найденное значение r меньше критического, то нет оснований считать, что имеется тесная линейная связь между параметрами, а если больше или равно, то гипотеза о корреляционной линейной связи не отвергается.

11. Выборочный множественный коэффициент корреляции (формула для расчета,интерпретация)
Коэффициент корреляции - это
статистический показатель зависимости двух случайных величин. Коэффициент корреляции может принимать значения от -1 до +1. При этом, значение -1 будет говорить об отсутствии корреляции между величинами, 0 - о нулевой корреляции, а +1 - о полной корреляции величин. Т.е., че ближе значение коэффициента корреляции к +1, тем сильнее связь мезду двумя случайными величинами.

12. Процедура проверки на значимость множественного коэффициента корреляции
Процедура проверки значимости начинается с формулировки ну­левой гипотезы H0. В общем виде она заключается в том, что между па­раметром выборки и параметром генеральной совокупности нет каких- либо существенных различий. Альтернативная гипотеза H1 состоит в том, что между этими параметрами имеются существенные различия. Например, при проверке наличия корреляции в генеральной совокуп­ности нулевая гипотеза заключается в том, что истинный коэффициент корреляции равен нулю (Н0: ρ = 0). Если в результате проверки ока­жется, что нулевая гипотеза не приемлема, то выборочный коэффи­циент корреляции rух значимо отличается от нуля (нулевая гипотеза отвергается и принимается альтернативная Н1). Другими словами, предположение о некоррелированности случайных переменных в ге­неральной совокупности следует признать необоснованным. И нао­борот, если на основе критерия значимости нулевая гипотеза прини­мается, т. е. rух лежит в допустимой зоне случайного рассеяния, то нет оснований считать сомнительным предположение о некоррелиро­ванности переменных в генеральной совокупности.
При проверке значимости исследователь устанавливает уровень значимости α, который дает определенную практическую уверенность в том, что ошибочные заключения будут сделаны только в очень ред­ких случаях. Уровень значимости выражает вероятность того, что ну­левая гипотеза Н0 отвергается в то время, когда она в действительности верна. Ясно, что имеет смысл выбирать эту вероятность как можно меньшей.

13. Коэффициент детерминации
Коэффициент детерминации
(R 2)— это доля дисперсии отклонений зависимой переменной от её среднего значения, объясняемая рассматриваемой модельюсвязи (объясняющими переменными). Модель связи обычно задается как явная функция от объясняющих переменных. В частном случае линейной связи R 2является квадратом коэффициентакорреляции между зависимой переменной и объясняющими переменными.

Общая формула для вычисления коэффициента детерминации:

где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии -среднее арифметическое зависимой переменной.
При проверке гипотезы о наличии связи модель связи может быть неизвестна. Тогда ее задают в виде кусочно-постоянной функции (в этом случае коэффициент детерминации равен квадрату корреляционного отношения) либо оценивают неизвестные значения функции связи, используя методы сглаживания эмпирической зависимости (например метод скользящих средних) [1].








Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: