Оценка тесноты связи расходов на железнодорожные перевозки и длины дороги с помощью показателей корреляции и детерминации

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции r xy . Существуют различные формы записи линейного коэффициента корреляции. Наиболее часто встречаются следующие:

r xy = b(S x /S y) = M xy /(S x \ S y) = ( - )/ S x S y.

Как известно, линейный коэффициент корреляции находится в пределах: -1 ≤ r xy ≤ 1. Если коэффициент регрессии b > 0, то 0 ≤ r xy ≤ 1, и, наоборот, при b<0, -1 ≤ r xy ≤ 0.

Используя первое выражение для r xy , рассчитаем линейный коэффициент парной корреляции:

r xy = b(S x /S y) = 3,2110 (2191,1976/8792,3929) = 0,8002.

Значение коэффициента корреляции показывает, что связь прямая, то есть с увеличением длины дороги пассажирооборот железнодорожных перевозок увеличивается.

Для оценки качества подбора линейной функции необходимо определить квадрат линейного коэффициента r xy 2, который называется коэффициентом детерминации. Он характеризует долю дисперсии (разброса) пассажирооборота железнодорожных перевозок y, объясняемую зависимостью от длины дороги x, в общей дисперсии, возникающей за счет влияния множества факторов не учтенных функцией регрессии.

Соответственно величина 1 - r xy 2 характеризует долю дисперсии пассажирооборота железнодорожных перевозок y, вызванную влиянием остальных не учтенных в математической модели факторов.

Определим коэффициент детерминации:

r yx 2 = (0,8002)2 = 0,6403.

Следовательно, изменение результата (пассажирооборот железнодорожных перевозок) на 64,0% объясняется изменением фактора (длины дороги).

В отличие от линейной регрессии нелинейная регрессия характеризуется не коэффициентом корреляции, а индексом корреляции Rxy и индексом детерминации R xy 2:

R xy = (1 – (Sост2/S y 2)1/2,

где

Sост2 = ((y1 - ŷx1)2 + (y2 - ŷx2)2 +....+ (y7 - ŷx16)2)/ n;

S y 2 = ((y1 - )2 + (y2 - )2 +....+ (y7 - )2)/ n.

Величина данного показателя находится в пределах

0 ≤ R xy ≤ 1, причем чем она ближе к единице, тем теснее связь между пассажирооборотом железнодорожных перевозок и длиной дороги, тем более надежное уравнение регрессии.

Расчеты показателей степени связи между пассажирооборотом железнодорожных перевозок и длиной дороги при степенной модели показывают, что она несколько лучше линейной модели.

Аналогичная оценка для показательной функции регрессии находится на уровне линейной, несколько хуже степенной.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: