Корреляция для нелинейной регрессии. Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателями корреляции

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателями корреляции:

; ,

где – общая дисперсия результативного признака у,

– объясненная уравнением регрессии дисперсия у;

остаточная (необъясненная уравнением) дисперсия признака y.

Величину R2 (равную отношению объясненной уравнением регрессии дисперсии результата у к общей дисперсии у) длянелинейных связей называют индексом детерминации, а корень из данной величины R называют индексом корреляции.

Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.

Если после преобразования уравнение регрессии (нелинейное по объясняющим переменным) принимает форму линейного парного уравнения регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции , где z – преобразованная величина признака-фактора, например или .

Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с результативным признаком (нелинейность по параметрам). В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.

Вследствие близости результатов и простоты расчета с использованием компьютерных программ для характеристики тесноты связи по нелинейным функциям широко используется линейный коэффициент корреляции ( или ). Несмотря на близость значений и или и следует помнить, что для функции не равен длярегрессии (в отличие от уравнений регрессии линейных или нелинейных по объясняющим переменным, для которых и .

Поскольку в расчете индекса корреляции используется соотношение объясненной (факторной) и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. Оценка существенности индекса корреляции производится так же, как и оценка надежности коэффициента корреляции.

Индекс детерминации R2 используется для проверки существенности уравнения нелинейной регрессии в целом по F-критерию Фишера:

где R2 – индекс детерминации;

n – число наблюдений;.

h – число параметров в уравнении.

Величина (h – 1) характеризует число степеней свободы для объясненной (факторной) суммы квадратов, а (п – h) – число степеней свободы для остаточной суммы квадратов.

Индекс детерминации R2 можно сравнивать с коэффициентом детерминации r2 для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации r2 меньше индекса детерминации R2. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически, если величина (R2 – r2) не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различий R2, вычисленных по одним и тем же исходным данным, через t- критерий Стьюдента:

где тRr ошибка разности между R2 и r2, определяемая по формуле:

Если tнабл > tкр,, различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Практически, если величина t<2, то различия между R и r несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: