Нелинейная регрессия и корреляция

Соотношение между социально-экономическими явлениями и процессами не всегда можно выразить линейными функциями, так как при этом могут возникать неоправданно большие ошибки.

Так, например, нелинейными оказываются производственные функции (зависимость между объемом произведенной продукции и основными факторами производства - трудом, капиталом и т.п.), функции спроса (зависимость между спросом на товары или услуги и их ценами или доходом) и другие.

Различают два класса нелинейных регрессий: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Примерами нелинейной регрессии по включаемым в нее объясняющим переменным являются следующие функции:

- полиномы разных степеней: , ;

- равносторонняя гипербола .

Примерами регрессий, нелинейных по оцениваемым параметрам, являются:

- степенная ;

- показательная ;

- экспоненциальная .

Для оценки параметров нелинейных моделей используют два подхода. Первый подход основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными. Второй подход обычно применяется тогда, когда подобрать соответствующее линеаризующее преобразование не удается. В этом случае применяются методы нелинейной оптимизации на основе исходных переменных.

Для линеаризации модели в рамках первого подхода могут использоваться как модели, не линейные по переменным, так и не линейные по параметрам.

Если модель не линейна по переменным, то введением новых переменных ее можно свести к линейной модели, для оценки параметров которой использовать обычный метод наименьших квадратов.

Например, для параболы второй степени, которую запишем в виде , заменяя переменные , получим двухфакторное уравнение регрессии , для оценки которого используется МНК. Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:

Система содержит 3 уравнения с 3 неизвестными коэффициентами и ее решение может быть произведено любым известным методом (Крамера, Гаусса и т.д.).

Еще один пример – гиперболическая регрессия . Линеаризующее преобразование и последующая оценка при помощи МНК приводят к системе

Следует, однако, отметить и недостаток такой замены переменных, связанный с тем, что оценки параметров получаются не из условия минимизации суммы квадратов отклонений от исходных переменных, а из условия минимизации суммы квадратов отклонений для преобразованных переменных, что не одно и то же. В связи с этим необходимо определенное уточнение полученных оценок.

Более сложной проблемой является нелинейность по параметрам, так как непосредственное применение МНК для их оценивания невозможно. Однако, если нелинейная модель внутренне линейна, то с помощью соответствующих преобразований может быть приведена к линейному виду. Чаще всего для линеаризации используется логарифмирование.

Примеры внутренне линейных функций и формулы нахождения коэффициентов:

Экспоненциальная регрессия: .

Линеаризующее преобразование: .

Степенная функция .

Линеаризующее преобразование: .

Показательная функция: .

Линеаризующее преобразование .

Логарифмическая функция: .

Линеаризующее преобразование .

При этом во всех рассмотренных моделях (кроме логарифмической) предполагается, что случайная ошибка мультипликативно связана с объясняющей переменной . Если же модель представить, например, в виде , то она становится внутренне нелинейной и не может быть представлена в линейном виде. Если модель внутренне нелинейна, то используют специальные (итеративные) процедуры оценивания параметров.

Из нелинейных функций, которые могут быть приведены к линейному виду, в качестве нелинейной регрессии широко используется степенная функция . Это объясняется тем, что параметр в ней является коэффициентом эластичности, показывающим, на сколько процентов изменится в среднем результат, если фактор изменится на 1%. Коэффициент эластичности Э для регрессии вычисляется по формуле

Коэффициент эластичности может быть вычислен и для других форм связи, но только для степенной функции он представляет собой постоянную величину, равную параметру . В других функциях коэффициент эластичности зависит от значений фактора и показывает, насколько процентов изменится относительно уровня при увеличении на 1% от уровня . В силу этого обычно рассчитывают средний показатель эластичности

Таблица формул расчета коэффициентов эластичности для различных форм зависимости.
Вид зависимости	Точечный коэффициент эластичности	Средний коэффициент эластичности
Линейная
Парабола
Равносторонняя гипербола
Степенная
Показательная

Несмотря на широкое использование в эконометрике коэффициентов эластичности, возможны случаи, когда их расчет экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах. Например, бессмысленно определять, на сколько процентов изменится заработная плата с ростом стажа рабочего на 1%. В такой ситуации, даже если степенная форма зависимости оказывается наилучшей по формальным соображениям, она не может быть экономически интерпретирована.

Уравнение нелинейной регрессии, так же как и в случае линейной зависимости, дополняется показателями корреляции, а именно индексом детерминации и индексом корреляции :

, .

Величина индекса корреляции находится в границах от 0 до 1.Чем ближе эта величина к единице, тем теснее связь рассматриваемых признаков.

Поскольку в расчете индекса корреляции используется соотношение объясненной и общей суммы квадратов отклонений, то имеет тот же смысл, что и коэффициент детерминации. Оценка существенности индекса корреляции производится так же, как и оценка надежности коэффициента корреляции.

Индекс детерминации используется для проверки существенности уравнения нелинейной регрессии в целом по F -критерию Фишера:

где - индекс детерминации;
n- число наблюдений;
h- число параметров в уравнении.

Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности использования линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации меньше индекса детерминации . Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически, если величина не превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различий , вычисленных по одним и тем же исходным данным, через t- критерий Стьюдента:

где - ошибка разности между и , определяемая по формуле:

Если , то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Практически, если величина , то различия между и несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

10 11 12 13 14 15 16

Подборка статей по вашей теме: