Построение регрессионной модели и оценка её адекватности

Важной характеристикой корреляционной связи является линия регрессии - эмпирическая в модели аналитической группировки и теоретическая в модели регрессионного анализа. Эмпирическая линия регрессии представлена групповыми средними результативного признака , каждая из которых принадлежит к соответствующему интервалу значений группирующего фактора х_j. Теоретическая линия регрессии описывается определенной функцией которую называют уравнением регрессии, а Y – теоретическим уровнем результативного признака. В отличие от эмпирической, теоретическая линия регрессии непрерывна.

Уравнение регрессии описывает числовое соотношение вариации признаков х і у в среднем. Коэффициент пропорциональности при этом играет определяющую роль. Он показывает, на сколько единиц в среднем меняется у с изменением х на единицу. В случае прямой связи b – величина положительная, в обратном случае – отрицательная.

Определив у как функцию х, тем самым абстрагируются от множественности причин, искусственно упрощая механизм формирования вариации у. Анализ причинных комплексов осуществляется с помощью множественной регрессии.

Разные явления по-разному реагируют на смену факторов. Для того чтобы отобразить характерные особенности связи конкретных явлений, используют разные за функциональным видом регрессионные уравнения. Если с изменением фактора х результат в меняется более или менее равномерно, такая связь описывается линейной функцией Y = a + bx. Когда речь идет о неравномерном соотношении вариаций взаимосвязанных признаков (например, когда прирост значений в с изменением х ускорен или замедлен, или направление связи меняется), применяют нелинейные регрессии, в частности:

степенная ;

гиперболическая ;

параболическая и т.п.

Выбор и обоснование функционального вида регрессии основывается на теоретическом анализе сущности связи.

Теоретический анализ сущности связи только очерчивает особенности формы регрессии и не может точно определить ее функционального вида. К тому же в конкретных условиях пространства и времени границы вариации взаимосвязанных признаков х і у значительно уже теоретически возможных. И если кривизна регрессии небольшая, то в пределах фактической вариации признаков связь между ними довольно точно описывается линейной функцией. Этим в значительной мере объясняется широкое применение линейных уравнений регрессии:

Параметр b (коэффициент регрессии) – величина именованная, имеет размерность результативного признака и рассматривается как эффект влияния x на y. Параметр a – свободный член уравнения регрессии, это значение y при x = 0. Если границы вариации x не содержат нуля, то этот параметр имеет лишь расчетное значение.

Подытоживая сказанное выше, можно указать основные задачи, которые могут быть решены с использованием корреляционного и регрессионного методов анализа.

Корреляционный анализ обеспечивает:

1) измерение степени связи двух или больше переменных;

2) изъятие факторов, которые наиболее существенно влияют на зависимую переменную;

3) определение прежде неизвестных причинных связей (корреляция непосредственно не раскрывает причинных связей между явлениями, но определяет числовое значение этих связей и вероятность суждений относительно них существование).

Регрессионный анализ позволяет решить такие задачи:

1) установление форм зависимости между одной эндогенной и одной или несколькими экзогенными сменными (положительная, отрицательная, линейная, нелинейная). Эндогенная переменная обычно считается Y, а экзогенная (экзогенные), которая еще иначе называется регрессором, – X;

2) определение функции регрессии. Важно не только указать общую тенденцию изменения зависимой переменной, а и выявить тот, который бы влиял на зависимую переменную главных факторов, если бы прочие (второстепенные, побочные) факторы не изменялись и были исключены случайные элементы;

3) оценку неизвестных значений зависимой переменной.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: