Уравнение парной регрессии

При статистическом изучении корреляционных зависимостей решаются две основные задачи:

1) нахождение формы связи между признаками x и y в виде математической формулы, выражающей эту зависимость;

2) измерение тесноты связи.

Эти задачи корреляционно-регрессионного анализа являются неразрывными и взаимно дополняющими друг друга. Решение данных задач допускается в разной последовательности. В настоящем пособии сначала рассматривается нахождение уравнения регрессии, а затем – методы выявления и измерения тесноты связи.

Определение формы связи называется нахождением уравнения регрессии (уравнения связи).

Регрессия – это зависимость среднего значения случайной величины от одной или нескольких величин. Термин «регрессия» (лат. regression – отступление, возврат к чему-либо) введен Ф. Гальтоном в 1886 г.

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: факторным x и результативным y. Найти уравнение регрессии – значит по фактическим (эмпирическим) данным математически описать изменения взаимно коррелируемых величин. Уравнение регрессии также называют теоретической линией регрессии – это линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление (основную тенденцию) связи. Теоретическая линия регрессии позволяет оценить среднее значение результативного признака y при различных значениях факторного признака x. При этом не должны учитываться все остальные факторы, влияющие на признак y и не связанные
с признаком x.

Значения результативного признака, рассчитанные по уравнению регрессии, называются теоретическими , т. е. теоретические значения рассматриваются в виде функции .

Аналитическая связь между признаками может описываться следующими уравнениями:

· прямая: ;

· парабола: ;

· гипербола: и др.

Считается, что если факторный и результативный признаки изменяются одинаково (примерно в арифметической прогрессии), то это свидетельствует о линейной связи между ними. Если признаки изменяются в разных направлениях, то связь является обратной. В этом случае применяется уравнение гиперболы. Если признаки изменяются в одном направлении, но с разной скоростью, то используется параболическая или степенная функция.

После выбора типа функции определяют параметры уравнения регрессии. Параметры должны быть такими, чтобы рассчитанные с их помощью теоретические значения результативного признака минимально отличались бы от фактических значений y, т. е. теоретическая линия регрессии должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии равнялась нулю ().

Уравнение парной линейной регрессии имеет вид

,

где – среднее значение результативного признака при определен-
ном значении факторного признака;

a 0 – свободный член уравнения (не имеет экономического
смысла);

a 1 – коэффициент регрессии, который показывает, на сколько
единиц в среднем изменится результативный признак при
изменении факторного признака на единицу его измерения.

При такой интерпретации коэффициента регрессии a 1 предполагается, что сила воздействия признака x на признак y постоянна при любых значениях признака x. С геометрической точки зрения коэффициент регрессии характеризует угол наклона линии регрессии к оси абсцисс.

Знак при коэффициенте регрессии показывает направление связи между признаками:

· при a 1 > 0 – связь прямая;

· при a 1 < 0 – связь обратная.

Параметры уравнения регрессии (a 0, a 1) определяются с помощью метода наименьших квадратов (МНК), согласно которому сумма квадратов отклонений теоретических значений результативного признака от фактических значений y была бы минимальной:

.

Рассмотрим парную линейную регрессию, так как линейная зависимость является наиболее используемой формой связи между двумя признаками.

Найдя частные производные указанной суммы по a 0 и a 1
и приравняв их нулю, получим систему нормальных уравнений при линейной парной регрессии:

где n – объем исследуемой совокупности.

Решение этой системы дает параметры уравнения регрессии. Для нахождения параметров a 0 и a 1 при линейной зависимости могут использоваться готовые формулы:

;

Однако значения параметров a 0 и a 1 можно получить иначе. Если в системе нормальных уравнений каждое уравнение разделить на n, то получим

.

Теперь, зная значение a 1, можно определить второй параметр уравнений регрессии: .

Если связь выражена параболой, то для отыскания параметров уравнения a 0, a 1 и a 2 применяется система нормальных уравнений вида

Решив систему, получим уравнение регрессии вида

.

Оценка обратной зависимости признаков x и y может быть осуществлена на основе уравнения гиперболы. Тогда для нахождения параметров уравнения гиперболы применяется система нормальных уравнений вида

Коэффициент регрессии a 1 также можно рассчитать с помощью линейного коэффициента корреляции rxy по формуле

.

Коэффициент регрессии применяется для определения
коэффициента эластичности
Э x, который показывает, на сколько процентов изменится в среднем величина результа-
тивного признака y при изменении факторного признака x
на 1 %.

Коэффициент эластичности определяется по формуле

.

Для большинства форм связи коэффициент эластичности является переменной величиной, т. е. изменяется в соответствии
с изменением значений фактора x.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: