На основе метода наименьших квадратов

Для каждого i -го наблюдения модель (4) имеет вид:

. (5)

Здесь постоянные b₀ и b₁ – коэффициенты регрессии, для определения которых необходимо знать и использовать все значения переменных Х и Y в генеральной совокупности.

На практике исследователь располагает лишь некоторой выборкой ограниченного объема, на основе которой он строит выборочную (эмпирическую) модель:

, (6)

где – выборочная оценка функции регрессии ; b ₀ и b ₁– выборочные оценки неизвестных генеральных коэффициентов b₀, b₁, e_i – оценка случайной составляющей e _i из (5).

На практике для вычисления b ₀и b ₁чаще всего используют метод наименьших квадратов (МНК), который проиллюстрирован на рис. 2.

Рис. 2. Иллюстрация принципа МНК

Идея МНК заключается в следующем: из всего множества линий, которые можно провести через экспериментальные точки на корреляционном поле, линия регрессии выбирается так, чтобы сумма квадратов погрешностей для всех точек была наименьшей.

Применение МНК даёт для оценок b ₀и b ₁следующие формулы:

; (7)

. (8)

Угловой коэффициент регрессии b ₁ показывает, на сколько единиц в среднем изменяется зависимая переменная Y при изменении независимой переменной X на единицу своего измерения. Постояннаяb ₀дает среднее значение зависимой переменной при X = 0, графически b ₀определяет точку пересечения прямой регрессии с осью ординат. Отметим, что параметр b ₁ всегда имеет прикладной экономический смысл, в то время как b₀ может не иметь экономического содержания.

Поясним сказанное на примере функции спроса, оцененной как регрессия между расходами на питание (y, млрд долл.) и располагаемым личным доходом (х, млрд долл.), по данным США, за период с 1959 г. по 1983 г. (рис. 3).

Рис. 3. Зависимость расходов на питание от доходов

По виду корреляционного поля (рис. 3) полагаем, что в генеральной совокупности регрессионная модель имеет вид:

Оценка функции регрессии по выборочным данным даёт:

Угловой коэффициент b ₁ показывает, что если доход увеличивается на 1 млрд долл., то расходы на питание возрастают на 93 млн долл. Другими словами, из каждого дополнительного доллара дохода 9,3 цента уйдут на питание.

Постоянная b ₀показывает, что если доход был бы равен нулю, то расходы на питание составили бы 55,3 млрд долл. Такое толкование может быть правдоподобным в отношении отдельного человека, так как он может израсходовать на питание накопленные или одолженные средства. Однако оно не имеет никакого смысла применительно к совокупности. В данном случае константа выполняет единственную функцию: позволяет определить положение линии регрессии на графике.

Из приведённого примера видно, что коэффициенты выборочного уравнения регрессии пригодны для содержательной интерпретации. При этом следует помнить, что оценки b ₀и b ₁ меняются от выборки к выборке, то есть являются случайными величинами. Поэтому следует проверить существенно ли b ₀и b ₁ отличаются от нуля.

Для того чтобы оцененная по МНК регрессия представляла изучаемый показатель Y наилучшим образом, случайная составляющая e (погрешность модели) должна удовлетворять условиям, сформулированным известными статистиками Гауссом и Марковым. В отношении e должны выполняться следующие свойства:

– при любом Х распределение e должно быть нормально с нулевым средним;

– дисперсия e должна быть независимой от Х;

– отклонения e в разных наблюдениях должны быть статистически независимыми.

В этих условиях МНК-оценки b ₀и b ₁ для неизвестных параметров регрессионной модели b₀ и b₁ являются наилучшими несмещёнными оценками с минимальной дисперсией. В литературе такие оценки называются BLUE (Best Linear Unbiased Estimators) – наилучшие линейные несмещенные оценки.