Для каждого i -го наблюдения модель (4) имеет вид:
. (5)
Здесь постоянные b0 и b1 – коэффициенты регрессии, для определения которых необходимо знать и использовать все значения переменных Х и Y в генеральной совокупности.
На практике исследователь располагает лишь некоторой выборкой ограниченного объема, на основе которой он строит выборочную (эмпирическую) модель:
, (6)
где – выборочная оценка функции регрессии ; b 0 и b 1– выборочные оценки неизвестных генеральных коэффициентов b0, b1, ei – оценка случайной составляющей e i из (5).
На практике для вычисления b 0и b 1чаще всего используют метод наименьших квадратов (МНК), который проиллюстрирован на рис. 2.
Рис. 2. Иллюстрация принципа МНК
Идея МНК заключается в следующем: из всего множества линий, которые можно провести через экспериментальные точки на корреляционном поле, линия регрессии выбирается так, чтобы сумма квадратов погрешностей для всех точек была наименьшей.
Применение МНК даёт для оценок b 0и b 1следующие формулы:
|
|
; (7)
. (8)
Угловой коэффициент регрессии b 1 показывает, на сколько единиц в среднем изменяется зависимая переменная Y при изменении независимой переменной X на единицу своего измерения. Постояннаяb 0дает среднее значение зависимой переменной при X = 0, графически b 0определяет точку пересечения прямой регрессии с осью ординат. Отметим, что параметр b 1 всегда имеет прикладной экономический смысл, в то время как b0 может не иметь экономического содержания.
Поясним сказанное на примере функции спроса, оцененной как регрессия между расходами на питание (y, млрд долл.) и располагаемым личным доходом (х, млрд долл.), по данным США, за период с 1959 г. по 1983 г. (рис. 3).
Рис. 3. Зависимость расходов на питание от доходов
По виду корреляционного поля (рис. 3) полагаем, что в генеральной совокупности регрессионная модель имеет вид:
.
Оценка функции регрессии по выборочным данным даёт:
.
Угловой коэффициент b 1 показывает, что если доход увеличивается на 1 млрд долл., то расходы на питание возрастают на 93 млн долл. Другими словами, из каждого дополнительного доллара дохода 9,3 цента уйдут на питание.
Постоянная b 0показывает, что если доход был бы равен нулю, то расходы на питание составили бы 55,3 млрд долл. Такое толкование может быть правдоподобным в отношении отдельного человека, так как он может израсходовать на питание накопленные или одолженные средства. Однако оно не имеет никакого смысла применительно к совокупности. В данном случае константа выполняет единственную функцию: позволяет определить положение линии регрессии на графике.
Из приведённого примера видно, что коэффициенты выборочного уравнения регрессии пригодны для содержательной интерпретации. При этом следует помнить, что оценки b 0и b 1 меняются от выборки к выборке, то есть являются случайными величинами. Поэтому следует проверить существенно ли b 0и b 1 отличаются от нуля.
|
|
Для того чтобы оцененная по МНК регрессия представляла изучаемый показатель Y наилучшим образом, случайная составляющая e (погрешность модели) должна удовлетворять условиям, сформулированным известными статистиками Гауссом и Марковым. В отношении e должны выполняться следующие свойства:
– при любом Х распределение e должно быть нормально с нулевым средним;
– дисперсия e должна быть независимой от Х;
– отклонения e в разных наблюдениях должны быть статистически независимыми.
В этих условиях МНК-оценки b 0и b 1 для неизвестных параметров регрессионной модели b0 и b1 являются наилучшими несмещёнными оценками с минимальной дисперсией. В литературе такие оценки называются BLUE (Best Linear Unbiased Estimators) – наилучшие линейные несмещенные оценки.