На основе метода наименьших квадратов

Для каждого i -го наблюдения модель (4) имеет вид:

. (5)

Здесь постоянные b0 и b1коэффициенты регрессии, для определения которых необходимо знать и использовать все значения переменных Х и Y в генеральной совокупности.

На практике исследователь располагает лишь некоторой выборкой ограниченного объема, на основе которой он строит выборочную (эмпирическую) модель:

, (6)

где – выборочная оценка функции регрессии ; b 0 и b 1– выборочные оценки неизвестных генеральных коэффициентов b0, b1, ei – оценка случайной составляющей e i из (5).

На практике для вычисления b 0и b 1чаще всего используют метод наименьших квадратов (МНК), который проиллюстрирован на рис. 2.

Рис. 2. Иллюстрация принципа МНК

Идея МНК заключается в следующем: из всего множества линий, которые можно провести через экспериментальные точки на корреляционном поле, линия регрессии выбирается так, чтобы сумма квадратов погрешностей для всех точек была наименьшей.

Применение МНК даёт для оценок b 0и b 1следующие формулы:

; (7)

. (8)

Угловой коэффициент регрессии b 1 показывает, на сколько единиц в среднем изменяется зависимая переменная Y при изменении независимой переменной X на единицу своего измерения. Постояннаяb 0дает среднее значение зависимой переменной при X = 0, графически b 0определяет точку пересечения прямой регрессии с осью ординат. Отметим, что параметр b 1 всегда имеет прикладной экономический смысл, в то время как b0 может не иметь экономического содержания.

Поясним сказанное на примере функции спроса, оцененной как регрессия между расходами на питание (y, млрд долл.) и располагаемым личным доходом (х, млрд долл.), по данным США, за период с 1959 г. по 1983 г. (рис. 3).

Рис. 3. Зависимость расходов на питание от доходов

По виду корреляционного поля (рис. 3) полагаем, что в генеральной совокупности регрессионная модель имеет вид:

.

Оценка функции регрессии по выборочным данным даёт:

.

Угловой коэффициент b 1 показывает, что если доход увеличивается на 1 млрд долл., то расходы на питание возрастают на 93 млн долл. Другими словами, из каждого дополнительного доллара дохода 9,3 цента уйдут на питание.

Постоянная b 0показывает, что если доход был бы равен нулю, то расходы на питание составили бы 55,3 млрд долл. Такое толкование может быть правдоподобным в отношении отдельного человека, так как он может израсходовать на питание накопленные или одолженные средства. Однако оно не имеет никакого смысла применительно к совокупности. В данном случае константа выполняет единственную функцию: позволяет определить положение линии регрессии на графике.

Из приведённого примера видно, что коэффициенты выборочного уравнения регрессии пригодны для содержательной интерпретации. При этом следует помнить, что оценки b 0и b 1 меняются от выборки к выборке, то есть являются случайными величинами. Поэтому следует проверить существенно ли b 0и b 1 отличаются от нуля.

Для того чтобы оцененная по МНК регрессия представляла изучаемый показатель Y наилучшим образом, случайная составляющая e (погрешность модели) должна удовлетворять условиям, сформулированным известными статистиками Гауссом и Марковым. В отношении e должны выполняться следующие свойства:

– при любом Х распределение e должно быть нормально с нулевым средним;

– дисперсия e должна быть независимой от Х;

– отклонения e в разных наблюдениях должны быть статистически независимыми.

В этих условиях МНК-оценки b 0и b 1 для неизвестных параметров регрессионной модели b0 и b1 являются наилучшими несмещёнными оценками с минимальной дисперсией. В литературе такие оценки называются BLUE (Best Linear Unbiased Estimators) – наилучшие линейные несмещенные оценки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: