Метод наименьших квадратов. Для оценивания параметров уравнения регрессии b0 , b1 , наиболее часто применяется метод наименьших квадратов (МНК)

Для оценивания параметров уравнения регрессии b0, b1,… наиболее часто применяется метод наименьших квадратов (МНК). Идею МНК продемонстрируем на примере определения параметров линейной регрессионной зависимости вида (1).

Рассмотрим функцию S (b0, b1,…), равную сумме квадратов отклонений выборочных значений yi случайной величины Y от значения , предсказанного уравнением регрессии в точке X = xi (рисунок 3):

. (3)

Фактически эти отклонения в каждой точке xi равны ei.

Рисунок 3 – Отклонения наблюденных значений зависимой случайной величины Y от значений, предсказываемых уравнением регрессии

Для случая линейной регрессии оценки параметров b0 и b1 получаются минимизацией по b0 и b1 суммы квадратов отклонений ei выборочных значений с. в. Y от значений, предсказываемых уравнением регрессии Y на X, т. е. минимизацией функции

.

Из курса математического анализа известно, что для нахождения минимума функции S (b0, b1) необходимо приравнять к нулю частные производные этой функции S (по неизвестным b0 и b1) и решить полученную систему уравнений, называемых нормальными:

(4)

Система уравнений (4) имеет единственное решение, если определитель матрицы ее коэффициентов не равен нулю. Полученные значения и , являющиеся решением системы (4), называются оценками параметров регрессии. Для предполагаемой линейной регрессионной зависимости (2) оценки минимизируют ошибку, возникающую при аппроксимации выборки прямой, и вычисляются по формулам:

; ; (5)

; . (6)

В результате оценка уравнения линейной регрессии (эмпирическое уравнение линейной регрессии, прямая, полученная МНК) будет иметь вид: .

В предположении, что значения ошибок { e 1, e 2,…, en }, возникающих при аппроксимации выборки уравнением линейной регрессии, являются взаимно независимыми случайными величинами с нормальным распределением, нулевым математическим ожиданием и постоянной дисперсией, оценки параметров таких уравнений регрессии (полученные МНК) являются несмещенными, состоятельными и эффективными.

Метод наименьших квадратов применим для оценивания параметров уравнений регрессии произвольного вида (гиперболической, параболической, экспоненциальной, логарифмической и т. д.).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: