Определения. Парная регрессия. Метод наименьших квадратов (МНК)

Если формула (3) линейна, то речь идет о линейной регрессии. Формула статистической связи двух переменных называется парной регрессией, зависимость от нескольких переменных – множественной регрессией. Например, Кейнсом была предложена линейная модель зависимости частного потребления С от располагаемого дохода Х: С=С₀+ С₁Х, где С₀ >0 – величина автономного потребления (при уровне дохода Х=0), 1>C₁>0 – предельная склонность к потреблению (C₁показывает, на сколько увеличится потребление при увеличении дохода на единицу).

В случае парной линейной регрессии имеется только один объясняющий фактор х и линейная регрессионная модель записывается в следующем виде:

у =a₀+a₁ х +e, (4)

где e – случайная составляющая с независимыми значениями Мe=0, De= s².

Оценка параметров регрессии a₀и a₁производится по наблюденным значениям зависимой и объясняющей переменным (x _i, y _i), i=1,2,…, n, где n – число пар наблюдений (объем выборки). Рассматриваются n уравнений у _i=a₀+a₁ х _i+e_i, где уклонения e_iявляется следствием реализации случайной составляющей, и выбирают такие значения a₀и a₁, которые минимизируют сумму квадратов этих уклонений, т.е. ищется минимум

Q=å_ie_i²= å_i(у _i – a₀ – a₁ х _i)² (5)

по отношению к параметрам a₀и a₁. Заметим, что указанный метод наименьших квадратов (МНК)может быть применен к любой кривой регрессии f(x). “Наилучшая” по МНК прямая линия всегда существует, но даже наилучшая не всегда является достаточно хорошей. Если в действительности зависимость у = f(x) является, например, квадратичной, то ее не сможет адекватно описать никакая линейная функция, хотя среди всех линейных функций обязательно найдется “наилучшая”.

Для отыскания минимума берутся частные производные Q по искомым параметрам (в данном случае по a₀и a₁) и приравниваются к нулю. После выполнения элементарных преобразований получают так называемую систему нормальных уравнений, из которой и находятся искомые параметры. Для парной линейной регрессии получаем

a₁=( – × )/( – ()²), (6)

a₀= –a₁ × =(() × – × )/( – ()²),

где =å x_iy _i/n, =å x_i /n, =å y_i /n, =å х _i²/n.

Коэффициент a₁называется коэффициентом регрессии и обозначается r_yx. Из (2) и (6) следует, что

r_yx = r_yx s_y /s_х. (7)

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученными по данным выборки, в известной степени может быть распространено и на генеральную совокупность, т.е. можно выдвинуть гипотезу об имеющейся линейной связи во всей генеральной совокупности вида у =a₀+a₁ х.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

14 15 16 17 18 19 20

Три этапа Великой Отечественной войны

Расчет на прочность при срезе и смятии

Источники международного права

Контроль за санитарным состоянием тумбочек, холодильников, за ассортиментом и сроками хранения продуктов

МЕТОДЫ ПРОГНОЗИРОВАНИЯ

Назначение, устройство и работа делителя передач. Управление коробкой передач с делителем

Самый сильный аргумент, почему эволюция человека не могла быть