Метод наименьших квадратов (МНК)

Оценка параметров регрессии a и b производится по наблюденным значениям зависимой и объясняющей переменным (x _i, y _i), i=1,2,…, n, где n – число пар наблюдений (объем выборки). Рассматриваются n уравнений у _i= aх _i +b +e_i, где уклонения e_iявляется следствием реализации случайной составляющей, и выбирают такие значения a и b, которые минимизируют сумму квадратов этих уклонений, т.е. ищется минимум

Q=å_ie_i²= å_i(у _i – aх _i - b)² (2.4)

по отношению к параметрам a и b. Заметим, что указанный метод наименьших квадратов (МНК)может быть применен к любой кривой регрессии f(x). “Наилучшая” по МНК прямая линия всегда существует, но даже наилучшая не всегда является достаточно хорошей. Если в действительности зависимость у = f(x) является, например, квадратичной, то ее не сможет адекватно описать никакая линейная функция, хотя среди всех линейных функций обязательно найдется “наилучшая”.

Для отыскания минимума берутся частные производные Q по искомым параметрам (в данном случае по a₀и a₁) и приравниваются к нулю. После выполнения элементарных преобразований получают так называемую систему нормальных уравнений, из которой и находятся искомые параметры. Для парной линейной регрессии получаем

a =( – × )/( – ()²), (2.5)

b = – a × =(() × – × )/( – ()²),

где =å x_iy _i/n, =å x_i /n, =å y_i /n, =å х _i²/n.

Коэффициент a называется коэффициентом регрессии и обозначается r_yx. Из (2.1) и (2.5) следует, что

r_yx = r_yx s_y /s_х. (2.6)

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученными по данным выборки, в известной степени может быть распространено и на генеральную совокупность, т.е. можно выдвинуть гипотезу об имеющейся линейной связи во всей генеральной совокупности вида у = aх+b.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

7 8 9 10 11 12 13

Методы и средства гигиенического обучения и воспитания населения

Анализ дебиторской задолженности

Недостатки речного транспорта

ПРОИЗВОДИТЕЛЬНОСТЬ ТРУДА

Индексы переменного и постоянного состава, индекс структурных сдвигов

Объяснительно-иллюстративный метод обучения

Самый сильный аргумент, почему эволюция человека не могла быть