Если связь между признаками Y и X нелинейная и описывается уравнением параболы второго порядка, то
В данном случае задача сводится к определению неизвестных параметров а, b, с.
Применив метод наименьших квадратов, получим уравнение:
Для нахождения значений неизвестных параметров а, b, с, при которых Функция была бы минимальной, необходимо приравнять частные производные по этим величинам к нулю, т. е.:
Проделав преобразования, получим систему нормальных уравнений:
Решив систему уравнений, найдем значения неизвестных параметров а,в,с и подставив их в получим уравнение регрессии
Оценка параметров конкретной регрессии является лишь отдельным этапом длительного и сложного процесса построения эконометрической модели. Первое же оцененное уравнение очень редко является удовлетворительным во всех отношениях. Обычно приходится постепенно подбирать формулу связи и состав объясняющих переменных, анализируя на каждом этапе качество оцененной зависимости. Этот анализ качества включает статистическую и содержательную составляющую. Проверка статистического качества оцененного уравнения состоит из следующих элементов:
|
|
- проверка статистической значимости каждого коэффициента уравнения регрессии;
- проверка общего качества уравнения регрессии;
- проверка свойств данных, выполнение которых предполагалось при оценивании уравнения.
Под содержательной составляющей анализа качества понимается рассмотрение экономического смысла оцененного уравнения регрессии: действительно ли значимыми оказались объясняющие факторы, важные с точки зрения теории; положительны или отрицательны коэффициенты, показывающие направление воздействия этих факторов; попали ли оценки коэффициентов регрессии в предполагаемые из теоретических соображений интервалы ит.д..
Рассмотрим пример построения простой эконометрической модели:
Построить эконометрическую модель зависимости производительности труда у от стажа работы х рабочих бригады по приведенным данным ранжированных по стажу их работы.
Таблица1.
Номер рабочего | Стаж работы, годы, х | Дневная выработка рабочего, шт., у | Х 2 | У 2 | ХУ | Ŷ |
4-ый 6-ый 3-ый 1-ый 2-ой 7-ой 9-ый 10-ый 8-ой 5-ый | 1 2 3 4 5 6 7 8 9 10 | 4 5 6 7 7 8 8 9 10 9 | 1 4 9 16 25 36 49 64 81 100 | 16 25 36 49 49 64 64 81 100 81 | 4 10 18 28 35 48 56 72 90 90 | 4.6 5,2 5,8 6,4 7.0 7,6 8,2 8,8 9.4 10,0 |
Итого | 55 | 73 | 385 | 565 | 451 | 73,0 |
РЕШЕНИЕ:
Построим искомую модель в виде уравнения (3.1).Используя расчетные значения
(таблица 1) и соответствующие формулы (3.3) найдем параметры уравнения:
|
|
а1 = (45,1 – 40,15) / (38,5 – 30,25) = 0,6;
а0 = 7,3 – 0,6 * 5.5 = 4.0.
Таким образом, эконометрическая модель распределения выработки по стажу работы для данного примера может быть записана в виде следующего уравнения регрессии:
Ŷ= 4,0 + 0,6х
Правильность расчета параметров уравнения может быть проверена сравнением сумм ∑У = ∑ Ŷ (при этом возможно некоторое расхождение вследствие округления расчетов).
Для практического использования моделей регрессии большое значение имеет их адекватность – соответствие фактическим статистическим данным. Достоверность построенной эконометрической модели можно прове-
рить, используя элементы дисперсионного анализа
Вычислив линейный коэффициент парной корреляции (для линейной регрессии) или индекс корреляции (для нелинейной регрессии), оценим тесноту связи изучаемых явлений:
r xy = (yx – y. x)/σxσy, ρxy = √1 - σост.2/ σу2 (3. 7)
Значение линейного коэффициента (индекса) парной корреляции лежит в пределах от -1 до 1. (от 0 до 1)
Коэффициент (индекс) детерминации равен квадрату коэффициента (индекса) корреляции и показывает сколько процентов вариации резуль
тативного признака у объясняется вариацией фактора х.
Средняя ошибка аппроксимации Ā оценивает точность моделиивычис-
ляется по формуле:
Ā =Σ Ai/n, Ai = │(уi – уx)/ yi│. 100% (3. 8)
Допустимый предел значения Ā – не более 8 - 10 %.
Средний коэффициент эластичности Э yxi показывает, на сколько про-
центов в среднем по совокупности изменится результат у от своей сред
ней величины у и вычисляется по формуле:
Э yxi = ai xi / y. (3. 9)
Так как корреляционный и регрессионный анализ, особенно в условиях малого и среднего бизнеса, проводится для ограниченной по объему совокупности, то параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов.
Для проверки статистической значимости коэффициентов регрессии и корреляции используют t – критерий Стьюдента Оценка проводится путем сопоставления оценок соответствующих параметров с величиной их случайной ошибки (первая и вторая строки при использовании функции ЛИНЕЙН). Эта величина имеет t - распределение Стьюдента с n–2 степенями свободы и называется t- статистикой:
t а1 .факт. = а1 / Sа1; t а0 .факт. = а 0 /Sа0; t r.факт. = r/Sr, (3. 10)
где
S а1=S ост. / σx√n - 2, Sa0=S ост/√п - 2, Sr =√ (1-r2 )/(n-2) (3. 11)
S2ост. = Σ(Y – Ŷ)2/ n
Для t- статистики проверяется нулевая гипотеза H0 т.е. утверждение о том, что величина y не зависит от х, то есть а1 = 0. Альтернативная гипотеза Ha заключается в том,что а1≠ 0, иными словами, что значение х влияет на величину
у.
Если t факт. > t табл., то гипотеза Н0 отклоняется, т.е. коэффициен-