Пример.
Имеются следующие исходные данные (таблица 2.1):
Таблица 2.1
| №№ | x1 | x2 | x3 | x4 | x5 | y |
| 0,8 | ||||||
| 5,3 | ||||||
| 4,7 | ||||||
| 3,3 | 0,5 | |||||
| 3,75 | 2,5 | |||||
| 3,2 | 1,5 | |||||
| Σ | 49,3 | 27,3 |
В таблице 2.1 приняты следующие обозначения:
x1- число членов семьи,
x2 - доход семьи,
x3 - число детей в семье,
x4 - среднедушевой доход,
x5 - затраты на питание,
y - расходы на покупку товаров длительного пользования. Y)Zq)r)) ¸)¹ǣ)ǤǨ)ǩǮ)ǯǰ'DZ
Построим два уравнения линейной регрессии:
1) Уравнение парной линейной регрессии y = a0 + a1 x4 (выражающее зависимость расходов на покупку товаров длительного пользования от среднедушевого дохода семьи);
2) Уравнение двухфакторной линейной регрессии y = a0 + a1 x2 + a2 x4 (выражающее зависимость расходов на покупку товаров длительного пользования от дохода семьи и среднедушевого дохода)
Для построения первого уравнения необходимо построить вспомогательную таблицу (см. таблицу 2.2.), чтобы на основе итоговых сумм в нижней строке этой таблицы рассчитать параметры уравнения линейной регрессии по формулам, известным из курса теории статистики (изученного в третьем семестре).
Таблица 2.2
Вспомогательная таблица для расчета параметров
| x4 | y | x42 | x*y |
| 5,0 | 1,0 | 25,0 | 5,0 |
| 6,0 | 5,0 | 36,0 | 30,0 |
| 9,0 | 6,0 | 81,0 | 54,0 |
| 3,0 | 0,8 | 9,0 | 2,4 |
| 5,3 | 3,0 | 28,4 | 16,0 |
| 4,7 | 3,0 | 21,8 | 14,0 |
| 6,0 | 4,0 | 36,0 | 24,0 |
| 3,3 | 0,5 | 11,1 | 1,7 |
| 3,8 | 2,5 | 14,1 | 9,4 |
| 3,2 | 1,5 | 10,2 | 4,8 |
| 49,28 | 27,30 | 272,64 | 161,24 |
Подсчитав суммы в нижней строке таблицы, находим параметры уравнения парной линейной регрессии по формулам:

Таким образом, окончательный вид уравнения регрессии:
y = -1,7 + 0,9 x4.
Теперь построим вспомогательную таблицу, чтобы рассчитать ошибку аппроксимации и индекс детерминации для данного уравнения.
Как известно из курса теории статистики, ошибка аппроксимации находится по формуле:

Где y – исходные (фактические) значения исходного ряда данных, а
- расчетные значения (т.е. рассчитанные на основе построенного уравнения регрессии).
А индекс детерминации – по формуле:

Где
- дисперсия фактических значений признака,
- дисперсия расчетных значений, y – исходные (фактические) значения исходного ряда данных,
- расчетные значения, а
– среднее значение (одинаковое для расчетных и фактических значений). В таблице 2.3. выполнены вспомогательные расчеты для определения этих показателей.
Таблица 2.3
Вспомогательная таблица для расчета ошибки аппроксимации и индекса детерминации (для уравнения
= -1,7+0,9x4)
Фактические значения (y)
и расчетные значения ( )
| Расчет ошибки аппроксимации (σ) | Расчет дисперсии фактических значений
( )
| Расчет дисперсии расчетных значений ( )
| |||
| Y | = -1,7+0,9x4
| (y - )2
|
|
|
|
|
| 1,0 | 2,79 | 3,22 | -1,73 | 2,99 | 0,06 | 0,004 |
| 5,0 | 3,69 | 1,71 | 2,27 | 5,15 | 0,96 | 0,925 |
| 6,0 | 6,38 | 0,15 | 3,27 | 10,69 | 3,65 | 13,351 |
| 0,8 | 1,00 | 0,04 | -1,93 | 3,72 | -1,73 | 2,994 |
| 3,0 | 3,09 | 0,01 | 0,27 | 0,07 | 0,36 | 0,132 |
| 3,0 | 2,50 | 0,25 | 0,27 | 0,07 | -0,23 | 0,055 |
| 4,0 | 3,69 | 0,10 | 1,27 | 1,61 | 0,96 | 0,925 |
| 0,5 | 1,30 | 0,64 | -2,23 | 4,97 | -1,43 | 2,049 |
| 2,5 | 1,67 | 0,68 | -0,23 | 0,05 | -1,06 | 1,118 |
| 1,5 | 1,18 | 0,10 | -1,23 | 1,51 | -1,55 | 2,406 |
| 27,30 | 27,30 | 6,90 | 0,00 | 30,86 | 0,00 | 23,96 |
Подсчитав суммы в нижней строке таблицы, легко вычислить все необходимые величины. Так как сумма фактических значений y равна сумме расчетных значений, то и среднее значение y совпадает со средним значением yx и равно: 27,3/10= 2,7
Ошибка аппроксимации: s =
= 0,831
Дисперсия фактических значений (y): sy2 =
= 3,09
Дисперсия расчетных значений (yx): syx2 =
= 2,40
Индекс детерминации: R2 =
= 0,777
Теперь найдем параметры уравнения двухфакторной линейной регрессии y = a0 + a1 x2 + a2 x4, включив в уравнение регрессии, кроме фактора x4 дополнительно фактор x2.
Так же, как для предыдущего уравнения построим вспомогательную таблицу, чтобы решить затем систему нормальных уравнений и найти параметры уравнения регрессии.
Таблица 2.4.
Вспомогательная таблица для расчета параметров уравнения регрессии y = a0 + a1 x2 + a2 x4
| Y | x2 | x4 | x22 | x42 | x2*x4 | x2*y | x4*y |
| 0,8 | 4,8 | ||||||
| 12,6 | 158,76 | 176,4 | 37,8 | ||||
| 0,5 | 6,5 | ||||||
| 2,5 | 37,5 | 37,5 | |||||
| 1,5 | 22,5 | ||||||
| 27,3 | 138,6 | 1954,76 | 1830,4 | 406,3 | 395,3 |
На основе сумм, рассчитанных в нижней строке этой таблицы, построим систему нормальных уравнений:
10a0+130a1+138,6a2=27,3
130a0+1886a1+1830,4a2=406,3
10a0+1830,4a1+1954,76a2=18,3
)






