Исследуется связь между величиной расходов на питание (X) и размером прожиточного минимума (Y). Результаты наблюдений изучаемых переменных приведены в табл. 13.
Построить прогноз для размера прожиточного минимума при расходах на питание хр = 20 (усл. ед.).
Таблица 13
X | ||||||||||
Y | ||||||||||
1. Из постановки задачи ясно, что размер прожиточного минимума – результативный признак (Y), а величина расходов на питание – факторный признак (X).
2. Корреляционное поле представлено на рис. 12.
Рис. 12. Корреляционное поле для изучаемых признаков
3. По виду корреляционного поля заключаем, что линейная форма связи между Y и Х вполне допустима.
4. Заготовим вспомогательную таблицу (табл. 14) и заполним в ней столбцы 1–6 по исходным данным.
Таблица 14
x | y | xy | x2 | y2 | = b 0 +b 1 x | e 2 = (y– )2 | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
7,8 | 1,44 | ||||||
10,9 | 0,81 | ||||||
14,0 | 4,00 | ||||||
17,1 | 3,61 | ||||||
20,2 | 0,04 | ||||||
70,0 | 9,90 | ||||||
164,8 | 217,2 | 14,0 | 1,98 |
В двух последних строках приведены суммарные и средние значения величин, необходимые для последующих расчётов. Используем эти данные, чтобы оценить тесноту линейной связи переменных Y и Х по формуле (2):
|
|
.
Проверим статистическую значимость коэффициента корреляции.
Согласно (3), наблюдаемое значение t -статистики:
.
С другой стороны, для уровня значимости α= 0,05 и числа степеней свободы n = n – 2 = 3 по таблице распределения Стьюдента найдем критическое значение t (α/2, n – 2) = 3,18.
Так как | t | > t (α/2, n – 2), коэффициент корреляции статистически значим.
Таким образом, между наблюдаемыми переменными есть положительная линейная связь: с увеличением расходов на питание величина прожиточного минимума в среднем возрастает. Теснота линейной связи оценивается по шкале Чеддока (табл. 1) как весьма высокая.
5. Найдём оценки коэффициентов уравнения регрессии по формулам (7) и (8). Используя данные табл. 14, получим b 0 = 6,25, b 1= 0,775, следовательно выборочное уравнение регрессии имеет вид: . Используя это уравнение, заполним столбцы 7 и 8 в табл. 14.
Коэффициент b1 показывает, что при увеличении расходов на питание на 1 усл. ед. прожиточный минимум увеличится в среднем на 0,775 усл. ед. Значение b0 показывает, что при нулевом уровне расходов на питание прожиточный минимум составит в среднем 6,25 усл. ед. Знаки коэффициентов уравнения регрессии соответствуют логике изучаемого явления.
6. Оценим значимость коэффициентов уравнения регрессии. Для этого сначала найдём стандартную ошибку регрессии (11): , отсюда .
|
|
Тогда, согласно (10) и (12), стандартные ошибки коэффициентовуравнения регрессии:
.
Для углового коэффициента регрессии наблюдаемое значение t -статистики, вычисленное по формуле (9), . При α = 0,05 и n = 3 критическое значение t (α/2, n) = 3,18. Поскольку | | > t(α/2, n), коэффициент регрессии β1 значим.
Аналогичную проверку проводим в отношении β0. Для него . Так как | | > t(α/2, n), коэффициент β0 значим.
Таким образом, в нашем примере оба коэффициента уравнения регрессии оказались статистически значимыми.
Выполним интервальное оценивание истинных коэффициентов регрессии b0иb1 согласно (13) и (14). Так, доверительный интервал, который с надёжностью 95 % накрывает истинный (теоретический) коэффициент регрессии b1:
0,775 – 3,18×0,14 < b1 < 0,775 + 3,18×0,14, т. е.
0,32 < b1 < 1,23.
Доверительный интервал для β0:
6,25-3,18×1,65 < β0 < 6,25+3,18×1,65, то есть
1,00 < β0 < 11,50.
Ширина доверительных интервалов для коэффициентов b0иb1(при одном и том же уровне значимости) отличается: для b0она заметно шире, следовательно точность оценивания в этом случае ниже по сравнению с точностью оценки b1. Скорей всего так проявляется очень малый объём выборки (n = 5).
7. Проверим качество построенного уравнения регрессии, вычислив коэффициент детерминации по формуле (15). В нашем примере получим R 2 = rxy 2 ≈ 0,91, отсюда заключаем, что 91 % дисперсии результативного признака объясняется уравнением регрессии , а доля необъяснённой дисперсии составляет лишь 9 %.
Значимость коэффициента детерминации следует из установленной выше значимости коэффициента корреляции.
Близость величины коэффициента R 2к единице свидетельствует о высоком качестве уравнения регрессии.
8. Найдем прогноз модели для уровня прожиточного минимума при величине расходов на питание хр = 20 (усл. ед.).
Точечный прогноз, согласно (18):
.
При расходах на питание в 20 усл. ед. наиболее вероятная величина прожиточного минимума будет 21,75 усл. ед..
Для интервального прогноза найдём его стандартную ошибку по формуле (20):
.
Тогда, согласно (19), доверительный интервал при a= 0,05:
21,75 – 3,18∙2,45 < Yp < 21,75 + 3,18∙2,45;
13,94 < Yp < 29,56.
При расходах на питание в 20 усл. ед. истинное значение прожиточного минимума Yр находится в пределах между 13,94 усл. ед. и 29,56 усл. ед. с вероятностью 95 %.
Вывод: при исследовании связи между размером прожиточного минимума Y и величиной расходов на питание X по выборочным данным построено уравнение регрессии , которое обладает хорошими статистическими свойствами и, следовательно, может быть рекомендовано для практического применения.