Пример «ручного» выполнения задания № 1

Исследуется связь между величиной расходов на питание (X) и размером прожиточного минимума (Y). Результаты наблюдений изучаемых переменных приведены в табл. 13.

Построить прогноз для размера прожиточного минимума при расходах на питание хр = 20 (усл. ед.).

Таблица 13

X            
  Y          
                     

1. Из постановки задачи ясно, что размер прожиточного минимума – результативный признак (Y), а величина расходов на питание – факторный признак (X).

2. Корреляционное поле представлено на рис. 12.

Рис. 12. Корреляционное поле для изучаемых признаков

3. По виду корреляционного поля заключаем, что линейная форма связи между Y и Х вполне допустима.

4. Заготовим вспомогательную таблицу (табл. 14) и заполним в ней столбцы 1–6 по исходным данным.

Таблица 14

x y xy x2 y2 = b 0 +b 1 x e 2 = (y– )2
1 2 3 4 5 6 7 8
            7,8 1,44
            10,9 0,81
            14,0 4,00
            17,1 3,61
            20,2 0,04
            70,0 9,90
    164,8   217,2   14,0 1,98

В двух последних строках приведены суммарные и средние значения величин, необходимые для последующих расчётов. Используем эти данные, чтобы оценить тесноту линейной связи переменных Y и Х по формуле (2):

.

Проверим статистическую значимость коэффициента корреляции.

Согласно (3), наблюдаемое значение t -статистики:

.

С другой стороны, для уровня значимости α= 0,05 и числа степеней свободы n = n – 2 = 3 по таблице распределения Стьюдента найдем критическое значение t (α/2, n – 2) = 3,18.

Так как | t | > t (α/2, n – 2), коэффициент корреляции статистически значим.

Таким образом, между наблюдаемыми переменными есть положительная линейная связь: с увеличением расходов на питание величина прожиточного минимума в среднем возрастает. Теснота линейной связи оценивается по шкале Чеддока (табл. 1) как весьма высокая.

5. Найдём оценки коэффициентов уравнения регрессии по формулам (7) и (8). Используя данные табл. 14, получим b 0 = 6,25, b 1= 0,775, следовательно выборочное уравнение регрессии имеет вид: . Используя это уравнение, заполним столбцы 7 и 8 в табл. 14.

Коэффициент b1 показывает, что при увеличении расходов на питание на 1 усл. ед. прожиточный минимум увеличится в среднем на 0,775 усл. ед. Значение b0 показывает, что при нулевом уровне расходов на питание прожиточный минимум составит в среднем 6,25 усл. ед. Знаки коэффициентов уравнения регрессии соответствуют логике изучаемого явления.

6. Оценим значимость коэффициентов уравнения регрессии. Для этого сначала найдём стандартную ошибку регрессии (11): , отсюда .

Тогда, согласно (10) и (12), стандартные ошибки коэффициентовуравнения регрессии:

.

Для углового коэффициента регрессии наблюдаемое значение t -статистики, вычисленное по формуле (9), . При α = 0,05 и n = 3 критическое значение t (α/2, n) = 3,18. Поскольку | | > t(α/2, n), коэффициент регрессии β1 значим.

Аналогичную проверку проводим в отношении β0. Для него . Так как | | > t(α/2, n), коэффициент β0 значим.

Таким образом, в нашем примере оба коэффициента уравнения регрессии оказались статистически значимыми.

Выполним интервальное оценивание истинных коэффициентов регрессии b0иb1 согласно (13) и (14). Так, доверительный интервал, который с надёжностью 95 % накрывает истинный (теоретический) коэффициент регрессии b1:

0,775 – 3,18×0,14 < b1 < 0,775 + 3,18×0,14, т. е.

0,32 < b1 < 1,23.

Доверительный интервал для β0:

6,25-3,18×1,65 < β0 < 6,25+3,18×1,65, то есть

1,00 < β0 < 11,50.

Ширина доверительных интервалов для коэффициентов b0иb1(при одном и том же уровне значимости) отличается: для b0она заметно шире, следовательно точность оценивания в этом случае ниже по сравнению с точностью оценки b1. Скорей всего так проявляется очень малый объём выборки (n = 5).

7. Проверим качество построенного уравнения регрессии, вычислив коэффициент детерминации по формуле (15). В нашем примере получим R 2 = rxy 2 ≈ 0,91, отсюда заключаем, что 91 % дисперсии результативного признака объясняется уравнением регрессии , а доля необъяснённой дисперсии составляет лишь 9 %.

Значимость коэффициента детерминации следует из установленной выше значимости коэффициента корреляции.

Близость величины коэффициента R 2к единице свидетельствует о высоком качестве уравнения регрессии.

8. Найдем прогноз модели для уровня прожиточного минимума при величине расходов на питание хр = 20 (усл. ед.).

Точечный прогноз, согласно (18):

.

При расходах на питание в 20 усл. ед. наиболее вероятная величина прожиточного минимума будет 21,75 усл. ед..

Для интервального прогноза найдём его стандартную ошибку по формуле (20):

.

Тогда, согласно (19), доверительный интервал при a= 0,05:

21,75 – 3,18∙2,45 < Yp < 21,75 + 3,18∙2,45;

13,94 < Yp < 29,56.

При расходах на питание в 20 усл. ед. истинное значение прожиточного минимума Yр находится в пределах между 13,94 усл. ед. и 29,56 усл. ед. с вероятностью 95 %.

Вывод: при исследовании связи между размером прожиточного минимума Y и величиной расходов на питание X по выборочным данным построено уравнение регрессии , которое обладает хорошими статистическими свойствами и, следовательно, может быть рекомендовано для практического применения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: