Варианты индивидуальных заданий
Задача 1. По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта).
Требуется:
1. Построить линейное уравнение парной регрессии от .
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6. На одном графике построить исходные данные и теоретическую прямую.
Вариант 4
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., | Среднедневная заработная плата, руб., |
1.Рассчитаем параметры уравнения парной регрессии
y^=a+b*x для этого воспользуемся формулой
a= -b* , b=
cov(x,y)= - * , -
Получим b = = = =0,900682
a= -b* =64,20747
x | y | x*y | x^2 | y^2 | yшляпа | |
138,9641 | ||||||
143,4675 | ||||||
131,7586 | ||||||
144,3681 | ||||||
140,7654 | ||||||
135,3613 | ||||||
137,1627 | ||||||
151,5736 | ||||||
135,3613 | ||||||
145,2688 | ||||||
139,8647 | ||||||
165,0838 | ||||||
сумма | ||||||
сред знач | 86,83333 | 142,4167 | 12447,25 | 7629,667 | 20399,92 | |
cov(x,y) | 80,73611 | |||||
Q2x | 89,63889 | |||||
b | 0,900682 | |||||
a | 64,20747 |
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
rxy=b* = 0,900682* =0,786987
близость коэффициента корреляций к 1 указывает на тесную связь между признаками
коэффициент детерминаций rxy^2=0,619349
показывает, что уравнение регрессий объясняется 61,9 % дисперсий результативного признака, а на долю прочих факторов приходится 38,1%
3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
F- критерия Фишера
F= *(n-2)=16,27075
t- критерий Стьюдента
= = 49883,45
mb= = = =6.81
ma=Sост* = * =223.34*805.87=179985.18
mr= = =0.19
фактические значения статистик
tb= = =0.132
ta= =0.00035
tr= =4.1
Табличное значение t критерия Стьюдента при а=0.05 и числе степеней свободы v=n-2=10,есть tтабл= 2.447. Так как tb<tтабл, ta<tтабл, tr>tтабл, то признаём статическую значимость параметров регрессий и показателя тесноты связи.
Средняя ошибка аппроксимаций
A= *100%=3.44
Говорит о хорошем качестве уравнения регрессий, т.е. свидетельствует о хорошем подборе модели к исходным данным.
4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
xр=1.07*xср=1*86.8=92.8
yшлr=a+b*xr=64.02+0.9*92.8=147.54
Значит при заработной плате в 147.54 среднедушевой прожиточный минимум будет 92.8
5. Найдём доверительный интервал прогноза
MyшлR=Sост* + = + =234.5
x | y | x*y | x^2 | y^2 | yшляпа | y-yшл | (y-yшл)^2 | A | |
138,9641 | -1,96405 | 3,857505 | 3,443935 | ||||||
143,4675 | -1,46746 | 2,153445 | |||||||
131,7586 | -3,7586 | 14,12707 | |||||||
144,3681 | -4,36814 | 19,08068 | |||||||
140,7654 | -7,76542 | 60,3017 | |||||||
135,3613 | 17,63867 | 311,1228 | |||||||
137,1627 | 4,83731 | 23,39957 | |||||||
151,5736 | 2,426402 | 5,887428 | |||||||
135,3613 | -3,36133 | 11,29851 | |||||||
145,2688 | 4,731174 | 22,38401 | |||||||
139,8647 | -7,86474 | 61,85406 | |||||||
165,0838 | 0,916176 | 0,839378 | |||||||
сумма | 1002,718 | 706,2822 | 498834,5 | ||||||
сред знач | 86,83333 | 142,4167 | 12447,25 | 7629,667 | 20399,92 | 83,55982 | 58,85685 | 41569,54 | |
cov(x,y) | 80,73611 | ||||||||
Q2x | 89,63889 | 117,4097 | |||||||
b | 0,900682 | ||||||||
a | 64,20747 | ||||||||
Q | 9,467782 | 10,83558 | |||||||
rxy | 0,786987 | ||||||||
rxy^2 | 0,619349 | ||||||||
F | 16,27075 | ||||||||
Sост^2 | 49883,45 |
Множественная регрессия и корреляция
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%) (смотри таблицу своего варианта).
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Вариант 4
Номер предприятия | Номер предприятия | ||||||
3,5 | 6,3 | ||||||
3,6 | 6,5 | ||||||
3,9 | 7,2 | ||||||
4,1 | 7,5 | ||||||
4,2 | 7,9 | ||||||
4,5 | 8,2 | ||||||
5,3 | 8,4 | ||||||
5,5 | 8,6 | ||||||
5,6 | 9,5 | ||||||
6,1 | 9,6 |
№ | y | x1 | x2 | yx1 | yx2 | x1x2 | x1^2 | x2^2 | y^2 |
3,5 | 24,5 | 31,5 | 12,25 | ||||||
3,6 | 25,2 | 12,96 | |||||||
3,9 | 27,3 | 46,8 | 15,21 | ||||||
4,1 | 28,7 | 69,7 | 16,81 | ||||||
4,2 | 33,6 | 75,6 | 17,64 | ||||||
4,5 | 85,5 | 20,25 | |||||||
5,3 | 47,7 | 100,7 | 28,09 | ||||||
5,5 | 49,5 | 30,25 | |||||||
5,6 | 117,6 | 31,36 | |||||||
6,1 | 128,1 | 37,21 | |||||||
6,3 | 138,6 | 39,69 | |||||||
6,5 | 42,25 | ||||||||
7,2 | 79,2 | 172,8 | 51,84 | ||||||
7,5 | 187,5 | 56,25 | |||||||
7,9 | 94,8 | 213,3 | 62,41 | ||||||
8,2 | 106,6 | 67,24 | |||||||
8,4 | 109,2 | 260,4 | 70,56 | ||||||
8,6 | 120,4 | 283,8 | 73,96 | ||||||
9,5 | 332,5 | 90,25 | |||||||
9,6 | 345,6 | 92,16 | |||||||
сумма | 1394,7 | 868,64 | |||||||
средн зн | 10,3 | 6,3 | 22,55 | 69,735 | 250,8 | 156,25 | 43,432 | 565,55 | 112,5 |
Найдем средние квадратические отклонения признаков:
Qy= - = =2.531
Qx1= - = 6,3^2=1,934
Qx2= - = =7,552
1. Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :
либо воспользоваться готовыми формулами:
; ;
.
Рассчитаем сначала парные коэффициенты корреляции:
cov(y;x1)= - * = 69,735-10,3*6,3=4,845
cov(y;x2)= - * = 250,8-10,3*22,55=18,535
cov(x1;x2)= - * = 156,25-6,3*22,55=14,185
= = =0,989
= =0,969
= =0,971
Находим
= * =1,308* =1,101
= * =0,335* =0,047 =10,3-1,101*6,3-0,047*22,55=10,3-6,936-1,059=2,305
Таким образом, получили следующее уравнение множественной регрессии:
Yшл=2,305+1,101*x1+b2*x2
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:
B1=b1 =1,101* =0,841
B2=b2 =0,047* =0,140
Т.е. уравнение будет выглядеть следующим образом:
tшлY=0,841* +0,140*
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
=1,101* =0,67 =0,047* =0,10
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,67% или 0,10% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
=0,989 0,969 0,971
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к 0,971>0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
= = =3,42
= = =0,258
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
= =1
= =0,057
Коэффициент множественной корреляции
= = 0,996
Нескорректированный коэффициент множественной детерминации
3. =0,988 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98,8% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
= 1 – (1- ) =1 – (1 – 0,988) =0,987
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 98%) детерминированность результата в модели факторами и .
2.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
= * =645,34
Получили, что > (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
4. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
;
.
Найдем и
=0,989^2=0,978
=0,969^2=0,938
Имеем
= * =19,295
= * =1,368
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .
5. Общий вывод состоит в том, что множественная модель с факторами и с =0,988 содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:
=0,978
Временные ряды
Требуется:
1. Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.
2. Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).
3. Сделать прогноз на 2 квартала вперед.
Варианты 3, 4
5,5 | 8,0 | |||||||||||
4,6 | 5,6 | |||||||||||
5,0 | 6,4 | |||||||||||
9,2 | 10,9 | |||||||||||
7,1 | 9,1 | |||||||||||
5,1 | 6,4 | |||||||||||
5,9 | 7,2 | |||||||||||
10,0 | 11,0 | |||||||||||
t | yt | yt-1 | yt-yшл1 | yt-1-yшл2 | d1*e1 | (yt-yшл1)^2 | (yt-1-yшл2)^2 | |||||
5,5 | - | - | - | - | - | - | ||||||
4,6 | 5,5 | -2,7125 | -1,56667 | 4,249583 | 7,357656 | 2,454444 | ||||||
4,6 | -2,3125 | -2,46667 | 5,704167 | 5,347656 | 6,084444 | |||||||
9,2 | 1,8875 | -2,06667 | -3,90083 | 3,562656 | 4,271111 | |||||||
7,1 | 9,2 | -0,2125 | 2,133333 | -0,45333 | 0,045156 | 4,551111 | ||||||
5,1 | 7,1 | -2,2125 | 0,033333 | -0,07375 | 4,895156 | 0,001111 | ||||||
5,9 | 5,1 | -1,4125 | -1,96667 | 2,777917 | 1,995156 | 3,867778 | ||||||
5,9 | 2,6875 | -1,16667 | -3,13542 | 7,222656 | 1,361111 | |||||||
0,6875 | 2,933333 | 2,016667 | 0,472656 | 8,604444 | ||||||||
5,6 | -1,7125 | 0,933333 | -1,59833 | 2,932656 | 0,871111 | |||||||
6,4 | 5,6 | -0,9125 | -1,46667 | 1,338333 | 0,832656 | 2,151111 | ||||||
10,9 | 6,4 | 3,5875 | -0,66667 | -2,39167 | 12,87016 | 0,444444 | ||||||
9,1 | 10,9 | 1,7875 | 3,833333 | 6,852083 | 3,195156 | 14,69444 | ||||||
6,4 | 9,1 | -0,9125 | 2,033333 | -1,85542 | 0,832656 | 4,134444 | ||||||
7,2 | 6,4 | -0,1125 | -0,66667 | 0,075 | 0,012656 | 0,444444 | ||||||
7,2 | 3,6875 | 0,133333 | 0,491667 | 13,59766 | 0,017778 | |||||||
сумма | 1,8125 | -1,1E-14 | 10,09667 | 65,17234 | 53,95333 | |||||||
сред знач | 7,3125 | 7,066667 | - | - | - | - | - | |||||
= = =0,170
Автокорреляция второго порядка
t | yt | yt-2 | yt-yшл3 | yt-2-yшл4 | d1*e1 | (yt-yшл3)^2 | (yt-2-yшл4)^2 |
5,5 | - | - | - | - | - | - | |
4,6 | - | - | - | - | - | - | |
5,5 | -2,3125 | -1,55714 | 3,600893 | 5,347656 | 2,424694 | ||
9,2 | 4,6 | 1,8875 | -2,45714 | -4,63786 | 3,562656 | 6,037551 | |
7,1 | -0,2125 | -2,05714 | 0,437143 | 0,045156 | 4,231837 | ||
5,1 | 9,2 | -2,2125 | 2,142857 | -4,74107 | 4,895156 | 4,591837 | |
5,9 | 7,1 | -1,4125 | 0,042857 | -0,06054 | 1,995156 | 0,001837 | |
5,1 | 2,6875 | -1,95714 | -5,25982 | 7,222656 | 3,830408 | ||
5,9 | 0,6875 | -1,15714 | -0,79554 | 0,472656 | 1,33898 | ||
5,6 | -1,7125 | 2,942857 | -5,03964 | 2,932656 | 8,660408 | ||
6,4 | -0,9125 | 0,942857 | -0,86036 | 0,832656 | 0,88898 | ||
10,9 | 5,6 | 3,5875 | -1,45714 | -5,2275 | 12,87016 | 2,123265 | |
9,1 | 6,4 | 1,7875 | -0,65714 | -1,17464 | 3,195156 | 0,431837 | |
6,4 | 10,9 | -0,9125 | 3,842857 | -3,50661 | 0,832656 | 14,76755 | |
7,2 | 9,1 | -0,1125 | 2,042857 | -0,22982 | 0,012656 | 4,173265 | |
6,4 | 3,6875 | -0,65714 | -2,42321 | 13,59766 | 0,431837 | ||
сумма | 98,8 | 4,525 | -1,1E-14 | -29,9186 | 57,81469 | 53,93429 | |
сред знач | 7,3125 | 7,057143 | - | - | - | - | - |
Вычисление коэффициента второго порядка
= = =0,5357
t | yt | yt-2 | yt-yшл4 | yt-3-yшл4 | d1*e1 | (yt-yшл3)^2 | (yt-3-yшл5)^2 |
5,5 | - | - | - | - | - | - | |
4,6 | - | - | - | - | - | - | |
- | - | - | - | - | - | ||
9,2 | 5,5 | 1,8875 | -1,60769 | -3,03452 | 3,562656 | 2,584675 | |
7,1 | 4,6 | -0,2125 | -2,50769 | 0,532885 | 0,045156 | 6,288521 | |
5,1 | -2,2125 | -2,10769 | 4,663269 | 4,895156 | 4,442367 | ||
5,9 | 9,2 | -1,4125 | 2,092308 | -2,95538 | 1,995156 | 4,377751 | |
7,1 | 2,6875 | -0,00769 | -0,02067 | 7,222656 | 5,92E-05 | ||
5,1 | 0,6875 | -2,00769 | -1,38029 | 0,472656 | 4,030828 | ||
5,6 | 5,9 | -1,7125 | -1,20769 | 2,068173 | 2,932656 | 1,458521 | |
6,4 | -0,9125 | 2,892308 | -2,63923 | 0,832656 | 8,365444 | ||
10,9 | 3,5875 | 0,892308 | 3,201154 | 12,87016 | 0,796213 | ||
9,1 | 5,6 | 1,7875 | -1,50769 | -2,695 | 3,195156 | 2,273136 | |
6,4 | 6,4 | -0,9125 | -0,70769 | 0,645769 | 0,832656 | 0,500828 | |
7,2 | 10,9 | -0,1125 | 3,792308 | -0,42663 | 0,012656 | 14,3816 | |
9,1 | 3,6875 | 1,992308 | 7,346635 | 13,59766 | 3,96929 | ||
сумма | 92,4 | 6,8375 | -8E-15 | 5,306154 | 52,46703 | 53,46923 | |
сред знач | 7,3125 | 7,107692 | - | - | - | - | - |
=0,0137 =0,7773
=0,9637
=0,1267
=-0,6237
=-0,0113
=0,9013
=0,1166
=-0,6052
=-0,0928