Исходные данные. Рассматривается динамика индекса Miles(X) – число миль, проведенных в пути, и динамика индекса Costs(Y) – расходы путешественников (усл

Рассматривается динамика индекса Miles(X) – число миль, проведенных в пути, и динамика индекса Costs(Y) – расходы путешественников (усл. ден. ед.).

Всего в выборке 25 наблюдений. Как видно из диаграммы рассеяния, данные однородны и между ними видна зависимость:

Гистограммы распределения значений исходных рядов Miles(X) и Costs(Y) приведены на рис. 1.1. и рис. 1.2. соответственно.

Рис. 1.1.

Проинтерпретируем описательные статистики, полученные в ходе исследования переменной Miles(X). Среднее арифметическое значение переменной равно 3177,92, то есть среднее число миль, проведенных в пути равно 3177,92. Значение 3082 мили делит данную совокупность пополам и является медианой ряда. Максимальное число миль, проведенных в пути – 5439 миль, а наименьшее – 1211 миль. Показатель рассеивания значений случайной величины относительно её математического ожидания (среднеквадратическое отклонение) равен 1306,196, то есть данные имеют средний разброс значений. Коэффициент ассиметрии равен 0,179, те он положительный, следовательно данный ряд имеет правостороннюю ассиметрию. Куртозис в данном исследовании равен 1,8, что свидетельствует о плосковершинном распределении. Значение статистики Жарка-Бера, равное 1,62, фиксирует отличие распределения от нормального. Вероятность ошибиться, отвергнув гипотезу о том, что выборка из нормального распределения равна 0,45.

Рис. 1.2.

Проинтерпретируем описательные статистики, полученные в ходе исследования переменной Costs(Y). Среднее арифметическое значение равно 4264,2, то есть среднее число расходов путешественников равно 4264,2. Значение 3998 усл.ден.ед. делит данную совокупность пополам и является медианой ряда. Максимальное число расходов -7026 усл.ден.ед., а наименьшее – 1802 усл.ден.ед. Показатель рассеивания значений случайной величины относительно её математического ожидания (среднеквадратическое отклонение) равен 1669, то есть данные имеют большой разброс значений в представленном множестве со средней величиной множества. Коэффициент ассиметрии равен 0,2, те он положительный, следовательно данный ряд имеет правостороннюю ассиметрию. Куртозис в данном исследовании равен 1,73, что свидетельствует о плосковершинном распределении. Значение статистики Жарка-Бера, равное 1,86, фиксирует отличие распределения от нормального. Вероятность ошибиться, отвергнув гипотезу о том, что выборка из нормального распределения равна 0,39.

Полученная матрица корреляции симметрична:

  MILES COSTS
MILES   0.982
COSTS 0.982  


1.2. Оценивание модели МНК

При визуальном сравнении рис. 1.1. и рис. 1.2. видно некоторое сходство между исходными рядами.

В таблице 1.1. приведены результаты оценивания модели МНК.

Из таблицы 1.1. видно, что в модели показатель Miles(X) является значимым по t-критерию, поскольку = 25,2 >2,05, то есть >

При этом, R2 = 0.965176, что означает высокую долю дисперсии результатирующего признака Y в общей дисперсии. Коэффициент детерминации стремиться к 1, то есть регрессия хорошо аппроксимирует эмпирические данные, наблюдение теснее примыкает к линии регрессии.

Регрессионная модель будет иметь вид: Y=1,26*X+274,85

Коэффициент при переменной Miles(X) означает, что при увеличении числа миль на 1, расходы путешественников увеличиваются на 1,26 усл.ден.ед.

Таблица 1.1. Результаты оценки модели методом наименьших квадратов (МНК)

Dependent Variable: COSTS    
         
         
Variable Coefficient Std. Error t-Statistic Prob.
         
         
C 274.8497 170.3368 1.613566 0.1203
MILES 1.255334 0.049720 25.24821 0.0000
         
         
R-squared 0.965176 Mean dependent var 4264.200
Adjusted R-squared 0.963662 S.D. dependent var 1669.030
S.E. of regression 318.1578 Akaike info criterion 14.43959
Sum squared resid 2328161. Schwarz criterion 14.53710
Log likelihood -178.4949 F-statistic 637.4722
Durbin-Watson stat 2.846924 Prob(F-statistic) 0.000000
         
         


Y=1,26*X+274,85

Оценка значимости регрессионного уравнения в целом осуществляется с помощью статистики Фишера. , то есть уравнение статистически значимо.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: