Спецификация множественной эконометрической зависимости

Введение

Целью данной лабораторной работы является исследование множественных эконометрических зависимостей средствами Statiatica 6.1, то есть построение приблизительной аналитической зависимости – множественной регрессии, которая представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция нескольких переменных х.

Исходные данные для анализа содержатся в матрице наблюдений, состоящей из пяти столбцов, один из которых содержит значение зависимой величины (функции отклика), а другие – значения независимых признаков.


Постановка задачи

Для набора экономических или финансовых показателей выполнить:

1) спецификацию множественной зависимости. В ходе спецификации определить

– мультиколлинеарность факторов;

– интеркоррелированость факторов;

– набор информативных факторов;

– коэффициенты частной корреляции;

– коэффициент детерминации;

2) построение линейной формы с полным набором факторов и оценку построенной модели;

3) построение линейной формы с информативными факторами и оценку построенной модели;

4) построение нелинейной формы с полным набором факторов и оценку построенной модели (гиперболическая модель);

5) расчет коэффициентов эластичности для каждой модели;

6) проверку предпосылок использования метода наименьших квадратов.

Исходные данные представлены в таблице 1.


Таблица 1 - Основные показатели водного транспорта в 1940-2004 гг.

y1 x1 x2 x3 x4
3,3        
2,4        
3,9        
4,8        
5,5        
5,3        
5,1        
4,8        
1,1        
0,9        
0,9        
0,8        
0,8        
0,9        
0,9        
         
0,8        
0,8        
Принятые в таблице обозначения: x1 – эксплуатационная длина внутренних водных судоходных путей, тыс. км; x2 – перевезено грузов водным транспортом, млн.т; x3 – грузооборот водного транспорта, млрд. т·км; x4 – перевезено пассажиров внутренним водным транспортом, млн. человек; y1 – пассажирооборот внутреннего вводного транспорта, млрд. пассажиро-километров.

Спецификация множественной эконометрической зависимости

Спецификацию множественной зависимости проводим на основе матрицы коэффициентов парной корреляции. Результаты расчета представлены в таблице 2.1.

Таблица 2.1 - Результаты построения матрицы парной корреляции

Переменная Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД)
y1 x1 x2 x3 x4
y1 1,00 0,75 0,85 0,83 0,98
x1 0,75 1,00 0,56 0,59 0,80
x2 0,85 0,56 1,00 0,98 0,80
x3 0,83 0,59 0,98 1,00 0,79
x4 0,98 0,80 0,80 0,79 1,00

Красным цветом выделены коэффициенты парной корреляции значимые на выбранном уровне.

Наличие значимых коэффициентов означает интеркоррелированность между следующими парами признаков:

1) пассажирооборотом внутреннего вводного транспорта и эксплуатационной длиной внутренних водных судоходных путей;

2) пассажирооборотом внутреннего вводного транспорта и объемом перевезенного груза водным транспортом;

3) пассажирооборотом внутреннего вводного транспорта и грузооборотом водного транспорта;

4) пассажирооборотом внутреннего вводного транспорта и количеством пассажиров, перевезенных внутренним водным транспортом;

5) эксплуатационной длиной внутренних водных судоходных путей и объемом перевезенного груза водным транспортом;

6) эксплуатационной длиной внутренних водных судоходных путей и грузооборотом водного транспорта;

7) эксплуатационной длиной внутренних водных судоходных путей и количеством пассажиров, перевезенных внутренним водным транспортом;

8) объемом перевезенного груза и грузооборотом водного транспорта;

9) объемом перевезенного груза и количеством пассажиров, перевезенных внутренним водным транспортом;

10) грузооборотом водного транспорта и количеством пассажиров, перевезенных внутренним водным транспортом.

Выдвинем гипотезу о том, что все факторы не обладают свойством мультиколлинеарности, т.е. являются независимыми. Поскольку величина имеет приближенное распределение со степенями свободы , то для нашего примера

,

где n = 18 – количество наблюдений;

m = 4 – количество факторов;

DetR = 0,004416 – определитель матрицы межфакторной корреляции при условии, что величина пассажирооборота внутреннего вводного транспорта выбрана как зависимая величина.

Табличное значение при количестве степеней свободы равном и уровне значимости a=5% составляет 43,8. Так как фактическое значение не превосходит табличное (22,1 < 43,8), то нет оснований отвергать гипотезу. Факторы не являются мультиколлинеарными.

Выполним исключение неинформативных факторов из рассмотрения. В матрице межфакторной корреляции максимальным по абсолютному значению является коэффициент, характеризующий зависимость между объемом грузов, перевезенных водным транспортом и грузооборотом водного транспорта, равный 0,98.

На основе попарного сравнения значений коэффициентов корреляции в столбцах для объемом грузов, перевезенным водным транспортом (x2) и грузооборотом водного транспорта (x3), можно утверждать, что все значения коэффициентов в столбце x3 меньше, чем значения коэффициентов в столбце x2. Поэтому фактор, характеризующий объемом грузов, перевезенных водным транспортом, признаем неинформативным и из дальнейшего рассмотрения исключаем.

Таблица 2.2- Матрица парной корреляции после исключения одного фактора

Переменная Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД)
y1 x1 x3 x4
y1 1,00 0,75 0,83 0,98
x1 0,75 1,00 0,59 0,80
x3 0,83 0,59 1,00 0,79
x4 0,98 0,80 0,79 1,00

Для оставшихся факторов повторяем процедуру исключения и на каждом шаге получим:

Шаг 2: Максимальный коэффициент парной корреляции характеризует зависимость между эксплуатационной длиной внутренних водных судоходных путей (x1) и количеством пассажиров, перевезенных внутренним водным транспортом (х4).

Выдвинем гипотезу о том, что все факторы не обладают свойством мультиколлинеарности, т.е. являются независимыми.

Величина имеет значение

,

где n = 18 – количество наблюдений;

m = 3 – количество факторов;

DetR = 0,13356 – определитель матрицы межфакторной корреляции при условии, что величина пассажирооборота внутреннего вводного транспорта выбрана как зависимая величина.

Табличное значение при количестве степеней свободы равное и уровне значимости a=5% составляет 43,8. Так как фактическое значение не превосходит табличное (18,6 < 43,8), то нет оснований отвергать гипотезу. Факторы не являются мультиколлинеарными.

Большее влияние на все остальные факторы оказывает признак, характеризующий количество пассажиров, перевезенных внутренним водным транспортом (х4). Этот фактор признаем неинформативным.

Таблица 2.3 - Матрица парной корреляции после исключения двух факторов

Переменная Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД)
y1 x1 x3
y1 1,00 0,75 0,83
x1 0,75 1,00 0,59
x3 0,83 0,59 1,00

Информативный набор факторов составляют:

– эксплуатационная длина внутренних водных судоходных путей;

– грузооборот водного транспорта.

На основе значений матрицы парной корреляции можно выполнить ранжирование зависимых признаков по силе их взаимодействия с функцией отклика при элиминировании влияния остальных факторов на основе показателей частной корреляции. Результаты вычислений и оценки приведены в таблице 2.4.

Для линейной формы модели коэффициент частной корреляции можно определить по формуле

, (2.1)

где - определитель матрицы парной корреляции, полученной вычеркиванием строки y и j -го столбца;

- определитель матрицы парной корреляции, полученной вычеркиванием строки y и столбца у;

- определитель матрицы парной корреляции, полученной вычеркиванием j- й строки и j- го столбца.


Для нашего случая = 0,004417.

Значения t-cтатистики посчитаем по формуле:

, (2.2)

. (2.3)

Табличное значение t-статистики при a=5% и количестве степеней свободы n=18–1–4=13 составляет 2,16.

Таблица 2.4 - Результаты вычислений и оценки показателей частной корреляции

j
  0,000368 -0,000173 -0,1359 0,2476 0,5488
  0,003893 -0,001486 -0,3583 0,2334 1,5351
  0,003253 -0,00074 -0,1952 0,2452 0,7961
  0,004025 -0,003862 -0,8447 0,1338 6,3131

Ранжирование частных корреляций можно представить в виде цепочки предпочтений:

,

т.е. можно сделать вывод, что в наибольшей степени на функцию отклика влияет фактор (объем перевозок пассажиров внутренним водным транспортом).



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: