Введение
Целью данной лабораторной работы является исследование множественных эконометрических зависимостей средствами Statiatica 6.1, то есть построение приблизительной аналитической зависимости – множественной регрессии, которая представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция нескольких переменных х.
Исходные данные для анализа содержатся в матрице наблюдений, состоящей из пяти столбцов, один из которых содержит значение зависимой величины (функции отклика), а другие – значения независимых признаков.
Постановка задачи
Для набора экономических или финансовых показателей выполнить:
1) спецификацию множественной зависимости. В ходе спецификации определить
– мультиколлинеарность факторов;
– интеркоррелированость факторов;
– набор информативных факторов;
– коэффициенты частной корреляции;
– коэффициент детерминации;
2) построение линейной формы с полным набором факторов и оценку построенной модели;
|
|
3) построение линейной формы с информативными факторами и оценку построенной модели;
4) построение нелинейной формы с полным набором факторов и оценку построенной модели (гиперболическая модель);
5) расчет коэффициентов эластичности для каждой модели;
6) проверку предпосылок использования метода наименьших квадратов.
Исходные данные представлены в таблице 1.
Таблица 1 - Основные показатели водного транспорта в 1940-2004 гг.
y1 | x1 | x2 | x3 | x4 |
3,3 | ||||
2,4 | ||||
3,9 | ||||
4,8 | ||||
5,5 | ||||
5,3 | ||||
5,1 | ||||
4,8 | ||||
1,1 | ||||
0,9 | ||||
0,9 | ||||
0,8 | ||||
0,8 | ||||
0,9 | ||||
0,9 | ||||
0,8 | ||||
0,8 | ||||
Принятые в таблице обозначения: x1 – эксплуатационная длина внутренних водных судоходных путей, тыс. км; x2 – перевезено грузов водным транспортом, млн.т; x3 – грузооборот водного транспорта, млрд. т·км; x4 – перевезено пассажиров внутренним водным транспортом, млн. человек; y1 – пассажирооборот внутреннего вводного транспорта, млрд. пассажиро-километров. |
Спецификация множественной эконометрической зависимости
Спецификацию множественной зависимости проводим на основе матрицы коэффициентов парной корреляции. Результаты расчета представлены в таблице 2.1.
Таблица 2.1 - Результаты построения матрицы парной корреляции
Переменная | Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД) | ||||
y1 | x1 | x2 | x3 | x4 | |
y1 | 1,00 | 0,75 | 0,85 | 0,83 | 0,98 |
x1 | 0,75 | 1,00 | 0,56 | 0,59 | 0,80 |
x2 | 0,85 | 0,56 | 1,00 | 0,98 | 0,80 |
x3 | 0,83 | 0,59 | 0,98 | 1,00 | 0,79 |
x4 | 0,98 | 0,80 | 0,80 | 0,79 | 1,00 |
Красным цветом выделены коэффициенты парной корреляции значимые на выбранном уровне.
|
|
Наличие значимых коэффициентов означает интеркоррелированность между следующими парами признаков:
1) пассажирооборотом внутреннего вводного транспорта и эксплуатационной длиной внутренних водных судоходных путей;
2) пассажирооборотом внутреннего вводного транспорта и объемом перевезенного груза водным транспортом;
3) пассажирооборотом внутреннего вводного транспорта и грузооборотом водного транспорта;
4) пассажирооборотом внутреннего вводного транспорта и количеством пассажиров, перевезенных внутренним водным транспортом;
5) эксплуатационной длиной внутренних водных судоходных путей и объемом перевезенного груза водным транспортом;
6) эксплуатационной длиной внутренних водных судоходных путей и грузооборотом водного транспорта;
7) эксплуатационной длиной внутренних водных судоходных путей и количеством пассажиров, перевезенных внутренним водным транспортом;
8) объемом перевезенного груза и грузооборотом водного транспорта;
9) объемом перевезенного груза и количеством пассажиров, перевезенных внутренним водным транспортом;
10) грузооборотом водного транспорта и количеством пассажиров, перевезенных внутренним водным транспортом.
Выдвинем гипотезу о том, что все факторы не обладают свойством мультиколлинеарности, т.е. являются независимыми. Поскольку величина имеет приближенное распределение со степенями свободы , то для нашего примера
,
где n = 18 – количество наблюдений;
m = 4 – количество факторов;
DetR = 0,004416 – определитель матрицы межфакторной корреляции при условии, что величина пассажирооборота внутреннего вводного транспорта выбрана как зависимая величина.
Табличное значение при количестве степеней свободы равном и уровне значимости a=5% составляет 43,8. Так как фактическое значение не превосходит табличное (22,1 < 43,8), то нет оснований отвергать гипотезу. Факторы не являются мультиколлинеарными.
Выполним исключение неинформативных факторов из рассмотрения. В матрице межфакторной корреляции максимальным по абсолютному значению является коэффициент, характеризующий зависимость между объемом грузов, перевезенных водным транспортом и грузооборотом водного транспорта, равный 0,98.
На основе попарного сравнения значений коэффициентов корреляции в столбцах для объемом грузов, перевезенным водным транспортом (x2) и грузооборотом водного транспорта (x3), можно утверждать, что все значения коэффициентов в столбце x3 меньше, чем значения коэффициентов в столбце x2. Поэтому фактор, характеризующий объемом грузов, перевезенных водным транспортом, признаем неинформативным и из дальнейшего рассмотрения исключаем.
Таблица 2.2- Матрица парной корреляции после исключения одного фактора
Переменная | Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД) | |||
y1 | x1 | x3 | x4 | |
y1 | 1,00 | 0,75 | 0,83 | 0,98 |
x1 | 0,75 | 1,00 | 0,59 | 0,80 |
x3 | 0,83 | 0,59 | 1,00 | 0,79 |
x4 | 0,98 | 0,80 | 0,79 | 1,00 |
Для оставшихся факторов повторяем процедуру исключения и на каждом шаге получим:
Шаг 2: Максимальный коэффициент парной корреляции характеризует зависимость между эксплуатационной длиной внутренних водных судоходных путей (x1) и количеством пассажиров, перевезенных внутренним водным транспортом (х4).
Выдвинем гипотезу о том, что все факторы не обладают свойством мультиколлинеарности, т.е. являются независимыми.
Величина имеет значение
,
где n = 18 – количество наблюдений;
|
|
m = 3 – количество факторов;
DetR = 0,13356 – определитель матрицы межфакторной корреляции при условии, что величина пассажирооборота внутреннего вводного транспорта выбрана как зависимая величина.
Табличное значение при количестве степеней свободы равное и уровне значимости a=5% составляет 43,8. Так как фактическое значение не превосходит табличное (18,6 < 43,8), то нет оснований отвергать гипотезу. Факторы не являются мультиколлинеарными.
Большее влияние на все остальные факторы оказывает признак, характеризующий количество пассажиров, перевезенных внутренним водным транспортом (х4). Этот фактор признаем неинформативным.
Таблица 2.3 - Матрица парной корреляции после исключения двух факторов
Переменная | Корреляции (Таблица данных в Workbook1) Отмеченные корреляции значимы на уровне p <.05000 N=18 (Построчное удаление ПД) | ||
y1 | x1 | x3 | |
y1 | 1,00 | 0,75 | 0,83 |
x1 | 0,75 | 1,00 | 0,59 |
x3 | 0,83 | 0,59 | 1,00 |
Информативный набор факторов составляют:
– эксплуатационная длина внутренних водных судоходных путей;
– грузооборот водного транспорта.
На основе значений матрицы парной корреляции можно выполнить ранжирование зависимых признаков по силе их взаимодействия с функцией отклика при элиминировании влияния остальных факторов на основе показателей частной корреляции. Результаты вычислений и оценки приведены в таблице 2.4.
Для линейной формы модели коэффициент частной корреляции можно определить по формуле
, (2.1)
где - определитель матрицы парной корреляции, полученной вычеркиванием строки y и j -го столбца;
- определитель матрицы парной корреляции, полученной вычеркиванием строки y и столбца у;
- определитель матрицы парной корреляции, полученной вычеркиванием j- й строки и j- го столбца.
Для нашего случая = 0,004417.
Значения t-cтатистики посчитаем по формуле:
, (2.2)
. (2.3)
Табличное значение t-статистики при a=5% и количестве степеней свободы n=18–1–4=13 составляет 2,16.
Таблица 2.4 - Результаты вычислений и оценки показателей частной корреляции
j | |||||
0,000368 | -0,000173 | -0,1359 | 0,2476 | 0,5488 | |
0,003893 | -0,001486 | -0,3583 | 0,2334 | 1,5351 | |
0,003253 | -0,00074 | -0,1952 | 0,2452 | 0,7961 | |
0,004025 | -0,003862 | -0,8447 | 0,1338 | 6,3131 |
Ранжирование частных корреляций можно представить в виде цепочки предпочтений:
|
|
,
т.е. можно сделать вывод, что в наибольшей степени на функцию отклика влияет фактор (объем перевозок пассажиров внутренним водным транспортом).