Эконометрика

Задача эконометрики заключается в оценивании параметров генеральной совокупности и в установлении зависимости объясняемых переменных от одного или нескольких объясняющих переменных на основании данных эмпирических наблюдений. Напомним основные понятия математической статистики и эконометрики, необходимые для выполнения контрольной работы.

Парный регрессионный анализ.

Предположим, что две величины, и , связаны между собой стохастической зависимостью вида

,

где ¾ нормально распределенная случайная величина, с нулевым математическим ожиданием и средним квадратичным уклонением s, не зависящая от . Производится независимых наблюдений, в каждом из которых мы отслеживаем значения пары . Результатом такого статистического опыта является следующая выборка объема :

, , …, .

На основании этих данных мы пытаемся установить точечные и интервальные оценки параметров , , а также точечные и интервальные оценки индивидуальных и средних значений переменной при различных уровнях фактора .

Теорема Гаусса—Маркова утверждает, что статистическими оценками параметров , , имеющими наименьшую дисперсию в классе линейных несмещенных оценок, являются следующие величины. Оценкой является величина

где

Для оценки параметра служит величина

Теперь, если значение параметра задано, то точечная оценка параметра вычисляется по формуле

.

Интервальные оценки для , , а также оценки значений объясняемой переменной , основаны на следующей точечной оценке параметра случайной величины (стохастической части зависимости ):

.

Доверительный интервал для параметра уравнения линейной регрессии с доверительной вероятностью имеет вид:

,

где - критическая точка распределения Стьюдента с доверительной вероятностью и числом степеней свободы .

Доверительный интервал для оценки дисперсии случайной величины с доверительной вероятностью имеет вид:

,

где критическая точка распределения с доверительной вероятностью и числом степеней свободы .

Доверительный интервал для средних значений объясняемой переменной при выбранном уровне значений переменной с доверительной вероятностью имеет вид

,

где

,

а , по-прежнему, критическая точка распределения Стьюдента с доверительной вероятностью и числом степеней свободы .

Доверительный интервал для индивидуальных значений объясняемой переменной при выбранном уровне значений переменной с доверительной вероятностью будет шире и определяется неравенством

,

где

.

После определения параметров регрессионной модели следует проверить гипотезу о значимости линейного уравнения регрессии. Значимость уравнения регрессии означает, что линейная часть в зависимости является существенной, отличной от нуля. Уравнение регрессии является незначимым, если разброс данных таков, что от выбора значений практически ничего не зависит, и изменения наблюдаемой величины объясняется лишь наличием стохастической зависимости вида . Зададимся уровнем значимости гипотезы, равным (уровень значимости гипотезы есть вероятность отвергнуть утверждение гипотезы в случае, когда оно на самом деле справедливо). Тогда гипотеза о значимости линейного уравнения регрессии принимается, если

,

где есть коэффициент детерминации, определяемый по формуле

,

а – критическая точка распределения Фишера-Снедекора с уровнем значимости и числом степеней свободы 1 и . В противном случае гипотезу о значимости регрессии на данном уровне значимости отвергают.

Если коэффициент детерминации достаточно велик, и уравнение линейной регрессии можно считать значимым, то показывает, какая доля в изменении значений переменной обязана изменению линейной части в соотношении , в отличие от стохастической части , которая обуславливает разброс значений независимо от выбора .

Квадратичная регрессия объясняемой переменной на объясняющую переменную есть точечная оценка параметров стохастической зависимости

,

где нормально распределенная случайная величина с нулевым математическим ожиданием и средним квадратичным уклонением , не зависящая от выбора . Чтобы найти несмещенные точечные оценки , , параметров , , методом Гаусса, составим функцию

.

Искомые оценки есть решение задачи

,

которая по теореме Ферма сводится к решению следующей невырожденной системы линейных уравнений на неизвестные параметры , , :

что может быть записано в виде

Вычислив коэффициенты при неизвестных в этой системе уравнений, мы любым известным способам (например, методом последовательных исключений переменных Гаусса) можем решить эту систему и определить значения коэффициентов квадратичной регрессии.

Задача 11.1. Имеются следующие данные о сменной добыче угля на одного рабочего y (т) и мощности пласта x (м) по 10 различным шахтам:

i          
xi          
yi          
i          
xi          
yi          

В предположении, что между условным среднем и x имеется связь вида , где e - нормально распределенная случайная величина (не зависящая от x) с нулевым математическим ожиданием и среднем квадратичным уклонением s, определить:

1) точечные оценки параметров a 0; a 1, s;

2) найти 95% доверительные интервалы для параметра a 1 уравнения регрессии и для параметра s;

3) среднюю добычу угля на одного рабочего для пласта мощностью 20 м;

4) найти 95% доверительные интервалы для средней и индивидуальной выработки рабочего для пласта мощностью 20 м;

5) проверить гипотезу о значимости уравнения регрессии на уровне значимости a =0.05;

6) определить коэффициент детерминации регрессионной модели.

Кроме того, методом наименьших квадратов Гаусса найти уравнение квадратичной регрессии .

Решение. 1). Найдем сначала точечные оценки выборок для переменных и . Выборочные средние значения и находим из соотношений

,

.

Для выборочных дисперсий и средних квадратичных уклонений получаем:

Отсюда

Для вычисления коэффициента линейной регрессии по формуле осталось найти смешанную сумму

Отсюда следует, что

Из формулы получаем оценку

.

Таким образом, уравнение линейной регрессии имеет вид

.

Теперь по формуле мы можем найти точечную оценку параметра случайной величины :

Отсюда .

2) Найдем 95% доверительные интервалы для параметров и s. Используем формулы

,

.

При , , критические точки распределения Стьюдента и распределения можно найти по таблицам этих распределений, и они равны соответственно

,

Отсюда следует, что доверительный интервал для параметра уравнения регрессии есть

Аналогично, доверительный интервал для параметра имеет вид

3) Найдем среднюю добычу угля на одного рабочего для пласта мощностью м. Подставим в уравнение линейной регрессии :

4) Найдем 95% доверительные интервалы для средней и индивидуальной выработки рабочего для пласта мощностью м. Используем формулы:

,

,

для интервальной оценки средней выработки, и формулы

,

для интервальной оценки индивидуальной выработки. Получаем:

Аналогично, для интервальной оценки индивидуальной выработки получаем:

5) Проверим гипотезу о значимости уравнения регрессии на уровне значимости a =0.05. Для этого найдем коэффициент детерминации по формуле

.

Получаем:

,

Следовательно,

Критическая точка распределения Фишера-Снедекора при уровне значимости a =0.05 равна

,

откуда получаем, что

.

Следовательно, уравнение линейной регрессии следует признать незначимым на данном уровне значимости.

6) Коэффициент детерминации регрессионной модели был найден при проверке гипотезы о значимости уравнения регрессии. Поскольку , следует заключить, что в зависимости объясняемой переменной от наиболее существенную роль играют случайные факторы, а не линейная часть регрессии .

7) Найдем уравнение квадратичной регрессии . Для этого подсчитаем коэффициенты линейной системы уравнений, которая определяется из принципа наименьших квадратов Гаусса:

Часть коэффициентов этой системы фактически уже была найдена в предыдущих пунктах. А именно,

,

,

,

,

Осталось, следовательно, вычислить три коэффициента системы.

Получаем:

Для решения системы используем пакет символьных вычислений MATHCAD. Средствами этой программы решение системы линейных уравнений производится с помощью следующих командных строк.

Решениями системы являются числа

Таким образом, квадратичная регрессия имеет вид

В заключение, построим графики функций и на отрезке . Для построения графиков функций вновь используем программу MATHCAD.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: