Постановка задачи регрессии

Рассмотрим задачу регрессии по . Пусть мы располагаем парами выборочных наблюдений над двумя переменными и :

;

Функция называется функцией регрессии по , если она описывает изменение условного среднего значения результирующей переменной в зависимости от изменения значений объясняющей переменной : .

Таким образом, имеет место уравнение регрессионной связи между и :

. (2.2)

Наличие в модели (2.2) случайной компоненты , называемой также случайным членом, обусловлено следующими причинами:

1. Ошибки спецификации. Среди них выделяют невключение важных объясняющих переменных, агрегирование (объединение) переменных, неправильную функциональную спецификацию модели.

2. Ошибки измерения, которые связаны со сложностью сбора исходных данных и использованием в модели аппроксимирующих переменных для учета факторов, непосредственное измерение которых невозможно.

3. Ошибки, связанные со случайностью человеческих реакций, которые обусловлены тем, что поведение и непосредственное участие человека в ходе сбора и подготовки данных может быть достаточно непредсказуемым и вносит, таким образом, свой вклад в случайный член.

На основе выборочных наблюдений с учетом дополнительных требований, налагаемых на и, статистически оценить функцию , проверим оптимальность полученной оценки и используем уравнение для построения прогноза.

Допущения модели. Относительно случайной компоненты необходимо принять ряд гипотез, известных как условия Гаусса-Маркова или основных предпосылок регрессионного анализа.

1. ,

Это требование состоит в том, что математическое ожидание случайного члена в любом наблюдении должно быть равно нулю. Иногда случайный член является положительным, иногда отрицательным, но он не должен иметь систематического смещения ни в одном из двух возможных направлений. Свойство непосредственно вытекает из смысла функции регрессии. Возьмём математическое ожидание от обеих частей равенства (2.2) при фиксированном значении , получим , а поскольку с учетом определения функции регрессии должно быть , то необходимо .

2.

Первая строчка означает требование постоянства дисперсии регрессионных остатков (независимость от того, при каких значениях объясняющей переменной производятся наблюдения ), которое называют гомоскедастичностью остатков. Вторая строчка предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях, которые должны быть абсолютно независимы друг от друга.

3. являются случайными величинами.

Таким образом задача регрессии имеет вид

, .

а. . (2.3)

б. (2.4)

в. - неслучайные величины. (2.5)

При выборе вида функции в (2.2) обычно руководствуются следующими рекомендациями:

· используется априорная информация о содержательной экономической сущности анализируемой зависимости - аналитический способ;

· предварительный анализ зависимости с помощью визуализации - графический способ;

· использование различных статистических приемов обработки исходных данных и экспериментальных расчетов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: