В регрессионном анализе рассматривается односторонняя зависимость случайной зависимой переменной Y от одной (или нескольких) неслучайной независимой переменной Х, называемой часто объясняющей переменной. Такая зависимость может возникнуть, например, в случае, когда при каждом фиксированном значении X соответствующие значения Y подвержены случайному разбросу за счет действия неконтролируемых факторов. Указанная зависимость Y от X (иногда ее называют регрессионной) может быть представлена также в виде модельного уравнения регрессии (1.1). В силу воздействия неучтенных случайных факторов и причин отдельные наблюдения y будут в большей или меньшей мере отклоняться от функции регрессии . В этом случае уравнение взаимосвязи двух переменных (парная регрессионная модель) может быть представлено в виде: , где — случайная переменная, характеризующая отклонение от функции регрессии. Эту переменную будем называть возмущающей или просто возмущением. Таким образом, в регрессионной модели зависимая переменная Y есть некоторая функция (Х) с точностью до случайного возмущения .
|
|
Рассмотрим линейный регрессионный анализ, для которого функция (Х) линейная относительно оцениваемых параметров:
. (2.1)
Предположим, что для оценки параметров линейной функции регрессии (2.1) взята выборка, содержащая n пар значений переменных (), где i=1,2,..., . В этом случае линейная парная регрессионная модель имеет вид:
(2.2)
Отметим основные предпосылки регрессионного анализа:
1. В модели (2.2) возмущение (или зависимая переменная ) есть величина случайная, а объясняющая переменная — величина неслучайная.
2. Математическое ожидание возмущения равно нулю:
(или математическое ожидание зависимой переменной равно линейной функции регрессии:
M()= (2.3)
3. Дисперсия возмущения (или зависимой переменной ) постоянна для любого i:
(2.4)
(или D() = — условие гомоскедастичности или равноизменчивости возмущения (зависимой переменной)).
4. Возмущения (или переменные и) не коррелированы.
(i (2.5)
5. Возмущение , (или зависимая переменная ) есть нормально распределенная случайная величина.
Для получения уравнения регрессии достаточно первых четырех предпосылок. Требование выполнения пятой предпосылки (т.е. рассмотрение «нормальной регрессии») необходимо для оценки точности уравнения регрессии и его параметров.
|
|
Оценкой модели (2.2) по выборке является уравнение регрессии:
(1.8). Параметры этого уравнения и определяются на основе метода наименьших квадратов.
Теорема Гауса-Маркова. Если регрессионная модель удовлетворяет предпосылкам 1-4, то оценки и имеют наименьшую дисперсию в классе линейных несмещенных оценок, т.е. являются эффективными оценками параметров и .
Воздействие неучтенных случайных факторов и ошибок наблюдений в модели (2.2) определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии . Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия
(2.6)
где — групповая средняя, найденная по уравнению регрессии;
— выборочная оценка возмущения , или остаток регрессии.
В знаменателе выражения (2.6) стоит число степеней свободы n—2, а не n, так как две степени свободы теряются при определении двух параметров прямой и .