Суть регрессионного анализа, его этапы

1 2 3 4 5 6 7

Методы выбора вида математической функции

В парной регрессии выбор вида математической функции может быть осуществлен тремя методами:

- графическим;

- аналитическим;

-экспериментальным.

При изучении зависимости между признаками графическим способом используется поле корреляции.

Аналитический метод основан на изучении материальной природы связи исследуемых признаков.

При обработке информации на компьютере выбор вида уравнения регрессии обычно осуществляется экспериментальным методом, т.е. путем сравнения величины остаточной дисперсии, рассчитанной при разных моделях.

Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии, то фактические значения результативного признака совпадают с теоретическими, т. е. они полностью обусловлены влиянием фактора х. В этом случае остаточная дисперсия равна нулю. В практических исследованиях имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых в уравнении регрессии факторов, т.е. имеют место отклонения фактических данных от теоретических. Величина этих отклонений и лежит в основе расчета остаточной дисперсии.

Чем меньше величина остаточной дисперсии, тем в меньшей мере наблюдается влияние прочих не учитываемых в уравнение регрессии факторов и лучше уравнение регрессии подходит к исходным данным. Если остаточная дисперсия оказывается примерно одинаковой для нескольких функций, то предпочтение отдается более простым видам функций.

При исследовании взаимосвязей между результативными показателями и различными факторами хозяйственной деятельности необходимо учитывать то, что их зависимость вызвана взаимосвязанным влиянием одних явлений на другие; отдельное какое-то явление развивается под действием многих явлений. Поэтому основным методом для оценки взаимосвязей и зависимостей является регрессионный анализ.

С помощью регрессионного анализа можно установить на сколько изменится результативный признак при изменении факторных признаков на единицу, если уровни всех других факторов принять неизменными.

Выделяют следующие этапы регрессионного анализа:

1) установление факта наличия связи между признаками и определение набора факторов для модели;

2) подготовка исходной информации для проведения анализа:

- выборочная совокупность должна быть репрезентативной. Считается, что число наблюдений должно в 6-7 раз превышать число рассчитываемых параметров при переменой х;

- результаты наблюдений должны быть однородными;

- в модель не должны включаться факторы, которые связаны между собой функционально.

3) выбор связи и построение уравнения регрессии;

4) вычисление показателей, характеризующих качество построенной модели;

5) экономическая интерпретация коэффициентов регрессии и других показателей;

6) вычисление показателей тесноты связи;

7) оценка существенности корреляции.

2.4 Линейная регрессия и корреляция: смысл и оценка параметров

Корреляция – это статистический термин, характеризующий степень взаимной зависимости двух случайных величин.

Линейная регрессия находит широкое применение в эконометрике в виде четкой экономической интерпретации ее параметров. Линейное уравнение регрессии позволяет по заданным значениям фактора х получить теоретические значения результативного признака. На графике теоретические значения представляют линию регрессии.

Линейное уравнение парной регрессии имеет следующий вид

y=a + b*x+e

Оценка параметров линейной регрессии основана на методе наименьших квадратов (МНК), который позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака от расчетных минимальна.

Для оценки параметров а и b используется система нормальных уравнений

Можно воспользоваться готовыми формулами:

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.

Параметр а экономического смысла не имеет. Интерпретировать можно знак при параметре а. Если а >0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции:

Линейный коэффициент корреляции находится в границах от – 1 до 1.

Если коэффициент регрессии b >0, то коэффициент корреляции будет находиться в пределах от 0 до 1, и, наоборот, при b <0, коэффициент корреляции будет в границах от -1 до 0.

Для оценки качества подбора линейной функции рассчитывается коэффициент детерминации (квадрат линейного коэффициента корреляции). Коэффициент детерминации характеризует долю дисперсии результативного признака, объясняемую регрессией. Чем больше доля объясненной вариации, тем меньше роль прочих факторов и линейная модель хорошо аппроксимирует исходные данные и ее можно воспользоваться для прогноза значений результативного признака.

Чтобы определить, с какой степенью достоверности построенное уравнение регрессии воспроизводит реальный характер зависимости результативного признака от факторного, рассчитывают среднюю ошибку аппроксимации

Чем меньше ошибка аппроксимации (8 – 10 %), тем ближе расчетные уровни признака, полученные из уравнения регрессии, к их фактическим значениям.

Для характеристики тесноты связи рассчитывается коэффициент эластичности, который показывает, на сколько процентов изменится результативный показатель, если факторный возрастет на 1 %.

Для линейной регрессии используется следующая формула расчета коэффициента эластичности:

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: