Регрессионный анализ. Понятия корреляции и регрессии непосредственно связаны между собой

Понятия корреляции и регрессии непосредственно связаны между собой. В корреляционном и регрессионном анализе много общих вычислительных приемов. Они используются для выявления причинно-следственных соотношений между явлениями и процессами. Однако если корреляционный анализ позволяет оценить силу и направление стохастической связи, то регрессионный анализ - еще и функцию зависимости. При этом следует отметить, что чем слабее взаимосвязь, тем больше диаграмма рассеяния похожа на облако (рис. 3) и тем труднее определить функцию зависимости.

Регрессия может быть:

а) в зависимости от числа явлений (переменных):

Рис. 4. Линейная зависимость Рис. 5. Нелинейная зависимость

- простой (регрессия между двумя переменными, рис. 4, 5);

- множественной (регрессия между зависимой переменной (y) и несколькими объясняющими ее переменными (х1, х2...хn);

б) в зависимости от формы (см. рис. 9, 10):

- линейной (отображается линейной функцией, а между изучаемыми переменными существуют линейные соотношения);

- нелинейной (отображается нелинейной функцией, между изучаемыми переменными связь носит нелинейный характер);

в) по характеру связи между включенными в рассмотрение переменными:

- положительной (увеличение значения объясняющей переменной приводит к увеличению значения зависимой переменной и наоборот);

- отрицательной (с увеличением значения объясняющей переменной значение объясняемой переменной уменьшается);

г) по типу:

- непосредственной (в этом случае причина оказывает прямое воздействие на следствие, т.е. зависимая и объясняющая переменные связаны непосредственно друг с другом);

- косвенной (объясняющая переменная оказывает опосредованное действие через третью или ряд других переменных на зависимую переменную);

- ложной (нонсенс-регрессия) - может возникнуть при поверхностном и формальном подходе к исследуемым процессам и явлениям. Например, регрессия, устанавливающая связь между уменьшением количества потребляемого алкоголя в нашей стране и уменьшением продажи стирального порошка.

При проведении регрессионного анализа решаются следующие основные задачи:

1. Определение формы зависимости.

2. Определение функции регрессии. Для этого используют математическое уравнение того или иного типа, позволяющее, во-первых, установить общую тенденцию изменения зависимой переменной, а, во-вторых, вычислить влияние объясняющей переменной (или нескольких переменных) на зависимую переменную.

3. Оценка неизвестных значений зависимой переменной. Полученная математическая зависимость (уравнение регрессии) позволяет определять значение зависимой переменной как в пределах интервала заданных значений объясняющих переменных, так и за его пределами. В последнем случае регрессионный анализ выступает в качестве полезного инструмента при прогнозировании изменений социально-экономических процессов и явлений (при условии сохранения существующих тенденций и взаимосвязей). Обычно длина временного отрезка, на который осуществляется прогнозирование, выбирается не более половины интервала времени, на котором проведены наблюдения исходных показателей. Можно осуществить как пассивный прогноз, решая задачу экстраполяции, так и активный, ведя рассуждения по известной схеме «если..., то» и подставляя различные значения в одну или несколько объясняющих переменных регрессии.

Технология построения регрессии

Для построения регрессии используется метод, получивший название метода наименьших квадратов. Суть его заключается в нахождении по фактическим данным динамического ряда теоретической кривой (тренд), точки которой равноудалены от кривой 1 (см. рис. 6).

При выборе модели регрессии одним из существенных требований к ней является возможность обеспечения наибольшей простоты, позволяющей получить решение с достаточной точностью. Поэтому для установления статистических связей вначале, как правило, рассматривают модель из класса линейных функций, затем другие.

Существует хорошо развитая система подбора аппроксимирующих функций - методика группового учета аргументов (МГУА), достаточно удачно реализованная в программе Excel.

О правильности подобранной модели можно судить по результатам исследования остатков i, являющихся разностями между наблюдаемыми величинами yi и соответствующими прогнозируемыми с помощью регрессионного уравнения величинами yi . В этом случае для проверки адекватности модели рассчитывается средняя ошибка аппроксимации:

1 yi - yi

= n yi

Модель считается адекватной, если , находится в пределах не более 15%.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: