double arrow

Показатели тесноты корреляционной связи для многофакторной корреляционно-регрессионной модели

Теснота связи между изучаемыми показателями при множественной корреляции определяется на основе различных коэффициентов. Чтобы уравнение регрессии достаточно адекватно отражало (аппроксимировало) реальные моделируемые социально-экономические процессы или явления должны быть соблюдены условия и требования множественного корреляционно-регрессионного анализа.

Корреляционнорегрессионный анализ: аналитическое выражение уравнения (прямолинейной, криволинейной) регрессии для многофакторной корреляционно-регрессионной модели. Определение параметров и их интерпретация.

Теснота связи между   них измеряется отношением факторной дисперсии к общей дисперсии результативного признака, называемым индексом детерминации. Индекс детерминации характеризует долю вариации результативного признака под влиянием факторного признака в общей колеблемости результативного признака. Если между признаками имеется корреляционная связь, то по мере ее усиления, т.е. повышения тесноты связи между результативным и факторным признаками, индекс детерминации увеличивается, а по мере ослабления – уменьшается. Таким образом, индекс детерминации характеризует тесноту связи, близость корреляционной связи к функциональной.

Корень квадратный из индекса детерминации есть индекс корреляции или теоретическое корреляционное отношение. Индекс корреляции, или теоретическое корреляционное отношение, характеризует тесноту связи при любой форме зависимости. Остаточная дисперсия необходима для выбора наилучшей функции, которая в наибольшей степени выравнивает (аппроксимирует) эмпирическую линию регрессии. Аппроксимирующую функцию выбирают по минимуму остаточной дисперсии s2ост = S(yt)2/n или .

Частным случаем индекса корреляции является линейный коэффициент корреляции r, который применяется для оценки тесноты связи при линейной зависимости. Коэффициент корреляции принимает значения от -1 до +1, показывая не только тесноту, но и направление связи. Знак "+" указывает на прямую зависимость между результативным и факторным признаками, знак «–» на обратную зависимость между ними. Если r=0, то связь между признаками отсутствует. Чем ближе r к единице, тем теснее связь между рассматриваемыми признаками.

При линейной форме связи параметр уравнения прямой – коэффициент регрессии а1 и коэффициент корреляции r взаимосвязаны следующим образом:

а1 = rsy/sx. При прямолинейной связи линейный коэффициент корреляции тождествен индексу корреляции, они численно равны: .

Линейный коэффициент корреляции r применяется для оценки тесноты связи при линейной зависимости: уравнения прямой = а01х

Для упрощения расчетов линейного коэффициента корреляции пользуются преобразованной формулой: .

Характер связи определятся величиной коэффициента корреляции:

r величина коэффициента корреляции характер связи
r = 0 до 0,3   практически отсутствует
0 < r < 1 0,3 - 0,5 + прямая слабая
-1 < r < 0 0,5 - 0,7 - обратная умеренная
r = 1 0,7 – 1,0 1 - функциональная сильная

Значимость линейного коэффициента корреляции определяется по t – критерию Стьюдента. Определяется расчетное значение tрасч, которое сравнивается с табличным значением tкрит. Линейный коэффициент корреляции считается значимым при соблюдении соотношения: tрасч > tкрит.

при n при n <50.

tкрит. определяется по таблице «Значение t – критерия Стьюдента при уровне значимости 0,10, 0,05, 0,01 и степени свободы .

Задача многофакторного корреляционно - регрессионного анализа заключается, во-первых, в изучении целого ряда факторов, влияющих на исследуемый показатель и отборе наиболее значимых; во-вторых, в определении степени влияния каждого фактора на результативный признак путем построения модели – уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится результативный показатель при изменении каждого фактора, входящего в модель; в-третьих, в количественной оценке тесноты связи между результативным признаком и факторными.

Математически задача состоит в нахождении аналитического выражения функции = f(x1,x2,x3,...,xn), наилучшим образом отражающего связь факторных признаков с результативным. От правильного выбора функции регрессии зависят результаты теоретического анализа и возможность их приложения к практике, поэтому форма связи должна наилучшим образом соответствовать реально существующим связям между результативным признаком и факторными. Сложность выбора функции состоит в том, что результативный признак с разными факторами может находиться в различных формах связи – прямолинейных и криволинейных. Эмпирическое обоснование типа функции с помощью графиков парных связей практически непригодно для множественной корреляции и регрессии.

Выбор формы уравнения множественной регрессии основывается на теоретическом анализе изучаемого явления. Если анализ взаимосвязей результативного и факторных признаков не позволяет остановиться на какой-либо форме связи, то перебирают различные функции и выбирают оптимальную с точки зрения близости эмпирических значений результативного признака выравненным, но это сопряжено со значительной трудоемкостью расчетов параметров различных уравнений. При наличии специального программного обеспечения, реализующего алгоритм перебора различных уравнений множественной регрессии на ПЭВМ, получают несколько моделей, выбор наилучшей осуществляется путем статистической проверки параметров уравнения на основе t–критерия Стьюдента и F–критерия Фишера.

Выбор формы уравнения множественной регрессии осуществляется на практике

на основе использования пяти типов моделей:

линейная a0 + a1x1 + a2x2 +... +anxn;

степенная ;

показательная ;

параболическая

гиперболическая

Чаще всего останавливаются на линейных моделях. Это объясняется тем, что, во-первых, параметры линейных уравнений легко интерпретируются, сами модели просты и удобны для экономического анализа, во-вторых, при желании любую функцию путем логарифмирования или замены переменных можно свести к линейной форме.

В уравнении множественной регрессии в линейной форме параметры а1, а2, а3,..., аn – коэффициенты регрессии, показывают степень влияния соответствующих факторов на результативный признак при закреплении остальных факторов на среднем уровне, т.е. насколько изменится y при увеличении соответствующего фактора на 1 пункт его единицы изменения; параметр а0 – свободный член, экономического смысла не имеет.

Параметры уравнения множественной регрессии, как и парной, рассчитываются методом наименьших квадратов на основе решения системы нормальных уравнений. Поскольку коэффициенты регрессии между собой несопоставимы (факторы имеют разные единицы измерения), то нельзя сравнивать силу влияния каждого из включенных в модель факторов на результативный признак на основании коэффициентов регрессии. Для оценки сравнительной силы влияния факторов рассчитывают частные коэффициенты эластичности и b-коэф­фициенты.

Частный коэффициент эластичности показывает, на сколько процентов в среднем изменится результативный показатель при изменении фактора на 1% и фиксированном положении других факторов и рассчитываются отдельно по каждому фактору:

, где аi – коэффициент регрессии при i-м факторе; – среднее значение i-го фактора; – среднее значение результативного показателя.

b-коэф­фициент показывает, на какую часть среднего квадратического отклонения изменяется результативный признак при изменении соответствующего фактора на величину его среднего квадратического отклонения , где sxi, sy – средние квадратические отклонения i-го фактора и результативного признака.

Вследствие того, что экономические явления подвергаются воздействию многочисленных и сложных причин, в уравнение множественной регрессии должны включаться существенные, систематически действующие факторы при элиминировании влияния остальных факторов. Наиболее важные факторы отбираются на основе анализа тесноты и существенности связи между факторами и результативным показателем. При этом условием включения в модель факторов является отсутствие между ними очень тесной корреляционной связи, близкой к функциональной. Наличие между двумя факторами весьма тесной линейной связи (линейный коэффициент корреляции r превышает по абсолютной величине 0,85) называется коллинеарностью, а между несколькими факторами – мультиколлинеарностью.

Причины возникновения мультиколлинеарности между признаками состоят, во-первых, в том, что анализируемые признаки характеризуют одну и ту же сторону явления или процесса (например, уставной фонд и численность работников характеризуют размер предприятия) и включать их в модель одновременно не целесообразно; во-вторых, факторные признаки являются составными элементами друг друга, дублируют друг друга или их суммарное значение дает постоянную величину (например, энерговооруженность и фондовооруженность, удельный вес заемных и собственных средств). Если в модель включены мультиколлинеарные факторы, то уравнение регрессии будет неадекватно отражать реальные экономические взаимосвязи, будут искажены величины параметров модели (завышены), изменен смысл и затруднена экономическая интерпретация коэффициентов регрессии и корреляции.

Поэтому при построении модели исключают один из коллинеарных факторов исходя из качественного и логического анализа или преобразуют исходные факторные признаки в новые, укрупненные. Качество и адекватность модели реальному социально-экономическому явлению и процессу определяется оптимальностью числа факторных признаков: чем больше включается факторов, тем модель лучше описывает явление и процесс, но такую модель трудно реализовать; при малом числе факторов модель недостаточно адекватна.

Проблема отбора факторных признаков и сокращения размерности модели множественной корреляции решается на основе эвристических и многомерных методов анализа. К эвристическим методам анализа относится метод экспертных оценок, основанный на интуитивно-логических предпосылках и содержательно-качественном анализе непараметрических показателей тесноты связи: коэффициентов корреляции рангов, конкордации. Наиболее часто используется метод пошаговой регрессии, состоящий в последовательном включении факторов в модель и оценке их значимости.

При введении фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции R. Если при включении в модель фактора xk величина R увеличивается, а коэффициент регрессии ak не изменяется или меняется незначительно, то данный фактор существенен и его включение в модель необходимо.

· совокупность исследуемых показателей должна быть однородной по условиям формирования результативного и факторных признаков (выделяющиеся наблюдения следует исключить из совокупности);

· результативный признак должен подчиняться нормальному закону распределения, факторные – быть близки к нормальному распределению. Если объем совокупности достаточно большой (n>50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Колмогорова, Боярского и др.;

· моделируемое явление или процесс описывается количественно (параметры должны иметь цифровое выражение) одним или несколькими уравнениями причинно-следственных связей. Причинно-следственные связи целесообразно описывать линейными или близкими к линейной форме зависимостями;

· постоянство территориальной и временной структуры изучаемой совокупности, отсутствие количественных ограничений на параметры модели;

· достаточность единиц совокупности: их количество должно быть в несколько раз больше, чем число факторов, включаемых в модель. На каждый фактор должно приходиться, как минимум, 5–6 наблюдений, т.е. число факторных признаков должно быть в 5–6 раз меньше объема изучаемой совокупности.

Основными этапами корреляционно-регрессионного анализа являются:

· предварительный теоретический анализ сущности явления, позволяющий установить причинно-следственные связи между признаками, выбрать наиболее важные факторы, решить вопрос об измерении результативного и факторных признаков;

· подготовка исходной информации, включающая вопросы достаточности единиц наблюдения, однородности совокупности изучаемых признаков и близости их распределения к нормальному;

· выбор формы связи между результативным признаком и факторами на основе перебора нескольких аналитических функций;

· исследование тесноты связи между результативным признаком и факторами, а также между факторами на основе построения матрицы парных линейных коэффициентов корреляции и отсев мультиколлинеарных факторов;

· отбор существенных (значимых) факторов, включаемых в многофакторную модель – уравнение множественной регрессии, на основе соответствующих статистических методов;

· расчет параметров уравнения множественной регрессии и оценка значимости отобранных факторов, коэффициентов корреляции и регрессии с помощью критериев t – Стьюдента и F – Фишера;

· анализ полученных результатов.

Взаимосвязи между признаками анализируются, как правило, на материале выборочных наблюдений, поэтому для проверки того, что полученные зависимости носят закономерный, а не случайный характер, оценивается значимость (существенность) показателей корреляции и регрессии.

Корреляционнорегрессионный анализ служит для оценки показателей бизнес–плана и нормативных уровней экономических показателей, отражающих эффективность использования производственных ресурсов, выявления имеющихся резервов производства, проведения сравнительного анализа, оценки потенциальных возможностей предприятий, краткосрочного прогнозирования развития производства.

Уравнение множественной регрессии позволяет найти теоретическое, возможное значение результативного показателя при определенных значениях факторных признаков.

Параметры уравнения множественной регрессии рассчитываются методом наименьших квадратов на основе решения системы нормальных уравнений. Для линейного уравнения регрессии с n факторами строится система из (n+1) нормальных уравнений:

a0n + a1Sx1 + a2Sx2 +...+ anSxn = Sy,

a0Sx1 + a1Sx21 + a2Sx1x2 +...+ anSx1xn = Syx1,

:

a0Sxn + a1Sx1xn + a2Sx2xn +...+ anSx2n = Syxn.

Теснота связи между изучаемыми показателями при множественной корреляции определяется на основе различных коэффициентов.

Парные коэффициенты корреляции r измеряют тесноту линейной связи между факторами и между результативным признаком и каждым из рассматриваемых факторов без учета их взаимодействия с другими факторами

Частные коэффициенты корреляции характеризуют степень влияния факторов на результативный признак при условии, что остальные факторы закреплены на постоянном уровне. В зависимости от количества факторов, влияние которых исключается, частные коэффициенты корреляции могут быть первого порядка (при исключении влияния одного фактора), второго порядка (при исключении влияния двух факторов) и т.д.

Частный коэффициент корреляции первого порядка между y и х1 при исключении влияния х2 в двухфакторной модели рассчитывается по формуле: ,

где ryx1, ryx2, rx1x2– парные коэффициенты корреляции между соответствующими признаками.

Совокупный коэффициент множественной корреляции R оценивает тесноту связи между результативным признаком и всеми факторами. Это основной показатель линейной множественной корреляции. Для двухфакторной модели совокупный коэффициент множественной корреляции рассчитывается по формуле:

. Совокупный коэффициент корреляции R изменяется от 0 до 1. Чем меньше эмпирические значения результативного признака отличаются от выравненных по линии множественной регрессии, тем корреляционная связь между исследуемыми показателями теснее и совокупный коэффициент множественной корреляции ближе к единице.

Совокупный коэффициент множественной детерминации, равный R2, показывает, какая часть вариации результативного признака обусловлена влиянием факторов, включенных в модель.

Совокупный индекс множественной корреляции характеризует тесноту связи между результативным признаком и всеми факторами при криволинейной зависимости:

=, где – дисперсия результативного признака под влиянием факторов, включенных в модель; – остаточная дисперсия результативного признака, вызванная влиянием не учтенных моделью факторов. При линейной форме связи совокупный коэффициент и индекс множественной корреляции равны между собой.

Значимость коэффициента множественной корреляции R определяется по F – критерию Фишера. Определяется расчетное значение Fрасч, которое сравнивается с табличным значением Fкрит. Коэффициент множественной корреляции считается значимым при соблюдении соотношения: Fрасч > Fкрит.

или ,

n - число наблюдений, m - число параметров уравнения.

Fкрит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », и .

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: Fрасч > Fкрит.

Д л я фактора х1: ;

Для фактора х2: .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: