Понятие о многомерном корреляционном анализе

Экономические явления чаще всего адекватно описываются многофакторными моделями. Поэтому возникает необходимость обобщить рассмотренную выше двумерную корреляционную модель на случай нескольких переменных.

Пусть имеется совокупность случайных переменных имеющих совместное нормальное распределение. В этом случае матрицу

, (2.11)

определяемых по формуле (2.1), будем называть корреляционной. Основная задача многомерного корреляционного анализа состоит в оценке корреляционной матрицы по выборке. Эта задача решается определением матрицы выборочных коэффициентов корреляции:

, (2.12)

где выборочный парный коэффициент корреляции, рассчитываемый по общей формуле:

. (2.13)

В многомерном корреляционном анализе рассматривают две типовые задачи:

а) определение тесноты связи между переменными при фиксировании или исключении влияния остальных l переменных, где ;

б) определение тесноты связи одной переменной с совокупностью остальных переменных, включенных в модель.

Эти задачи решаются с помощью частных и множественных коэффициентов корреляции.

Частные коэффициент корреляции. Если переменные коррелируют друг с другом, то на величине парного коэффициента корреляции частично сказывается влияние других переменных. В связи с этим часто возникает необходимость исследовать частную корреляцию между переменными при исключении (элиминировании) влияния одной или нескольких других переменных.

Выборочный частный коэффициент корреляции между переменными и при фиксированных значениях остальных переменных оценивается выражением:

(2.14)

где алгебраические дополнения к элементу корреляционной матрицы R; алгебраические дополнения к элементу ; алгебраические дополнения к элементу .

Необходимо заметить, что в формуле (2.14) указывает на то, что из модели исключено влияние факторов на факторы и .

Множественный коэффициент корреляции. Теснота линейной взаимосвязи одной переменной с совокупностью других переменных , рассматриваемой в целом, измеряется с помощью множественного коэффициента корреляции. Выборочный множественный коэффициента корреляции например между и остальными определяется выражением:

(2.15)

где определитель матрицы выборочных коэффициентов корреляции (2.12); алгебраические дополнения к элементу .

Можно показать, что множественный выборочный коэффициент корреляции значимо отличается от нуля, если значение статистики

, (2.16)

где табличное значение F – критерия Фишера на уровне значимости при числе степеней свободы и .

Рассмотрим частный случаи трехмерной генеральной совокупности () понятия и правила вычисления частных и множественных коэффициентов корреляции. Пусть каждый экономический объект, элемент генеральной совокупности характеризуется тремя показателями и Требуется по данным выборки объемом п из генеральной совокупности исследовать взаимосвязь между этими показателями.

В этом случае выборка объемом п будет представлять собой выборочную матрицу наблюдений X:

В ней каждая i-я строка (i = 1, 2,..., k)характеризует i -и экономический объект, а столбец, например первый, содержит значение для 1-го показателя для всех п объектов.

Для трехмерной (и других многомерных) корреляционных моделей важную роль играют частные и множественные коэффициенты корреляции или детерминации (коэффициент детерминации равен квадрату соответствующего коэффициента корреляции). Частные и множественные коэффициенты корреляции рассчитываются на основе выборочных парных коэффициентов корреляции.

Частные коэффициенты корреляции рассчитываются на основе выборочных парных коэффициентов корреляции. Для трехмерных моделей расчетные формулы таковы:

; (2.17)

: (2.18)

. (2.19)

Таким образом, для анализа взаимосвязи между двумя признаками в трехмерных и многомерных моделях мы имеем по два коэффициента корреляции. Например, парный r₁₂ и частный r_12/3которые характеризуют степень линейной зависимости между величинами и .Однако если парный коэффициент r₁₂ оценивает степень зависимости на фоне влияния , то частный коэффициент корреляции r_12/3 - при исключенном влиянии .

Следовательно, частный коэффициент корреляции более точно характеризует степень линейной зависимости.

Частный коэффициент корреляции обладает всеми свойствами парного, т.е. изменяется в пределах от-1 до+1. Если частный коэффициент корреляции равен ±1, то связь между двумя величинами функциональная, а равенство его нулю свидетельствует о линейной независимости этих величин. Частный коэффициент корреляции, вычисленный на основе выборки объемом n, имеет такое же распределение, что и парный коэффициент корреляции. Поэтому значимость частного коэффициента

корреляции оценивают так же, как и парного коэффициент корреляции. Для оценки значимости вычисляют расчетное значение t – статистики Стьюдента:

. (2.20)

Если , то частный коэффициент корреляции значимо отличается от нуля.

Множественный коэффициент корреляции тоже получаются на основании выборочных коэффициентов корреляции. Для трехмерной модели множественные коэффициенты корреляции вычисляются по формулам:

(2.21)

(2.22)

(2.23)

Множественный коэффициент корреляции, например , характеризует степень линейной зависимости между величиной , и остальными переменными (, ), входящими в модель. Он изменяется в пределах от 0 до 1. Равенство его единице свидетельствует о функциональной зависимости между, например, , и остальными переменными (, ), входящими в модель, а равенство его 0 свидетельствует об отсутствии линейной зависимости между , и переменными (, ).

Квадрат коэффициента корреляции называют коэффициентом детерминации. При этом множественный коэффициент детерминации, например , характеризует долю дисперсии объясняемую влиянием показателей и . Например, если = 0,85, то это свидетельствует, что 85% дисперсии объясняется влиянием показателей и , а 15% дисперсии объясняется влиянием факторов, которые не вошли в модель.

Таким образом, коэффициент детерминации характеризует долю дисперсии одной величины, например у, объясняемой влиянием фактора .

Рассмотрим пример.

Пример 2.2. Для исследования зависимости между прибылью , затратами на 1 руб. произведенной продукции и стоимостью основных фондов была проведена выборка из 100 предприятии одной отрасли. Вычисленные парные коэффициенты корреляции оказались значимыми и составили: Вычислить частные и множественные коэффициенты корреляции и оценить их значимость на уровне

Решение. По формуле (3.17) вычислим частный коэффициент корреляции:

и аналогично ; .

Оценим значимость . Расчетное значение критерия Стьюдента получим по формуле (3.20):

По таблице распределения Стьюдента находим 1,99. Так как , то частный коэффициент корреляции значимо отличается от нуля.

Теперь оценим значимость . Для этого получим расчетное значение критерия Стьюдента:

Так как , то частный коэффициент корреляции значим. Тем более значим, будет коэффициент , так как .

Сравнивая значения парного и частного коэффициентов корреляции (они достаточно близки), можно утверждать, что слабо влияет на степень зависимости между величинами и .

С другой стороны сравнивая частные коэффициенты корреляции соответствующими парными коэффициентами корреляции, видим, что за счет «очищения связи» наибольшему изменению подвергся коэффициент корреляции между затратами на 1руб. произведенной продукции и стоимостью основных фондов (изменилась не только его величина, но даже и знак: ). Можно утверждать также, что между прибылью и затратами на 1 руб. произведенной продукции существует сильная обратная корреляционная связь . Если же устранить влияние переменной «затраты на 1 руб. произведенной продукции» , то в чистом виде на прибыл слабо влияет на стоимость основных фондов . Наконец если устранить влияние прибыли , на затраты на 1 руб. произведенной продукции и на стоимость основных фондов то связь между затратами на 1 руб. произведенной продукции и стоимостью основных фондов практически отсутствует т. к. .

Определим теперь множественный коэффициент корреляции по формулам (2.21), (2.22) и (2.23) соответственно:

Оценим значимость . Для этого по формуле (3.16) вычислим расчетное значение критерия Фишера:

По таблице распределения Фишера находим 8,56. Так как , то множественный коэффициент корреляции значим. Тем более будут значимы большие коэффициенты и .

Множественный коэффициент корреляции свидетельствует о том, что между прибылью, с одной стороны, и затратами на 1 руб. произведенной продукции и стоимостью основных фондов – с другой, существует сильная связь. Рассчитаем множественный коэффициент детерминации:

Множественный коэффициент детерминации показывает, что изменение (вариация) прибыли предприятии на 95,8% объясняется изменением затрат на 1 руб. произведенной продукции и стоимостью основных фондов , а 4,2% вариация прибыли объясняется влиянием факторов, которые не вошли в корреляционную модель.

Аналогические рассуждения можно провести и по другим множественным коэффициентам корреляции.

Заканчивая краткое изложение корреляционного анализа количественных признаков, остановимся на двух моментах.

1. Задача научного исследования состоит в отыскании причинных зависимостей. Только знание истинных причин явлений позволяет правильно истолковывать наблюдаемые закономерности. Однако корреляция как формальное статистическое понятие сама по себе не вскрывает причинного характера связи. С помощью корреляционного анализа нельзя указать, какую переменную принимать в качестве причины, а какую — в качестве следствия. Например, рассматривая корреляционную связь между суточной выработкой продукции и величиной основных производственных фондов (см. пример 3.1), изменение последней можно считать одной из причин изменения суточной выработки. Но, с другой стороны, необходимость повышения суточной выработки продукции может повлечь за собой увеличение размера основных производственных фондов. Между урожайностью сельскохозяйственных культур и погодными условиями (температурой, количеством осадков и т.п.) существует корреляционная связь. Но здесь не возникает сомнений, какая переменная является следствием, а какая — причиной.

Иногда при наличии корреляционной связи ни одна из переменных не может рассматриваться причиной другой (например, зависимость между весом и ростом человека). Наконец, возможна ложная корреляция (нонсенс-корреляция), т.е. чисто формальная связь между переменными, не находящая никакого объяснения и основанная лишь на количественном соотношении между ними (таких примеров в статистической литературе приводится немало). Поэтому при логических переходах от корреляционной связи между переменными к их причинной взаимообусловленности необходимо глубокое проникновение в сущность анализируемых явлений.

2. Не существует общеупотребительного критерия проверки определяющего требования корреляционного анализа — нормальности многомерного распределения переменных. Учитывая свойства теоретической модели, обычно полагают, что отнесение к совместному нормальному закону возможно, если частные одномерные распределения переменных не противоречат нормальным распределениям (в этом можно убедиться, например, с помощью критериев согласия); если совокупность точек корреляционного поля частных двумерных распределений имеет вид более или менее вытянутого «облака» с выраженной линейной тенденцией.

3 4 5 6 7 8 9

Подборка статей по вашей теме: