Методы стохастического факторного анализа

6.1. Корреляционно-регрессионный анализ

Выше указанные способы детерминированного факторного анализа используются для функциональных зависимостей, но не менее важную долю в экономических исследованиях занимают стохастические зависимости (корреляционные). При проведении корреляционно-регрессионного анализа выявляется количественная оценка взаимосвязей между факторными и результативными признаками, выявляется наличие и характеристика взаимосвязи, а также направление и форма. Следует помнить, то применение корреляционной зависимости оправдано только в большой массе наблюдений, подчиняющихся закону нормального распределения. Для другого вида взаимозависимостей вероятностного характера оправдано применение непараметрических способов анализа.

Корреляционные связи не являются точными (жесткими) зависимостями, а эти зависимости носят соотносительный характер. Если знание функциональных зависимостей позволяет точно расcчитывать события, например, время восхода и захода солнца ежедневно, время наступления солнечных затмений с точностью до секунды, то при корреляционных связях при одном и том же значении учтенного факторного признака могут быть различные значения результата. Это объясняется наличием других, порой неучтенных факторов, которые действуют на изучаемые социально-экономические явления. Особенность корреляционных связей состоит в том, что их проявление можно заметить не в единичных случаях, а в массе случаев.

Для определения корреляционной связи показателей социально-экономической, финансовой и прочей деятельности необходимо решить две основные задачи:

1) проверить возможность существования взаимосвязи между изучаемыми показателями и придать выявленной взаимосвязи конкретную математическую форму зависимости;

2) установить количественные оценки тесноты взаимосвязи, т.е. силу влияния факторных признаков на результат.

Наиболее разработанными в статистике являются методы изучения парной корреляции, позволяющие определить влияние изменения факторного признака (х) на результативный (у). Чтобы отразить выявляемые взаимосвязи в аналитической форме прибегают к использованию математических функции в виде уравнения прямолинейной и криволинейной зависимости.

Для анализа прямолинейной зависимости применяется уравнение вида:

ух01*х

Криволинейная зависимость анализируется с помощью математических функций параболы, гиперболы, показательной, степенной и др.

При анализе корреляционной зависимости между признаками “х” и “у” необходимо:

а) выявить вид функционального уравнения;

б) определить численное выражение их параметров;

в) осуществить проверку вычисленных параметров на их типичность;

г) произвести оценку практической ценности выявленной модели функционального уравнения;

д) определить в какой степени теснота корреляционной (соотносительной) связи между факторами и результатом отличается от функциональной (жесткой) зависимости, и.т.д.

Осуществить это можно путем применения метода группировок и корреляционно-регрессионного анализа влияния изменения (вариации) факторного признака “х” на результативный “у”.

Модель регрессии может быть построена как по индивидуальным значениям признака, так и по сгруппированным данным (таблица № 1). Для выявления связи между признаками по достаточно большому числу наблюдений используется корреляционная таблица на ее основе можно построить не только уравнение регрессии, но и определить показатели тесноты связи.

Искомые параметры уравнения связи находят с помощью способа наименьших квадратов, т.е. при условии что:

Ѕ=→ min

Эти расчеты при даже очень большом объеме эмпирических данных с использованием компьютерных технологий, не представляет больших трудностей и времени.

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

;

где

n — объем исследуемой совокупности (число единиц наблюдения),

и – коэффициенты, и – свободные члены

В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр - коэффициент регрессии, который показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения. Для нахождения параметров системы нормальных уравнении используется метод определителей. Во-первых представим эту систему в матричном виде:

==

Определители и получаются заменой свободными членами элементов соответственно первого () и второго () столбцов. Получаем таким образом:

==

==

=

=

Система нормальных уравнений для нахождения параметров полулогарифмической парной регрессии методом наименьших квадратов имеет следующий вид:

Аналогично находятся параметры системы уравнений:

При статистическом анализе не линейной корреляции связи возможно применение уравнения регрессии показательной функции:

.

Для решения уравнения производится его логарифмирование:

С учетом требований метода наименьших квадратов составляется система нормальных уравнений:

;

.

Применением к системе метода определителей устанавливаются алгоритмы расчета параметров уравнения:

;

.

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. То есть необходимо сначала проверить параметры уравнения на типичность прежде, чем использовать полученную модель.

Если n (количество групп) меньше 30 то:

;

.

Параметры модели признаются типичными если:

где - это табличное значение, определяемое по распределению Стьюдента (t – распределение) обычно при вероятности α=0,05 и v=n-2.

Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции.

В практике применяются различные модификации формул расчета данного коэффициента:

,

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

Линейный коэффициент корреляции изменяется в пределах от –1 до +1. Знаки коэффициентов регрессии и корреляции совпадают.

Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:

Если расчетное значение (табличное), то гипотеза =0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а, следовательно, и свидетельствует о статистической существенности зависимости между факторами “х” и “у”.

Для характеристики степени тесноты связи по линейному коэффициенту корреляции используется шкала Чеддока:

Таблица 17

Характеристика силы связи по шкале Чеддока

Теснота связи 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Характеристика степени тесноты связи слабая заметная умеренная высокая весьма высокая

Частное от деления факторной (σ2ух) дисперсии на общую дисперсию (σ2у) представляет собой показатель (R), указывающий на меру тесноты связи между признаками “х” и “у”, при не линейных зависимостях.

R2=; тогда R==

Показатель R2 называется индексом детерминации, свидетельствующий насколько значение результативного признака обусловлено влиянием факторного. Чем ближе значение R2 к единице, тем сильнее зависимость.

Проверка адекватности всей модели осуществляется с помощью F – критерия Фишера и величины средней ошибки аппроксимации .

где m – число параметров уравнения (при и , т.е. m=2)

V1=n-m; V2=m-1.

Индекс корреляции считается типичным если

Значение средней ошибки аппроксимации, определяется по формуле, которая показывает степень влияния на изменение результативного признака неучтенных факторов. Если ошибка аппроксимации не превышает 12-15%, то с построенное уравнение регрессии можно использовать в экономических расчетах.

Расчет частных коэффициентов эластичности позволяет определить на сколько процентов изменяется результативный признак при изменении факторного признака на один процент.

Применение методов корреляционно-регрессионного анализа влияния вариации факторного показателя “x” на результативный “y” рассмотрим на конкретном примере.

Пример 18. Имеются данные о затратах на ремонт оборудования У (тыс.руб.) в подразделениях предприятия и сроке его эксплуатации Х.

Исследуем имеющиеся данные с помощью уравнения прямой и определим его параметры:

= = ≈-1,576

= = ≈0,611

Подставляя значения вычисленных параметров (и ), в уравнение регрессии получаем:

Таблица 18

Расчет зависимости производительности труда работников от коэффициента сменности с помощью прямолинейной зависимости

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Для этого сначала рассчитаем требующиеся параметры:

σ2у== σу=1,48

σ2ху== σху=1,31

σ2ε== σε=0,69

2,19=1,72+0,47

σ2х== σх=2,14.

На основании приведенных вычислений определяем фактические значения t – критерия.

=.

=.

Определим – табличное по распределению Стьюдента при уровне значимости α=0,05 t равно 2,306.

Наши расчеты показывают, что условие неравенства соблюдаются, следовательно параметры уравнения типичны.

Далее произведем оценку практической значимости синтезированной модели. Для прямолинейной связи это выполняется посредством расчета линейного коэффициента корреляции:

≈0,89.

Согласно шкалы Чеддока связь между факторным и результативным признаком высокая. Из значения =0,792 следует, что 79,2% общей вариации затрат на ремонт оборудования объясняется изменением факторного признака (сроком эксплуатации).

Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:

=≈3,69

Þ

Так как расчетное значение , то связь между сроком эксплуатации оборудования и затратами на его ремонт, следует признать существенной. Поэтому синтезированная по уравнению математическая модель может быть использована для практических целей.

Использование полученной модели возможно при определении нормативной (плановой) суммы затрат на ремонт, при известном сроке эксплуатации оборудования.

Как правило, для выявления зависимости используется не одна, а несколько математических моделей, из которых выбирается наиболее адекватно описывающая исследуемую зависимость.

В таблице проведены расчеты для построения полулогарифмической функции: У=а01 lg x

Подставляя значения вычисленных параметров (и ), в уравнение регрессии получаем:

У=-4,903+9,217 lg x

Таблица 3.19

Расчет зависимости производительности труда работников от коэффициента сменности c помощью полулогарифмической зависимости

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Для этого сначала рассчитаем требующиеся параметры:

σ2ε== σε=0,83

На основании приведенных вычислений определяем фактические значения t – критерия.

=.

=.

Определим – табличное по распределению Стьюдента при уровне значимости α=0,05 t равно 2,306.

Наши расчеты показывают, что условие неравенства

16.7>2.306<67.2 соблюдаются, следовательно параметры уравнения типичны.

Далее произведем оценку практической значимости синтезированной модели. Для не линейной связи это выполняется посредством расчета индекса корреляции:

R2=; тогда R===

Согласно шкалы Чеддока связь между факторным и результативным признаком высокая.

Проверим адекватность модели с помощью F – критерия Фишера и величины средней ошибки аппроксимации .

Индекс корреляции считается типичным если 17,3>5,32, так как условие выполняется, следовательно данную модель также возможно использовать в экономических расчетах.

Для того, чтобы выявить какая из рассчитанных моделей более точно описывает связь между затратами на ремонт оборудования и сроком его эксплуатации рассчитаем значение средней ошибки аппроксимации.

Для прямолинейной зависимости:

=0,1*2,16*100%=21,6%

Для полулогарифмической зависимости:

=0,1*2,52*100%=25,2%

Ошибка аппроксимации при прямолинейной зависимости ниже, чем при полулогарифмической зависимости, следовательно для расчетов лучше воспользоваться уравнением:

3.7.2. Непараметрические методы оценки связи

Для количественной характеристики многомерных связей социально-экономических явлений используется метод корреляционных плеяд, основанный на расчете непараметрических коэффициентов связи.

1. Коэффициент ассоциации и контингенции

Вспомогательная таблица для расчетов

а в а + в
с D с + d
а + с в + d а + в + с + d

Если Ка > 0,5 или Кк > 0,3, то связь считается подтверждаемой.

Пример 19. С помощью данных об изготовлении качественной продукции рабочими предприятия определим коэффициенты ассоциации и контингенции

Таблица 20.

Данные об изготовлении качественной продукции рабочими предприятия

Качество изготовленной продукции Прошли специальную подготовку Не прошли специальную подготовку Итого
Высокое      
Низкое      
Всего      

Связь считается подтвержденной, если коэффициент ассоциации больше или равен 0,5, а коэффициент контингенции больше или равен 0,3.

2. Коэффициенты взаимной сопряженности Пирсона – Чупрова.

k1 и k2 - число значений (групп)

чем ближе значение коэффициентов к 1, тем сильнее связь.

Пример 20 Имеются данные о распределении рабочих предприятий по заработной плате и тарифному разряду.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: