Параметризация модели

Параметры КМ, т.е. а0, а1 ... аn чаще всего рассчитываются по методу наименьших квадратов. Этот метод позволяет найти такие значения а0, а1 ... аn, при которых сумма квадратов отклонений фактического значения от расчетного значения результативного показателя будет наименьшей:

®min,

где Yx – расчетное значение результативного показателя;

Yi – фактическое значение результативного показателя.

Метод наименьших квадратов для нахождения параметров КМ требует решения следующей системы уравнений. Допустим, необходимо рассчитать коэффициенты регрессии однофакторной КМ вида , для этого необходимо решить следующую систему уравнений:

Если имеем двухфакторную линейную КМ вида

, то необходимо решить систему из трех уравнений:

Если же необходимо найти коэффициенты регрессии КМ типа параболы , то система уравнений будет иметь вид

Если имеем КМ типа гиперболы, т.е. модель вида , то система уравнений будет иметь вид

Для оценки параметров степенной модели вида  необходимо предварительно ее привести к условно линейному виду путем логарифмирования.

Например,  и решить систему уравнений

В большинстве стандартных пакетов прикладных программ предусмотрена процедура преобразования нелинейных моделей в линейные. Исследователь может работать с линейной моделью, построенной по преобразованным данным.

Верификация модели

 

Получив параметры КМ, необходимо проверить адекватность модели реальному процессу. Рассмотрим экономическую и математическую проверку.

Экономическая проверка адекватности модели заключается:

1) в анализе знаков коэффициентов регрессии;

2) в анализе влияния факторов на результат, т.е. анализируют величину полученных коэффициентов регрессии.

Например: Необходимо построить КМ формирования стоимости товарной продукции животноводства. Объем товарной продукции животноводства зависит от количества затраченного живого труда и вложенных средств, приобретенных ресурсов со стороны. Для уменьшения вариации информации данные показатели взяты в расчете на 100 га сельскохозяйственных угодий.

За результативный показатель модели принята стоимость товарной продукции животноводства в расчете на 100 га сельскохозяйственных угодий, млн. рублей (Ух).

В качестве факторных показателей взяты:

х1 – фондооснащенность, млн. руб.,

х2 – трудообеспеченность, чел.,

х3 – стоимость производственных затрат без амортизации в расчете на 100 га сельхозугодий, млн. руб.,

х4 – плотность условного поголовья скота, гол.,

х5 – куплено скота у населения в расчете на 100 га сельхозугодий, ц,

х6 – куплено кормов в расчете на 100 га сельхозугодий, т.

В результате расчетов получили КМ вида:

Ух =16,829–0,015х1+1,064х2+0,695х3+1,531х4+0,637х5+0,086х6 .

Как видно, коэффициент регрессии при х1отрицательный. Это нелогично, трудно согласиться с тем, что с ростом фондооснащенности стоимость товарной продукции животноводства уменьшается. Причина появления отрицательного коэффициента регрессии заключается во взаимосвязи факторов, т.е. более высокой теснотой связи между факторными показателями, чем между факторным и результативным. Это явление получило название мультиколлинеарности.

Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам:

1) совокупное воздействие факторов друг на друга оказывает влияние на надежность параметров и характеристик модели, что делает ее непригодной для анализа и прогнозирования;

2) затрудняется интерпретация параметров модели, они теряют экономический смысл.

Для оценки мультиколлинеарности факторов используют матрицу коэффициентов парной корреляции (табл. 7.5).

 

Т а б л и ц а 7.5.  Матрица коэффициентов парной корреляции

 

  У х1 х2 х3 х4 х5 х6
У 1,0            
х1 0,288 1,0          
х2 0,574 0,193 1,0        
х3 0,873 0,865 0,561 1,0      
х4 0,863 0,287 0,489 0,759 1,0    
х5 0,342 0,057 0,192 0,242 0,183 1,0  
х6 0,335 0,070 0,208 0,243 0,222 0,314 1,0

 

Явление мультиколлинеарности отсутствует, если коэффициент парной корреляции между двумя переменными по абсолютной величине не превышает 0,8 или связь между факторными показателями менее тесная, чем между факторным и результативным  и .

Появление отрицательных коэффициентов регрессии объясняется более высокой теснотой связи между х1 и х3 (коэффициент парной корреляции = 0,865, чем между х1 и результативным показателем = 0,288.

Имеется ряд подходов преодоления мультиколлинеарности. Самый простой из них состоит в исключении из модели одного или нескольких факторов. Рекомендуется фактор, имеющий наименьшее по модулю значение t-критерия Стьюдента , исключить из уравнения.

Просмотрим значение t‑критерия для коэффициентов регрессии модели (табл. 7.6).

 

Т а б л и ц а 7.6. Значение t-критерия для коэффициентов регрессии

 

Переменные Коэффициенты регрессии, аj Значение t-критерия Стьюдента,
х1 -0,015 -1,038
х2 1,064 2,066
х3 0,695 5,489
х4 1,531 5,092
х5 0,637 2,152
х6 0,086 3,162

 

Из табл. 7.6 видно, что фактор х1 необходимо исключить из модели, и расчет параметров КМ повторить сначала, но уже без этого фактора. Но по логике стоимость основных производственных фондов животноводства должна входить в модель и оказывать определенное влияние на формирование результата. Приемы, с помощью которых можно значительно уменьшить мультиколлинеарность и сохранить логическую структуру модели, будут рассмотрены в курсе «Эконометрика». А пока мы исключим х1 из модели.

После отсева несущественного по фактора получена следующая КМ:

ух = 16,558 + 1,297х2 + 0,668х3 + 1,535х4 + 0,649х5 + 0,087х6.

При математической проверке адекватности модели реальному процессу определяют характеристики:

1. Коэффициенты тесноты связи.

Для линейной однофакторной КМ рассчитывают коэффициент парной корреляции

,

где – среднее произведения;

– произведение средних,

 – произведение среднеквадратических отклонений соответственно факторного и результативного показателей.

Коэффициент парной корреляции изменяется в пределах -1£ r £1 и показывает силу и направление связи между результативным и факторным показателями.

Если КМ многофакторная линейная или степенная, определяют коэффициент множественной корреляции (R) или корреляционное отношение (h).

Частная формула коэффициента множественной корреляции (если КМ двухфакторная линейная)

,

где – коэффициенты парной корреляции.

Общая формула коэффициента множественной корреляции (корреляционного отношения):

,

где – расчетное значение результативного показателя;

 – фактическое значение результативного показателя;

 – среднее значение результативного показателя.

Значение коэффициента множественной корреляции и корреляционного отношения изменяются в пределах 0£R (h) £1 и отражают силу влияния учтенных в модели факторных признаков на результативный. Чем ближе показатель к 1, тем связь сильнее. Если 0£R (h) £ 0,3 считают, что связь между результативным и включенными в модель факторными показателями слабая,если 0,3 <R (h) £ 0,7 – то средняя, если 0,7 ≤R (h)< 1,0 – то сильная. В нашем случае коэффициент множественной корреляции равен 0,948.

Так как коэффициенты тесноты связи величины вероятностные, их необходимо проверить на существенность, т.е. определить коэффициент существенности коэффициента множественной (парной) корреляции или корреляционного отношения:

, ,

где – соответственно ошибка коэффициента парной, множественной корреляции (корреляционного отношения).

Ошибка коэффициента парной, множественной корреляции (корреляционного), которая находится по формуле

 , ,

где k – количество факторов модели;

n – количество опытов.

Если коэффициент  существенности коэффициента парной, множественной корреляции (корреляционного отношения) больше его табличного значения, то коэффициент парной, множественной корреляции (корреляционное отношение) существенен, и модель, для которой он рассчитан, можно применять в дальнейших расчетах. В нашем случае

mR = (1–0,9482)/Ö34 = 0,017;

tR = 0,948/0,017 =55,76.

Сопоставим tR с соответствующей табличной величиной критерия Стьюдента с числом степеней свободы 40–5–1=34 и принятого уровня значимости  (при изучении социально-экономических явлений уровень значимости, равный 0,05, считается достаточным). Для нашего случая табличная величина критерия равна 2,0423 (приложение 1). Превышение расчетного значения t-критерия над его фактическим значением указывает на существенность коэффициента тесноты связи.

Если же получим небольшие значения коэффициентов тесноты связи, обычно ниже 0,7, и коэффициент существенности коэффициентов тесноты связи ниже, чем его табличное значение, то необходимо вернуться к первому этапу построения модели, т.е. к выбору факторов, найти неучтенные в модели, но существенно влияющие на результат факторы, ввести их в уравнение и повторить расчеты.

2. Кроме коэффициентов тесноты связи рассчитывают и коэффициент детерминации (D):

D = r2 ∙ 100%; D = R2(h)2 ∙ 100%. 

Коэффициент детерминации показывает, на сколько процентов учтенные в КМ факторы объясняют вариацию (изменение) результативного показателя. В нашем случае D = 0,9482 ∙ 100% = 89,9, т.е. на 89,9% выбранные факторы объясняют вариацию результата. А на 100–89,9=10,1% – на изменение результативного признака оказывают влияние неучтенные в модели факторы.

Скорректированный коэффициент детерминации равен

3. Для определения ценности модели в целом используют критерий Фишера или F- критерий, который равен отношению общей дисперсии к остаточной:

; .

Полученное значение критерия (Fрасч.) сравнивают с критическим (табличным) (Fтабл.) для принятого уровня значимости (a = 0,05 (приложение 2)) и числа степеней свободы (n 1 = m – 1 и n 2 = nm, где n – число наблюдений, m – число факторов уравнения, включая результативный). Если оно окажется больше соответствующего табличного значения, то данное уравнение статистически значимо, т.е. доля вариации, обусловленная регрессией намного превышает случайную ошибку. Если же Fрасч. < Fтабл., то модель неадекватно описывает реальный процесс и ее использовать для анализа и планирования нельзя, нужно пересмотреть выбор факторных показателей. В нашем случае коэффициент Фишера равен

Найдем табличное значение F-статистики со степенями свободы  и  При доверительной вероятности 0,95 табличное значение F-критерия составит 1,74 (приложение 2). Превышение F над Fтабл (60,3>1,74) свидетельствует о статистической надежности производственной функции.

4. Проверка отсутствия существенной автокорреляции в остаточной последовательности осуществляется на основе статистики Дарбина-Уотсона (ДW):

,

где .

Считается, что автокорреляция остатков отсутствует, если 1,5< ДW <2,5. Для более надежного вывода целесообразно обратиться к специальной таблице критических точек статистики Дарбина-Уотсона, которая позволит при данном числе наблюдений n, количестве объясняющих переменных m и заданном уровне значимости  определить границы приемлемости наблюдаемой статистики ДW.

Длязаданных , n, m в таблице указываются два числа: d1 – нижняя граница, d2 – верхняя граница. Если ДW < d1, это свидетельствует о положительной автокорреляции остатков. Если ДW >4- d1, то это свидетельствует об отрицательной автокорреляции остатков. При d2 < ДW <4- d2 гипотеза об отсутствии автокорреляции остатков принимается. Если d1 < ДW < d2 или 4- d2 < ДW <4- d1, то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена. При наличии автокорреляции остатков полученная модель обычно считается неудовлетворительной. В нашем примере коэффициент Дарбина-Уотсона равен

Для проверки статистической значимости ДW воспользуемся таблицей (приложение 3). При уровне значимости , числе объектов n =40 и числа факторов m =5 имеем d1 =1,23; d2 =1,79. Так как d2 < ДW <4- d2 (1,79<1,555<4-1,79) считаем, что автокорреляция остатков отсутствует.

5. Для обобщающей оценки модели рассчитывают показатель средней относительной ошибки аппроксимации , показывающий среднее отклонение расчетных значений зависимой переменной от соответствующих искомых величин:

Функция имеет высокую точность, если  не превышает 10%. Если  более 10% и менее 20% – модель имеет допустимую точность и может быть использована для анализа и прогноза.

В нашем примере показатель средней относительной ошибки аппроксимации равен

Так как =10,92, то считается, чтомодель имеет допустимую точность и может быть использована для анализа и прогноза.

6. Кроме проверки ценности КМ в целом проверяют на существенность и каждый коэффициент регрессии, что делают с помощью     t -критерия Стьюдента

,

где – коэффициент существенности коэффициента регрессии;

– ошибка коэффициента регрессии.

Ошибка коэффициента регрессии определяется по формуле

,

где – среднеквадратическое отклонение по данным уравнения.

Среднеквадратическое отклонение по данным уравнения определяется по формуле

.

Расчетные значения t-критерия Стьюдента сравнивают с критическими, которые определяют по таблице (приложение 1) с учетом принятого уровня значимости (a = 0,10; a = 0,05 или a = 0,01) и числа степеней свободы n = n – m – 1 (где n – число наблюдений; m – число факторов уравнения). Параметр признается значимым, если tрасч. ³ tтабл.

Некоторые исследователи придерживаются мнения, что коэффициенты регрессии:

1) относительно значимы, если ;

2) значимы, если ;

3) сильно значимы, если .

Если есть коэффициент регрессии, для которого условие не выполняется, то из уравнения исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение t -критерия. После этого уравнение регрессии строится без исключенного фактора и снова проверяется значимость коэффициентов регрессии. Такой процесс длится до тех пор, пока все коэффициенты регрессии не окажутся значимыми, что свидетельствует о наличии в уравнении только существенных (действительно влияющих на результативный показатель) факторов. В нашем случае имеем следующие значения t-критерия (табл. 7.7).

 

Т а б л и ц а 7.7. Значение t-критерия для коэффициентов регрессии

 

Переменные Коэффициенты регрессии, аj Значение t-критерия,
х2 1,297 2,064
х3 0,668 5,411
х4 1,535 5,100
х5 0,649 2,166
х6 0,087 3,124

 

7. Коэффициенты регрессии показывают эффективность каждого ресурса. Но так как факторные показатели КМ имеют различные единицы измерения, то коэффициенты регрессии несравнимы между собой. Вместе с тем часто требуется оценить роль факторных показателей в формировании результата и сравнить ее между собой. Для этого используются коэффициенты эластичности , которые определяются по формуле

,

где – коэффициент регрессии при j -ом факторном признаке;

 – среднее арифметическое значение факторного признака;

 – среднее арифметическое значение результативного признака.

Коэффициент эластичности показывает, на сколько процентов изменится результативный показатель, если факторный показатель изменится на один процент. Недостаток данного показателя заключается в том, что он применяется только при приблизительно одинаковой вариации факторов.

Для экономической информации колеблемость факторных показателей редко бывает приблизительно одинаковой. Если же вариация показателей существенно различается, то для этих же целей применяются бета коэффициенты или стандартизированные коэффициенты регрессии :

,

где aj – коэффициент регрессии при j -ом факторном признаке;

– стандартное (среднее квадратическое) отклонение j-го факторного признака;

– стандартное (среднее квадратическое) отклонение результативного признака.

Он показывает, на какую часть стандартного отклонения изменяется зависимая переменная с изменением фактора хj на величину своего стандартного отклонения.

Например, в нашем случае значение -коэффициентов приведены в табл. 7.8.

 

Т а б л и ц а 7.8. Значение b -коэффициентов

 

Переменные Коэффициенты регрессии, аj Значение b -коэффициентов
х2 1,297 0,022
х3 0,668 0,504
х4 1,535 0,432
х5 0,649 0,111
х6 0,087 0,103

 

Из таблицы видно, что при увеличении стоимости производственных затрат без амортизации (более 50% которых составляют корма) на 1% стоимость товарной продукции животноводства возрастет на 0,504%; при увеличении плотности условного поголовья на 1% стоимость товарной продукции животноводства на 100 га сельскохозяйственных угодий возрастет на 0,432%.

Если все b -коэффициенты суммировать и сумма будет больше 1, как в нашем случае, сумма равна 1,172, то это означает, что значение результативного показателя увеличивается более быстрыми темпами, чем происходит прирост факторов. Если же данная сумма меньше единицы, то прирост результативного показателя отстает от темпов прироста факторов. Вышеизложенное касается и коэффициентов эластичности.

6. По рассчитанным -коэффициентам и коэффициентам парной корреляции можно оценить индивидуальный вклад каждого факторного показателя в вариацию зависимой переменной. Для этой цели используются показатели частной детерминации

.

В нашем примере:

=0,022×0,574=0,013;

=0,504×0,873=0,440;

=0,432×0,863=0,373;

=0,111×0,342=0,038;

=0,103×0,335=0,035.

Сумма показателей частной детерминации равна коэффициенту детерминации . Построенная модель объясняет 89,9% общей вариации переменной у, на долю фактора х3 приходится 44,0%, фактора х4 – 37,3% и т.д.

Комбинируя факторы-ресурсы производства различным образом, можно обеспечить высокий уровень результатов. Причем в определенных пределах имеется возможность замещения одного ресурса другим.


 

Качество уравнения характеризуют следующие показатели:

1. Коэффициент парной корреляции (r) – для однофакторных линейных моделей; коэффициент множественной корреляции (R) – для многофакторных линейных моделей; корреляционное отношение (h) – для нелинейных моделей.

Данные показатели изменяются в пределах –1 £ r £ 1 и 0 £ R (h) £ 1 и показывают силу влияния учтенных в уравнении факторных признаков на результативный. Чем ближе показатель к 1 (или –1), тем связь сильнее. Коэффициент парной корреляции, кроме этого, показывает направление связи (знак «плюс» говорит о прямой связи, знак «минус» – об обратной).

2. Коэффициент детерминации (r 2, R 2, h 2), выраженный в процентах показывает, на сколько процентов учтенные в уравнении регрессии факторные признаки объясняют вариацию (влияние) результативного.

3) Критерий Фишера (F) дает общую оценку адекватности (правдивости) уравнения. Полученное значение критерия (Fрасч.) сравнивают с критическим (табличным) (Fтабл.) для принятого уровня значимости (a = 0,05 (приложение Е) или a = 0,01 (приложение F)) и числа степеней свободы (n 1 = m – 1 и n 2 = nm, где n – число наблюдений, m – число факторов уравнения, включая результативный). Если оно окажется больше соответствующего табличного значения, то данное уравнение статистически значимо, т. е. доля вариации, обусловленная регрессией намного превышает случайную ошибку.

После построения уравнения регрессии возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии, что делают с помощью t-критерия Стьюдента. Расчетные значения данного показателя сравнивают с критическими, которые определяют по таблице (приложение G) с учетом принятого уровня значимости (a = 0,10; a = 0,05 или a = 0,01) (при изучении социально-экономических явлений достаточным считается уровень значимости, равный 0,05) и числа степеней свободы n = n – m – 1 (где n – число наблюдений; m – число факторов уравнения, включая результативный). Параметр признается значимым, если tрасч. ³ tтабл.

Если есть коэффициент регрессии, для которого условие не выполняется, то из уравнения исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение t -критерия. После этого уравнение регрессии строится без исключенного фактора и снова проверяется значимость коэффициентов регрессии. Такой процесс длится до тех пор, пока все коэффициенты регрессии не окажутся значимыми, что свидетельствует о наличии в уравнении только существенных (действительно влияющих на результативный показатель) факторов.

Иногда расчетные значения t-критерия ниже критического значения для факторных признаков, имеющих достаточно тесную связь с результативным. Это связано с проявлением эффекта мультиколлинеарности, когда два и более признака, оказывающих влияние на результативный, тесно связаны друг с другом. В таком случае включение одного из них (наиболее значимого) в уравнение регрессии позволяет учесть и влияние других.

В некоторых случаях tрасч. находится вблизи tтабл., поэтому с точки зрения содержательности уравнения такой фактор можно оставить для последующей проверки его значимости.

В рассматриваемом примере табличное значение t-критерия при уровне значимости a = 0,05 и числе степеней свободы n = 35 – 4 – 1=30 равно 2,042. Расчетное значение t-критерия при факторе «число торговых агентов» меньше табличного значения (tрасч. =1,008), поэтому данный признак исключается из уравнения регрессии. Это объясняется, в первую очередь, сильной связью между числом торговых агентов и затратами по стимулированию сбыта. Присутствие последних в уравнении регрессии во многом уже учитывает влияние исключаемого признака (эффект мультиколлинеарности).

После исключения незначимых факторов уравнение регрессии будет иметь следующий вид:

;

R = 0,900; R 2 = 0,811; F = 68,50,

где у – объем продаж, ед.;

х 1 – цена реализации, ден. ед.;

х 2 – затраты по стимулированию сбыта, ден. ед.

Факторы, включенные в уравнение регрессии оказывают сильное влияние на объем продаж. Они объясняют вариацию (влияние) результативного показателя на 81,1% (остальные 18,9% – влияние неучтенных факторов). Расчетное значение критерия Фишера значительно превосходит табличное при значимости a = 0,01 (Fтабл. = 5,34), что говорит о соответствии уравнения реальным зависимостям, проявляющимся при реализации товара.

5. Дайте экономическую интерпретацию коэффициентов регрессии.

В линейном уравнении коэффициенты регрессии показывают, на сколько в среднем изменяется величина результативного признака (y) при увеличении соответствующего факторного (хj) на единицу.

В рассматриваемом случае с увеличением цены реализации 1 ден. ед. объем реализации снижается на 4328 ден. ед., а с увеличением затрат по стимулированию сбыта на 1 ден. ед. результативный показатель увеличивается на 0,085 ед.

Поскольку в большинстве случаев факторные признаки выражены в разных единицах измерения, коэффициенты регрессии не позволяют сравнить силу их воздействия на результативный. В этом случае необходимо рассчитать коэффициенты эластичности и b -коэффициенты.

Рассчитаем коэффициенты эластичности для факторов, включенных в уравнение:

;

.

Они показывают, что с увеличением цены реализации относительно среднего значения на 1% объем продаж сокращается на 1,41% относительно своего среднего значения. В то же время увеличение затрат по стимулированию сбыта на 1% приведет к росту объема реализации только на 0,31%.

Недостаток данного показателя связан с тем, что факторные признаки изменяются в разных пределах. В частности цена реализации при среднем значении 27,8 ден. ед. изменяется в пределах от 19,5 до 35,9 ден. ед. (см. Описательная статистика), т. е. в интервале ±30%. В то же время затраты по стимулированию сбыта отклоняются от своего среднего значения более, чем в 2 раза. Поэтому рассчитывается b-коэффициент.

Он показывает, на какую часть стандартного отклонения изменяется зависимая переменная с изменением фактора хj на величину своего стандартного отклонения.

В рассматриваемом случае:

;

.

Рост цены и затрат по стимулированию сбыта на одно свое стандартное отклонение ведет в первом случае к снижению объема продаж на 0,86 стандартных отклонений, а во втором – к росту на 0,68. Несмотря на то, что цена и в этом случае в большей степени оказывает влияние на объем реализации, чем расходы по продвижению товара, разница является не столь существенной, как у коэффициента эластичности.

 

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: