Корреляционно-регрессивные модели и их применение в анализе и прогнозе социально-жизненных явлений.
Корреляционно-регрессивной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы влияющие на вариацию результативного признака, обладает высоким коэффициентом детерминации (не ниже, чем 50%) и коэффициентом регрессии, интерпретированным в соответствии с теоретическим знанием о природе связей в изучаемой системе.
Рекомендации для построения корреляционно-регрессивной модели:
1. признаки – факторы находятся в причинной связи с результативными признаками.
Поэтому недопустимо, к примеру, себестоимости (у) вводить в качестве одного из факторов коэффициента рентабельности.
2. признаки–факторы не должны быть составными частями результативного признака или его функциями.
3. признаки-факторы не должны дублировать друг друга, т.е. быть коллинеарны
4. не следует включать в модель факторы разного уровня иерархии, т.е. факторы ближнего порядка и его субфакторы. Например в модель себестоимости зерна не стоит включать его урожайность, дозу внесения удобрений, показатели качества семян, плодородие почвы, т.е. субфакторы самой урожайности
5. желательно, чтобы между результативными признаками и факторами наблюдалось единство совокупности, к которой они отнесены.
6. математическая формула регрессии должна соответствовать ломке связей между факторами в реальной ситуации.
Корреляционно-регрессивный анализ применим только к количественным признакам. Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих 2 или более уровней градации.
К числу таких признаков можно отнести:
- пол (м., ж.)
- образование
- фактор сезонности
- форма собственности предприятия
- отрасль и т.д.
Качественные признаки могут оказать существенное влияние на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессивной модели. В этом случае говорят об исследовании регрессивной модели с переменной структурой или построении регрессивной модели по неоднородным данным.
Например, необходимо изучить зависимость размеров заработной платы (у), не только от количественных факторов: х1 – производительности труда; х2 – количества рабочих дней, но и от качественного признака Z – пол работника.
Можно получить оценки для каждого уровня качественных признаков, т.е. построить уравнение регрессии.
Отдельно для работников - мужчин и отдельно для работников – женщин, а затем изучить различия между ними.
Но есть и другой подход, позволяющий изучить влияние значений количественных переменных и качественных признаков с помощью одного уровня регрессии. Этот подход основан на введении так называемых фиктивных переменных (структурных, манекенных). В качестве фиктивных переменных используются дихотолические переменные, которые принимают всего 2 значения: 0 или 1. В этом случае первоначальная модель заработной платы изменится и примет следующий вид.
Где Z1 = 0, если работник женского пола,
Z1 = 1, если работник мужского пола.
Таким образом по данной модели мы можем сделать вывод, что средняя заработная плата у мужчин больше на величину C1 Z1 = C1 q 1, т.е. С1.
Следует отметить, что в принципе качественные различия можно формализировать с помощью любой переменной, принимающей 2 разных значения (т.е. необязательно 0 или 1).
Однако в эконометрике почти всегда используются переменные типа 0 или 1, т.к. при этом интерпретация полученных результатов выглядит предельно просто.