Условиями правильного использования методов теории корреляции являются следующие:
а) наличие однородности тех единиц, которые подлежат исследованию (например, отбор предприятий, которые выпускают однотипную продукцию, имеют одинаковый характер технологии и тип оборудования и т. п.);
б) достаточно большое количество наблюдений, при которых мы погашаем влияние случайностей на результативный признак и имеет силу закон больших чисел;
в) нормальный характер распределения результативного признака, на котором построены все положения теории корреляции.
СХЕМА ПОСТРОЕНИЯ УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ
В основе теории корреляции лежит корреляционно-регрессионный анализ (КРА), суть которого заключается в выборе вида уравнения регрессии
Y=f(x) (1)
В вычислении его параметров и установлении адекватности (соответствия) теоретической зависимости фактическим данным, представленным в табличном форме. Наличие такой теоретической зависимости значительно облегчает анализ экономических явлений, дает возможность установления прогноза на будущее.
|
|
Наиболее часто для характеристики корреляционной связи между признаками применяют такие виды уравнений парной регрессии, или корреляционных уравнений:
а) линейный Y = а0 + a1 х; (2)
б) параболический Y= a0 + atx2 (3)
в) гиперболический Y = а0 + а1 /x (4)
г) степенной, Y = а0 хn и др. (5)
где ао, a1— параметры уравнений регрессии, которые подлежат определению.
Параметры aj. (j=l m) в уравнениях регрессии определяются методом наименьших квадратов Уравнение (2) является линейным относительно факторного признака.х и линия регрессии, которая отвечает функции такого вида, будет прямой; уравнения (3) —- (5) — нелинейные и линии регрессии будут соответственно параболой (3), гиперболой (4), степенной линией (5). Соответствующими преобразованиями нелинейные уравнения можно свести к линейной форме, так как классическая теория корреляции является по своей сути линейной.
Этот метод наилучшим образом отвечает корреляционной таблице и допускает нахождение таких значений параметров уравнения регрессии, при которых сумма квадратов отклонений табличных (фактических) значений результативного признака у от теоретических значений У по линии регрессии была бы минимальной:
S = ∑(y-Y)2 =min,
Функция S параметров уравнения регрессии аi будет минимальной тогда, когда выполняются необходимые условия нахождения экстремума этой функции — равенство нулю первых производных функции по разыскиваемым параметрам:
∂S / ∂a0 = 0 ∂S / ∂a1 = 0
Из этих условий формируется система нормальных уравнений для нахождения параметров аа и аг
|
|
В случае линейного вида уравнения регрессии (2), которое отвечает линейной зависимости между признаками, а система нормальных уравнений записывается в виде:
na0 + a1∑x =∑y:
a0 ∑xi + a1∑x2 = ∑xy
где n — количество единиц совокупности (то есть заданных пар значений.v и у).
Решив эту систему, находим такие значения параметров:
a0 = (∑y∑x2 - ∑xy∑x) / (n∑x2 - ∑x∑x);
a1 = (n∑yx - ∑y∑x) / (n∑x2 - ∑x∑x);
или а0 = yср – a1xср; a1 = ((xy)ср – xср yср) / (xср 2-(xср)2)
Параметр а1 называется коэффициентом регрессии и показывает изменение результативного признака У при изменении факторного признака х на единицу; геометрически параметр а, отвечает углу наклона (в радианах) прямой линии регрессии к горизонтальной оси.
Для оценки влияния факторного признака на результативный может рассчитываться коэффициент эластичности в среднем для всей совокупности:
Ке = а1хср /y
где х, у - средние величины фактических данных соответственно по факторному и результативному признаку в целом для совокупности.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится результативный признак при изменении факторного признака на 1%.
Коэффициент корреляции (корреляционное отношение) показывает, насколько значительным является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле:
R =√ R2
Он находится в диапазоне 0 < R < 1; чем более близок R к единице, тем теснее корреляционная связь между признаками.
Иногда коэффициент корреляции рассчитывают по формуле, которую можно представить в виде:
R1 =√∑(1- (y-Y)2 / (∑y-ÿ)2 )
В случае линейной связи между Y и х величина линейного коэффициента корреляции определяется по формуле:
r = ((n∑xy - ∑x∑y) /√ (n∑y2-(∑y)2) 1/(n∑x2-(∑x)2.
Значение r лежит в диапазоне -1 = r = +1. При г = 0 не существует линейной корреляционной связи. Степень тесноты их линейной зависимости растет при приближении к ±1. Когда r > О связь между признаками прямая (при росте х растет У), при r < 0— обратная (при росте х уменьшается Y).
Принято считать, если коэффициент корреляции:
до ±0,3 – связь слабая | ±0,3 до ±0,7 – связь средней силы | >± 0,7 связь тесная |
После установления тесноты связи дают оценку з начимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных переменных от своих значений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использованием F-критерия. Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:
F =∑(Y - ÿ)2 /1: (∑y-Y)2 /(n-2)
где [l, (п - 2)] — число степеней свободы числителя и знаменателя зависимости.
Вопросы для самоконтроля
1. Дайте определение функциональной, стохастической и корреляционной связи.
2. Дайте определение факторного и результативного признаков.
3. Что означает прямая и обратная связь между признаками?
4. Что показывает коэффициент эластичности?
5. Какие коэффициенты используются для изучения связи качественных признаков?
6. Какие задачи решаются с помощью корреляционно-peгpeccионного анализа?
7. В чем сущность метода наименьших квадратов?
8. В каких пределах изменяется парный (линейный) коэффициент корреляции? Что он показывает?
9. В каких пределах изменяется частный коэффициент регрессии? Что
он показывает?
10. Какой экономический смысл несут свободный член уравнения регрессии и коэффициенты линейного регрессионного уравнения?
11. Линейный коэффициент корреляции может принимать значения …
1. от –1 до +1; 2. от –1 до 0; 3. от –0,5 до +0,5; 4. от 0 до 1.
12. Какое значение коэффициента корреляции показывает наиболее тесную связь?
1. -0,981; 2. -0,957; 3. 0,971; 4. 0,972
|
|
13. Коэффициент эластичности показывает …
1. среднее изменение результативного признака при изменении факторного признака на 1%;
2. долю вариации результативного признака под влиянием вариации признака-фактора;
3. направленность корреляционной связи между двумя варьирующими признаками;
4. тесноту связи между двумя варьирующими признаками.
14. Для определения параметров уравнения регрессии можно применять метод
1. наименьших квадратов; 3. скользящей средней;
2. основного массива; 4. параллельных рядов.
ОСНОВНЫЕ ПОНЯТИЯ
Корреляционная связь — изменение среднего значения результативного признака, которое обусловливается изменением факторных признаков.
Корреляционное отношение показывает связь между двумя признаками.
Корреляция - статистическая зависимость между случайными величинами, которая не имеет строго функционального характера, но изменение одной из случайных величин приводит к изменению математического ожидания другой.
Коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией j'-го признака (частный) или всех вошедших в модель факторных признаков (множественный).
Коэффициент регрессии показывает, на сколько в среднем изменяется значение результативного признака при изменении факторного на единицу собственного измерения.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.
Линейная связь - статистическая связь между явлениями, выраженная уравнением прямой линии.
Линейный коэффициент корреляции определяет тесноту и направление связи между двумя коррелируемыми признаками.
Нелинейная связь - статистическая связь между социально-экономическими явлениями, аналитически выраженная уравнением кривой линии (параболы, гиперболы и т. д.).
Обратная связь - с увеличением или уменьшением значений факторного признака уменьшается или увеличивается значение результативного.
|
|
Парная регрессия - аналитическое выражение связи двух признаков.
Прямая связь - с увеличением или уменьшением значений факторного признака увеличивается или уменьшается значение результативного.
Ранг - порядковый номер значения признака, расположенного в порядке возрастания или убывания величин.
Ранжирование - процедура упорядочения объектов изучения, которая выполняется на основе предпочтения значений признака в порядке возрастания или убывания.
Регрессионный анализ - аналитическое выражение связи, в котором изменение одной величины - результативного признака - обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.
Результативный признак - признак, изменяющийся под действием факторных признаков.
Стохастическая связь - связь, которая проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений.
Факторный признак - признак, оказывающий влияние на изменение результативного признака.
Функциональная связь - связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.