Условиями правильного использования методов теории корреляции являются следующие:
а) наличие однородности тех единиц, которые подлежат исследованию (например, отбор предприятий, которые выпускают однотипную продукцию, имеют одинаковый характер технологии и тип оборудования и т. п.);
б) достаточно большое количество наблюдений, при которых мы погашаем влияние случайностей на результативный признак и имеет силу закон больших чисел;
в) нормальный характер распределения результативного признака, на котором построены все положения теории корреляции.
СХЕМА ПОСТРОЕНИЯ УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ

В основе теории корреляции лежит корреляционно-регрессионный анализ (КРА), суть которого заключается в выборе вида уравнения регрессии
Y=f(x) (1)
В вычислении его параметров и установлении адекватности (соответствия) теоретической зависимости фактическим данным, представленным в табличном форме. Наличие такой теоретической зависимости значительно облегчает анализ экономических явлений, дает возможность установления прогноза на будущее.
Наиболее часто для характеристики корреляционной связи между признаками применяют такие виды уравнений парной регрессии, или корреляционных уравнений:
а) линейный Y = а0 + a1 х; (2)
б) параболический Y= a0 + atx2 (3)
в) гиперболический Y = а0 + а1 /x (4)
г) степенной, Y = а0 хn и др. (5)
где ао, a1— параметры уравнений регрессии, которые подлежат определению.
Параметры aj. (j=l m) в уравнениях регрессии определяются методом наименьших квадратов Уравнение (2) является линейным относительно факторного признака.х и линия регрессии, которая отвечает функции такого вида, будет прямой; уравнения (3) —- (5) — нелинейные и линии регрессии будут соответственно параболой (3), гиперболой (4), степенной линией (5). Соответствующими преобразованиями нелинейные уравнения можно свести к линейной форме, так как классическая теория корреляции является по своей сути линейной.
Этот метод наилучшим образом отвечает корреляционной таблице и допускает нахождение таких значений параметров уравнения регрессии, при которых сумма квадратов отклонений табличных (фактических) значений результативного признака у от теоретических значений У по линии регрессии была бы минимальной:
S = ∑(y-Y)2 =min,
Функция S параметров уравнения регрессии аi будет минимальной тогда, когда выполняются необходимые условия нахождения экстремума этой функции — равенство нулю первых производных функции по разыскиваемым параметрам:
∂S / ∂a0 = 0 ∂S / ∂a1 = 0
Из этих условий формируется система нормальных уравнений для нахождения параметров аа и аг
В случае линейного вида уравнения регрессии (2), которое отвечает линейной зависимости между признаками, а система нормальных уравнений записывается в виде:
na0 + a1∑x =∑y:
a0 ∑xi + a1∑x2 = ∑xy
где n — количество единиц совокупности (то есть заданных пар значений.v и у).
Решив эту систему, находим такие значения параметров:
a0 = (∑y∑x2 - ∑xy∑x) / (n∑x2 - ∑x∑x);
a1 = (n∑yx - ∑y∑x) / (n∑x2 - ∑x∑x);
или а0 = yср – a1xср; a1 = ((xy)ср – xср yср) / (xср 2-(xср)2)
Параметр а1 называется коэффициентом регрессии и показывает изменение результативного признака У при изменении факторного признака х на единицу; геометрически параметр а, отвечает углу наклона (в радианах) прямой линии регрессии к горизонтальной оси.
Для оценки влияния факторного признака на результативный может рассчитываться коэффициент эластичности в среднем для всей совокупности:
Ке = а1хср /y
где х, у - средние величины фактических данных соответственно по факторному и результативному признаку в целом для совокупности.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится результативный признак при изменении факторного признака на 1%.
Коэффициент корреляции (корреляционное отношение) показывает, насколько значительным является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле:
R =√ R2
Он находится в диапазоне 0 < R < 1; чем более близок R к единице, тем теснее корреляционная связь между признаками.
Иногда коэффициент корреляции рассчитывают по формуле, которую можно представить в виде:
R1 =√∑(1- (y-Y)2 / (∑y-ÿ)2 )
В случае линейной связи между Y и х величина линейного коэффициента корреляции определяется по формуле:
r = ((n∑xy - ∑x∑y) /√ (n∑y2-(∑y)2) 1/(n∑x2-(∑x)2.
Значение r лежит в диапазоне -1 = r = +1. При г = 0 не существует линейной корреляционной связи. Степень тесноты их линейной зависимости растет при приближении к ±1. Когда r > О связь между признаками прямая (при росте х растет У), при r < 0— обратная (при росте х уменьшается Y).
Принято считать, если коэффициент корреляции:
| до ±0,3 – связь слабая | ±0,3 до ±0,7 – связь средней силы | >± 0,7 связь тесная |
После установления тесноты связи дают оценку з начимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных переменных от своих значений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использованием F-критерия. Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:
F =∑(Y - ÿ)2 /1: (∑y-Y)2 /(n-2)
где [l, (п - 2)] — число степеней свободы числителя и знаменателя зависимости.
Вопросы для самоконтроля
1. Дайте определение функциональной, стохастической и корреляционной связи.
2. Дайте определение факторного и результативного признаков.
3. Что означает прямая и обратная связь между признаками?
4. Что показывает коэффициент эластичности?
5. Какие коэффициенты используются для изучения связи качественных признаков?
6. Какие задачи решаются с помощью корреляционно-peгpeccионного анализа?
7. В чем сущность метода наименьших квадратов?
8. В каких пределах изменяется парный (линейный) коэффициент корреляции? Что он показывает?
9. В каких пределах изменяется частный коэффициент регрессии? Что
он показывает?
10. Какой экономический смысл несут свободный член уравнения регрессии и коэффициенты линейного регрессионного уравнения?
11. Линейный коэффициент корреляции может принимать значения …
1. от –1 до +1; 2. от –1 до 0; 3. от –0,5 до +0,5; 4. от 0 до 1.
12. Какое значение коэффициента корреляции показывает наиболее тесную связь?
1. -0,981; 2. -0,957; 3. 0,971; 4. 0,972
13. Коэффициент эластичности показывает …
1. среднее изменение результативного признака при изменении факторного признака на 1%;
2. долю вариации результативного признака под влиянием вариации признака-фактора;
3. направленность корреляционной связи между двумя варьирующими признаками;
4. тесноту связи между двумя варьирующими признаками.
14. Для определения параметров уравнения регрессии можно применять метод
1. наименьших квадратов; 3. скользящей средней;
2. основного массива; 4. параллельных рядов.
ОСНОВНЫЕ ПОНЯТИЯ
Корреляционная связь — изменение среднего значения результативного признака, которое обусловливается изменением факторных признаков.
Корреляционное отношение показывает связь между двумя признаками.
Корреляция - статистическая зависимость между случайными величинами, которая не имеет строго функционального характера, но изменение одной из случайных величин приводит к изменению математического ожидания другой.
Коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией j'-го признака (частный) или всех вошедших в модель факторных признаков (множественный).
Коэффициент регрессии показывает, на сколько в среднем изменяется значение результативного признака при изменении факторного на единицу собственного измерения.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.
Линейная связь - статистическая связь между явлениями, выраженная уравнением прямой линии.
Линейный коэффициент корреляции определяет тесноту и направление связи между двумя коррелируемыми признаками.
Нелинейная связь - статистическая связь между социально-экономическими явлениями, аналитически выраженная уравнением кривой линии (параболы, гиперболы и т. д.).
Обратная связь - с увеличением или уменьшением значений факторного признака уменьшается или увеличивается значение результативного.
Парная регрессия - аналитическое выражение связи двух признаков.
Прямая связь - с увеличением или уменьшением значений факторного признака увеличивается или уменьшается значение результативного.
Ранг - порядковый номер значения признака, расположенного в порядке возрастания или убывания величин.
Ранжирование - процедура упорядочения объектов изучения, которая выполняется на основе предпочтения значений признака в порядке возрастания или убывания.
Регрессионный анализ - аналитическое выражение связи, в котором изменение одной величины - результативного признака - обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.
Результативный признак - признак, изменяющийся под действием факторных признаков.
Стохастическая связь - связь, которая проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений.
Факторный признак - признак, оказывающий влияние на изменение результативного признака.
Функциональная связь - связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.






