Корреляция – связь между объективно существующими явлениями.
Тесноту связи между переменными Х и Y в линейной форме количественно можно измерить с помощью линейного коэффициента корреляции (Rxy или rxy):
где – среднее квадратическое отклонение по признаку Х, рассчитывается по формуле:
, где ;
– среднее квадратическое отклонение по признаку Y, рассчитывается по формуле:
, где ;
n – объем исследуемой совокупности;
b – коэффициент при переменной Х в уравнении регрессии (коэффициент регрессии).
Значение линейного коэффициента корреляции находится в границах:
Если Rxy=0, можно говорить о неправильно выбранной форме связи или об отсутствии связи между переменными Х и Y.
Если Rxy=1, все точки Xi и Yi расположены на прямой, связь между ними самая сильная – функциональная.
Если Rxy>0, связь между переменными Х и Y прямая.
Если Rxy<0, связь между переменными Х и Y обратная.
Оценить тесноту связи между переменной Х и переменной Y можно с помощью шкалы Чеддока (табл. 2.1):
Таблица 2.1
|
|
Показания тесноты связи | |0,1 – 0,3| | |0,3 – 0,5| | |0,5 – 0,7| | |0,7 – 0,9| | |0,9 – 0,99| |
Характеристика тесноты связи | Слабая | Умеренная | Заметная | Высокая | Весьма высокая |
Оценить тесноту связи между переменными Х и Y в нелинейной форме можно с помощью индекса корреляции:
Значение индекса корреляции находится в пределах:
Регрессия – односторонняя вероятностная зависимость между случайными величинами.
Различают следующие виды регрессии (табл. 2.2):
1. Однофакторная (парная, простая) регрессия – это регрессия между двумя переменными Y и X.
2. Многофакторная (множественная) регрессия – это регрессия между зависимой переменной Y и несколькими объясняющими переменными Х1, Х2, …, Хn.
Таблица 2.2
Однофакторные регрессии | Линейная: . |
Нелинейные: § гиперболическая: =a+ +e, § показательная: =abxe, § степенная: =axbe, § экспоненциальная: =ea+bx+e. | |
Многофакторные регрессии | Линейная: = а+b1х1+b2х2+b3х3+b4х4+b5х5+b6х6+…+bnxn + е. |
Нелинейные: § гиперболическая: , § показательная: , § степенная: , § экспоненциальная: . |
Образцы решения задач контрольной работы:
Задача 1.
Торговое предприятие имеет сеть, состоящую из 12 магазинов (табл.2.3). Определите форму и направление связи между годовым товарооборотом и торговой площадью, средним временем обслуживания, используя графический метод и метод сопоставления параллельных рядов.
Таблица2.3
Номер магазина | Годовой товарооборот, млн. руб. | Торговая площадь,тыс. кв.м | Среднее время обслуживания покупателей, мин |
20,01 | 0,25 | 0,96 | |
37,1 | 0,42 | 3,22 | |
41,11 | 0,53 | 1,89 | |
41,21 | 0,5 | 5,22 | |
56,5 | 0,82 | 2,8 | |
68,22 | 1,02 | 8,23 | |
74,94 | 1,1 | 2,33 | |
88,9 | 1,4 | 5,4 | |
91,2 | 1,4 | 6,32 | |
91,16 | 1,4 | 3,1 | |
1,61 | 2,54 | ||
107,98 | 1,7 | 10,3 |
|
|
Решение
Рассматривается зависимость годового товарооборота в зависимости от торговой площади и среднего времени обслуживания, значит в качестве результирующей переменной у берется товарооборот, а два других фактора – объясняющие переменные, обозначим их как х1 и х2. Построим диаграммы зависимости у(х1) и у(х2) (рис.2.1. и 2.2.).
Рис. 2.1. Диаграмма зависимости у(х1)
Рис. 2.2. Диаграмма зависимости у(х2)
Анализируя эти диаграммы, можно прийти к выводу, что на первом рисунке прослеживается линейная закономерность, а на втором –закономерности нет.
Значит форма связи между годовым товарооборотом и торговой площадью линейная, а между годовым товарооборотом и средним временем обслуживания связи нет.
Для определения направления связи между показателя применим метод сопоставления параллельных рядов. Для этого необходимо объясняющую переменную х расположить в порядке возрастания (убывания) и соответственно ей расположить результирующую переменную у. Рассмотрим данную процедуру (табл. 2.4 и табл. 2.5).
Таблица 2.4
Номер магазина | Годовой товарооборот, млн. руб. | Торговая площадь,тыс. кв.м |
20,01 | 0,25 | |
37,1 | 0,42 | |
41,21 | 0,5 | |
41,11 | 0,53 | |
56,5 | 0,82 | |
68,22 | 1,02 | |
74,94 | 1,1 | |
88,9 | 1,4 | |
91,2 | 1,4 | |
91,16 | 1,4 | |
1,61 | ||
107,98 | 1,7 |
Таблица 2.5
Номер магазина | Годовой товарооборот, млн. руб. | Среднее время обслуживания покупателей, мин |
20,01 | 0,96 | |
41,11 | 1,89 | |
74,94 | 2,33 | |
56,5 | 2,8 | |
2,54 | ||
91,16 | 3,1 | |
37,1 | 3,22 | |
41,21 | 5,22 | |
88,9 | 5,4 | |
91,2 | 6,32 | |
68,22 | 8,23 | |
107,98 | 10,3 |
Анализируя данные таблиц, можно прийти к выводу, что между торговой площадью и годовым товарооборотом связь прямая, т.е. с ростом торговой площади растет годовой товарооборот, а по данным второй таблицынельзя прийти к определенному выводу, т.к. не прослеживается никакой взаимосвязи междусреднем временем обслуживания покупателей и годовым товарооборотом.
Задача 2.
Определите вид регрессии:
а) = 123,5 - 1,74х1+ 51х2 – 2,7х3 + е,
б) = e42,04 + 10,05x + е.
Покажите, где здесь результирующая и объясняющие переменные. Что обозначает «е » в уравнениях регрессии?
Решение
= 123,5 – 1,74х1+ 51х2 – 2,7х3 + е – это множественная линейная регрессия, т.к. здесь прямая зависимость между у – результирующей переменной и объясняющими переменными х1, х2, х3, е - дополнительный остаточный член.
= e42,04 + 10,05x + е– это простая экспоненциальная регрессия, т.к. здесь экспоненциальная зависимость между у – результирующей переменной и объясняющей переменной х, в основании е – экспонента, а в степени - дополнительный остаточный член.
Задача 3.
Определите направление и тесноту связи между результирующей переменной «Y» и объясняющей переменной «Х» с помощью линейного коэффициента корреляции, если известны следующие данные: = 5,23 + 10x и σx=134, σy=4950, b=10.
Решение
Линейный коэффициент корреляции можно вычислить по формуле:
Связь между результирующей переменной «Y» и объясняющей переменной «Х» прямая (т.к. линейный коэффициент корреляции положительный), слабая (т.к. значение линейного коэффициента корреляции попадает в интервал от 0,1 до 0,3 по шкале Чеддока).