Тема 2. Корреляция и регрессия

 

Корреляция – связь между объективно существующими явлениями.

Тесноту связи между переменными Х и Y в линейной форме количественно можно измерить с помощью линейного коэффициента корреляции (Rxy или rxy):

где – среднее квадратическое отклонение по признаку Х, рассчитывается по формуле:

, где ;

– среднее квадратическое отклонение по признаку Y, рассчитывается по формуле:

, где ;

n – объем исследуемой совокупности;

b – коэффициент при переменной Х в уравнении регрессии (коэффициент регрессии).

 


Значение линейного коэффициента корреляции находится в границах:

Если Rxy=0, можно говорить о неправильно выбранной форме связи или об отсутствии связи между переменными Х и Y.

Если Rxy=1, все точки Xi и Yi расположены на прямой, связь между ними самая сильная – функциональная.

Если Rxy>0, связь между переменными Х и Y прямая.

Если Rxy<0, связь между переменными Х и Y обратная.

Оценить тесноту связи между переменной Х и переменной Y можно с помощью шкалы Чеддока (табл. 2.1):

Таблица 2.1

Показания тесноты связи |0,1 – 0,3| |0,3 – 0,5| |0,5 – 0,7| |0,7 – 0,9| |0,9 – 0,99|
Характеристика тесноты связи Слабая Умеренная Заметная Высокая Весьма высокая

 

Оценить тесноту связи между переменными Х и Y в нелинейной форме можно с помощью индекса корреляции:


Значение индекса корреляции находится в пределах:


Регрессия – односторонняя вероятностная зависимость между случайными величинами.

Различают следующие виды регрессии (табл. 2.2):

1. Однофакторная (парная, простая) регрессия – это регрессия между двумя переменными Y и X.

2. Многофакторная (множественная) регрессия – это регрессия между зависимой переменной Y и несколькими объясняющими переменными Х1, Х2, …, Хn.

Таблица 2.2

Однофакторные регрессии Линейная: .
Нелинейные: § гиперболическая: =a+ +e, § показательная: =abxe, § степенная: =axbe, § экспоненциальная: =ea+bx+e.
Многофакторные регрессии Линейная: = а+b1х1+b2х2+b3х3+b4х4+b5х5+b6х6+…+bnxn + е.  
Нелинейные: § гиперболическая: , § показательная: , § степенная: , § экспоненциальная: .

Образцы решения задач контрольной работы:

Задача 1.

Торговое предприятие имеет сеть, состоящую из 12 магазинов (табл.2.3). Определите форму и направление связи между годовым товарооборотом и торговой площадью, средним временем обслуживания, используя графический метод и метод сопоставления параллельных рядов.

Таблица2.3

Номер магазина Годовой товарооборот, млн. руб. Торговая площадь,тыс. кв.м Среднее время обслуживания покупателей, мин
  20,01 0,25 0,96
  37,1 0,42 3,22
  41,11 0,53 1,89
  41,21 0,5 5,22
  56,5 0,82 2,8
  68,22 1,02 8,23
  74,94 1,1 2,33
  88,9 1,4 5,4
  91,2 1,4 6,32
  91,16 1,4 3,1
    1,61 2,54
  107,98 1,7 10,3

 

Решение

 

Рассматривается зависимость годового товарооборота в зависимости от торговой площади и среднего времени обслуживания, значит в качестве результирующей переменной у берется товарооборот, а два других фактора – объясняющие переменные, обозначим их как х1 и х2. Построим диаграммы зависимости у(х1) и у(х2) (рис.2.1. и 2.2.).


 

Рис. 2.1. Диаграмма зависимости у(х1)

 


Рис. 2.2. Диаграмма зависимости у(х2)

 

Анализируя эти диаграммы, можно прийти к выводу, что на первом рисунке прослеживается линейная закономерность, а на втором –закономерности нет.

Значит форма связи между годовым товарооборотом и торговой площадью линейная, а между годовым товарооборотом и средним временем обслуживания связи нет.

Для определения направления связи между показателя применим метод сопоставления параллельных рядов. Для этого необходимо объясняющую переменную х расположить в порядке возрастания (убывания) и соответственно ей расположить результирующую переменную у. Рассмотрим данную процедуру (табл. 2.4 и табл. 2.5).

Таблица 2.4

Номер магазина Годовой товарооборот, млн. руб. Торговая площадь,тыс. кв.м
  20,01 0,25
  37,1 0,42
  41,21 0,5
  41,11 0,53
  56,5 0,82
  68,22 1,02
  74,94 1,1
  88,9 1,4
  91,2 1,4
  91,16 1,4
    1,61
  107,98 1,7

 

 

 

 

 

Таблица 2.5

Номер магазина Годовой товарооборот, млн. руб. Среднее время обслуживания покупателей, мин
  20,01 0,96
  41,11 1,89
  74,94 2,33
  56,5 2,8
    2,54
  91,16 3,1
  37,1 3,22
  41,21 5,22
  88,9 5,4
  91,2 6,32
  68,22 8,23
  107,98 10,3

 

Анализируя данные таблиц, можно прийти к выводу, что между торговой площадью и годовым товарооборотом связь прямая, т.е. с ростом торговой площади растет годовой товарооборот, а по данным второй таблицынельзя прийти к определенному выводу, т.к. не прослеживается никакой взаимосвязи междусреднем временем обслуживания покупателей и годовым товарооборотом.

Задача 2.

Определите вид регрессии:

а) = 123,5 - 1,74х1+ 51х2 – 2,7х3 + е,

б) = e42,04 + 10,05x + е.

Покажите, где здесь результирующая и объясняющие переменные. Что обозначает «е » в уравнениях регрессии?

Решение

 

= 123,5 – 1,74х1+ 51х2 – 2,7х3 + е – это множественная линейная регрессия, т.к. здесь прямая зависимость между у – результирующей переменной и объясняющими переменными х1, х2, х3, е - дополнительный остаточный член.

= e42,04 + 10,05x + е– это простая экспоненциальная регрессия, т.к. здесь экспоненциальная зависимость между у – результирующей переменной и объясняющей переменной х, в основании е – экспонента, а в степени - дополнительный остаточный член.

Задача 3.

Определите направление и тесноту связи между результирующей переменной «Y» и объясняющей переменной «Х» с помощью линейного коэффициента корреляции, если известны следующие данные: = 5,23 + 10x и σx=134, σy=4950, b=10.

Решение

 

Линейный коэффициент корреляции можно вычислить по формуле:


Связь между результирующей переменной «Y» и объясняющей переменной «Х» прямая (т.к. линейный коэффициент корреляции положительный), слабая (т.к. значение линейного коэффициента корреляции попадает в интервал от 0,1 до 0,3 по шкале Чеддока).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: