Определить выборочную ковариацию и построить диаграмму рассеяния между реальной ценой и потребительскими расходами на бензин в США за период с 1973-1982 гг.
Год | Расходы У (млрд. долл.) | Индекс P реальных цен |
26,2 24,8 25,6 26,8 27,7 28,3 27,4 25,1 25,2 25,6 | 103,5 127,0 126,0 124,8 124,7 121,6 149,7 188,8 193,6 173,9 |
Выборочная ковариация является мерой взаимосвязи между двумя переменными. На рисунке 1 эти данные представим в виде диаграммы рассеяния.
Р
180 140 25 26 27 28 У
Рис. 1. Диаграмма рассеяния
Показатель выборочной ковариации позволяет выразить данную связь
единым числом. Для его вычисления находим сначала среднее значение цены и расходов на бензин. Затем заполняем таблицу для расчета.
, , ; .
Таблица для расчета:
Год | р | у | |||||
103,5 127,0 126,0 124,8 124,7 121,6 149,7 188,8 193,6 173,9 | 26,2 24,8 25,6 26,8 27,7 28,3 27,4 25,1 25,2 25,6 | -39,86 -16,36 -17,36 -18,56 -18,66 -21,76 6,34 45,44 50,24 30,54 | -0,07 -1,47 -0,67 0,53 1,43 2,03 1,13 -1,17 -1,07 -0,67 | 2,79 24,05 11,63 -9,84 -26,68 -44,17 7,16 -53,16 -53,76 -20,46 | 1588,82 267,65 301,37 344,47 348,20 473,50 40,20 2064,79 2524,06 932,69 | 0,01 2,16 0,45 0,28 2,05 4,12 1,28 1,37 1,15 0,45 | |
Сумма | 1433,6 | 262,7 | -162,44 | 8885,75 | 13,30 | ||
Среднее | 143,36 | 26,27 | -16,24 | 888,58 | 1,33 |
Затем вычисляем отклонения
|
|
Найдем произведение по годам, сложим их и найдем среднее значение. Эта величина называется выборочной ковариацией.
Отрицательная связь выражается отрицательной ковариацией. Но пользоваться ковариацией для оценки связи неудобно, поэтому используют нормированный показатель коэффициент корреляции.
Выборочный коэффициент корреляции:
.
Коэффициент ryp является безразмерной величиной и измеряется в пределах от .
Для характеристики степени или силы связи используют шкалу Чеддока
Показатель тесноты связи | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,999 |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Значит у нас получилась связь умеренная линейная, а знак минус говорит о том, что в уравнении регрессии коэффициент при х имеет знак минус, т.е. , такая связь называется обратной.
Если rху>0, то говорят, что связь прямая.