Корреляционный анализ. Корреляционный анализ используется для определения степени линейной взаимосвязи между случайными величинами (корреляция – зависимость между случайными

Корреляционный анализ используется для определения степени линейной взаимосвязи между случайными величинами (корреляция – зависимость между случайными величинами, выражающая тенденцию одной величины возрастать или убывать при возрастании или убывании другой).

Если число случайных величин больше двух (r>2), то составляется квадратная корреляционная матрица размером (r х r), элементами которой являются коэффициенты корреляции , а диагональные элементы равны единице (т.е. =1). Коэффициенты корреляции изменяются от нуля до единицы, и чем больше его значение, тем теснее связь между случайными величинами.

Ковариация двух наборов данных (цен закрытия или логарифмических доходностей двух финансовых инструментов), или, выражаясь языком теории вероятностей, двух случайных величин представленных выборками, это показатель взаимозависимости этих случайных величин. Основным свойством ковариации является следующее утверждение «если ковариация отлична от нуля, то случайные величины зависимы».

N - размер выборки, и — соответственно значения случайных величин в замере с индексом t.

и— среднеквадратические отклонения, рассчитанные по выборкам первого и второго показателя соответственно:

.

Пример 9.4. Требуется оценить зависимость времени перевозок товара от расстояния между пунктом хранения и различными пунктами доставки внутри города. Данные наблюдения приведены в таблице:

Расстояние (в км) 3,5 2,4 4,9 4,2 3,0 1,3 1,0 3,0 1,5 4,1
Время (в мин)                    

Обозначим: Y - время, X - расстояние и нарисуем поле рассеяния (Рис. 9.4). Расположение точек говорит о возможной линейной связи Y и X. Поэтому, используя формулы (9.2.8) и (9.2.9), вычислим:


Тогда линейная модель имеет вид:


Коэффициент корреляции, рассчитанный по формуле (9.4.1), есть


Так как это значение очень близко к единице, то линейная связь между расстоянием и временем доставки очень тесна. Этот вывод подтверждается характером разброса точек на Рис. 9.4.
Коэффициент детерминации (9.4.7) здесь показывает долю общей вариации времени перевозок, которая зависит от расстояния:

r2=(0,958)2=0,918


Таким образом, выборочная модель (9.4.8) объясняет 91,8% вариации времени доставки. Не объясняется 8,2% вариации времени доставки. Эта часть вариации обусловлена не учтенными в модели, но влияющими на время поездки факторами (пробки на дорогах, время суток, погода, вид транспорта и пр.).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: