Связь между случайными величинами

При изучении зависимости между двумя величинами, каждая из которых подвергается случайному рассеиванию (неконтролируемому разбросу), применяются методы корреляционного анализа. Корреляционный анализ изучает меру зависимости между рассматриваемыми величинами. Сопоставляя каждому значению одной величины x, среднее из соответствующих значений другой величины y, мы получаем функцию регрессии или просто регрессию y на x. Функция регрессии изображается графически линией регрессии.

Рис. 1. Линия регрессии y на x.

Корреляция между величинами x и y называется линейной, если функция регрессии линейна. Угловые коэффициенты этих прямых выражаются через коэффициент корреляции, который служит также мерой линейной зависимости между величинами. Коэффициентом корреляции rxy между случайными величинами x и y называется математическое ожидание произведения их нормированных отклонений:

,

.

. Коэффициент корреляции характеризует меру линейной зависимости между величинами x и y. Для независимых величин x и y коэффициент корреляции r равен нулю. rxy = 0 означает отсутствие линейной зависимости (но не исключает зависимости нелинейной). Чем ближе ï rxy ï к 1, тем теснее линейная зависимость между величинами. Если rxy > 0, то при возрастании одной СВ другая тоже (в среднем) возрастает.

Значимость коэффициента корреляции проверяется простыми правилами

< 0.3 – нет корреляции,

0.3 < < 0.5 – слабая корреляция,

0.5 < < 0.7 – умеренная корреляция,

0.7 < < 1 – сильная корреляция,

= 1 – есть функциональная связь.

Характер зависимости между СВ определяют уравнением регрессии.

Рис. 2. Прямые регрессии для обоих параметров.

. Коэффициенты регрессии by|x и bx|y имеют тот же знак, что и коэффициент корреляции r. Обе прямые регрессии проходят через точку (mx, my)—центр распределения (рис. 2).

Коэффициенты уравнения регрессии удовлетворяют условию наименьших квадратов. Как правило стараются получить линейную регрессию

Одномерная линейная регрессия: Y=ax+b

Множественная линейная регрессия

Y=

Если связь между x и y нелинейная, то применяют три вида аппроксимирующих функций:

1. полиномы,

2. функции пользователя,

3. сплайны,

Как правило, применяют полиномы вида

y= ,

То есть нелинейную зависимость заменяют рядом Тейлора. Степень полинома берут не выше четвертой.

Сплайн – аппроксимация – это кусочная интерполяция сложной нелинейной зависимости отрезками прямых или кривых низкого порядка, которые затем объединяют в общую интерполяционную функцию


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: