xi \ yj | 2 | ||
Случайный вектор дискретного типа, следовательно, F (x, y) = .
F (x, y) | y ≤ 0 | 0 < y ≤ 1 | 1 < y ≤ 2 | y > 2 |
x ≤ 0 | ||||
0 < x ≤ 1 | ||||
1 < x ≤ 2 | + | |||
x > 2 | + | + + = 1 |
Пояснение: .
= .
= .
.
Ковариация, корреляция. Линии регрессии
Особую роль при исследовании системы играет второй смешанный центральный момент.
Определение 16. Второй смешанный центральный момент μ11 называется корреляционным или моментом связи или ковариацией:
.
для СВДТ.
для СВНТ.
Теория корреляции решает две задачи: 1) установление формы связи между случайными величинами, 2) определение тесноты и силы этой связи.
, помимо рассеивания, характеризует взаимное влияние случайных величин X и Y, входящих в систему. Для оценки степени влияния используется не сам момент, а безразмерное соотношение, которое называется нормированной ковариацией или коэффициентом корреляции:
–
коэффициент корреляции двух случайных компонент X и Y случайного вектора.
(Иногда его обозначают как ).
Средние квадратические отклонения случайных величин Х и У равны , .
Определение 17. X и Y называются некоррелированными случайными величинами, если их коэффициент корреляции , и коррелированными, если отличен от нуля.
Свойства коэффициента корреляции :
1. Если X и Y – независимые СВ, то = . (X и Y некоррелированные случайные величины). Обратное утверждение неверно, так как X и Y могут быть зависимыми, но при этом .
2. .
3. В случае говорят о положительной корреляции Х и Y, что означает: при возрастании одной из них другая тоже имеет тенденцию в среднем возрастать. Например, вес и рост человека.
4. В случае говорят об отрицательной корреляции Х и Y, что означает: при возрастании одной из них другая имеет тенденцию в среднем убывать. Например, время, потраченное на подготовку прибора к работе и количество неисправностей, обнаруженных при его работе.
Взаимная связь двух случайных величин, помимо , может быть описана с помощью линий регрессии. Действительно, хотя при каждом значении Х = x величина Y остается случайной величиной, допускающей рассеивание своих значений, однако зависимость Y от Х сказывается часто в изменении средних размеров Y при переходе от одного значения х к другому. С изменением х будет изменяться и . Это означает, что можно рассматривать функцию = , областью определения которой является множество возможных значений случайной величины Х. Эта функция носит название регрессии Y по Х.
Аналогично, зависимость X от Y описывает функция = .
и – уравнения регрессии
Линии, определенные этими уравнениями, называются кривыми или линиями регрессии. (Вводятся лишь для непрерывных СВ, для ДСВ линии будут состоять из точек.)
Если обе линии регрессии – прямые, то корреляционную зависимость называют линейной (линейная корреляция). Для нормально распределенного случайного вектора (X, Y) уравнения регрессии линейные:
,
.
Связь коэффициента корреляции и линий регрессии
1) Если , то линии регрессии наклонены вправо.
2) Если , то линии регрессии наклонены влево.
3) Если , то линии регрессии проходят параллельно осям координат.
4) Если, , то линии регрессии сливаются в одну линию, а случайные величины X и Y связаны между собой линейной функциональной зависимостью , , причем знак коэффициента корреляции (+ rХУ) или (– rХУ) берется в зависимости от знака (+ или –) коэффициента а, который называется коэффициентом регрессии.
Часто пишут уравнение в виде: и называют его уравнением парной регрессии, где коэффициент регрессии .
Определение 18. Ковариационной матрицей случайного вектора называется симметрическая действительная матрица, элемент которой представляет собой ковариации соответствующих пар компонент: .
Определение 19. Корреляционной матрицей случайного вектора называется нормированная ковариационная матрица .
Пример 9. Дано уравнение парной регрессии . Выберите правильный коэффициент корреляции: 1) = 0,6, 2) = – 0,6, 3) =1,2.