double arrow

Коэффициент корреляции случайных величин

Пусть x и h — случайные величины, заданные на одном и том же вероятностном пространстве {W, F, Р }. Вопросы взаимосвязи случайных величин (вид этой связи, ее количественная мера) возникают во многих задачах. Коэффициент корреляции один из числовых показателей связи между случайными величинами.

Определение. Коэффициентом корреляции между случайными величинами x и h называется число

 
 

Отметим, что E (xЕ x)(hЕ h) = cou(x,h)— называется ковариацией случайных величин x и h. Она характеризует меру линейной связи между случайными величинами.

Если cou(x,h) = 0, то говорят, что случайные величины x и h некоррелируемые.

Рассмотрим свойства коэффициента корреляции.

 
 

Это свойство следует непосредственно из определения, поскольку

 
 

2. Если случайные величины x и h независимы, то (x, h) = 0.

 
 

Следует из свойства 1, поскольку для независимых случайных величин x и h справедливо E (x × h) = E x × E h

Замечание 1. Обратное не верно!

4. | (x, h) | = 1 имеет место тогда и только тогда, когда существуют числа а ¹ 0, b такие, что P (x = ah + b) = 1, т.е. x и h линейно зависимые случайные величины.

 
 

Докажем сначала достаточность. Пусть P (x = ah + b) = 1, тогда

т.е.

или | (x, h) | = 1.

 
 

Докажем теперь необходимость. При доказательстве свойства 3 нами было получено следующее равенство

 
 

Пусть (x, h) = 1, тогда

 
 

По свойству 2 дисперсии получаем, что

поскольку D (x 1h 1) = 0. Отсюда P (x = a h + b) = 1, где

 
 

 
 

Пусть (x, h) = - l; тогда

По свойству 2 дисперсии получаем, что

 
 

 
 

поскольку D (x 1 + h 1) = 0. Отсюда, P (x = a h + b) = 1, где

Замечание 2. Чем сильнее связь между случайными величинами, тем больше и величина коэффициента корреляции. При (x, h) ¹ 0 этот показатель характеризует не только наличие связи между x и h, но и её степень. При положительной (или прямой) связи, когда большим значениям одной случайной величины соответствуют большие значения другой, коэффициент корреляции больше нуля. А при отрицательной (или обратной) связи, когда большим значениям одной случайной величины соответствуют меньшие значения другой, коэффициент корреляции меньше нуля. Недостатком (x, h) является то, что он характеризует только линейные связи. При наличии нелинейной связи следует использовать другие показатели связи.

 
 

Пример 2. Изготавливаемые в цехе втулки сортируются по отклонению их внутреннего диаметра от номинального размера на четыре группы со значениями 0,01; 0,02; 0,03; 0,04 мм, по овальности на четыре группы со значениями 0,002; 0,004; 0,006; 0,008 мм. Совместное распределение отклонений диаметра (x) и овальности (h) втулок задано таблицей:

Вычислим коэффициент корреляции между x и h.

Найдем сначала частные распределения случайных величин x и h. Согласно 2.4.2, например,

Р (x = 0, 01) = 0, 01 + 0, 03 + 0, 04 + 0, 02 = 0,10

и т.д. (остальные вычисления проведите самостоятельно) получим следующую таблицу распределения случайной величины x:

 
 

также таблицу распределения случайной величины h:

Теперь вычислим математические ожидания и дисперсии случайных величин x и h:

 
 

(проверьте самостоятельно!).

Остается вычислить величину Е (x × h):

Е (x × h) = 0,01 × 0,002 × 0,01 + 0,04 × 0,008 × 0,02 = 0,0001274.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: