Понятие функциональной, стохастической и корреляционной

зависимости. Функция регрессии

Условимся обозначать через Χ независимую переменную, а через Υ – зависимую переменную.

Зависимость величины Υ от Χ называется функциональной, если каждому значению величины Χ соответствует единственное значение величины Υ. С функциональной зависимостью мы встречаемся, например, в математике, при изучении физических законов. Обратим внимание на то, что если Χ – детерминированная величина (т.е. принимающая вполне определённые значения), то и функционально зависящая от неё величина Υ тоже является детерминированной; если же Χ – случайная величина, то и Υ также случайная величина.

Однако гораздо чаще в окружающем нас мире имеет место не функциональная, а стохастическая, или вероятностная, зависимость, когда каждому фиксированному значению независимой переменной Χ соответствует не одно, а множество значений переменной Υ, причём сказать заранее, какое именно значение примет величина Υ, нельзя. Более частое появление такой зависимости объясняется действием на результирующую переменную не только контролируемого или контролируемых факторов (в данном случае таким контролируемым фактором является переменная Χ), а и многочисленных неконтролируемых случайный факторов. В этой ситуации переменная Υ является случайной величиной. Переменная же Χ может быть как детерминированной, так и случайной величиной. Следует заметить, что со стохастической зависимостью мы уже сталкивались в дисперсионном анализе.

Допустим, что существует стохастическая зависимость случайной переменной Υ от Χ. Зафиксируем некоторое значение х переменной Χ. При Χ = х переменная Υ в силу её стохастической зависимости от Χ может принять любое значение из некоторого множества, причём какое именно – заранее неизвестно. Среднее этого множества называют групповым генеральным средним переменной Υ при Χ = х или математическим ожиданием случайной величины Υ, вычисленным при условии, что Х = х; это условное математическое ожидание обозначают так: М(Υ/Х = х). Если существует стохастическая зависимость Υ от Χ, то прежде всего стараются выяснить, изменяются или нет при изменении х условные математические ожидания М(Υ/Х= х). Если при изменении х условные математические ожидания М(Υ/Х= х) изменяются, то говорят, что имеет место корреляционная зависимость величины Υ от Χ; если же условные математические ожидания остаются неизменными, то говорят, что корреляционная зависимость величины Υ от Χ отсутствует.

Функция φ(х)=М(Υ/Х= х), описывающая изменение условного математического ожидания случайной переменной Υ при изменении значений х переменной Χ, называется функцией регрессии.

Выясним, почему именно при наличии стохастической зависимости интересуются поведением условного математического ожидания.

Рассмотрим пример. Пусть Χ – уровень квалификации рабочего, Υ – его выработка за смену. Ясно, что зависимость Υ от Χ не функциональная, а стохастическая: на выработку помимо квалификации влияет множество других факторов. Зафиксируем значение х уровня квалификации: ему соответствует некоторое множество значений выработки Υ. Тогда М(Υ/Х = х) – средняя выработка рабочего при условии, что его уровень квалификации равен х, или, иначе говоря, М(Υ/Х = х) – это норматив выработки при уровне квалификации, равном х. Зная зависимость этого норматива от уровня квалификации, можно для любого уровня квалификации рассчитать норматив выработки и, сравнив его с реальной выработкой, оценить работу рабочего.

Обратим внимание на то, что введённые понятия стохастической и корреляционной зависимости относились к генеральной совокупности. Поясним эти понятия числовым примером.

Пример. Допустим, что одновременно изучаются две случайные величины Χ и Υ, или, иначе говоря, двумерная случайная величина (Χ, Υ), которая задана табл. 9.

Таблица 9.

j i      
xi yi x 1 = 2 x 2 = 5 x 3 = 8
  y 1 = 0,4 0,15 0,12 0,03
  y 2 = 0,8 0,05 0,30 0,35

Табл. 9 называют таблицей распределения двумерной величины (Χ, Υ);её следует понимать так. Случайная величина Χ может принять одно из следующих значений: 2, 5 и 8. Случайная величина Υ – значения 0,4 и 0,8. Число 0,15 – это вероятность того, что Χ = 2 и одновременно Υ = 0,4, или, иначе говоря, вероятность произведения двух событий; события, состоящего в том, что Χ = 2, и события, состоящего в том, что Υ = 0,4, т.е. Р ((Χ=2)(Υ=0,4)) = 0,15. Аналогично, вероятность Р ((Χ=2)(Υ=0,8)) = 0,05 и т.д. Обратим внимание на следующее: поскольку в табл. 9 указаны все возможные значения величин Χ и Υ, сумма вероятностей, стоящих в таблице, должна быть равна единице: 0,15 + 0,05 + 0,12 + 0,30 + 0,03 + 0,35 = 1.

Прежде чем выяснить тип зависимости величины Υ от Χ, найдём:

а) Закон распределения величины Χ. Он представлен табл. 10.

Таблица 10.

х х 1 = 2 х 2 = 5 х 3 = 8  
Р (Х = х) 0,15 + 0,05 = 0,2 0,12 + 0,30 = 0,42 0,35 + 0,03 = 0,38 Σ = 1

М(Х) = 5,54, D(X) = 4,9284

Действительно, например, величина Χ примет значение, равное 2, только в том случае, когда одновременно с этим величина Υ примет значение 0,4 или 0,8, т.е.

Р (Χ = 2) = Р ((Χ = 2)(Υ = 0,4)) + Р ((Χ = 2)(Υ = 0,08)) = 0,15 + 0,05 = 0,2.

Справа от ряда распределения величины Χ находятся её математическое ожидание и дисперсия.

б) Закон распределения величины Υ. Он имеет вид табл. 11.

Таблица 11.

у у 1 = 0,4 у 2 = 0,8  
Р (Υ = у) 0,15 + 0,12 + 0,03 = 0,30 0,05 + 0,30 + 0,35 = 0,7 Σ = 1

М(Υ) = 0,68, D(Y) = 0,0336

в) Условные законы распределения величины Υ, а именно закон распределения величины Υ сначала при условии, что Χ = 2, затем при условии, что Χ=5, и наконец, при условии, что Χ = 8.

Итак, пусть Χ = 2. Тогда условная вероятность

Р (Υ = 0,4/Χ = 2) = = = 0,75,

а условная вероятность

Р (Υ = 0,8/Χ = 2) = = = 0,25.

Таким образом, закон распределения величины Υ при условии, что Χ = 2, задан табл. 12.

Таблица 12.

y y 1 = 0,4 y 2 = 0,8  
P(Y = y/X = 2) 0,75 0,25 Σ = 1

M(Y/X = 2) = 0,4*0,75 + 0,8*0,25 = 0,5, D(Y/X = 2) = 0,03

Справа помещено условное математическое ожидание и значение условной дисперсии. Покажем, как вычисляется условная дисперсия. Общая формула условной дисперсии имеет вид

D(Y/X = x) = M [ (Y/X = x) – M(Y/X = x) ]2. (23)

Для табл. 12 получаем

D(Y/X = 2) = M [(Y/X = 2) – M(Y/X = 2)]2 = M [(Y/X = 2) – 0,5]2 = = ∙P(Y = yi/X = 2) = (0,4 – 0,5)2 ∙ 0,75 + (0,8 – 0,5)2 ∙ 0,25 = 0,03.

Пусть Χ = 5. Тогда Р(Υ = 0,4/Χ = 5) = = = ; Р(Υ=0,8/Χ=5) = = = .

Таким образом, закон распределения величины Υ при условии, что Χ = 5, имеет вид табл. 13.

Таблица 13.

у 0,4 0,8  
Р (Υ = у /Χ = 5) 2/7 5/7 Σ = 1

М(Υ/Χ = 5) = ≈0,686, D(Y/X = 5) = 0,03265.

И наконец, при Χ = 8 ряд распределения задан таблицей 14.

Таблица 14.

у 0,4 0,8  
Р (Υ = у /Χ = 8) Σ = 1

М(Υ/Χ = 8) = ≈ 0,768, D(Υ/Χ = 8) = 0,01163

Из табл. 12–14 видно, что зависимость Υ от Χ стохастическая, поскольку при каждом фиксированном значении величины Χ величина Υ может быть равной либо 0,4, либо 0,8, причём какому именно из этих чисел она будет равна – сказать заранее нельзя. Ясно прослеживается и корреляционная зависимость величины Υ от Χ, поскольку с изменением значений х величины Χ меняются и условные математические ожидания М (Υ/Χ = х). Функция регрессии, т.е. зависимость условного математического ожидания М(Υ/Χ = х) от х, задаётся в виде табл. 15.

Таблица 15.

х      
М (Υ/Χ = х) 0,5 24/35 ≈ 0,686 73/95 ≈ 0,768

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: