При анализе результатов экспериментальных данных по надёжности часто приходится рассматривать распределение не только одной случайной величины (например, наработки на отказ,), но и влияние на эту случайную величину другой случайной величины, то есть приходится устанавливать – есть ли и какая взаимная связь двух случайных величин.
Обычно говорят, что величины Х и Y связаны функционально, если каждому значению х1 соответствует определённое (может быть не одно) значение у1. Между случайными величинами, кроме функциональной, может существовать ещё и стохастическая связь. При стохастической связи одна из случайных величин реагирует на изменение другой или других случайных величин изменениями параметров закона распределения. Исследованием круга вопросов, связанных с использованием стохастической связи, занимается теория корреляции (теория стохастической регрессии).
При оценке стохастической связи между двумя или несколькими случайными величинами определяют форму связи (криволинейная или прямолинейная) и силу (тесноту) связи. Метод определения тесноты связи (степени взаимосвязи) между случайными величинами называют корреляционным анализом.
|
|
При рассмотрении системы двух случайных величин Х и Y необходимо ввести новые статистические характеристики, устанавливающие их взаимную связь.
Стохастическую зависимость Y от Х описывают условным математическим ожиданием ∞
Y(x) = M[Y / (X=x)] = ∫ y f(Y/x) dy. (57)
–∞
В механической аналогии распределения, если единичная масса распределена на плоскости хоу с плотностью f(x,y), то Y(x) есть ордината центра тяжести массы, распределённой на прямой Х = х.
Дисперсия M[(Y – α)2] минимальна при α = M[Y / (X=x)].
Поэтому линия (57) даёт наилучшее предсказание значения величины Y по значению Х = х и называется линией регрессии.
При исследовании линии регрессии (57) и определяют форму связи случайных величин. Таким образом, регрессия Y по Х определяет изменение математического ожидания Y при изменении Х.
Форма связи исследуемых величин зависит от физической сущности явления (физической сущности отказов) и может иметь вид прямой линии, параболы и т.д. Определение формы линии регрессии, соответствующей реальной форме зависимости, составляет принципиальный момент в изучении корреляции. Глубокое знание исследуемых явлений, влияющих на отказы, зависимостей между ними, является существенным элементом для правильного выбора линии регрессии.
При линейной зависимости
Y(x) = a + bx. (58)
Задача определения линии регрессии сводится в этом случае к определению коэффициентов a и b. Эта задача решается методом наименьших квадратов, согласно которому необходимо, чтобы математическое ожидание квадратов отклонений условных средних от расчётных значений было минимально, т.е. надо найти a и b так, чтобы обеспечить
|
|
min M[y(x) – y(x)] = min M[y(x) – a – bx].
Тесноту связи между случайными величинами при линейной корреляции оценивают корреляционным моментом (ковариацией) Kxy и коэффициентом корреляции rxy.
Корреляционный момент представляет собой математическое ожидание произведения отклонений X и Y от их математических ожиданий
Kx = M[(X – MX) (Y – MY)] (59)
Так как Kxy зависит от единиц измерения и сам по себе не может служить показателем связи, то рассматривают связь нормированных отклонений
(X – MX)/σx и (Y – MY)/σy,
в результате чего получают коэффициент корреляции
rxy = Kxy/σxσy. (60)
Коэффициент корреляции может находиться в пределах – 1≤ rxy ≤ 1.
Чем ближе к нулю │ rxy│, тем слабее линейная связь между величинами, чем │rxy│, ближе к единице, тем связь сильнее. При │rxy│=0 ( или близком к нулю), линейная корреляционная связь отсутствует. При │ rxy│=1 (или близком к единице) статистическая линейная связь становится функциональной.