Экспериментальных данных

При анализе результатов экспериментальных данных по надёжности часто приходится рассматривать распределение не только одной случайной величины (например, наработки на отказ,), но и влияние на эту случайную величину другой случайной величины, то есть приходится устанавливать – есть ли и какая взаимная связь двух случайных величин.

Обычно говорят, что величины Х и Y связаны функционально, если каждому значению х₁ соответствует определённое (может быть не одно) значение у₁. Между случайными величинами, кроме функциональной, может существовать ещё и стохастическая связь. При стохастической связи одна из случайных величин реагирует на изменение другой или других случайных величин изменениями параметров закона распределения. Исследованием круга вопросов, связанных с использованием стохастической связи, занимается теория корреляции (теория стохастической регрессии).

При оценке стохастической связи между двумя или несколькими случайными величинами определяют форму связи (криволинейная или прямолинейная) и силу (тесноту) связи. Метод определения тесноты связи (степени взаимосвязи) между случайными величинами называют корреляционным анализом.

При рассмотрении системы двух случайных величин Х и Y необходимо ввести новые статистические характеристики, устанавливающие их взаимную связь.

Стохастическую зависимость Y от Х описывают условным математическим ожиданием _∞

Y(x) = M[Y / (X=x)] = ∫ y f(Y/x) dy. (57)

^–∞

В механической аналогии распределения, если единичная масса распределена на плоскости хоу с плотностью f(x,y), то Y(x) есть ордината центра тяжести массы, распределённой на прямой Х = х.

Дисперсия M[(Y – α)²] минимальна при α = M[Y / (X=x)].

Поэтому линия (57) даёт наилучшее предсказание значения величины Y по значению Х = х и называется линией регрессии.

При исследовании линии регрессии (57) и определяют форму связи случайных величин. Таким образом, регрессия Y по Х определяет изменение математического ожидания Y при изменении Х.

Форма связи исследуемых величин зависит от физической сущности явления (физической сущности отказов) и может иметь вид прямой линии, параболы и т.д. Определение формы линии регрессии, соответствующей реальной форме зависимости, составляет принципиальный момент в изучении корреляции. Глубокое знание исследуемых явлений, влияющих на отказы, зависимостей между ними, является существенным элементом для правильного выбора линии регрессии.

При линейной зависимости

Y(x) = a + bx. (58)

Задача определения линии регрессии сводится в этом случае к определению коэффициентов a и b. Эта задача решается методом наименьших квадратов, согласно которому необходимо, чтобы математическое ожидание квадратов отклонений условных средних от расчётных значений было минимально, т.е. надо найти a и b так, чтобы обеспечить

min M[y(x) – y(x)] = min M[y(x) – a – bx].

Тесноту связи между случайными величинами при линейной корреляции оценивают корреляционным моментом (ковариацией) K_xy и коэффициентом корреляции r_xy.

Корреляционный момент представляет собой математическое ожидание произведения отклонений X и Y от их математических ожиданий

K_x = M[(X – MX) (Y – MY)] (59)

Так как K_xy зависит от единиц измерения и сам по себе не может служить показателем связи, то рассматривают связь нормированных отклонений

(X – MX)/σ_x и (Y – MY)/σ_y,

в результате чего получают коэффициент корреляции

r_xy = K_xy/σ_xσ_y. (60)

Коэффициент корреляции может находиться в пределах – 1≤ r_xy ≤ 1.

Чем ближе к нулю │ r_xy│, тем слабее линейная связь между величинами, чем │r_xy│, ближе к единице, тем связь сильнее. При │r_xy│=0 ( или близком к нулю), линейная корреляционная связь отсутствует. При │ r_xy│=1 (или близком к единице) статистическая линейная связь становится функциональной.