double arrow

Математические методы планирования и оптимизации эксперимента


Методы корреляционного и регрессионного анализа

Самая простая зависимость между Х и Y, полученная в эксперименте – линейная. Вследствие случайных отклонений экспериментально полученных величин одному значению Х могут соответствовать различные значения Y. Степень зависимости случайных величин Х, Y характеризуется коэффициентом корреляции (в данном случае, парной корреляции). Коэффициент корреляции характеризует различие между зависимостями Y =f(X) и X = f(Y) и численно равен косинусу угла, который образуют эти функции. Если линейная связь между Х и Y отсутствует, то угол равен 90 , а соответственно cos = 0.

Проверку значимости коэффициента корреляции проводят либо по таблицам критических значений коэффициентов парной корреляции, либо по критерию Стьюдента. Для проверки по критерию Стьюдента рассчитывают его экспериментальное значение и сравнивают с соответственным табличным. При tэксп>tтабл коэффициент корреляции статистически значим и, следовательно, зависимость между рассматриваемыми переменными имеется.

Если для описания массива экспериментальных данных нет рабочей гипотезы, то массив описывают статистически, так называемым уравнением регрессии. В общем случае уравнение регрессии – полином, в простейшем – уравнение прямой линии. По массиву экспериментальных данных в выбранной форме уравнения регрессии определяют коэффициенты (коэффициенты регрессии) и подбирают их таким образом, чтобы разброс экспериментальных данных относительно линии регрессии был минимальным. Используют метод наименьших квадратов, то есть минимальна сумма квадратов отклонений экспериментальных значений от рассчитанных по уравнению регрессии.




Достоверность уравнения регрессии оценивают по величине коэффициента детерминации, который показывает, какую долю экспериментальных данных удалось описать уравнением регрессии.

Более подробно эти вопросы будут разобраны в лабораторном практикуме.

Используют для получения максимального объема информации при минимальном объеме эксперимента, поиска оптимума процесса или технологии, описания неизвестного процесса математической моделью (полиномиальной формулой), систематизации экспериментального материала.

1.На первом этапе проводят выбор параметров оптимизации (У) и выбор факторов (Х) для зависимости у = f(x). Параметр оптимизации – количественно определенная характеристика процесса. Параметр должен обладать однозначностью (каждому состоянию – одно значение параметра), статистической эффективностью (наименьшим разбегом повторных значений) и т.д. Фактор – измеримая переменная величина, может быть количественным и качественным (например, вид топлива). Между факторами: - не должно быть линейной связи, - они должны быть совместимы (комбинация факторов не должна приводить к порче оборудования), - должны измеряться с необходимой точностью, - в процессе эксперимента поддерживаться на определенном уровне. Факторы выбирают по литературным данным, опросу специалистов и из других источников.



2.На втором этапе проводят отсеивание факторов. Составляют полный факторный план эксперимента – все возможные комбинации факторов, например, на двух уровнях: 2к, где к – количество факторов. Часто используют не полный план, а его часть (реплику), то есть дробный факторный план. Составляют так называемую матрицу эксперимента. Значения факторов кодируют по формуле: xi = (x1i-x0i)/Ii, где x1i – натуральное значение фактора на каком-либо уровне, x0i - натуральное значение фактора на нулевом уровне, Ii – интервал варьирования фактора (в натуральном виде). Подбирают такие реплики, в которых количество опытов равно или немного больше числа факторов К. Например, для учета 15 факторов необходимо провести 215 опытов, что составит 32768 опытов. И можно взять реплику, в которой число опытов для учета влияния 15 факторов будет равно 16 опытам. Соответственно, для учета 7 факторов – реплику из 8 опытов и т. д. То есть планируют так называемый дробный факторный эксперимент. Факторы варьируют обычно на двух уровнях, при этом кодированные значения факторов равны (-1, 0, +1). Ноль обычно находится в середине значения фактора. Интервалы -1¸0 и 0¸+1 должны быть одинаковы. Интервалы не должны быть меньше удвоенной среднеквадратичной ошибки. Обычно интервал составляет 10-25% максимального натурального значения фактора.



После проведения опытов рассчитывают коэффициенты полинома – уравнения регрессии. Формула для расчета коэффициентов регрессии:

bj = (Syixij)/n, где bj – коэффициент регрессии i-го фактора, yi – значение параметра оптимизации в i-ом опыте, xij – кодированное значение j-го фактора в i-ом опыте, n – количество опытов в матрице.

Ошибку эксперимента находят по результатам опытов, повторенных несколько раз при одних и тех же условиях. Рекомендуется каждый опыт проводить дважды, а если результаты отличаются более, чем на 10%, то повторяют опыт еще раз. Одно из трех значений, как случайное, отсеивают по критерию Стьюдента: tрасч ³ tтабличное. Для отсеивания подсчитывают среднеквадратическую ошибку эксперимента Sопыт и коэффициентов регрессии Sbi.

где m – число повторений опыта, n1 – количество опытов с повторением. Доверительный интервал равен Dbi = ± t Sbi » ±2Sbi , где t – критерий Стьюдента.

Факторы, незначительно влияющие на параметр оптимизации У, имеют коэффициенты регрессии меньше доверительного интервала. По этому признаку факторы и отсеивают. Если факторов отсеялось слишком много, то вполне вероятно, что неправильно определены интервалы варьирования.

Для отыскания области оптимума применяют два метода – крутого восхождения (Бокса-Уилсона), - последовательный симплексный.

При использовании метода крутого восхождения вначале проводят дробный факторный эксперимент, определяют коэффициенты уравнения регрессии. Если шаги отдельных факторов оказываются малыми (незначимыми), то значения этих факторов стабилизируют. Затем проводят статистический анализ полученных коэффициентов, выбор нового шага (обычно меньшего) и применяют так называемое крутое восхождение по поверхности отклика. Чтобы задать направление вектора, по которому будет происходить возрастание значений Y (при нахождении максимума), вычисляют частные производные по независимым переменным. Численно они равны коэффициентам уравнения регрессии, качественно – значениям переменных Х и являются шагами для крутого восхождения. Результаты некоторых опытов рассчитывают по найденному в дробном эксперименте полиному. Намеченные опыты реализуют до тех пор, пока не будет найден оптимум.








Сейчас читают про: