Лекция 11
Одна из основных задач теории планирования эксперимента состоит в выборе такого плана эксперимента, чтобы он обеспечивал получение наилучших, в определенном смысле, результатов исследований. При этом оптимальность плана определяется задачей, стоящей перед экспериментом, видом модели, стоимостью отдельных опытов, областью планирования эксперимента
и т.д..
Важнейшей характеристикой плана, влияющей как на стоимость и: длительность исследований, так и на точность получаемых результатов, является число наблюдений. По числу экспериментов планы бывают насыщенные, ненасыщенные и сверхнасыщенные. План называется насыщенным, если число экспериментов равно числу определяемых пара-t метров модели (N=к+1 для линейной модели). Однако такой план не позволяет определить адекватность модели. Если N больше числа определяемых параметров, то план ненасыщенный. В некоторых задачах (например, при выявление значимых факторов из общей совокупчости [1]) используются сверхнасыщенные планы, в которых число экспериментов N меньше числа параметров модели (выявляется только часть значимых параметров).
Среди критериев оптимальности, используемых в планировании эксперимента, можно выделить две группы.
К первой группе относятся критерии, связанные с точностью оценок коэффициентов регрессии, ко второй - с ошибкой в оценке зависимой переменной у.
К критериям первой группы относятся:
- критерий D-оптимальности. Он обеспечивает минимальный объем эллипсоида рассеяния оценок уравнения регрессии, что требует такого расположения точек плана в области
, при котором определитель дисперсионной матрицы
был бы минимальным (или, что то же самое,
);
- критерий А-оптимальности. Ему отвечают планы с минимальной средней дисперсией оценок коэффициентов (минимум суммы квадратов главных полуосей эллипсоида рассеивания), чему соответствует наименьшее значение следа дисперсионной матрицы (суммы элементов, стоящих на главной диагонали,
К критериям второй группы, связанным с ошибкой оценки поверхности отклика, можно отнести:
- критерий G-оптимальности. Ему отвечает план, обеспечивающий наименьшую по сравнению с другими планами величину максимальной дисперсии отклика во всей области планирования
. Достижение возможно большей точности модели связано, как правило, с лучшим использованием области планирования при проведении эксперимента;
- критерий ротатабельности (ротатабельность - инвариантность ковариационной матрицы относительно ортогонального вращения (ротации) системы координат). Ротатабельность плана позволяет получить одинаковую дисперсию предсказанных значений функции отклика во всех точках, равноудаленных от центра плана, вне зависимости от направления.
Кроме рассмотренных используются и другие критерии [1,2].
Следует отметить, что свойства плана связаны с видом анализируемой модели. При изменении вида модели свойства одного и того же плана могут меняться (см. пример).
На практике частo истинный вид модели априорно неизвестен. Поэтому первоначально эксперимент планируется исходя из предположения о линейности модели относительно независимых переменных. После проведения опытов и построения такой модели проверяется ее адекватность. Если модель неадекватна, то переходят к построению модели более высокого порядка. При этом при построении плана для модели более высокого порядка целесообразно использовать точки, в которых уже проводился эксперимент.
Планы, которые обеспечивают возможность использования точек, применяемых для построения полинома степени d. в качестве подмножества точек, необходимых для оптимального плана формирования полинома степени (d+1), называются композиционными планами порядка (d+1). Так, планы для квадратичных моделей, построенные путем добавления точек к плану для линейной модели, называются композиционными планами 2-го порядка. Такое построение планов, использующих результаты предыдущих наблюдений, сокращает общее число опытов и отвечает последовательной стратегии планирования эксперимента.
Выбор критерия оптимальности плана осуществляется исходя из конкретного содержания решаемой задачи. Часто полезно бывает стремиться к тому, чтобы один и тот же план удовлетворял нескольким критериям (например, для линейной модели вида Y=B X ортогональный план является одновременно и ротатабельным).
Однако часто бывает целесообразным отказаться от одних свойств ради достижения других (от ортогональности в пользу D-оптимальности) или ради возможности проверки адекватности модели и т.п. Поскольку на первом этапе исследований наиболее часто используются линейные регрессионные модели, начнем рассмотрение вопросов выбора плана эксперимента с планов, предназначенных для построения линейных уравнений регрессии.