Основы планирования эксперимента
Планирование эксперимента - это комплекс мероприятий, направленных на эффективную постановкуопытов. Иными словами, планирование эксперимента -это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. Основная цельпланирования эксперимента - достижение максимальной точности измерений при минимальном количествепроведенных опытов и сохранении статистической достоверности результатов.
Под объектом исследования в теории планирования эксперимента подразумевается носитель некоторыхнеизвестных и подлежащих изучению свойств и качеств.
Принципы, положенные в основу теории планирования эксперимента, направлены на повышение эффективности экспериментирования, то есть должны обеспечивать:
- стремление к минимизации общего числа опытов;
- одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам - алгоритмам;
- использование математического аппарата, формализующего многие действия экспериментатора;
- выбор четкой стратегии, позволяющей приниматьобоснованное решение после каждой серии экспериментов.
Задачи, для решения которых может использоватьсяпланирование эксперимента, чрезвычайно разнообразны.Примерами таких задач могут служить, например, поископтимальных условий, построение интерполяционныхформул, выбор существенных факторов, оценка и уточнение констант теоретических моделей, выбор наиболееприемлемых из некоторого множества гипотез и т.д.
Применение математической теории при планировании эксперимента позволяет определенным образомоптимизировать объем экспериментальных исследований и повысить их точность. Параметры, подлежащиеоптимизации, в теории планирования эксперимента принято называть факторами.
Фактор - это измеримая переменная величина, принимающая в некоторый момент некоторое определенноезначение и соответствующая одному из возможных способов воздействия на объект исследования. Число возможных воздействий на объект принципиально не ограничено. Чтобы облегчить выбор, удобно разбить их на двегруппы. К первой группе относятся воздействия (факторы), определяющие сам объект, а ко второй - факторы,определяющие его состояние. Каждый фактор имеет область определения. В планировании эксперимента рассматриваются только дискретные области определенияфакторов. Кроме того, эти области всегда ограничены.Ограничения могут быть принципиальными и техническими. Примером принципиального ограничения может служить абсолютный нуль температуры в обычныхтермодинамических системах. Если в ходе оптимизациифактор получил значение, близкое к принципиальномуограничению, то возможности объекта исчерпаны. Примером технического ограничения может служить температура плавления материала аппарата. При нагреваниидо этой температуры аппарат просто расплавится. Еслив ходе оптимизации значение фактора приблизилоськ технической границе, а желаемое значение параметраоптимизации еще не достигнуто, то может быть поставлена новая задача: создать, например, более тугоплавкийматериал для аппарата. Решение этой новой задачи позволит продолжить оптимизацию.
Существуют два основных требования, предъявляемых к совокупности факторов. Это, во-первых, требование отсутствия корреляции между любыми двумя факторами и, во-вторых, требование совместимости факторов.Отсутствие коррелированности факторов означает возможность установления какого-либо фактора на любойуровень вне зависимости от уровней других факторов.Если эти условия не выполняются, то нельзя планировать эксперимент. Кроме того, нет никакой необходимости включать в эксперимент коррелированные факторы,так как один из них не содержит никакой информации.Требование некоррелированности не означает, что между факторами нет никакой связи. Достаточно, чтобы этасвязь не была линейной. Это требование может налагатьограничения на области определения факторов.
Другие ограничения на область определения факторов налагаются требованием совместимости факторов. Несовместимость факторов возникает в том случае,если некоторые комбинации их значений, каждое из которых лежит внутри области определения, не могут бытьосуществлены. Если в эти комбинации входят значенияфакторов, близкие к границам областей их определения,то устранение несовместимости производится просто сокращением областей. Сложнее обстоит дело тогда, когдазапрещенные значения лежат внутри областей. Тогда области оказываются многосвязными. Это вызывает трудности, преодоление которых в некоторых случаях приводит к расчленению задачи на части.
Все факторы, учитываемые при проведении экспериментальных исследований, можно разделить на качественные и количественные. Отбор факторов начинаютпосле того, как в распоряжении экспериментатора окажется их полный список. При составлении такого спискаследует перечислить все возможные удовлетворяющиеобщим требованиям факторы, как бы велико ни было ихчисло. Ограничение списка факторов с целью упрощениязадач исследования может привести к малоэффективнымили даже бессмысленным исследованиям.
Методы планирования эксперимента позволяютминимизировать число необходимых испытаний, установить рациональный порядок и условия проведения исследований в зависимости от их вида и требуемой точности результатов. Если же по каким-либо причинам числоиспытаний уже ограничено, то методы дают оценку точности, с которой в этом случае будут получены результаты. Методы учитывают случайный характер рассеяниясвойств испытываемых объектов и характеристик используемого оборудования. Они базируются на методахтеории вероятности и математической статистики.
Планирование эксперимента включает в себя следующие этапы:
1. Установление цели эксперимента (определениехарактеристик, свойств и т. п.) и его вида (определительные, контрольные, сравнительные, исследовательские).
2. Уточнение условий проведения эксперимента(имеющееся или доступное оборудование, сроки работ,финансовые ресурсы, численность и кадровый составработников и т. п.), а также выбор вида испытаний (нормальные, ускоренные, сокращенные в условиях лаборатории, на стенде, полигонные, натурные или эксплуатационные).
3. Выявление и выбор входных и выходных параметров на основе сбора и анализа предварительной (априорной) информации. Входные параметры (факторы) могутбыть детерминированными, то есть регистрируемымии управляемыми (зависимыми от наблюдателя), и случайными, то есть регистрируемыми, но неуправляемыми.Наряду с ними на состояние исследуемого объекта могут оказывать влияние нерегистрируемые и неуправляемые параметры, которые вносят систематическую илислучайную погрешность в результаты измерений, например, ошибки измерительного оборудования, изменениесвойств исследуемого объекта в период эксперимента из-за старения материала или его износа, воздействия персонала и т. д.
4. Установление потребной точности результатовизмерений (выходных параметров), области возможногоизменения входных параметров, уточнение видов воздействий. При этом выбирается вид образцов или исследуемых объектов, учитывая степень их соответствияреальному изделию по состоянию, устройству, форме,размерам и другим характеристикам. На назначение степени точности влияют условия изготовления и эксплуатации объекта, при создании которого будут использоватьсяэти экспериментальные данные. Условия изготовления,то есть возможности производства, ограничивают наивысшую реально достижимую точность. Условия эксплуатации, то есть условия обеспечения нормальнойработы объекта, определяют минимальные требованияк точности. Точность экспериментальных данных такжесущественно зависит от объема (числа) испытаний - чемиспытаний больше, тем (при тех же условиях) выше достоверность результатов.
5. Составление плана проведения эксперимента -количество и порядок испытаний, способ сбора, хранения и документирования данных. Порядок проведенияиспытаний важен, если входные параметры (факторы)при исследовании одного и того же объекта в течение одного опыта принимают разные значения. В ряде случаев,когда систематически действующие параметры сложноучесть и проконтролировать, их преобразуют в случайные, специально предусматривая случайный порядокпроведения испытаний (рандомизация эксперимента).Это позволяет применять к анализу результатов методыматематической теории статистики. Порядок испытанийтакже важен в процессе поисковых исследований: в зависимости от выбранной последовательности действийпри экспериментальном поиске оптимального соотношения параметров объекта или какого-то процесса можетпотребоваться больше или меньше опытов. Эти экспериментальные задачи подобны математическим задачамчисленного поиска оптимальных решений. Наиболеехорошо разработаны методы одномерного поиска (одно-факторные однокритериальные задачи), такие как методФибоначчи, метод золотого сечения.
6. Статистическая обработка результатов эксперимента, построение математической модели поведенияисследуемых характеристик. Необходимость обработкивызвана тем, что выборочный анализ отдельных данных,вне связи с остальными результатами, или же некорректная их обработка могут не только снизить ценность практических рекомендаций, но и привести к ошибочным выводам. Обработка результатов включает в себя:
- определение доверительного интервала среднегозначения и дисперсии (или среднего квадратичного отклонения) величин выходных параметров (экспериментальных данных) для заданной статистической надежности;
- проверка на отсутствие ошибочных значений (выбросов), с целью исключения сомнительных результатов издальнейшего анализа. Проводится на соответствие одномуиз специальных критериев, выбор которого зависит от закона распределения случайной величины и вида выброса;
- проверка соответствия опытных данных ранееаприорно введенному закону распределения. В зависимости от этого подтверждаются выбранный план эксперимента и методы обработки результатов, уточняетсявыбор математической модели. Построение математической модели выполняется в случаях, когда должны бытьполучены количественные характеристики взаимосвязанных входных и выходных исследуемых параметров.Это - задачи аппроксимации, то есть выбора математической зависимости, наилучшим образом соответствующейэкспериментальным данным. Для этих целей применяютрегрессионные модели, которые основаны на разложении искомой функции в ряд с удержанием одного (линейная зависимость, линия регрессии) или нескольких (нелинейные зависимости) членов разложения (ряды Фурье,Тейлора). Одним из методов подбора линии регрессииявляется широко распространенный метод наименьшихквадратов (МНК). Название свое данный метод получил,исходя из основного принципа, которому должны удовлетворять полученные на его основе оценки параметров:сумма квадратов ошибки модели должна быть минимальной. Если случайные ошибки модели имеют нормальноераспределение, имеют одинаковую дисперсию и некор-релированы между собой, МНК-оценки параметров совпадают с оценками метода максимального правдоподобия (ММП).
Для оценки степени взаимосвязанности факторовили выходных параметров проводят корреляционныйанализ результатов испытаний. В качестве меры взаимосвязанности используют коэффициент корреляции: длянезависимых или нелинейно зависимых случайных величин он равен или близок к нулю, а его близость к единице свидетельствует о полной взаимосвязанности величини наличии между ними линейной зависимости. Модельлинейной регрессии является наиболее изученной и наиболее часто используемой при проведении экспериментальных исследований.
При обработке или использовании экспериментальных данных, представленных в табличном виде, возникает потребность получения промежуточных значений.Для этого применяют методы линейной и нелинейной(полиноминальной) интерполяции (определение промежуточных значений) и экстраполяции (определение значений, лежащих вне интервала изменения данных).
Процедура использования упомянутых методовматематической обработки результатов экспериментальных исследований в данном учебно-методическомпособии не рассматривается, поскольку требует большого объема научного и методического материала. Прииспользовании математических методов обработки полученной информации следует обращаться к специальной литературе.
7. Объяснение полученных результатов и формулирование рекомендаций по их использованию, уточнениюметодики проведения эксперимента.
Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными,экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной илинескольких) для описания зависимой переменной. Дляпроверки значимости выдвигают нулевую гипотезу о надежности параметров. Нулевая гипотеза НО - это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влиянияфактора, отсутствие эффекта, равенство нулю значенийвыборочных характеристик и т.п. Другое проверяемоепредположение (не всегда строго противоположное илиобратное первому) называется конкурирующей или альтернативной гипотезой.
Выдвинутая гипотеза может быть правильной илинеправильной, поэтому возникает необходимость проверить ее. Так как проверку производят статистическимиметодами, то данная проверка называется статистической. При проверке статистических гипотез возможныошибки (ошибочные суждения) двух видов:
- можно отвергнуть нулевую гипотезу, когда она насамом деле верна (так называемая ошибка первого рода);
- можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода).
Альтернативные гипотезы принимаются тогдаи только тогда, когда опровергается нулевая гипотеза. Этобывает в случаях, когда различия в средних арифметических экспериментальной и контрольной групп настолькозначимы (статистически достоверны), что риск ошибкиотвергнуть нулевую гипотезу и принять альтернативнуюне превышает одного из трех принятых уровней значимости статистического вывода. Уровень значимости - этовероятность ошибки первого рода при принятии решения(вероятность ошибочного отклонения нулевой гипотезы):
1- й уровень - 5 % (a= 0,05), где допускается рискошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайномотборе для каждого эксперимента;
2- й уровень - 1 % (a= 0,01), т. е. соответственно допускается риск ошибиться только в одном случае из ста;
3- й уровень - 0,1 % (a= 0,01), т. е. допускается рискошибиться только в одном случае из тысячи.
Последний уровень значимости предъявляет оченьвысокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.В эконометрических исследованиях, не нуждающихсяв очень высоком уровне достоверности, представляетсяразумным принять 5 % уровень значимости
Методы и способы измерений.