Неполный факторный анализ

В полном факторном эксперименте разность между числом опытов и числом коэффициентов велика. Надо уменьшать число опытов. Эксперимент 27 уже содержит 128 прогонов (и это без повторений): 27 = 128.

Таблица 7.5.4

k                    
N                    

С ростом числа факторов k число комбинаций переменных растет, растет число взаимодействий высокого порядка. Это демонстрируется в таблицах 7.5.4 и 7.5.5. (Полное число взаимодействий равно , где k - число факторов, m - число элементов во взаимодействии).

Таблица 7.5.5

  2 k Число главных эффектов Число взаимодействий
  1й порядок 2й порядок 3й порядок 4.. 5...
               
               
               
               

При больших k появляются взаимодействия очень высоких порядков. Часто на основе априорных и общих соображений их предполагают пренебрежимыми. Т.к. взаимодействия высоких порядков соответствуют членам высокого порядка в регрессионном полиноме -члены высокого порядка полагаются равными нулю, и считается, что полином низкого порядка дает адекватного регрессионное уравнение. А если некоторые эффекты предполагаются равными нулю, то мы не обязаны делать наблюдение во всех 2 экспериментальных точках, можно сделать только часть точек -т.е. поставить дробный факторный эксперимент.

Оказывается, что если нас не интересуют взаимодействия высокого порядка (пренебрегаем некоторыми эффектами взаимодействия, в этом случае -члены полинома высокого порядка можем принять за 0), мы можем получить достаточное количество информации с помощью исследования лишь некоторой части (1/2, 1/4, 1/8 и т.д.) всех возможных комбинаций (реализовать часть экспериментальных точек или дробный факторный эксперимент).

Неполным факторным планом называется план эксперимента, если в факторном эксперименте производится лишь часть всех возможных повторений. Такой эксперимент называется дробным факторным экспериментом, а его матрица планирования — дробной репликой.

Всякий раз, когда мы используем выборку меньшую, чем этого требует полный факторный план, мы платим за это риском смешивания эффектом. Под смешиванием мы понимаем то, что статистик, измеряя один эффект, в то же время измеряет, возможно, и некоторый другой эффект. Например, если главный эффект смешивается с взаимодействиями более высокого порядка, то эти два эффекта уже невозможно отделить друг от друга. Т.е., если наш анализ показывает наличие некоторого эффекта, то мы не можем с уверенность сказать, главный ли это эффект, или эффект взаимодействия, или некоторая аддитивная комбинация этих эффектов.

Поэтому экспериментатору необходимо выбирать эффективную стратегию экспериментирования. При построении неполного факторного плана экспериментатор должен определить эффекты, смешивание которых он может допустить. Вообще говоря, лучше спутать взаимодействия высокого порядка, чем главные эффекты. Обычно, можно надеяться, что взаимодействия высокого порядка отсутствуют, и можно получить разумную информацию о главных эффектах или взаимодействиях низкого порядка. Эффективная стратегия экспериментирования или успех неполного факторного эксперимента достигается в случае, если его план позволяет не смешивать ни один главный эффект с другим.

Когда 2 или более эффекта смешиваются, то говорят, что они являются совместными.

Таблица 7.5.6

Пример

Х 1 Х 2 Х 3 = (Х 1 Х 2) Y
- - + Y1
+ - - Y2
- + - Y3
+ + + Y4

Пользуясь планом (табл.7.5.6.), можно вычислить 4 коэффициента и представить результаты:

. (7.5)

Если предположить и считать, что в выбранных интервалах варьирования процесс может быть описан линейной моделью, то достаточно определить 3 коэффициента: b 0, b 1, b 2.

Оставшуюся степень свободы используем для минимизации числа опытов. При b 12 ® 0 столбец х 1 х 2 используется для нового фактора х 3. Но теперь оценки будут смешанные. Оценки смешаются следующим образом:

Это так называемые смешанные эффекты или эффекты, оцениваемые совместно (вместе). Однако основные эффекты оцениваются раздельно друг от друга. Не огорчайтесь! Мы постулируем линейную модель, значит все парные взаимодействия незначимы.

.

Главное, что мы минимизировали число опытов вместо 8 опытов для 3 факторов можно поставить 4. При этом матрица планирования не потеряла своих свойств (ортогональность, ротатабельность и т.п.) — можете самостоятельно убедиться.

Правило: Чтобы сократить число опытов, нужно новому фактору присвоить вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь. Тогда значение нового фактора в условиях опытов определяется знаками этого столбца.

Т.о., поставив 4 опыта для оценки влияния 3-х факторов, мы воспользовались половиной полного факторного эксперимента 23, т.е. "полурепликой".

Если х3 то получили бы 2-ую половину матрицы 23 (см. табл.7.5.3.), объединение этих 2-х полуреплик есть полный факторный эксперимент 23.Есть две полуреплики 23-1: 1 случай —когда х 3приравниваем к х 1 х 2;2 случай — х 3приравниваем к - х 1 х 2.

Для обозначения дробных реплик, в которых p линейных эффектов приравнены к эффектам взаимодействия, используют условные обозначения 2 k - p Например, полуреплика от 26 – обозначается 26-1. Бывают реплики большей дробности (см. табл.7.5.7.). Например, при 15 факторах можно в 2048 раз сократить число опытов, применяя реплику большей дробности (поставить16 опытов вместо 32768)

Таблица 7.5.7

Примеры дробных реплик

    Число опытов
Дробная реплика Полный факторный эксперимент
1/2 реплики от 24 24-1    
1/2 реплики от 25 25-1    
1/4 реплики от 26 26-1    
1/8 реплики от 26 26-3    
1/2048 реплики от 215 215-11    

Символическое обозначение произведения столбцов, равного + 1 или -1, называется определяющим контрастом.

Контраст помогает определять смешанные эффекты. Для того, чтобы определить какой эффект смешан с данным, нужно помножить обе части определяющего контраста на столбец, соответствующий данному эффекту.

Так, если 1 = х 1 х 2 х 3,то

,

,

.

Это значит, что коэффициенты линейного уравнения будут оценками

Соотношение, показывающее, с каким из эффектов смешан данный эффект, называется генерирующим соотношением.

Полуреплики, в которых основные эффекты смешаны с двухфактор-ными взаимодействиями, носят название планов с разрешающей способностью III. (по наибольшему числу факторов (символов) в определяющем контрасте). Обозначают такие планы 231щ Разрешающая способность плана равна наименьшему числу символов в коде определяющего контраста.

Неполный факторный анализ используется на начальной стадии исследования в случае наличия больше 4 факторов, когда необходимо выявить наиболее существенные переменные. Если число переменных меньше 4 -ставят полный факторный эксперимент.

Итак, резюмируем наше рассуждение:

Дробные реплики применяются при получении линейных моделей.

Эффективность применения дробных реплик зависит от удачного выбора системы смешивания линейных эффектов с эффектами взаимодействия.

При построении дробных реплик используют правило:

для того, чтобы сократить число опытов при введении в планирование нового фактора, нужно поместить этот фактор в вектор столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь.

Реплики, которые используются для сокращения опытов в 2 m раз, где
m = 1,2,3,4.... называются регулярными и пользуются популярностью, т.к. расчет коэффициентов производится также просто, как в случае полного факторного эксперимента (см. техника регрессионного анализа).

При применении дробных реплик линейные эффекты смешиваются с эффектами взаимодействия. Чтобы определить систему смешивания, надо знать определяющие контрасты и генерирующие соотношения.

Эффективность реплики зависит от системы смешивания реплики, у которых линейные эффекты смешаны с взаимодействиями наивысшего порядка, являются наиболее эффективными, т.к. обладают наибольшей разрешающей способностью.

7.6 Основные классы планов, применяемые в вычислительном эксперименте

Приведем краткий обзор планов, используемых в имитационном эксперименте.

По методу анализа и виду математической модели различают: планы дисперсионного анализа (однофакторный, многофакторный); планы регрессионного анализа; планы ковариационного анализа. Планы многофакторного анализа: двухуровневые, многоуровневые; симметричные, несимметричные.

В практике машинного эксперимента полезны следующие виды планов:

1. Планы многофакторного анализа:

Планы типа 2 k Все k факторов имеют 2 уровня, используется часть всех комбинаций (дробная реплика) -существует возможность оценить главные эффекты факторов и взаимодействия низкого порядка.

Определяют следующие типы планов:

Планы разрешающей способности III:

ни один главный эффект не смешан ни с каким другим главным эффектом, но главные эффекты смешаны с двухфакторными взаимодействиями, которые смешаны друг с другом.

Планы разрешающей способности IV:

ни один главный эффект не смешан с другим главным эффектом или взаимодействием двух факторов, но эти взаимодействия смешаны друг с другом.

Планы разрешающей способности V:

ни один главный эффект и ни одно взаимодействие 2-х факторов не смешаны с другими главными эффектами или двухфакторными взаимодействиями, но эти взаимодействия смешаны с взаимодействиями трех факторов.

В общем случае разрешающая способность плана равна наименьшему числу символов в коде определяющего контраста.

2. Планы отсеивающего эксперимента:

Если k велико, число комбинаций все-таки остается большим даже при неполном факторном плане (2 k-p), - тогда используются планы отсеивающих экспериментов. "Отсеивающий эксперимент" предполагает предварительное отсеивание, определение наиболее важных (существенных) факторов и используется на стадии предварительного исследования.

2.1. Случайные планы

Комбинации уровней факторов случайно (рандомизация) отбираются среди всех возможных комбинаций. Число комбинаций N может быть определено независимо от числа факторов и уровней. (N может быть, например, < k). Могут быть получены "хорошие" оценки индивидуальных эффектов, не требуется специальных методов анализа -используются традиционные ДАН и регрессионный анализ.

Если очень много факторов - можно использовать сверхнасыщенные планы:

2.2. Сверхнасыщенные планы. Если реплики от планов 2 k насыщены, то они содержат как раз столько опытов, сколько эффектов надо оценить. Сверхнасыщенные планы -когда число комбинаций N меньше, чем число факторов k, и комбинации отбираются так, чтобы (для данных N и k) оценки эффектов были достаточно "хорошими".

2.3. Планы группового отсеивания (последовательного отсеивания). k факторов разбиваются на q групп (q<<k) и эти q групп факторов испытываются в плане типа 2 k или в сверхнасыщенном плане. Та группа факторов, которая оказалась наиболее важной, разбивается на несколько групп меньшей размерности (в конечном итоге до групп размерности 1).

Планы для изучения поверхности отклика

В имитационном моделировании используется технология последовательного планирования.

На практике, например, может быть использована следующая схема проведения эксперимента: допустим, сначала реализуется план 2*р-используется малая часть эксперимента; если оказывается его недостаточно (часть эксперимента слишком мала для оценки всех эффектов) необходимо уменьшить дробность плана, дополнить план эксперимента ("методом перевала") -расширить эксперимент до полного факторного эксперимента- и т. д.

Аналогичные типы планов, основанные на последовательном планировании используются в методологии анализа поверхности отклика (см. раздел 7.7.), которая состоит в отыскании оптимальной комбинации уровней k количественных факторов.

Рассмотрим некоторые планы, полезные для анализа поверхности отклика.

Дело в том, что в почти стационарной области желательно аппроксимировать поверхность отклика по меньшей мере полиномом второго порядка. Для этой цели проводится эксперимент квадратичного приближения. Ниже приведен общий вид квадратичного полинома (второго порядка) для случая двух независимых переменных

.

Для оценивания коэффициентов регрессии в этой модели необходимо измерить каждый фактор или переменную по меньшей мере на трех уровнях. Это означает необходимость использования полного 3 n -факторного эксперимента или же неполного факторного эксперимента. К сожалению, в случае более чем трех переменных число необходимых прогонов может стать слишком большим даже при использовании неполного факторного эксперимента. Кроме того, эксперимент с 3 n комбинациями дает довольно низкую точность оценок коэффициентов регрессии.

Для квадратичных полиномов используют специальные способы построения эксперимента. Из них наиболее полезны центральные композиционные, или ротатабельные, построения, которые получаются посредством добавления дополнительных точек к данным, полученным из 2 n -факторного эксперимента. Для ротатабельных построений стандартная ошибка одинакова для равноудаленных от центра области точек. Такие построения существуют для любого числа факторов и представляют собой регулярные и полурегулярные геометрические фигуры с центральными точками.

Весьма простое и полезное построение, называемое куб плюс звезда плюс центральные точки, приведено для случая двух переменных на рисунке 7.6.1. Отметим, что это 22 эксперимент (куб), плюс четыре дополнительные точки (звезда), расположенные на равном расстоянии друг от друга в плоскости по окружности с центром (0, 0), плюс центральные точки. Тот же самый принцип, но применительно к 3-факторному эксперименту, иллюстрируется на рис. 7.6.2.

Рисунок 7.6.1 — 22-факторный план плюс звезда и центральные точки

Рисунок 7.6.2 — 32 -факторный план плюс звезда и центральные точки

Другое полезное ротатабельное построение, называемое гексагональ плюс центральные точки, приведено на рисунке 7.6.3.

Рисунок 7.6.3 — Гексагональный план

Известны и другие типы планов: латинские квадраты, квадраты Юдена, сбалансированные блоки и др.

На практике может быть полезен план Бокса В2 в кодированном двухфакторном пространстве, иллюстрированный на рисунке 7.6.4.

Рисунок 7.6.4 — План Бокса B2


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: