double arrow

Однофакторный дисперсионный анализ

 

Во многих областях практической деятельности встречаются объекты исследования, состояние которых определяется входными переменными (факторами), не имеющими количественного описания. Такими факторами могут быть неуправляемые и управляемые переменные, которые по каким-либо причинам не позволяют производить их измерение в данном эксперименте, а также те неконтролируемые переменные, уровни варьирования которых можно произвольно выбирать и фиксировать во времени. Для изучения влияния факторов подобного рода на выходную функцию объекта (отклик), их общего оценивания, ранжирования и выделения среди них существенных, очевидно, непригодны все методы отсеивания управляемых количественных факторов и метод регрессионного анализа неуправляемых факторов, поскольку эти методы предусматривают измерение уровней исследуемых факторов.

Рассмотрим теперь постановку задачи в общем виде.

Дано:

– отклик Y может зависеть (по физическим причинам) от k независимых управляемых факторов X1, X2,…Xk, не имеющих количественного описания, и их парных взаимодействий;

– каждый фактор Xi может варьироваться на m уровнях;

– полный факторный эксперимент состоит из N серий независимых наблюдений по числу всех возможных неповторяющихся сочетаний k факторов:

– каждая j-ая серия содержит nj наблюдений Yj1, Yj2, … параллельных опытов.

Требуется: определить, в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора Xi или взаимодействия факторов на отклик Y; провести сравнение с другими факторами и выделить наиболее существенные.

Допущения, на которых базируется дисперсионный анализ:

– наблюдение отклика Y – нормально распределенная случайная величина с центром распределения M{Y}. Таким образом, факторы определяют величину Y лишь в среднем, оставляя простор для случайных ошибок наблюдений, подчиняющихся нормальному распределению;

– дисперсия единичного наблюдения, обусловленная случайными ошибками, постоянна во всех опытах и не зависит от X1, X2,…Xk.

Из данных задачи и указанных допущений очевидно, что чем больше влияние некоторого фактора Xi на отклик Y, тем больше расхождение между собой средних арифметических отклика в сериях параллельных наблюдений, сделанных при различных уровнях варьирования фактора Xi. Статистическая значимость такого расхождения указывает на существенное влияние фактора. Требуется одновременно сопоставить произвольно большое число средних и на основании этого сделать вывод о существенности влияния того или иного фактора.

Из множества факторов, влияющих на рассеяние выходной величины Y, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние. Остальные факторы служат фоном (ошибкой эксперимента). Чтобы выявить эффект исследуемого фактора, его делят на несколько четко разделимых уровней, а остальные факторы рандомизируют. Число экспериментов при этом может быть случайным или определенным по специальной методике из условия минимальной различимости эффектов. Продолжительность экспериментальных исследований должна быть достаточной для того, чтобы учесть все факторы, влияющие на рассеяние выходной величины. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 3.1), причем число наблюдений по разным уровням исследуемого фактора может быть разным. По данным таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемого фактора, то есть дисперсия между выборками , и ошибки эксперимента, то есть дисперсия внутри выборки . Эти формулы представлены в таблице 3.2.

Таким образом, сумма квадратов отклонений SS общ и общее число степеней свободы N-1 делятся на две составляющие. Одна составляющая основана на дисперсии частных средних вокруг общего среднего X, а другая – на дисперсиях внутри выборок.


 

Таблица 3.1 – Результаты наблюдений однофакторного эксперимента

Номер наблюдения Уровни фактора  
    j k
  y11 y12 y1j y1k
  y21 y22 y2j y2k
   
i yi1 yi2 yij yik
   
n yn1 yn2 ynj ynk
Суммы Yi1 Yi2 Yij Yik
Число наблюдений n1 n2 nj nk
Средние
Квадраты сумм Y2

 

Таблица 3.2 – Схема определения дисперсий

Источник дисперсии Сумма квадратов Число степеней свободы Дисперсия
Внутри выборок
Между выборками ν1=k-1
Общая

 

Если на выборочные наблюдения не оказывают влияния определенные факторы, то обе оценки дисперсий не отличаются друг от друга. Это можно проверить с помощью F-критерия (критерия Фишера), а именно

F= / . (3.1)

По таблице F-распределения (таблица А2 приложения А) находим значение Fкр для выбранного уровня значимости β и числа степеней свободы ν1=k–1 и ν2=N–k. Если Fрасч<Fкр, то делается вывод о том, что результаты эксперимента не противоречат гипотезе об отсутствии эффекта уровней исследуемого фактора. Если Fрасч≥Fкр, то следует сделать вывод о том, что исследуемый фактор вносит существенный эффект в разброс выходной величины Y.

Дисперсионный анализ более эффективно применять при значительном объеме выборки, так как в этом случае удается выделить даже слабый сигнал (влияние фактора) на фоне шума (ошибка эксперимента). Дисперсионный анализ можно использовать и при оценке нескольких факторов (как правило, не более трех) – двух- и трехфакторный дисперсионные анализы. В этом случае удается оценить влияние или его отсутствие не только самих факторов, но и их взаимодействий.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: