Общая схема дисперсионного анализа

В экономике часто встречаются объекты исследования, состояние которых определяется факторами, не имеющими количественной оценки. Такими факторами могут быть неуправляемые и управляемые переменные, которые по каким-либо причинам не позволяют производить их измерение в данном эксперименте, а также те неконтролируемые переменные, уровни варьирования которых можно произвольно выбирать и фиксировать во времени.

Для изучения влияния факторов подобного рода на функцию от Y (целевую функцию), их общего оценивания, ранжирования выделения среди них существенных методы регрессионного анализа непригодны, поскольку они решают задачи определения вида магматической модели при варьировании величины факторов.

Рассмотрим постановку задачи дисперсионного анализа в общем виде.

Пусть исследуется некоторый процесс, описываемый функцией

(5.11)

Величина Y может зависеть (по каким-либо физическим причинам) от п независимых управляемых факторов и их парных взаимодействий.

При этом:

• каждый фактор может варьироваться на уровнях;

• полный факторный эксперимент состоит из серий независимых наблюдений по числу всех возможных неповторяющихся сочетаний уровней п факторов;

• каждая -я серия содержит наблюдений параллельных опытов.

Требуется определить, в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора или взаимодействия факторов на отклик Y, провести сравнение с другими факторами и выделить наиболее существенные.

При исследовании принимаются следующие допущения:

• наблюдаемые величины функции отклика Y имеют нормальное распределение с центром Таким образом, факторы определяют величину Yлишь в среднем, оставляя простор для случайных ошибок наблюдений, подчиняющихся нормальному распределению;

• дисперсия единичного наблюдения , обусловленная случайной ошибкой , постоянна во всех опытах и не зависит от т.е. дисперсии равны, а их выборочные оценки однородны, т.е. соблюдается условие воспроизводимости опытов с равной точностью.

Каждое из этих допущений необходимо проверять в процессе анализа эксперимента.

Из данных задачи и допущений очевидно, что чем больше влияние некоторого фактора X на функцию отклика Y, тем больше расхождение между собой средних арифметических функции отклика в сериях параллельных наблюдений, сделанных при различных уровнях варьирования фактора . Статистическая значимость такого расхождения указывает на существенное влияние фактора . При двух сериях наблюдений сравнение средних и проверка гипотезы о незначимости их различия проводится с помощью -критерия Стьюдента. В сформулированной задаче требуется одновременно сопоставить произвольное большое число средних и на основании этого сделать вывод о существенности влияния того или иного фактора.

Чтобы иметь возможность оценивать влияние каждого фактора на функцию отклика Y и сравнивать влияние различных факторов, установим некоторый количественный показатель этого влияния. Пусть в отсутствие ошибок опыта при варьировании фактор X на uразных уровнях получены опытные значения функции отклика Y. Тогда в качестве показателя влияния фактора X примем величину, по аналогии с обычной дисперсией называемую дисперсией фактора X:

(5.12)

где .

При этом будем иметь в виду, что числа не являются случайными и поэтому дисперсия не связана ни с какой случайной величиной, так как мы полагаем .

Изучать влияние факторов по величинам их дисперсий удобно, поскольку это простейшая мера рассеяния и к тому же аналогичная мере влияния фактора случайных величин, т.е. дисперсии единичного наблюдения (воспроизводимости) . Благодаря этому имеет- возможность сравнивать влияние любого изучаемого фактора и фактора случайности.

Исследование факторов по их дисперсиям называют дисперсионным анализом.

Дисперсионный анализ был предложен Р. Фишером и развит Йейтсом.

Рассмотрим идею дисперсионного анализа на примере изучения одного фактора X на фоне случайных погрешностей, когда дисперсия воспроизводимости известна.

При варьировании фактора X на и уровнях в результате наблюдений (без проведения параллельных опытов на каждом -м уровне) получим значения функции отклика рассеяние которых можно оценить дисперсией

(5.13)

с числом степеней свободы к = и - 1. Если отличие от незначимо, то разброс наблюдений, который она характеризует, связан только со случайными причинами и влияние фактора X несущественно. Если же отличие от значимо, то повышенный разброс наблюдений вызван не только случайными причинами, но еще и влиянием фактора, которое в данном случае нужно признать существенным. Причинами влияния двух независимых факторов могут быть:

· случайные причины с дисперсией (Y);

· фактор X с дисперсией приводящей к общему рассеянию наблюдений. В результате общая дисперсия является суммой двух дисперсий:

(5.14)

откуда дисперсия фактора равна

(5.15)

В общем случае, когда дисперсия воспроизводимости неизвестна, схема дисперсионного анализа должна позволить найти ее оценку наряду с оценками дисперсий изучаемых факторов. С этой целью планируется проведение серий параллельных опытов при каждом из всех возможных сочетаний уровней изучаемых факторов.

Таким образом, основная идея дисперсионного анализа заключается в разложении оценки общего рассеяния функции отклика Y на составляющие, зависящие от:

• случайных причин;

• каждого из рассматриваемых факторов;

• взаимодействия факторов;

• оценивания статистической значимости дисперсий факторов с учетом ошибки воспроизводимости опыта.

Техника дисперсионного анализа достаточно разнообразна. Мы рассмотрим лишь простейшие способы, наиболее часто встречающиеся в практике.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: