Однофакторный дисперсионный анализ

Пусть изучается влияние только одного фактора х. Представим в табл. 10.1 результаты эксперимента из и´т наблюдений уjl,

Таблица 10.1

  1, 2,..., l,..., m
. . . j . . . u y11 y12... у1 l... у1m y21 y22... у2 l... у2m .......... .......... .......... уj1 yj2... у jl... у jm .......... .......... .......... уu1 yu2... yu l ... yum - . . . . .
   

где j — порядковый номер уровня варьирования фактора х (j=1,2,...,u); l — порядковый номер параллельного опыта в серии на каждом j-м уровне (l =1, 2,..., т.). Для упрощения выкладок, не нарушая общности выводов, рассмотрим сначала случай равночисленных серий наблюдений на всех уровнях, т. е. mj=m= const. При расположении наблюдений в табл. 10.1 их рассеяние между столбцами обусловливается ошибкой воспроизводимости, а рассеяние между строками — дополнительным действием изучаемого фактора.

20. Оценки дисперсий. Предположим, что влияние фактора х на отклик отсутствует, т е нуль-гипотеза об однородности (j0=1, 2,.... и) верна Тогда все и серий параллельных наблюдений можно рассматривать как случайные выборки из одной и той же нормальной генеральной совокупности и, следовательно:

1) несмещенная общая оценка дисперсии воспроизводимости по всем um наблюдениям определяется выражением

(10.12)

с числом степеней свободы n0=um-1;

2) выборочная дисперсия рассеивания «внутри серий», или остаточная оценка дисперсии воспроизводимости , находится как среднее извыборочных дисперсий по каждой серии в отдельности:

(10.13)

с числом степеней свободы ne=u(m-1);

3) выборочная дисперсия средних по сериям служит несмещенной оценкой дисперсии , с которой нормально распределены независимые друг от друга средние j-х еерий:

(10.14)

с числом степеней свободы nх=u-1. Отсюда легко получаем третью оценку дисперсии воспроизводимости, выборочную дисперсию рассеивания «между сериями»:

(10.15)

с числом степеней свободы nх=u-1. Подсчет чисел степеней свободы проверяется с помощью соотношения n0=ne+nx;

4) в результате более глубокого анализа можно показать, что Se и Sx независимы друг от друга.

Из сказанного очевидно, что при отсутствии влияния фактора х оценки , и однородны, так как являются оценками одной и той же генеральной дисперсии .

Предположим теперь, что влияние фактора х на отклик существенно, т е. нуль-гипотеза об однородности (j=1, 2,.... и) неверна. Тогда и серий параллельных наблюдений можно рассматривать как случайные выборки и независимых нормально распределенных случайных величин с одной и той же дисперсией и различными генеральными центрами распределения С1, С2,..., Сj,..., Сu и, следовательно:

1) выборочная дисперсия характеризует влияние как фактора случайности e, так и фактора х, т. е.

; (10.16)

2) так как сумма Se. не изменяется при замене yjl на yjl-Cj, где Сj—генеральный центр распределения целевой функции у при стабилизации фактора х на j-м уровне, то выборочная дисперсия также не изменяется и по-прежнему является несмещенной оценкой для генеральной дисперсии воспроизводимости , т. е.

; (10.17)

3) поскольку сумма Sx учитывает не только случайные, то и систематические расхождения между средними серий и увеличивается за счет влияния фактора х, дисперсия при этом также увеличивается и перестает служить оценкой только для , т. е.

,

откуда следует, что

; (10.18)

4) независимость Se и Sx друг от друга сохраняется.

Таким образом, для дисперсии фактора х теперь можно дать две опенки;

, (10.19)

. (10.20)

Первая оценка менее точна из-за погрешностей величин и . Точность же второй выше, так как выборочные дисперсии входят в нее поделенными на m. Из сделанного второго предположения очевидно, что при влиянии фактора х оценки неоднородны. Следовательно, сопоставляя эти выборочные дисперсии, можно принять решение о справедливости первого или второго предположения относительно существенности влияния фактора х (с дисперсией ) на отклик. 3°. Оценивание влияния фактора. Для того чтобы влияние фактора х было признано существенным (>0), необходимо и достаточно, чтобы оценка дисперсии значимо отличалась от . Проверку нуль-гипотезы об однородности этих выборочных дисперсий можно осуществить с помощью критерия Фишера:

. (10.21)

Если вычисленное по результатам наблюдений дисперсионное отношение F превосходит табличное Fq(nx;ne), найденное по распределению Фишера для выбранного уровня значимости q при соответствующих степенях свободы nх и ne, то влияние фактора х признается существенным (> 0), и, наоборот, если F£Fq (nx; ne), то несущественным (=0). В дисперсионном анализе проверяют нуль-гипотезу при альтернативе , поэтому пользуются односторонним F-критерием (см. Приложения VI—IX).

Следует иметь в виду, что дисперсионный анализ наблюдений эксперимента позволяет оценивать влияние фактора лишь в целом и что выводы, полученные с его помощью, относятся только к данному экспериментальному материалу при данной его систематизации. Так, например, при изменении диапазона варьирования изучаемого фактора или основной (базовой) точки оценка влияния последнего может измениться.

Если влияние фактора х считается несущественным, то дисперсию воспроизводимости можно оценить выборочной общей дисперсией , которая имеет на и —1 степеней свободы больше чем . Если же влияние фактора х считается существенным, то по результатам наблюдений можно оценить:

1) дисперсию воспроизводимости выборочной остаточной дисперсией

(10.22)

и определить доверительный интервал для по c2 распределению с и (m-1) степенями свободы;

2) дисперсию фактора х по формуле

(10.23)

3) расхождение центров серий, обусловленное влиянием фактора х. Так как

, (10.24)

то можно показать, что

, (10.25)

где - среднее значение из центров распределения Сj, или

. (10.26)

Оценкой величины служит выборочная характеристика

; (10.27)

4) расхождение Cj-Cg между центрами любых двух серий. Так как статистика

(10.28)

следует распределению Стьюдента с числом степеней свободы ne=u(m-1), то интервал

служит доверительным (1 —q) 100% интервалом для Cj-Cg.

4°. Случаи неравночисленных серий наблюдений. Выше мы рассмотрели случай только равночисленных серий наблюдении на всех уровнях фактора х. Это обстоятельство несущественно для теории дисперсионного анализа, и поэтому при разном числе параллельных наблюдений на различных j х уровнях схема проведения и основные приемы анализа остаются прежними. Претерпевает изменение лишь вид следующих выражений:

1) общее число наблюдений

; (10.29)

2) суммы наблюдений по сериям

; (10.30)

3) средние в сериях

; (10.31)

4) общее среднее

; (10.32)

5) соотношение для сумм

; (10.33)

6) соотношение для числа степеней свободы

; (10.34)

7) дисперсия фактора х при существенном влиянии фактора вычисляется по формуле

. (10.35)

5°. Расчетные формулы для сумм. Вычислительный алгоритм| однофакторного дисперсионного анализа упрощается» если для расчета сумм квадратов отклонений использовать преобразование

. (10.36)

Тогда для сумм получаются удобные расчетные формулы:

; (10.37)

; (10.38)

. (10.39)

Таким образом, для проведения однофакторного ДА достаточно предварительно вычислить:

1) суммы наблюдений по сериям

; (10.40)

2) сумму квадратов всех М наблюдений

; (10.41)

3) сумму квадратов итогов по сериям, поделенных на число наблюдений в серии,

; (10.42)

4) квадрат общего итога, поделенный на число всех наблюдений

. ( 10.43 )

60. Пример. Рассмотрим пример [2] применения однофакторного ДА при исследовании зависимости долговечности у (ч) электрических ламп от технологии изготовления (фактор х). Предположим, что выполняются допущения ДА, т. е. случайная величина долговечности имеет нормальное распределение и влияние технологии изготовления электрических ламп не сказывается на дисперсии величины у, но может вызывать расхождение средних значений. Были отобраны неравночисленные серии образцов из четырех партий продукции (u=4). Результаты наблюдений приведены в табл. 10.2, причем для упрощения вычислений все данные уменьшены на одну и ту же величину (1500 ч), так как на

Таблица 10.2

l

         
f

yj1 yj2 yj3 yj4 yj5
-40                  

Продолжение табл. 10.2

Yj
l

           
f

yj6 yj7 yj8      
              Q2= =527394 Q1= =677500

значениях дисперсий это не отражается. Подсчеты, выполненные в той же таблице, понятны без пояснений и служат для нахождения сумм квадратов отклонений и выборочных дисперсий. Эти величины приведены в табл. 10.3 однофакторного ДА.

Таблица 10 3

Рассеивание Сумма квадратов отклонений Число степеней свободы Выборочная дисперсия Компоненты генеральной дисперсии
Общее Внутри серий Между сериями S0=192788 Se=150106 Sx=42682 n0=M-1=25 ne=M-u=22 nx=u-1=3 =7712 =6823 =14227

Произведем проверку существенности влияния фактора х, для чего найдем дисперсионное отношение:

Из Приложения VI находим, что значение F-критерия для 5 %-ного уровня значимости q и чисел степеней свободы n1=nx=3 и n2=ne=22 составляет F0,05 (3; 22) =3,05. Так как F<F0,05 (3; 22), то влияние технологии изготовления на продолжительность горения электрических ламп в рассмотренных четырех партиях может считаться несущественным.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Что называется факторами изменчивости и случайности?

2. Какого типа практические задачи обычно решают методом ДА?

3. Как математически формулируется задача однофакторного ДА?

4. Каковы основные предпосылки применения ДА?

5. В чем заключается основная идея метод? ДА?

6. Каким образом производится количественное оценивание влияния фак­торов изменчивости^

7. На какие составляющие суммы раскладывается «общая» сумма квадратов отклонении в однофакторном ДА и влияние каких факторов они харак­теризуют?

•8. На какие составляющие суммы раскладывается «общая» сумма квадратов отклонений в двухфакторном ДА и влияние каких факторов они харак­теризуют?

9. Совместной оценкой каких генеральных дисперсий в однофакторноы ДА являются выборочные дисперсии рассеивании- «общего», «внутри серий», «между сериями»'

10. Совместными оценками каких генеральных дисперсий в двухфакторном ДА являются выборочные дисперсии рассеивании, «общего», «внутри се­рий», «между строками», «между столбцами»?

1). Как в однофакторном ДА формируются выборочные дисперсии рас­сеивании: «общего», «внутри серий», «между сериями»^

12. Как в двухфакторном ДА формируются выборочные дисперсии рас­сеивании: «общего», «внутри серий», «между строками», «между столбцами»;

«между сериями»'

13. Каким образом производится оценивание существенности влияния фактора изменчивости в однофакторном ДА?

14. Каким образом производится оценивание существенности влияния двух:

факторов изменчивости и их взаимодействия в двухфакторяом ДА


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: