Пусть изучается влияние только одного фактора х. Представим в табл. 10.1 результаты эксперимента из и´т наблюдений уjl,
Таблица 10.1
1, 2,..., l,..., m | ||
. . . j . . . u | y11 y12... у1 l... у1m y21 y22... у2 l... у2m .......... .......... .......... уj1 yj2... у jl... у jm .......... .......... .......... уu1 yu2... yu l ... yum | - . . . . . |
где j — порядковый номер уровня варьирования фактора х (j=1,2,...,u); l — порядковый номер параллельного опыта в серии на каждом j-м уровне (l =1, 2,..., т.). Для упрощения выкладок, не нарушая общности выводов, рассмотрим сначала случай равночисленных серий наблюдений на всех уровнях, т. е. mj=m= const. При расположении наблюдений в табл. 10.1 их рассеяние между столбцами обусловливается ошибкой воспроизводимости, а рассеяние между строками — дополнительным действием изучаемого фактора.
20. Оценки дисперсий. Предположим, что влияние фактора х на отклик отсутствует, т е нуль-гипотеза об однородности (j0=1, 2,.... и) верна Тогда все и серий параллельных наблюдений можно рассматривать как случайные выборки из одной и той же нормальной генеральной совокупности и, следовательно:
|
|
1) несмещенная общая оценка дисперсии воспроизводимости по всем um наблюдениям определяется выражением
(10.12)
с числом степеней свободы n0=um-1;
2) выборочная дисперсия рассеивания «внутри серий», или остаточная оценка дисперсии воспроизводимости , находится как среднее извыборочных дисперсий по каждой серии в отдельности:
(10.13)
с числом степеней свободы ne=u(m-1);
3) выборочная дисперсия средних по сериям служит несмещенной оценкой дисперсии , с которой нормально распределены независимые друг от друга средние j-х еерий:
(10.14)
с числом степеней свободы nх=u-1. Отсюда легко получаем третью оценку дисперсии воспроизводимости, выборочную дисперсию рассеивания «между сериями»:
(10.15)
с числом степеней свободы nх=u-1. Подсчет чисел степеней свободы проверяется с помощью соотношения n0=ne+nx;
4) в результате более глубокого анализа можно показать, что Se и Sx независимы друг от друга.
Из сказанного очевидно, что при отсутствии влияния фактора х оценки , и однородны, так как являются оценками одной и той же генеральной дисперсии .
Предположим теперь, что влияние фактора х на отклик существенно, т е. нуль-гипотеза об однородности (j=1, 2,.... и) неверна. Тогда и серий параллельных наблюдений можно рассматривать как случайные выборки и независимых нормально распределенных случайных величин с одной и той же дисперсией и различными генеральными центрами распределения С1, С2,..., Сj,..., Сu и, следовательно:
1) выборочная дисперсия характеризует влияние как фактора случайности e, так и фактора х, т. е.
|
|
; (10.16)
2) так как сумма Se. не изменяется при замене yjl на yjl-Cj, где Сj—генеральный центр распределения целевой функции у при стабилизации фактора х на j-м уровне, то выборочная дисперсия также не изменяется и по-прежнему является несмещенной оценкой для генеральной дисперсии воспроизводимости , т. е.
; (10.17)
3) поскольку сумма Sx учитывает не только случайные, то и систематические расхождения между средними серий и увеличивается за счет влияния фактора х, дисперсия при этом также увеличивается и перестает служить оценкой только для , т. е.
,
откуда следует, что
; (10.18)
4) независимость Se и Sx друг от друга сохраняется.
Таким образом, для дисперсии фактора х теперь можно дать две опенки;
, (10.19)
. (10.20)
Первая оценка менее точна из-за погрешностей величин и . Точность же второй выше, так как выборочные дисперсии входят в нее поделенными на m. Из сделанного второго предположения очевидно, что при влиянии фактора х оценки неоднородны. Следовательно, сопоставляя эти выборочные дисперсии, можно принять решение о справедливости первого или второго предположения относительно существенности влияния фактора х (с дисперсией ) на отклик. 3°. Оценивание влияния фактора. Для того чтобы влияние фактора х было признано существенным (>0), необходимо и достаточно, чтобы оценка дисперсии значимо отличалась от . Проверку нуль-гипотезы об однородности этих выборочных дисперсий можно осуществить с помощью критерия Фишера:
. (10.21)
Если вычисленное по результатам наблюдений дисперсионное отношение F превосходит табличное Fq(nx;ne), найденное по распределению Фишера для выбранного уровня значимости q при соответствующих степенях свободы nх и ne, то влияние фактора х признается существенным (> 0), и, наоборот, если F£Fq (nx; ne), то несущественным (=0). В дисперсионном анализе проверяют нуль-гипотезу при альтернативе , поэтому пользуются односторонним F-критерием (см. Приложения VI—IX).
Следует иметь в виду, что дисперсионный анализ наблюдений эксперимента позволяет оценивать влияние фактора лишь в целом и что выводы, полученные с его помощью, относятся только к данному экспериментальному материалу при данной его систематизации. Так, например, при изменении диапазона варьирования изучаемого фактора или основной (базовой) точки оценка влияния последнего может измениться.
Если влияние фактора х считается несущественным, то дисперсию воспроизводимости можно оценить выборочной общей дисперсией , которая имеет на и —1 степеней свободы больше чем . Если же влияние фактора х считается существенным, то по результатам наблюдений можно оценить:
1) дисперсию воспроизводимости выборочной остаточной дисперсией
(10.22)
и определить доверительный интервал для по c2 распределению с и (m-1) степенями свободы;
2) дисперсию фактора х по формуле
(10.23)
3) расхождение центров серий, обусловленное влиянием фактора х. Так как
, (10.24)
то можно показать, что
, (10.25)
где - среднее значение из центров распределения Сj, или
. (10.26)
Оценкой величины служит выборочная характеристика
; (10.27)
4) расхождение Cj-Cg между центрами любых двух серий. Так как статистика
(10.28)
следует распределению Стьюдента с числом степеней свободы ne=u(m-1), то интервал
служит доверительным (1 —q) 100% интервалом для Cj-Cg.
4°. Случаи неравночисленных серий наблюдений. Выше мы рассмотрели случай только равночисленных серий наблюдении на всех уровнях фактора х. Это обстоятельство несущественно для теории дисперсионного анализа, и поэтому при разном числе параллельных наблюдений на различных j х уровнях схема проведения и основные приемы анализа остаются прежними. Претерпевает изменение лишь вид следующих выражений:
1) общее число наблюдений
; (10.29)
2) суммы наблюдений по сериям
|
|
; (10.30)
3) средние в сериях
; (10.31)
4) общее среднее
; (10.32)
5) соотношение для сумм
; (10.33)
6) соотношение для числа степеней свободы
; (10.34)
7) дисперсия фактора х при существенном влиянии фактора вычисляется по формуле
. (10.35)
5°. Расчетные формулы для сумм. Вычислительный алгоритм| однофакторного дисперсионного анализа упрощается» если для расчета сумм квадратов отклонений использовать преобразование
. (10.36)
Тогда для сумм получаются удобные расчетные формулы:
; (10.37)
; (10.38)
. (10.39)
Таким образом, для проведения однофакторного ДА достаточно предварительно вычислить:
1) суммы наблюдений по сериям
; (10.40)
2) сумму квадратов всех М наблюдений
; (10.41)
3) сумму квадратов итогов по сериям, поделенных на число наблюдений в серии,
; (10.42)
4) квадрат общего итога, поделенный на число всех наблюдений
. ( 10.43 )
60. Пример. Рассмотрим пример [2] применения однофакторного ДА при исследовании зависимости долговечности у (ч) электрических ламп от технологии изготовления (фактор х). Предположим, что выполняются допущения ДА, т. е. случайная величина долговечности имеет нормальное распределение и влияние технологии изготовления электрических ламп не сказывается на дисперсии величины у, но может вызывать расхождение средних значений. Были отобраны неравночисленные серии образцов из четырех партий продукции (u=4). Результаты наблюдений приведены в табл. 10.2, причем для упрощения вычислений все данные уменьшены на одну и ту же величину (1500 ч), так как на
Таблица 10.2
| ||||||||||||
| yj1 | yj2 | yj3 | yj4 | yj5 | |||||||
-40 |
| ||||||||||||
| yj6 | yj7 | yj8 | |||||||||
Q2= =527394 | Q1= =677500 |
значениях дисперсий это не отражается. Подсчеты, выполненные в той же таблице, понятны без пояснений и служат для нахождения сумм квадратов отклонений и выборочных дисперсий. Эти величины приведены в табл. 10.3 однофакторного ДА.
|
|
Таблица 10 3
Рассеивание | Сумма квадратов отклонений | Число степеней свободы | Выборочная дисперсия | Компоненты генеральной дисперсии |
Общее Внутри серий Между сериями | S0=192788 Se=150106 Sx=42682 | n0=M-1=25 ne=M-u=22 nx=u-1=3 | =7712 =6823 =14227 |
Произведем проверку существенности влияния фактора х, для чего найдем дисперсионное отношение:
Из Приложения VI находим, что значение F-критерия для 5 %-ного уровня значимости q и чисел степеней свободы n1=nx=3 и n2=ne=22 составляет F0,05 (3; 22) =3,05. Так как F<F0,05 (3; 22), то влияние технологии изготовления на продолжительность горения электрических ламп в рассмотренных четырех партиях может считаться несущественным.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Что называется факторами изменчивости и случайности?
2. Какого типа практические задачи обычно решают методом ДА?
3. Как математически формулируется задача однофакторного ДА?
4. Каковы основные предпосылки применения ДА?
5. В чем заключается основная идея метод? ДА?
6. Каким образом производится количественное оценивание влияния факторов изменчивости^
7. На какие составляющие суммы раскладывается «общая» сумма квадратов отклонении в однофакторном ДА и влияние каких факторов они характеризуют?
•8. На какие составляющие суммы раскладывается «общая» сумма квадратов отклонений в двухфакторном ДА и влияние каких факторов они характеризуют?
9. Совместной оценкой каких генеральных дисперсий в однофакторноы ДА являются выборочные дисперсии рассеивании- «общего», «внутри серий», «между сериями»'
10. Совместными оценками каких генеральных дисперсий в двухфакторном ДА являются выборочные дисперсии рассеивании, «общего», «внутри серий», «между строками», «между столбцами»?
1). Как в однофакторном ДА формируются выборочные дисперсии рассеивании: «общего», «внутри серий», «между сериями»^
12. Как в двухфакторном ДА формируются выборочные дисперсии рассеивании: «общего», «внутри серий», «между строками», «между столбцами»;
«между сериями»'
13. Каким образом производится оценивание существенности влияния фактора изменчивости в однофакторном ДА?
14. Каким образом производится оценивание существенности влияния двух:
факторов изменчивости и их взаимодействия в двухфакторяом ДА