Большое количество практических задач приводится к задачам однофакторного дисперсионного анализа.
Типичным примером является работа технологической линии в составе которой имеется несколько параллельных рабочих агрегатов.
На выходе имеют место какие-то детали. Эти детали по какому-то параметру можем контролировать.
Ясно, что среднее значения контролируемых параметров после каждого станка будут несколько отличаться.
Вопрос: Обусловлены ли эти отличия действием случайных факторов или имеет место влияние конкретного станка агрегата.
В данном случае фактор только один – станок.
Совокупность размеров деталей подчиняется нормальному закону распределения, и все эти совокупности имеют равные дисперсии.
Имеется m станков, т.о. имеется m совокупностей. Из этих совокупностей мы проводим выборки объёмом n. Так, что значение параметров i-той совокупности i: .
Все выборки можно записать в виде таблицы, которая называется матрицей наблюдения.
i \ j | . | j | . | n | Ср. выборочное | ||
x11 | x12 | . | x1j | . | x1n | ||
x21 | x22 | . | x2j | . | x2n | ||
. | . | . | . | . | . | . | . |
i | xi1 | xi2 | . | xij | . | xin | |
. | . | . | . | . | . | . | . |
m | xm1 | xm2 | . | xmj | . | xmn |
Выдвигаем гипотезу Н0 заключающуюся в равенстве средних выборочных.
|
|
Гипотеза Н0 проверяется сравнением внутригрупповых и межгрупповых дисперсий по F критерию Фишера.
Если расхождение незначительно, то принимается гипотеза Н0, в противном случае гипотеза Н0 отвергается.
Далее находят сумму квадратов отклонений от общего среднего:
Ноль потому, что стоит сумма от - сумма отклонений переменных одной совокупности от средней арифметической той же совокупности.
Слагаемое Q1 является суммой квадратов разностей между средними отдельных совокупностей и общей средней всех совокупностей. Эта сумма называется суммой квадратов отклонений между группами. Она характеризует систематическое отклонение между совокупностями наблюдений.
Величину Q1 – рассеяние по фактору.
Слагаемое Q2 – представляет собой сумма квадратов разностей между отдельными и средней соответствующей совокупности. Эта сумма называется суммой квадратов отклонений внутри группы.
Она характеризует остаточное рассеяние случайных погрешностей совокупностей.
Величина Q называется общей или полной суммой квадратов отклонений отдельных отклонений от общей средней.
Получим оценки дисперсий:
- дисперсия обусловленная влиянием фактора;
- остаточная дисперсия – влиянием случайных и других неучтённых факторов.
- полная дисперсия.
Далее формируем оценку различия между оценками
подчиняется распределению f 2 Фишера.
|
|
Выбираем уровень значимости α, или доверительной вероятности 1– α = Р и по таблице F-распределения с числом степеней свободы: к1 = m–1; к2 = m(n–1) находим критическое значение Фишера.
Сравнивая между собой Fн и Fкр,α мы делаем вывод насколько сильно влияние интересующего нас фактора на исследуемую случайную величину.
В этом и состоит идея дисперсионного анализа.
Однофакторный дисперсионный анализ обычно представляют в виде таблицы.
Компоненты дисперсии | Оценки дисперсии | Число степеней свободы | |
Основной фактор | Межгрупповая дисперсия | m - 1 | |
Случайные, неучтенные факторы | Внутригрупповая дисперсия | m(n - 1) | |
Общая дисперсия | mn - 1 |
Пример: Исследуем влияние числа оборотов вращения центрифуги при нанесении фоторезиста на равномерность слоя фоторезиста.
Отклонение толщины плёнки от среднего значения равно 1 мкм при различных частотах вращения центрифуги помещены в таблице:
Частоты вращения центрифуги об/мин | Наблюдения | Среднее ариф. значение | |||||||
0,16 | 0,06 | 0,18 | 0,22 | 0,12 | 0,22 | 0,20 | 0,06 | 0,140 | |
0,04 | 0,13 | 0,14 | 0,04 | 0,06 | 0,14 | 0,06 | 0,08 | 0,085 | |
0,06 | 0,02 | 0,06 | 0,06 | 0,04 | 0,04 | 0,02 | 0,06 | 0,045 | |
=0,09 |
Задаётся уровень значимости α = 0,05, Р = 0,95.
Н0 неверна, т.к. Р(Fн > Fкр) = α
Н1 – зависит от частоты вращения центрифуги.