Дисперсионный анализ позволяет оценить степень и достоверность отличия нескольких выборочных средних одновременно, т. е. изучить влияние одного контролируемого фактора на результативный признак путем оценки его относительной роли в общей изменчивости этого признака, вызванной влиянием всех факторов. Сущность дисперсионного анализа заключается в расчленении общей вариации (дисперсии) изучаемого признака, вычисляемой по сумме квадратов отклонений отдельных вариант (x) от средней арифметической всего комплекса наблюдений (М), на его составные части –дисперсию, вызванную организованными, учитываемыми в исследовании факторами (факториальную дисперсию), оценивающую межгрупповую изменчивость, и дисперсию, обусловленную остальными, неорганизованными в данном исследовании факторами (внутригрупповую, или случайную, дисперсию) отклонения отдельных значений от средней в группе.
Общая вариация (сумма квадратов) признака рассчитывается как сумма квадратов отклонений всех вариант (xi) от общей средней (M):
|
|
Собщ. = Σ (xi − M) ².
Факториальная (межгрупповая, межвыборочная) сумма квадратов рассчитывается как сумма квадратов отклонений частных средних (Mi) для каждой выборки (всего k выборок) от общей средней:
Сфакт. = Σ (Mj − M) ².
Остаточная (случайная, внутригрупповая) сумма квадратов есть сумма квадратов отклонений вариант каждой выборки (xi) от своей средней (Mj):
Сслуч. = Σ (xi − Mj) ².
Очевидно, что в общем комплексе наблюдений должно выполняться равенство Собщ . = Сфакт . + Сслуч .
Отношение сумм квадратов к соответствующему числу степеней свободы дает оценку величины дисперсии, или средний квадрат, иногда ее именуют варианса. Влияние изучаемого фактора отражает факториальная, или межгрупповая, дисперсия S ² факт ., а влияние случайных неорганизованных в данном исследовании причин – случайная S ² случ., или внутригрупповая, остаточная дисперсия S ² остат .:
,
где dfфакт. = k − 1, j = 1, 2, …, k, k – число сравниваемых средних.
,
где df случ. = n − 1, i = 1, 2, …, n, n – число вариант всех выборок.
Сила влияния фактора определяется как доля частной суммы квадратов в общем варьировании признака. Показатель силы влияния изучаемого фактора составляет: η ² факт. = Сфакт . / Собщ ., неорганизованных (случайных): η ² случ . = Сслуч . / Собщ .; сумма этих показателей, естественно, равна единице: η ² факт . + η ² случ . = 1. Заметим, что показатель силы влияния дисперсионного комплекса есть не что иное, как квадрат пирсоновского корреляционного отношения, которым и оценивается относительная доля влияния организованного (изучаемого) фактора в общем суммарном статистическом влиянии всех факторов, определяющих развитие данного результативного признака.
|
|
О достоверности оценок влияния факторов судят по уже знакомому нам критерию Фишера: ~ F ( α , df 1, df 2),
где df 1 = k − 1, df 2 = n − k, k – число градаций,
n – общий объем всех выборок.
Проверяется нулевая гипотеза: «влияние фактора на признак отсутствует». Влияние считается доказанным, если величина расчетного критерия равна или превышает свое табличное значение с принятым уровнем значимости (обычно α = 0.05) (F определяется по табл. 7 П). Все параметры однофакторного дисперсионного анализа и порядок их вычислений представлены в таблице 8.
Таблица 8
Составляющие дисперсии | Суммы квадратов (SS), С | Сила влияния, η ² | Степени свободы, df | Дисперсии (средний квадрат, MS), S ² | Критерий влияния, F |
Факториальная | Сфакт . = Σ (Mj − M) ² | k − 1 | S ² факт . = = | F = | |
Случайная | Сслуч . = Σ (xi − Mj) ² | n − k | S ² случ . = = | ||
Общая | Собщ . = Σ (xi − M) ² |
Однофакторным называется анализ, изучающий действие на результативный признак только одного организованного фактора А. Для примера оценим влияние растворенного в воде вещества на плодовитость дафний, используемых в качестве тест-объектов в водно-токсикологических экспериментах. В ходе предварительного исследования были получены четыре выборки, четыре группы значений плодовитости животных, выращенных в средах с разным содержанием химической добавки.
Сначала необходимо сгруппировать выборочный материал в комбинативную таблицу (организовать дисперсионный комплекс). Для этого варианты каждой выборки записываются в отдельные графы, именуемые градациями (табл. 9). Результативным признаком служит средняя плодовитость дафний за неделю (для иллюстративности расчетов она дана в целых числах). В нашем примере организованы 4 градации – чистая вода (контроль, градация А 1; значения плодовитости 6, 5, 5, 7), слабая концентрация вещества (5 мг/л, А 2; 8, 7, 6, 6), средняя (15 мг/л, А 3; 8, 8, 7) и сильная (30 мг/л, А 4; 8, 7, 9). Предлагаемый ниже алгоритм расчетов позволяет использовать неравное число вариант в градациях. Расчеты показаны в таблице 9.
Таблица 9
Градации фактора | ||||||||||||||||||
A 1 | A 2 | A 3 | A 4 | |||||||||||||||
x | x 2 | x | x 2 | x | x 2 | x | x 2 | |||||||||||
Σ | ||||||||||||||||||
Σ x ² | H 1 = ΣΣ x ² = 691 | |||||||||||||||||
Σ x | H 2 = (ΣΣ x)²/ n = | |||||||||||||||||
n | = (97)²/14= 672 | |||||||||||||||||
Σ x ² /n | 176.3 | 682.8 | H 3 = ΣΣ x ² /n = = 682.8 | |||||||||||||||
M | 5.8 | 6.8 | 7.67 | 6.93 | ||||||||||||||
Сфакт . = H 3 − H 2 = 682.8 − 672 = 10.76 | ||||||||||||||||||
С случ. = H 1 − H 2 = 691 − 672 = 8.17 | ||||||||||||||||||
С общ. = H 1 − H 3 = 691 − 682.8 = 18.93 | ||||||||||||||||||
Полученные значения позволяют вычислить дисперсии, определить силу влияния фактора и критерий достоверности Фишера.
Составляющие дисперсии | Суммы квадратов, С | Сила влияния, η ² | Степени свободы, df | Дисперсии, S | Критерий, F |
Факториальная | 10.76 | 57% | 3.59 | ||
Случайная | 8.17 | 0.82 | 4.39 | ||
Общая | 18.93 | 4.39 |
Поскольку полученное значение критерия (F = 4.39) больше табличного (F (0.05,3,10) = 3.7) (табл. 7 П), отличие факториальной и случайной дисперсий достоверно, влияние фактора значимо.
|
|
Отсюда следует биологический вывод: стимулирующее влияние изучаемого фактора (вещества) на плодовитость дафний относительно велико (57%) и достоверно (с вероятностью Р > 0.95).