ANOVA (дисперсионный анализ)

Дисперсионный анализ был разработан английским математиком Р.Фишером. Его чаще используют в научно-практических исследованиях общественного здоровья и здравоохранения для изучения влияния одного или нескольких факторов на результативный признак. Дисперсионный анализ основан на принципе «отражения разнообразий значений факторного на разнообразии значений результативного признака» и устанавливает силу влияния фактора в выборочных совокупностях.

Сущность метода дисперсионного анализа заключается в измерении отдельных дисперсий (общая, факториальная, остаточная), и дальнейшем определении силы (доли) влияния изучаемых факторов (оценки роли каждого из факторов, либо их совместного влияния) на результативный признак.

Дисперсионный анализ – это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия () – средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.

Условия применения дисперсионного анализа:

1. Задачей исследования является определение силы влияния одного (до 3) факторов на результат или определение силы совместного влияния различных факторов (пол и возраст, физическая активность и питание и т.д.).

2. Изучаемые факторы должны быть независимые (несвязанные) между собой. Например, нельзя изучать совместное влияние стажа работы и возраста, роста и веса детей и т.д. на заболеваемость населения.

3. Подбор групп для исследования проводится рандомизированно (случайный отбор). Организация дисперсионного комплекса с выполнением принципа случайности отбора вариантов называется рандомизацией (от англ. random), т.е. выбранные наугад.

4. Можно применять как количественные, так и качественные (атрибутивные) признаки.

Оценка значимости различия при альтернативной форме учета реакций. Для оценки значимости расхождения частот какого-либо явления в двух группах может быть использован статистический метод, который носит название критерия c². Этот критерий может быть применен, например, при сравнении групп, получивших различные сравниваемые по своей активности препараты; групп, получивших различные дозы изучаемого препарата или одну и ту же дозу различными путями введения и т.д. Для описания результатов такого исследования удобно применять таблицу сопряженности, в которой для каждой из групп указывается число пациентов с каждым из градаций признака. Таким образом, для 2-х рассматриваемых групп и 2-х возможных исходов получается таблица размерности 2х2 (рис. 6.1). Для ответа на вопрос о значимости различий между группами вычисляется величина статистики c², которая является показателем максимально возможных при данном уровне значимости отклонений частот.

Критерий c² может применяться и к таблице сопряженности произвольной размерности.

Точный критерий Фишера основан на переборе всех возможных вариантах заполнения таблицы сопряженности при данной численности групп. Позволяет получить точные значения вероятности событий, столь же или еще менее вероятных, чем те, которые наблюдались в действительности.

Критерий Мак-Нимара применяется для анализа связанных измерений в случае измерения реакции для связанной переменной. Является аналогом параметрического критерия Стьюдента для зависимых выборок или непараметрического Т-критерий Уилкоксона.

Критерий Кокрена является аналогом непараметрического критерия Фридмана для случая альтернативного учета реакций. Сравнивается влияние различных воздействий на одну группу (мультиперекрестный план – повторные измерения) или однородные группы (рандомизированный блочный план). Нулевая гипотеза состоит в том, что в генеральной совокупности доли всех изучаемых воздействий одинаковы. Полученное значение статистики Q проверяется по таблицам c² для выбранного уровня значимости и числа степеней свободы.

Порядок проведения парных и множественных сравнений качественных признаков представлен на рис. 6.1, 6.2.

Рис 6.1. Схема проведения парного сравнения средних значений.

Рис. 6.2. Схема проведения множественного сравнения.

Контрольные вопросы

Что такое статистическая гипотеза?
Что такое нулевая гипотеза?
Что такое альтернативная гипотеза?
Что такое ложноположительный и ложноотрицательный результат проверки статистического теста?
Что такое ошибка первого рода?
Что такое ошибка второго рода?
Что такое мощность критерия?
Какие параметрические критерии используются для проверки статистических гипотез?
Какие непараметрические критерии используются для проверки статистических гипотез?
Приведите примеры статистических критериев, используемых для множественных сравнений средних значений нескольких выборок.

Список литературы

Гланц С. Медико-биологическая статистика. Пер. с англ. – М.: Практика, 1998. – 459 с.
Лях Ю.Е., Гурьянов В.Г., Хоменко В.Н., Панченко О.А. Основы компьютерной биостатистики: анализ информации в биологии, медицине и фармации статистическим пакетом Medstat. – Донецк: 2006. – 214 с.
Платонов А.Е. Статистический анализ в медицине и биологии: задача, терминология, логика, компьютерные методы. – М.: Издательство РАМН, 2000. – 52 с.
Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. – М.: МедиаСфера, 2002. – 312 с.
Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях. - М.: ГЭОТАР-МЕД, 2001. – 256 с.