Методы статистического анализа данных принято классифицировать по нескольким принципам.
1. По количеству анализируемых признаков:
- одномерные (анализ каждого признака в отдельности);
- двумерные (одновременный анализ двух признаков);
- многофакторные (анализ трех и более признаков одновременно, например многофакторный дисперсионный анализ, многофакторный регрессионный анализ, дискриминантный анализ).
2. По статистическим принципам, лежащим в основе методов:
- параметрические, применяются для анализа нормально распределенных количественных признаков;
- непараметрические, применяются в остальных случаях:
- А) для анализа количественных признаков независимо от вида распределения;
- Б) для анализа качественных признаков.
Непараметрические методы являются менее мощными, по сравнению с параметрическими, и не всегда позволяют выявить закономерности, которые могут быть выявлены с помощью параметрических методов. В то же время непараметрические методы более надежны в случаях, когда есть сомнения в том, что анализируемый признак имеет нормальное распределение. Для нормально распределенных признаков параметрические и непараметрические методы дают сходные результаты.
3. По возможности учета имеющихся априори предположений:
– односторонние тесты – тесты, учитывающие исходное предположение о том, что в одной из групп распределение признака смещено в определенную сторону по отношению к другой. Для использования такого теста необходимо обоснование.
- двусторонние тесты – используются в отсутствие априорного предположения о том, что в одной из групп распределение признака смещено. Вычисляемое значение р обычно примерно в 2 раза больше одностороннего теста.
4. По зависимости или независимости сопоставляемых выборок:
- тесты для независимых выборок – используются в случае, если при формировании выборки объекты исследования набирались независимо друг от друга;
- тесты для зависимых выборок – используются когда в динамике анализируются данные, полученные в одной группе испытуемых (больных) до и после вмешательства (лечения, испытания, обследования, опроса), или когда анализируются выборки, сформированные путем подбора пар по полу, возрасту, стадии заболевания и т.д.
Для двумерного и одномерного анализа параметрические методы могут применяться лишь при условии, что все анализируемые признаки одновременно являются нормально распределенными. В противном случае должны применяться непараметрические методы.
Классификация наиболее важных статистических методов, которые могут быть использованы при выборе теста для решения задачи, представлены в таблице 2.
Таблица 2