Возможные решения при различных соотношениях результатов теста и истинной ситуации в генеральной совокупности

    В генеральной совокупности
    Н0 неверна Н0 верна
В статистическом тесте Н0 отклонена Истинно-положительный результат Ложно-положительный результат
Н0 не отклонена Ложно-отрицательный результат Истинно-отрицательный результат
         

Если обозначить вероятность ошибки первого рода как a, а вероятность ошибки второго рода как b, то значения вероятности правильного вывода в первом случае будет равным р=1- a.. Значение р – это рассчитанная в ходе статистического теста вероятность ошибочного отклонения нулевой гипотезы, или это вероятность получить данные анализируемых выборок в случае справедливости нулевой гипотезы, или это вероятность справедливости нулевой гипотезы. Значения р могут быть выражены как 0,95 или 0,05 (0,99 или 0,01; 0,999 или 0,001) и называются уровнем значимости.

Метод проверки статистических гипотез заключается в сравнении полученного значения р с принятым уровнем значимости:

- если рассчитанное в тесте значение р>0,05, то нулевую гипотезу не отклоняют;

- если рассчитанное в тесте значение р<0,05, то нулевую гипотезу отклоняют и принимают альтернативную гипотезу На. При этом различия групп называют статистически значимыми.

Величина b -ошибки зависит от величины ожидаемого эффекта и объема выборки. Часто величина b задается значением 0,2 (20%). С учетом допустимого уровня этого параметра существует возможность рассчитать объем выборки, необходимый для выявления эффекта определенной величины. Ошибки второго рода непосредственно влияют на мощность критерия при проверке гипотезы, когда велика вероятность не совершить ошибки второго рода.

В целом ряде случаев полученный отрицательный результат – тоже результат, поэтому вероятность и значимость ошибок первого рода значительно выше, чем ошибок второго рода.

Ошибка первого рода существенна в конфирматорном (уточняющем) эксперименте, а так же тогда, когда неприятие верной гипотезы об отсутствии различий имеет практическую значимость (принятие ложной гипотезы об эффективности препарата может иметь катастрофические последствия)

Ошибка второго рода существенна в эксплораторном (разведочном) эксперименте. Отклонение гипотезы о различиях на начальной стадии эксперимента может (в лучшем случае!) неверно ориентировать исследователя на перспективу.

Чем меньше величина р, тем менее вероятна справедливость нулевой гипотезы, однако эта величина никак не отражает величину различий между группами. Именно поэтому получил широкое распространение подход, основанный на построении и сравнении ДИ для оценки различий между группами и изменений в одной группе во времени.

Два упомянутых подхода сравнения групп – проверка статистической гипотезы и сравнение ДИ – основаны на одних и тех же статистических моделях и предположениях. Но, поскольку ДИ имеет такие же единицы измерения, что и изучаемый признак (в отличие от безразмерной величины р), интерпретация сопоставления выборок с использованием ДИ легче, чем при статистической проверке гипотез. Значение р обычно интерпретируется либо как статистически значимый (позитивный), либо как статистически незначимый (негативный) результат, то ДИ позволяет интерпретировать значения изменений на любом конце ДИ (например, если один конец ДИ содержит клинические важные значения, а другой – нет, результаты могут быть оценены как неоднозначные). По этим причинам ДИ предпочтительнее, чем р, но так как построение ДИ возможно не всегда, то проверка статистических гипотез с помощью статистических критериев, остается основным подходом при сравнении групп.

Если признак определен как количественный, то задача исследователя заключается в том, чтобы становить, является ли его распределение нормальным (гауссовым). Лишь 20% распределений количественных признаков, встречающихся в медико-биологических исследованиях, являются приближенно нормальными. Проверка нормальности важна еще и по другой причине: нормальное распределение возникает в том случае, когда вариабельность значений этого признака обусловлена влиянием множества причин, вклад каждой в отдельности минимален. Для конкретного признака это означает его взаимосвязь со многими подсистемами организма (психики), а не с одной-двумя из них.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: