СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
Статистическая гипотеза (H, лат. hypothesis) – предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки.
Например, гипотеза о том, что средняя в генеральной совокупности равна некоторой величине H: , или о том, что генеральная средняя больше некоторой величины: H: .
Различают простые и сложные гипотезы.
− Простая – однозначно характеризует параметр распределения случайной величины. Например, H: .
− Сложная – состоит из конечного или бесконечного числа простых гипотез, при этом указывается некоторая область вероятных значений параметра. Например, H: . Она состоит из множества простых гипотез: H: , где с — любое число, большее b.
Гипотезы о параметрах генеральной совокупности (, ) называются параметрическими, о распределениях – непараметрическими.
Нулевая гипотеза (H0) – гипотеза о том, что две или более сравниваемые величины не отличаются. При этом предполагается, что выявленное по данным отличие носит случайный характер.
|
|
H0 отвергается, когда по выборке получается результат, который при истинности выдвинутой H0 маловероятен. Границей невозможного или маловероятного обычно считают γ = 0,05, т.е. 5%, или 0,01, 0,001 – уровень значимости.
Проверка H0 осуществляется с помощью статистического критерия – определенное правило, устанавливающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо не отклонить.
Основными статистическими критериями являются
− t-критерий Стьюдента,
− F-критерий Фишера,
− χ2 (хи-квадрат) критерий Пирсона.
Принятие или отклонение H0 определяется границами критической области и области допустимых значений.
Рис. 10.1. Границы критической области и область допустимых значений при
5%-м уровне значимости
Критическая область – область, попадание значения статистического критерия в которую приводит к отклонению H0. Вероятность попадания значения критерия в эту область равна принятому уровню значимости γ.
Область допустимых значений дополняет критическую область. Если значение критерия попадает в область допустимых значений, это свидетельствует о том, что выдвинутая гипотеза H0 не противоречит фактическим данным (H0 не отклоняется).
Точки, разделяющие критическую область и область допустимых значений, называются критическими точками или границами критической области.
Если вычисляемое значение критерия попадает в критическую область, нулевая гипотеза отклоняется, т.к. она противоречит фактическим данным.