ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №7
Тема: « Табличный процессор MS Excel. Проверка статистических гипотез. Непараметрическая статистика. Оценка на нормальность распределения»
ЗАДАНИЕ 1. В рабочей тетради составить опорный конспект по теме занятия, используя следующий теоретический материал:
Статистическая гипотеза – это любое предположение, которое относится к виду распределения или отдельным параметрам случайных величин.
Практически – это любое высказывание о генеральной совокупности, проверяемое по выборочным данным.
Статистическая гипотеза может относиться к одной выборке или к нескольким. Например:
1) данная выборка извлечена из генеральной совокупности с нормальным законом распределения;
2) две выборки относятся к одной генеральной совокупности, т.е. имеют одинаковые генеральные средние и дисперсии.
Гипотезы о типах распределения и о значениях параметров распределения называют параметрическими.
Гипотезы, в которых о типе распределения никаких предположений не делается, называются непараметрическими.
|
|
Первая из приведенных выше гипотез – параметрическая, а вторая – непараметрическая.
Задача проверки гипотез. Ошибки первого и второго рода. Уровень значимости.
Вернемся к примеру, представленному в таблице. В процессе проверки гипотез всегда имеются две стороны: «скептик» и «оптимист». «Скептик» считает, что первая методика не лучше второй, а лучший показатель числа необходимых процедур получился случайно. Из-за малого объема выборки. Он говорит = (гипотеза скептика). «Оптимист» считает, что < (гипотеза оптимиста). Арбитром между «скептиком» и «оптимистом» выступает статистика.
При проверке гипотез принято формулировать сразу две гипотезы:
Н0 – нулевая гипотеза – гипотеза об отсутствии различий между сравниваемыми выборками.
Н1 – альтернативная (конкурирующая) гипотеза – гипотеза о наличии различий между сравниваемыми выборками.
Задача проверки гипотез заключается в том, чтобы на основании анализа выборочных данных принять решение о справедливости одной из них.
Однако, при проверке гипотез могут быть допущены ошибки двух видов:
1. Принимается Н1, когда верна Н0 – ошибка первого рода.
2. Принимается Н0, когда верна Н1 – ошибка второго рода.
Вероятность совершить ошибку первого рода должна быть достаточно мала, т.к. нужны веские основания для признания того, что один метод лечения лучше другого, т.е. ¹ . Эта вероятность называется уровнем значимости и обозначается a.
При проверке статистических гипотез уровнем значимости (a) называется максимально приемлемая вероятность, отвергающая нулевую гипотезу, если она верна. И тогда можно сказать, что результаты значимы на уровне a.
|
|
В медицинских исследованиях обычно используют a= 0.05 или a=0.01.
Как правило, для большинства случаев 5%-ный уровень значимости является вполне достаточным. И только при рассмотрении вопросов, в которых ошибочное отклонение нулевой гипотезы может повлечь тяжелые последствия (например, увеличение частоты летальных исходов), используют меньший уровень значимости.