Общие понятия статистической проверки гипотез

1 2 3 4 5 6 7

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к выполнению лабораторной работы №2

«Проверка статистических гипотез при помощи

Системы “GRETL”»

по учебной дисциплине

«Прикладная статистика»

для студентов экономических специальностей

всех форм обучения

Севастополь

УДК 658.

Проверка статистических гипотез при помощи системы «GRETL». Методические указания по выполнению лабораторной работы №2 по дисциплине «Прикладная статистика» / Сост. И. А. Гребешкова, Б.А. Букач, М.В. Погорелова, А.Д.Горобец, А.А. Загорулько, Е.А. Черноморченко. ‑ Севастополь: Изд-во СевГТУ, 2008. ‑ 24 с.

Целью методических указаний является применение теоретических знаний по теме «Проверка статистических гипотез» при решении ситуаций с помощью системы «GRETL». Методические указания предназначены для студентов экономических специальностей.

Методические указания рассмотрены и утверждены на заседании кафедры менеджмента и экономико-математических методов, (протокол № 6 от " 20 " февраля 2008 г.)

Допущено учебно-методическим центром СевГТУ в качестве методических указаний

Рецензенты:

Цуканов А.В, д.т.н., заведующий кафедры «Менеджмент и экономико-математические методы»

Персидсков Г.М. ‑ нормоконтроль

Содержание

	Стр.
1 Общие понятия статистической проверки гипотез
2 Проверка статистических гипотез в системе «GRETL»
3 Пример проверки статистической гипотезы
4 Задание по выполнению лабораторной работы
5 Порядок выполнения работы
6 Контрольные вопросы
Библиография

ОБЩИЕ ПОНЯТИЯ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ

Статистическая гипотеза обычно представляет собой некоторое предположение об одном или нескольких параметрах функции распределения случайной величины.

Пример статистической гипотезы: «генеральная совокупность распределена по нормальному закону», «различие между дисперсиями двух выборок незначимо», «среднее значение равно 10» и т.д.

В теории статистического вывода обычно проверяются гипотезы на основе выборочной информации. В практике статистической работы чаще всего имеют дело с двумя конкурирующими гипотезами: нулевой гипотезой, обозначаемой H₀; и альтернативной гипотезой, обозначаемой H₁. Нулевая гипотеза используется при статистической проверке гипотез об отсутствии существующих различий между несколькими выборочными совокупностями, для суждения о близости фактического распределения к теоретическому (нормальному), об отсутствии зависимости между признаками. Суть нулевой гипотезы состоит в признании того, что выборки взяты из одной совокупности, фактическое распределение укладывается в теоретическое, зависимость между признаками отсутствует и т. д. Следовательно, нулевая гипотеза ‑ это гипотеза, подлежащая проверке. И если отвергается нулевая гипотеза как неподходящая в каком-то статистическом смысле, то принимается альтернативная гипотеза.

Так как мы имеем дело с неизвестной генеральной совокупностью и выносим суждения о ней на основе выборочной информации, то мы можем и не прийти к правильному выводу. Мы сделаем неправильный вывод, если отвергнем нулевую гипотезу, когда она справедлива (ошибка I рода), или примем нулевую гипотезу, когда она ошибочна (ошибка II рода).

В большинстве случаев при проведении проверки гипотез в экономике задается некоторый допустимый уровень вероятности совершения ошибки I рода (α) и осуществляется проверка на основе выборочной информации. В классическом статистическом выводе существует два общих правила для определения величины α:

1) чем больше степень уверенности в нулевой гипотезе, тем меньше должно быть значение α.

2) чем больше цена отбрасывания справедливой нулевой гипотезы, тем меньше значение должно иметь α.

Сформулируем общий алгоритм проверки статистических гипотез. Процедуру проверки можно описать следующими шагами:

1) формулировка гипотезы. Гипотеза формулируется в терминах различия величин. Например, есть случайная величина х и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие. Существует два типа критериев:

а) двухсторонний критерий вида: х ≠ a;

б) односторонний критерий вида: х < a или х > a.

Необходимо отметить, что знаки “>”, “<” и “=” здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».

2) Установка закона распределения. Далее необходимо установить или постулировать закон распределения. Существуют также критерии, которые не зависят от вида распределения ‑ так называемые непараметрические критерии.

3) Вычисление тестовой статистики. Тестовая статистика – это некоторая функция от рассматриваемых величин, закон распределения которой точно известен и ее можно сравнить с табличным значением.

4) Сравнение с табличным значением. Затем тестовая статистика сравнивается с табличным значением. Тестовая статистика всегда зависит от доверительной вероятности, и, в некоторых случаях, от дополнительных параметров. Так, в приведенном выше примере сравнения двух дисперсий тестовая статистика сравнивается с табличным значением критерия Фишера («критическим» значением), которое зависит от доверительной вероятности и числа степеней свободы дисперсий.

5) Вывод. На основании сравнения делается вывод о том, выполняется ли гипотеза (например, значимо ли различие и т.д.).

Уровень значимости α ‑ это такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существующего расхождения выдвинутой гипотезы и результатов выборки.

Допустим, рассчитанное по эмпирическим данным значение критерия попало в критическую область. Тогда при условии верности проверяемой гипотезы H₀ вероятность этого события будет не больше уровня значимости α. Поскольку α выбирается достаточно малым, то такое событие является маловероятным, и, следовательно, проверяемая гипотеза может быть отвергнута. Если же наблюдаемое значение характеристики не принадлежит к критической области, и, следовательно, находится в области допустимых значений, то проверяемая гипотеза H₀не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы H₀ равна 1‑α. Чем меньше уровень значимости, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, то есть меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки II рода.

Если альтернативная гипотеза Х₁ ≠ Х₂, то гипотеза называется двухсторонней. Если гипотеза имеет вид Х₁ > Х₂ и Х₁ < Х₂, то такую гипотезу называют односторонней. При проверке двухсторонней гипотезы с уровнем значимости α критическое значение будет определено с уровнем значимости α/2 и с соответствующим числом степеней свободы. При проверке односторонней гипотезы критическое значение будет определено с соответствующим числом степеней свободы и уровнем значимости α.

Для принятия решения о принятии или отвержении гипотезы необходимо рассчитать расчетное значение критерия, выбрать критическую область, и сравнить расчетное значении критерия с табличным. Критическая область будет зависеть от выбранной альтернативной гипотезы, как показано на рисунках 1.1 ‑ 1.3.

Рисунок 1.1 ‑ Двухсторонняя критическая область

Гипотезы:

Н₀: μ = а

Н₁: μ ≠ а

Табличное значение критерия определяется для уровня значимости α/2 и соответствующего числа степеней свободы. Если TR_{расчетное} попадает в интервал (‑t_табл.; t_табл.), то принимается нулевая гипотеза, в противном случае, нулевая гипотеза отвергается и принимается альтернативная:

-t_табл. < TR < t_табл. → Н₀

TR < ‑t_табл. → Н₁

TR > t_табл. → Н₁

Рисунок 1.2 ‑ Критическая область при альтернативной гипотезе «больше чем»

Гипотезы:

Н₀: μ = а

Н₁: μ > а

Табличное значение критерия определяется для уровня значимости α и соответствующего числа степеней свободы. Если TR_{расчетное} попадает в интервал (‑ ;t_табл.), то принимается нулевая гипотеза, в противном случае, нулевая гипотеза отвергается и принимается альтернативная.

TR < t_табл. → Н₀

TR > t_табл. → Н₁

Рисунок 1.3.- Критическая область при альтернативной гипотезе «меньшечем».

Гипотезы:

Н₀: μ = а

Н₁: μ < а

Табличное значение критерия определяется для уровня значимости α и соответствующего числа степеней свободы. Если TR_{расчетное} попадает в интервал (‑ ;t_табл.), то принимается альтернативная гипотеза, в противном случае, нулевая гипотеза отвергается и принимается нулевая.

TR < ‑t_табл. → Н₁

TR > ‑t_табл. → Н₀