Проверка равенства среднего известному значению

В практике статистического анализа часто возникает необходимость проверки гипотезы о равенстве среднего известному значению. Например, при контроле времени изготовления детали различными рабочими получено выборочное среднее минут (нецелое число). Необходимо выяснить, можно ли за норматив времени взять, например, ближайшее к целое число x0? Сущность данного теста - проверка, находится ли x0 от в пределах доверительного интервала для среднего. В отличие от формулы (7.4) для двухвыборочного z-теста опытное значение критерия равенства x0 и определяется по формуле 7.7, где в знаменателе стоит стандартное отклонение для среднего рассматриваемой выборки:

(7.7)

Если x0 находится достаточно близко от (иначе - разность ( - x0) мала, а - меньше критического табличного значения), гипотеза о равенстве и x0 выполняется, в противном случае - отвергается.

В ряду статистических функций MS EXCEL имеется функция ZТЕСТ, обычно используемая для проверки гипотезы о равенстве среднего известному значению [5, 6]. Но результат вычислений функции ZТЕСТ является лишь промежуточным в проверке гипотезы о равенстве x0 и , достаточно трудоёмкой даже при её выполнении в рамках MS EXCEL. Поэтому предлагается более простой способ проверки гипотезы о равенстве и x0 с использованием рассматриваемой в главе 6 родственной ZТЕСТ функции ДОВЕРИТ (см. рис. 6.1), определяющей доверительный интервал для среднего значения выборки размером (объёмом) n. То есть в окно «размер» аргументов функции ДОВЕРИТ следует вносить объём выборки n.

Т.к. математическое ожидание генеральной совокупности находится в интервале x ± Д, где Д - результат расчёта с использованием функции ДОВЕРИТ, контроль равенства среднего известному значению производится по следующим критериям.

1. Если результат расчёта функции ДОВЕРИТ оказывается бόльшим, чем разность |x0 - |, то гипотеза о равенстве x0 и принимается. То есть x0 можно брать в качестве среднего значения, например производительности (см. выше).

2. Если результат расчёта функции ДОВЕРИТ оказывается меньшим, чем разность |x0 - |, то гипотеза о равенстве x0 и отвергается.

7.4.3 t- тесты о равенстве средних значений

Строго говоря, описанные ниже критерии применимы только к выборкам, извлеченным из генеральной совокупности, распределённой по нормальному закону. Однако специальные исследования показали, что рассматриваемый в этом параграфе t-критерий является весьма устойчивым по отноше­нию к отклонениям исследуемых генеральных совокупностей от нормаль­ного закона распределения. Это позволяет широко использовать его в заводской практике, когда, как правило, нет возможности предварительно проводить достаточно трудоёмкую проверку нормальности исследуемых генеральных совокупностей (см. ниже § 7.6). Следует лишь иметь в виду, что истинные значения уровня значимости и мощности критерия могут незначительно отличаться от заданных значений.

Данный параграф посвящен процедурам проверки гипотез о равенстве средних (математических ожиданий) двух нормальных распределений X и Y с неизвестными дисперсиями σX и σY. Причем можно выдвинуть два предпо­ложения:

1) обе дисперсии неизвестны, но предполагается, что они рав­ны между собой (σX = σY).

2) обе дисперсии неизвестны, их равенство не предполагается (σX ≠ σY).

В первом случае переходят к объединенной оценке дисперсии S2:

(7.8)

В математической статистике доказывается, что если гипотеза о равенстве средних значений выполняется, то определяемая с использованием оценки стандартного отклонения объединенной дисперсии (7.8) величина

(7.9)

имеет распределение Стьюдента с k= n+m-2 степенями сво­боды, т.е.

Величину t используют в качестве критерия при проверке ги­потезы H0: .

Когда дисперсии неизвестны и их равенство не предполага­ется (σX ≠ σY), то взамен формулы (7.9) используется аналог t-статистики с заменой неизвестных дисперсий их оценками SX и SY, называ­емый критерием Фишера-Беренса:

(7.10)

Известно, что это распределе­ние близко к распределению Стьюдента с числом степеней свобо­ды, равным

Аналогично двум рассмотренным аналитическим подходам в программе excel имеется два инструмента для случаев, когда σX = σY и когда σX ≠ σY. Окна инструментов «Двухвыборочный t-тест с одинаковыми дисперсиями» (рис. 7.9) и «Двухвыборочный t-тест с различными дисперсиями» аналогичны по своей структуре. Они содержат опцию «Гипотетическая средняя разность», в которую при проверке равенства средних можно ничего не вносить, если эта «Гипотетическая средняя разность» равна нулю (см. выше).

Рис. 7.9. Двухвыборочный t-тест с одинаковыми дисперсиями

В выходных данных кроме значений средних, дисперсий, количества наблюдений для каждой из двух выборок присутствуют:

- гипотетическая разность средних;

- число степеней свободы df = n1+n2-2;

- вычисленное значение t-статистики;

- значения «t критическое одностороннее» и «t критическое двухстороннее», соответственно для односторонней и двухсторонней гипотезы;

- вероятности P(T<=t) выполнения односторонней и двухсторонней гипотезы о равенстве средних.

Вычисленное значение t-статистики следует сравнивать со значениями «t критическое одностороннее» или «t критическое двухстороннее» в зависимости от того, какая альтернативная гипотеза (односторонняя или двухсторонняя) рассматривается. При t > tкритическое гипотеза о равенстве средних отвергается, при t < tкритическое гипотеза о равенстве средних подтверждается.

Значение P для двухсторонней гипотезы можно сравнивать с принятым уровнем значимости α.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: