Испытание гипотезы по двум выборочным долям

В разделе 6.5 мы утверждали, что, если мы берем большую случайную выборку из генеральной совокупности, в которой доля случаев р соответствующей характеристики, следует биномиальному распределению, то выборочное распределение

выборочной доли р приближается к нормальному распределению. Таким же образом мы находим, что если две большие выборки взяты независимо из двух

биномиальных генеральных совокупностей, то статистика (р, - р₂) нормально

распределена со средней (р, - р₂) и стандартной ошибкой:

_SE«_>=уМ1-Р.) fed-pa)

где р — выборочная статистика, р — параметр генеральной совокупности и обе выборки большие, то есть (п, и п,) больше или равны 30.

Нас обычно интересует, взяты ли или нет две выборки из биномиальных генеральных совокупностей с одинаковой долей случаев, то есть р, = р₂. Проверочная статистика приблизительно нормально распределена при больших размерах выборки:

(Pi - Рг) - (Pi ~ Рг>

2- л *

О Пример 6.15. Внутренние аудиторы большой компании интересуются системой обработки счетов доходов. Они взяли случайную выборку объемом ni = 50 законченных счетов и проверяют их подробно. Четыре из них оказались дефектными.

184 Ч. 2. Анализ данных как составная часть принятия решений

Тогда аудиторы предложили некоторые модификации в процедуре. Дав определенное время клеркам для приспособления к новым процедурам, аудиторы затем провели случайную выборку объемом nj = 60 завершенных счетов. Теперь они обнаружили три неисправных счета. Имеется ли какое-либо основание предполагать, что новые процедуры уменьшают ошибки?

Решение

Нулевая гипотеза предполагает, что две выборки случайно взяты из двух биномиальных генеральных совокупностей с равными долями дефектов:

^н(>: Pi = Рг ~ PI ^НГ- Pi *• Pj.

То есть предполагается, что новые процедуры сократили долю ошибок, поэтому здесь приемлемо испытание с одной границей.

Будем принимать наше решение на 5%-ном уровне значимости. Здесь подходит нормальное распределение, поскольку размеры обеих выборок большие. По таблице нормального распределения в Приложении 2, находим:

Zo_>05 ⁼ 1.645;

р, - 4/50 - 0,08 и Pj = 3/60 = 0,05.

Предполагая, что Н₀ — верна, лучшая оценка доли дефектных счетов в генеральной совокупности достигается комбинированием долей двух выборок. В общем оказывается 7 дефектов из ПО случаев. Поэтому, лучшей оценкой генеральной доли является:

Поэтому

р«= 7/110 -0,0636.

ср. л yl 0.0636 x 0,9364 0,0636 x 0$Ш,„

^SEP,-P,^e^ 50 ⁺ 60 -0.0467.

Проверочной статистикой является:

0,64 P.-Pj

(Pi - ft) - (Pi - Pj) 0.08 - 0,05

SE," - в'⁰⁴⁸⁷

Z» -------------:------------------- = —'----------------