В разделе 6.5 мы утверждали, что, если мы берем большую случайную выборку из генеральной совокупности, в которой доля случаев р соответствующей характеристики, следует биномиальному распределению, то выборочное распределение
выборочной доли р приближается к нормальному распределению. Таким же образом мы находим, что если две большие выборки взяты независимо из двух
биномиальных генеральных совокупностей, то статистика (р, - р2) нормально
распределена со средней (р, - р2) и стандартной ошибкой:
SE«>=уМ1-Р.) fed-pa)
где р — выборочная статистика, р — параметр генеральной совокупности и обе выборки большие, то есть (п, и п,) больше или равны 30.
Нас обычно интересует, взяты ли или нет две выборки из биномиальных генеральных совокупностей с одинаковой долей случаев, то есть р, = р2. Проверочная статистика приблизительно нормально распределена при больших размерах выборки:
(Pi - Рг) - (Pi ~ Рг>
2- л *
О Пример 6.15. Внутренние аудиторы большой компании интересуются системой обработки счетов доходов. Они взяли случайную выборку объемом ni = 50 законченных счетов и проверяют их подробно. Четыре из них оказались дефектными.
|
|
184 Ч. 2. Анализ данных как составная часть принятия решений
Тогда аудиторы предложили некоторые модификации в процедуре. Дав определенное время клеркам для приспособления к новым процедурам, аудиторы затем провели случайную выборку объемом nj = 60 завершенных счетов. Теперь они обнаружили три неисправных счета. Имеется ли какое-либо основание предполагать, что новые процедуры уменьшают ошибки?
Решение
Нулевая гипотеза предполагает, что две выборки случайно взяты из двух биномиальных генеральных совокупностей с равными долями дефектов:
н(>: Pi = Рг ~ PI НГ- Pi *• Pj.
То есть предполагается, что новые процедуры сократили долю ошибок, поэтому здесь приемлемо испытание с одной границей.
Будем принимать наше решение на 5%-ном уровне значимости. Здесь подходит нормальное распределение, поскольку размеры обеих выборок большие. По таблице нормального распределения в Приложении 2, находим:
Zo>05 = 1.645;
р, - 4/50 - 0,08 и Pj = 3/60 = 0,05.
Предполагая, что Н0 — верна, лучшая оценка доли дефектных счетов в генеральной совокупности достигается комбинированием долей двух выборок. В общем оказывается 7 дефектов из ПО случаев. Поэтому, лучшей оценкой генеральной доли является:
Поэтому
р«= 7/110 -0,0636.
ср. л yl 0.0636 x 0,9364 0,0636 x 0$Ш,„
SEP,-P,e^ 50 + 60 -0.0467.
Проверочной статистикой является:
0,64 P.-Pj |
(Pi - ft) - (Pi - Pj) 0.08 - 0,05
SE," - в'0487 |
Z» -------------:------------------- = —'----------------