Пусть в n независимых испытаниях некоторое событие A, вероятность появления которого в каждом испытании равна p, имело место m раз, где 0 ≤ m ≤ n. В качестве основы интервальной оценки генеральной доли используется точечная оценка вероятности – частость m / n (выборочная доля), где m – число элементов выборочной совокупности, обладающих данным признаком, n – объём выборочной совокупности.
При достаточно больших n (n > 30) можно считать, что частость имеет приближённо нормальное распределение с параметрами . В этом случае доверительный интервал для генеральной доли p определяется соотношением:
,
где tγ определяется по таблице интегральной функции Лапласа Ф(t):
w – частость события A;
1− w – частость противоположного события Ā;
n – объём выборки.
Точность оценки генеральной доли p равна:
где σw – средняя квадратическая (стандартная) ошибка выборочной доли, которая рассчитывается по следующим формулам:
а) в случае повторной выборки: ;
б) в случае бесповторной выборки: .
|
|
Тогда доверительный интервал для генеральной доли p будет иметь следующие границы:
Если задан доверительный интервал для оценки генеральной доли или вероятности (pmin; pmax) при большом объёме выборки, то надёжность попадания вероятности в заданный интервал определяется из условия:
где , .
Пример 4. Из партии, содержащей 2000 деталей для проверки качества было случайно отобрано 50 деталей, среди которых 4 оказались нестандартными. Определить границы доверительного интервала, в которых с надёжностью 0,954 заключена генеральная доля нестандартных изделий во всей партии.
Решение. Находим выборочную долю:
Коэффициент доверия по нормальному распределению при заданном уровне надёжности равен: tγ = 2. Тогда точность оценки генеральной доли составит:
Границы доверительного интервала для генеральной доли:
Таким образом, доля нестандартных изделий во всей партии с вероятностью 0,954 составляет: 0,004 ≤ p ≤ 0,156.
Пример 5. При испытании зерна на всхожесть из n = 400 зёрен проросло m = 384. С надёжностью γ = 0,9812 определить доверительный интервал для генеральной доли p.
Решение. По таблице интегральной функции Лапласа из условия γ = Ф(tγ) = 0,9812 определяем tγ = 2,35.
Учитывая, что , определим точность оценки:
Доверительный интервал равен:
0,96 – 0,023 ≤ p ≤ 0,96 + 0,023
и окончательно 0,937 ≤ p ≤ 0,983.
Таблица 1. Основные формулы, используемые при интервальном оценивании параметров распределений
Оцениваемый параметр | Условия оценки | Используемое распределение | Точность оценки | Доверительный интервал | ||
Генеральная средняя μ
| σ известно | Ф(t) | ||||
σ не известно | S(t) | |||||
Генеральная дисперсия σ2 (или σ) | n ≤ 30 | χ2 | ||||
n > 30 | Ф(t) | |||||
Генеральная доля p | Ф(t) |
Таблица 2. Основные формулы для определения объёма выборки
Объём выборки N | Повторный отбор | Бесповторный отбор |
При определении среднего размера признака | ||
При определении доли признака |
Вместо неизвестных характеристик генеральной совокупности – генеральной дисперсии σ2 и генеральной доли p – обычно используют выборочную дисперсию S2 и выборочную долю w.