Доверительный интервал

Параметры генеральной совокупности практически всегда остаются не­известными, о них судят по выборочным оценкам, используя для этого значения ошибок репрезентативности. Теоретические исследования поведения выборочных средних (как случайных величин) показали, что они подчиняются нормальному закону, большинство из них (95%) находится поблизости от генеральной средней – в диапа-зоне Mген. ± 1.96 m (приближенно ±2­ m). Это обстоятельство позво-ляет делать обратное заключение – генеральная средняя находится в диапазоне Mвыбор. ± 1.96 m, т. е. предсказывать ширину интервала, в котором заключен генеральный параметр, давать интервальную оценку генеральному параметру.

В соответствии с законом нормального распределения можно ожидать, что генеральный параметр (истинное значение) окажется в ин­тервале

от Мtm до М + tm,

где m – ошибка средней арифме­тической,

t – квантиль распределения Стьюдента (табл. 6 П) при данном числе степеней свободы (df)и уровне зна­чимости (обычно α = 0.05).

Сказанное можно перефразировать так: с вероятностью P можно ожидать, что генеральная средняя находится в доверительном интервале М ± tm, построенном вокруг выборочной средней арифметической M.

Доверительный интервал – интервал значений изучаемого признака, в котором с той или иной вероятностью P находится значение генерального параметра.

Возвращаясь к примеру о весе землероек-бурозубок, мы теперь можем записать доверительные интервалы при разных уровнях вероятности (граничные значения t взяты для случая n = ∞):

для Р = 0.95 М ± tт = 9.3 ± 1.96 ∙ 0.11 = 9.3 ± 0.21 г;

для Р = 0.99 М ± tт = 9.3 ± 2.58 ∙ 0.11 = 9.3 ± 0.28 г.

Здесь искомая генеральная средняя величина веса землероек с вероятностью P = 95% находится в пределах 9.11-9.53 г, а при P = 99% – 9.04-9.6 г.

Если объем выборки, для которой были получены параметры и ошибка репрезентативности m, был невелик (n < 50), то необходимо вводить поправки на объем выборки, расширяя область возможного пребывания генерального параметра. Это понятно, поскольку при дефиците информации любые заключения не могут быть очень точными. Так, для выборки объемом n = 20 экз. ошибка средней составит г, а доверительный интервал: М ± tт = 9.3 ± 2.09∙0.2 = 9.3 ± 0.41 г – от 8.9 до 9.7 г (при уровне значимости α = 0.05 и числе степеней свободы df = n − 1 = 20 − 1 = 19 табличная величина статистики Стьюдента равна t = 2.09).

Аналогичным образом можно построить доверительный интервал для стандартного отклонения (S ± tmS), коэффициента вариации (CV ± tmCV), а также других статистических параметров (коэффициентов асимметрии, эксцесса, регрессии, корреляции).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: