По выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании выборочных показателей, называют доверительными.
Понятие о доверительных вероятностях вытекает из принципа, что маловероятные события считаются практически невозможными, а события, вероятность которых близка к единице, принимают за почти достоверные. Обычно в качестве доверительных используют вероятности Р1 = 0.95, Р2 = 0.99, Р3 = 0.999. Определенным значениям вероятностей соответствуют уровни значимости, под которыми понимают разность α = 1–Р. Вероятности 0.95 соответствует уровень значимости α1= 0.05 (5%), вероятности 0.99 – α2 = 0.01 (1%), вероятности 0.999 – α3 = 0.001 (0.1%).
Это означает, что при оценке генеральных параметров по выборочным показателям существует риск ошибиться в первом случае 1 раз на 20 испытаний, т.е. в 5% случаев; во втором – 1 раз на 100 испытаний, т.е. в 1% случаев; в третьем – 1 раз на 1000 испытаний, т.е. в 0.1% случаев. Таким образом, уровень значимости обозначает вероятность получения случайного отклонения от установленных с определенной вероятностью результатов. Вероятности, принятые как доверительные, определяют доверительный интервал между ними. На них можно основывать оценку той или иной величины и те границы, в которых она может находиться при разных вероятностях.
|
|
Для различных вероятностей доверительные интервалы будут следующими:
- Р1 = 0.95 интервал – 1.96σ до + 1.96σ (рис. 5)
- Р2 = 0.99 интервал – 2.58σ до + 2.58σ
- Р3 = 0.999 интервал – 3.03σ до + 3.03σ
Доверительным вероятностям соответствуют следующие величины нормированных отклонений:
- вероятности Р1 = 0.95 соответствует t1 = 1.96σ
- вероятности Р2 = 0.99 соответствует t2 = 2.58σ
- вероятности Р3 = 0.999 соответствует t3 = 3.03σ
Выбор того или иного порога доверительной вероятности осуществляют исходя из важности события. Уровень значимости в таком случае – эта та вероятность, которой решено пренебрегать в данной исследовании или явлении.
Средняя ошибка (m), или ошибка репрезентативности.
Выборочные характеристика, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой, или ошибкой репрезентативности. Статистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности.
Средняя ошибка вычисляется по формуле:
|
|
(5) ,
где σ – среднее квадратическое отклонение,
n – количество измерений (объем выборки).
Выражается в тех же единицах измерения, что и .
Величина средней ошибки обратно пропорциональна численности выборочной совокупности. Чем больше размеры выборки, тем меньше средняя ошибка, а следовательно, меньше расхождение между значениями признаков в выборочных и генеральной совокупностях.
Среднюю ошибку выборки можно использовать для оценки генеральной средней согласно закону нормального распределения. Так, в пределах ±1 находится 68.3% всех выборочных средних арифметических , в пределах ±2 – 95.5% всех выборочных средних , в пределах ±3 – 99.7% всех выборочных средних .
Поэтому, зная среднюю арифметическую выборки и среднюю ошибку выборки , можно с определенной степенью вероятности судить о пределах, в которых заключены возможные величины выборочных средних. Средняя арифметическая выборки с учетом средней ошибки записывают с виде ± , либо ±2 , либо ±3 в зависимости от значений лимитов (Хmax и Хmin). Лимиты при нормальной распределении не должны отклоняться за пределы 3 .