Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.
Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведения наблюдения.
Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т.е. между величинами выборных и соответствующих генеральных показателей.
Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.
Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности.
Величина случайной ошибки репрезентативности зависит от:
· степени колеблемости изучаемого признака в генеральной совокупности;
· способа формирования выборочной совокупности;
· объема выборки.
Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.
Формула определения средней ошибки выборки для средней величины (
) определяется следующим образом:
при повторном отборе:
,
при бесповторном отборе:
,
где n – численность выборки; N – численность генеральной совокупности.
Величина (1 – n / N) всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора обеспечивает меньшую ошибку выборки.
Таким образом, формулы для расчета средней ошибки выборочной доли имеют вид:
для повторного отбора
,
безповторного отбора
.
Приведенные формулы характеризуют среднюю величину отклонения сводных характеристик генеральной совокупности. Однако то, что генеральная средняя (или генеральная доля) не выйдет за определенные пределы, можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности. Доказано, что генеральные характеристики не отклоняются от выборочных на величину большую, чем величина ошибки выборки, и всегда имеют степень вероятности, равную 0,683. Т.е. из 1000 выборок в 683 выборках сводная характеристика генеральной совокупности будет отличаться от сводной характеристики выборочной совокупности не более чем на величину, равную 1
; но в остальных 317 выборках из 1000 она может отличаться и в большей степени.
Можно повысить вероятность этого утверждения, если расширить пределы отклонений, приняв в качестве меры, удвоенную ошибку выборки - 2
. В этом случае вероятность нашего утверждения достигнет уже 0,954, т.е. только в 46 выборках из 1000 отклонение выйдет за пределы 2
. При 3
вероятность соответственно повышается до 0,997, и таким образом она все более и более приближается к 1. Таким образом, проявление ошибки большей, чем утроенная средняя ошибка выборки, имеет крайне малую вероятность (1-0,997=0,003) и считается практически невозможным событием. С определенной степенью вероятности можно утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки.
Придельная ошибка выборки (
) связана со средней ошибкой выборки следующим равенством:
,
где t – коэффициент доверия,зависящий от вероятности, с которой можно гарантровать, что предельная ошибка не превысит t-кратную среднюю ошибку. Этот коэффициент определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.
Способы распространения выборочных данных на генеральную совокупность. Зная величину выборочной средней (x) или доли (
), а также предельную ошибку выборки (
), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:
,
.






