Средняя и предельная ошибка выборки

После изучения данного раздела можно:

· обосновать природу ошибки выборки;

· объяснять формулы расчета средней и предельной ошибок выборки по количественным и альтернативным признакам, способам и видам отбора;

· получить представления о моментно- выборочном наблюдении;

· провести практические расчеты по определению ошибок выборки.

При любом статистическом наблюдении неизбежны ошибки, которые обусловлены расхождением его результатов с реальной действительностью. Помимо общих для статистки ошибок существуют ошибки репрезентивности. Под ними понимаются расхождения между показателями выборочной и генеральной совокупности. Они возникают из- за нарушения принципа случайности как основного принципа выборки (систематические ошибки) и в результате случайности отбора (случайные ошибки). Первые иногда называют ошибками смещения, они могут быть преднамеренными (при тенденционном отборе единиц) и непреднамеренными (при подготовке наблюдения, формировании выборочной совокупности и т.д.) Случайные ошибки имеют объективный характер и возникает в результате случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. Поэтому и структуры этих совокупностей чаще всего не совпадают.

Научным обоснованием случайных ошибок выборки являются теория вероятностей и её предельные теоремы. Применительно к выборочному наблюдению пользуются теоремами русских математиков П.Л. Чебышева и А.М. Лягунова. Согласно этим теоремам с увеличением численности выборки размеры случайных ошибок сокращаются. Из этого следует, что при достаточно большом объеме выборки случайная ошибка будет сколь угодно мала, а характеристики выборочного наблюдения могут надлежащим образом представлять генеральную совокупность. Предельные теоремы исходят из закона нормального распределения, по которому большая часть выборочных средних (x). Эти теоремы позволяют определить размеры случайных ошибок выборки. Различают среднюю и предельную ошибку выборки. Под средней ошибкой понимают такое расхождение между средними выборочной и генеральной совокупностями (x-X), которое не превышает . Предельной ошибкой принято считать максимально возможное расхождение этих средних, т.е. максимум ошибки заданной вероятности её проявления. На основании теоремы П.Л. Чебышева величина средней ошибки () собственно случайного повторного отбора с достаточно большой выборкой при изучении средних показателей определяется по формуле

,

Где дисперсия признака x в выборочной совокупности: n- численность выборочной совокупности.

Иными словами, величина средней ошибки прямо пропорциональна колеблемости признака в выборочной совокупности и обратно пропорциональна корню из объема выборки. По теории, лучше взять дисперсию х в генеральной совокупности (), но она неизвестна, как неизвестна и генеральная средняя. К тому же при достаточно больших выборках () определяется по формуле

где t- заданный коэффициент доверия.

Так, при t= 1 величина предельной ошибки составит , которая гарантируется с вероятностью 0,683. Это означает, что в 6823 выборках из 1000 подобных максимальная (предельная) ошибка выборки не превысит . При t= 2 с вероятностью 0,954 она не выйдет за пределы и т.д. В практике предельной ошибки можно вычислять предельные значения характеристик генеральной совокупности при заданной вероятности, а именно

Это означает, что с заданной вероятностью значение генеральной средней будет находиться в пределах до .

При изучении альтернативного признака (доля w) формула средней ошибки выборки для доли в соответствии с теоремой Я. Бернулли имеет вид

Где w(1-w) – дисперсия доли изучаемого признака в выборочной совокупности (лучше брать дисперсию доли признака в генеральной совокупности –р(1-р), но она неизвестна).

Предельная ошибка альтернативного признака ( определяется аналогично указанной выше формуле.

Практический интерес представляет и показатель относительной ошибки выборки как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности

Следует заметить, что величина ошибки выборки не может не зависеть от способа и вида отбора единиц. Так, при том же собственно случайном, но бесповторном способе отбора, расчет средней ошибки производится по несколько иной формуле

Где доля единиц генеральной совокупности, не попавших в выборку. Поскольку эта доля меньше 1, ошибка выборки здесь, при прочих равных условиях, всегда меньше, чем при повторном.

Кстати, бесповторный способ проще, чем повторный, и применяется чаще. Если доля единиц генеральной совокупности, не попавших в выборку, большая, величина близка к единице, расчет средней ошибки производится по общей формуле. По этим же формулам исчисляются и формулы механического отбора.

При выборке (районированной, стратифицированной) средняя ошибка будет зависеть не от величины общей дисперсии x, а от величины средней из групповых дисперсий. Поскольку эта дисперсия всегда меньше общей, x средняя ошибка типической выборки, при прочих равных условиях, будет меньше средней ошибки собственно случайного отбора. Формула средней ошибки повторной типической выборки будет следующей

Где, –средняя из групповых дисперсий в выборочной совокупности

= .

Для альтернативного признака (доли w) d в этой выборке:

.

При бесповторном типическом отборе в формулы добавляется уже известный сомножитель .

Средняя ошибка серийной (гнездовой) выборки определяется по формуле

где r –число отработанных серий; –межсерийная дисперсия выборочной совокупности.

При бесповторном отборе появляется сомножитель (1-R), где R- число серий в генеральной совокупности.

В практике выборочных наблюдений чаще всего применяются комбинированные выборки в разном сочетании их способов и видов. Так, если при комбинированной выборке использовались механическая и типическая выборки, то средняя ошибка определяется по формуле

где , –средние ошибки механической и типической выборки


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: