Понятие малой выборки. Определение средней и предельной ошибок по малой выборке с учетом заданного доверительного интервала

Определение необходимого объёма выборки для обеспечения репрезентативности выборочных наблюдений при повторном и бесповторном способе отбора. Виды отбора (случайный, механический, типический, стратифицированный, комбинированный).

Необходимый объем выборки ()определяется из формул предельных ошибок выборки D, соответствующих различным способам отбора.

Так, для случайного повторного отбора имеем:

D_x = , откуда .

Уменьшение (увеличение) предельной ошибки в несколько раз ведет к увеличению (уменьшению) выборочной совокупности в квадрат раз. Для уменьшения предельной ошибки, например, в 2 раза численность выборки должна быть увеличена в 4 раза. Из трех параметров два (t и D) задаются исследователем.

При бесповторном отборе необходимая численность выборки рассчитывается по формуле: .

При прочих равных условиях при бесповторном отборе требуется меньший объем выборочной совокупности, чем при повторном.

При изучении альтернативного признака (доли р) необходимый объем выборки определяется по формулам при отборе:

повторном: , бесповторном: .

Если неизвестна, даже приблизительно, дисперсия альтернативного признака w(1-w), то она принимается равной своему максимуму – 0,25 (0,5∙0,5) и формулы объема выборки выглядят следующим образом:

; .

Репрезентативность выборки зависит не только от количества отобранных единиц совокупности и степени их колеблемости по изучаемым признакам, но и от способа отбора.

В зависимости от способа выборки единиц из генеральной совокупности различают следующие виды отбора (выборки):

собственно случайный;

механический;

типический (районированный, стратифицированный);

серийный (гнездовой);

комбинированный, многофазный и др.

При собственно случайном отборе единицы отбираются из генеральной совокупности в строгом соответствии с научными принципами и правилами случайного отбора.

Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно. Используются таблицы случайных чисел, нумеруются все единицы генеральной совокупности, при жеребьевке на каждую единицу заготавливаются соответствующие карточки или фишки. При большой генеральной совокупности проводить такую предварительную работу практически невозможно и нецелесообразно.

Для удобства проведения выборочного наблюдения на практике применяют другие формы отбора, организуемые таким образом, чтобы была обеспечена случайность выборки.

При механическом отборе генеральная совокупность делится на n равных частей в соответствии с естественным расположением ее границ (географическим, пространственным, алфавитным и др.) и из каждой части обследуется одна единица. Например, если нужно отобрать 10% рабочих, то обследуют каждого десятого рабочего по списку, упорядоченного по алфавиту. Ошибки репрезентативности при механическом отборе возникают не в результате случайности отбора, а в результате случайности размещения единиц изучаемой совокупности.

Если единицы в генеральной совокупности размещены случайно в отношении изучаемого признака (в алфавитном порядке, в порядке времени поступления писем, телеграмм, телефонных соединений), то ошибка механической выборки становится случайной и ее можно определять по формуле ошибки случайной выборки. Механический отбор удобно проводить, когда уже имеются списки единиц совокупности и когда имеют дело с генеральной совокупностью, численность которой известна лишь приблизительно и единицы которой появляются постепенно, например, при контроле качества услуг и средств связи.

Типический (районированный, стратифицированный) отбор осуществляется на основе предварительного разделения единиц генеральной совокупности на типические группы (районы, страты) по изучаемым признакам. В качестве групп, страт в зависимости от характера изучаемого признака могут использоваться округа, регионы, отрасли, предприятия. Отбор из каждой группы может осуществляться в случайном (повторном или бесповторном) или механическом порядке.

Объем выборки в каждой типической группе обычно устанавливается пропорционально ее удельному весу в генеральной совокупности или дифференцированному признаку. Это повышает точность выборочного наблюдения, поскольку более точно, чем при собственно случайной выборке, отражается структура генеральной совокупности.

При типической выборке устраняется влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как имеется представительство в выборочной совокупности каждой из типических групп. Средняя ошибка выборки здесь зависит не от общей дисперсии s², а от средней из групповых дисперсий . Так как средняя из групповых дисперсий всегда меньше общей дисперсии, при прочих равных условиях ошибка типической выборки меньше ошибки собственно случайного отбора.

При определении ошибки типической выборки в случае пропорционального отбора для расчета предельной ошибки выборки применяется формула случайной выборки, в которой применяется средняя из групповых дисперсий .

∆ = t*µ или для выборки:

повторной - ; бесповторной - .

Отбор единиц в типическую выборку производится пропорционально объему типических групп: ,

где = Ss²_in_i/Sn_i; n_i – численность единиц выборочной совокупности i-й группы; s²_i – выборочная дисперсия i-й группы; N – объем всей совокупности; - объем типических групп.

При определении ошибки типической выборки в случае отбора по дифференциальному признаку для расчета предельной ошибки выборки применяется формула случайной выборки, в которой применяется внутригрупповые дисперсии s²_i.

∆ = t*µ или для выборки:

повторной - ; бесповторной - .

Отбор единиц в типическую выборку производится пропорционально дифференциальному признаку - среднему квадратическому отклонению :

Выделение типических групп в генеральной совокупности значительно повышает репрезентативность выборки.

Примером типической выборки является уровень потребления услуг связи с разделением потребителей на население и организации с разбивкой последних на две группы – бюджетные и хозрасчетные.

В статистике связи находит применение и серийный (гнездовой) отбор, при котором в случайном порядке отбираются не единицы, а группы единиц (серии, гнезда). Серии, или группы, единиц отбираются по принципу случайного отбора или механическим способом, внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Если общее число серий в генеральной совокупности обозначить через R, а число отобранных серий – r, то средняя ошибка выборки может быть определена по формулам:

m_x = для бесповторной выборки, m_x = , повторной выборки,

где – межсерийная (межгрупповая) дисперсия.

Объём серийной выборки определяется по формуле:

Чем меньше серийные средние отличаются одна от другой, т.е. чем ближе друг к другу серии по уровню изучаемого признака, тем точнее серийная выборка.

При значительной вариации серийных средних увеличивается ошибка репрезентативности выборки.

Серийная выборка применяется в организациях связи для определения скорости пересылки письменной корреспонденции и телеграмм, доли неисправных таксофонов, массы писем, объема передаваемой информации электронных сообщений и т.д. В качестве серии здесь выступает совокупность писем, телеграмм, разговоров за сутки, количество суток (дней) обследования равно количеству серий, попавших в выборочную совокупность.

На практике в зависимости от цели и задач выборочного обследования часто выборки производят на основе сочетания двух и более способов, образующих ступени отбора: механический и серийный, типический и механический, серийный и собственно случайный. Такие выборки получили название комбинированных (ступенчатых). При комбинированном отборе общая ошибка выборки состоит из ошибок на каждой ее ступени. Например, единовременно скорость прохождения письменной корреспонденции учитывается с помощью трех способов, образующих три ступени отбора: на основе случайного отбора определяются регионы страны, механического отбора – города и сельские населенные пункты регионов, серийного отбора – группы писем, представляющие определенные направления пересылки и подлежащие сплошному учету.

Малой называют выборку, объем которой находится в пределах 5...30 ед.

Качество работы аппаратуры связи и затраты времени на производственные операции по передаче сообщений или обслуживанию средств связи исследуются с помощью малых выборок. Особенностью малой выборки является то, что ее случайные ошибки не подчиняются закону нормального распределения. Поэтому при оценке результатов малой выборки нельзя пользоваться формулами собственно случайного отбора.

Результаты малой выборки оцениваются по закону распределения вероятностей Стьюдента. На практике пользуются таблицами распределения Стьюдента S(t*), в которых для различных n и t* приведены вероятности Р(t*). В табл. 5.1 даны значения доверительной вероятности Р(t*), рассчитанные для различных t* и k (k – число степеней свободы, равное n–1).

Таблица 5.1. Доверительная вероятность Р(t*)

t*	Степени свободы k
									¥
2,0 2,5 3,0	0,844 0,933 0,960	0,898 0,946 0,970	0,908 0,953 0,976	0,914 0,959 0,980	0,919 0,963 0,983	0,923 0,966 0,985	0,927 0,969 0,987	0,936 0,976 0,991	0,941 0,979 0,993	0,954 0,988 0,997

По этой таблице определяется двусторонний критерий, т.е. вероятность того, что фактическое значение t* по случайным причинам не будет больше табличного по абсолютной величине.

Средняя ошибка малой выборки рассчитывается по формуле:

m_мв =или .

Предельная ошибка малой выборки равна: D_мв= t*m_мв.

Для генеральной совокупности доверительные интервалы отклонения средней от средней выборочной :.

Одним из вариантов выборочного метода для изучения использования рабочего времени и времени работы оборудования в организациях связи является метод моментных наблюдений. Так как статистическая отчетность такой информации не содержит, то моментные наблюдения являются единственным ее источником. Метод заключается в том, что в заранее выбранные моменты фиксируется состояние процесса. Его особенность состоит в том, что по охвату объекта совокупности метод является сплошным, а по времени – выборочным. Интервалы времени между моментами наблюдения могут быть равными и неравными. Продолжительность интервала и число моментов наблюдения определяются в соответствии с теорией выборочного метода. Моменты наблюдения могут отбираться по таблицам случайных чисел или периодически через определенные промежутки времени по способу механического отбора.

Например, качество обслуживания вызовов на цифровых телефонных станциях оценивается по коэффициенту занятий с ответом (КЗО), который определяется по всем станциям в единый день съема показателей счетчиков (третья среда следующих месяцев: марта, мая, августа, ноября) в час наибольшей нагрузки (ЧНН) станции.

Средняя ошибка моментных наблюдений рассчитывается по формуле: m = ,

где w – коэффициент потерь рабочего времени, доля простоев оборудования во всем рабочем времени, процент занятий, закончившихся сигналом «ответ» в ЧНН.

Конечной целью любого выборочного наблюдения является распространение его характеристик на генеральную совокупность. Приемы распространения характеристик зависят от цели выборочного обследования.

Если целью наблюдения является определение объема признака генеральной совокупности (известна лишь численность ее единиц), то данные выборки пересчитываются прямо на всю совокупность. Так, простая письменная корреспонденция учитывается с целью определения ее количества, поэтому умножение среднесуточного обмена по данным выборки на количество дней в периоде дает величину месячного обмена. Количество календарных дней в месяце – это объем генеральной совокупности N. В данном случае с определенной вероятностью можно утверждать, что месячный обмен находится в пределах (–D_q)N £ q_мес£ (+D_q)N, где – среднесуточный обмен по результатам выборки; D_q – возможная ошибка выборки.

При определении обобщающих характеристик генеральной совокупности на основе выборки рассчитываются доверительные интервалы средней или доли. Этот прием используется при определении показателей качества работы организаций связи, различных социально-экономических показателей, которые не охвачены статистической отчетностью.

Адекватность применения конкретных видов выборочного наблюдения в статистике связи определяется его целями и задачами. Для получения наиболее полной информации о генеральной совокупности на основе выборочного наблюдения необходимо теоретическое обоснование наилучших выборочных оценок. Например, качество услуг в аспекте выполнения контрольных сроков пересылки почтовых отправлений и телеграмм, искажения передачи речевой и текстовой информации средствами электросвязи имеет явно выраженное асимметричное распределение, наилучшей обобщающей характеристикой которого является не средняя, а мода. Решение данного вопроса представляет собой содержание теории статистического оценивания.

Важнейшей сферой применения выборки являются производственные и управленческие задачи. Результаты выборочного наблюдения и контроля технологических операций и качества услуг предоставляют базу для принятия управленческих решений.

Формирование конкурентной среды на рынке услуг связи и прямая зависимость предложения услуг связи от платежеспособного спроса пользователей обуславливают особое значение выборочных наблюдений в маркетинговых изучениях потребностей и предпочтений клиентов, социально-демографического портрета пользователя, географии потребления услуг и средств связи и информатизации. Для прогнозирования объемов производства, выяснения потребительских реакций на новые услуги и средства связи, для сегментации рынка, позиционирования продуктов связи и информатизации широко применяют выборочное анкетирование, опросы.

Современные компьютерные технологии обработки и накопления данных в значительной мере способствуют расширению практики и качеству результатов выборочного наблюдения.