Отбор исследуемых объектов

Общие понятия

Математическая статистикараздел математики, посвященный ма­тематическим методам систематизации, обработки и использования статистиче­ских данных для научных и практических выводов.

Статистические данные – данные, полученные в результате обследования (наблюдения) большого числа объектов или явлений.

Совокупность – множество варьирующих объектов, явлений, объединенных какими-либо общими свойствами и подвергающихся статистическому исследованию. Например, совокупность промышленных предприятий региона, совокупность оценок за контрольную работу и т.д.

Генеральная (основная) совокупность - исходная совокупность объектов, из которых про­из­водится выборка.

Выборочная совокупность (выборка) – совокупность объектов исследова­ния, отобранная оп­ределен­ным образом.

Объем совокупности (выборочной или генеральной) – число объектов этой совокупности. Обозна­чение: n и N соответственно. Так, если из 200 текстов контрольных работ отобрано для об­сле­дования 15 работ, то объем генеральной совокупности N =200, а объем выборки n =15. Относи­тельно объема генеральной совокупности, как правило, делается предположение, что он беско­нечно велик, т.е. выборка получается как бы из бесконечной гене­ральной совокупности.

На практике методы матема­тиче­ской статистики используются в тех случаях, когда требуется изучить распределе­ние большой совокупности объектов по некоторому признаку. Например, распределе­ние множества школьников по возрасту, результатов тестирования по баллам и т.д.

Признак – отличительная черта, свойство, качество присущие единице совокупности, и учитываемое при статистическом исследовании.

Современная математическая статистика подразделяется на две обширные области: описательную и ана­лити­ческую статистику. Описательная статистика охватывает методы описания ста­тистических данных, представления их в форме таблиц, распределений и др. Предме­том аналитической статистики (теории статистических выводов) является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих при­кладное значение для самых различных областей человеческой дея­тельности.

Теория вероятностей по вероятностной модели процесса предсказывает его поведение, а математическая статистика по результатам наблюдений за процессом строит его вероятностную модель. В этом состоит тесная взаимосвязь между данными науками.

Сплошное обследованиеобследование, когда обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике сплошное обследование применяют сравни­тельно редко, а пользуются обычно бесповторным случайным отбором.

Бесповторная выборкавыборка, при которой отобранный объект не возвраща­ется в генеральную совокупность.

Повторная выборкавыборка, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Способы отбора подразделяются на два вида.

Первый вид отбора. Отбор, не требующий расчленения генеральной совокупности на части: про­стой случайный бесповторный отбор; простой случайный повторный отбор.

Простой случайный отборотбор, при котором объекты извлекаются по одному из всей генеральной совокупности. Осуществить простой отбор можно различными спосо­бами. Например, для извлечения n объектов из генеральной совокупности объема N посту­пают так. Выписываются номера от 1 до N на карточках, которые тщательно пе­реме­шивают и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию; затем карточка возвращается в пачку и процесс повторяется. Так поступаю n раз; в итоге получают простую случай­ную повторную выборку. Если извлеченные карточки не возвращать в пачку, то вы­борка будет простой случайной бесповторной.

Второй вид отбора. Отбор, при котором генеральная совокупность разбивается на части: типиче­ский отбор; механический отбор; серийный отбор.

Типический отборотбор, при котором объекты отбираются не из всей генеральной со­вокупности, а из каждой ее «типической» части. Так, если учащихся отбирают из некоторой школы, то отбор производят не из всей совокупности учащихся школы, а из каждого класса в отдельности.

Механический отборотбор, при котором генеральная совокупность «механически» де­лится на несколько групп, сколько объектов должно войти в выборку, и из каждой группы отбирается один объект. Так, если нужно отобрать 20% контрольных работ, то отбирают каждую пятую контрольную работу; если требуется отобрать 5% кон­трольных работ, то отбирают каждую двадцатую контрольную работу и т.д.

Серийный отборотбор, при котором объекты отбираются из генеральной совокупно­сти не по одному, а «сериями», которые подвергают сплошному обследованию. Так, если имеются данные о состоянии здоровья школьников нескольких классов, то подвергают сплош­ному обследованию данные только нескольких классов. Серийный отбор пользуют тогда, когда обследуемый признак колеблется в различных сериях незначительно.

На практике часто применяется комбинированный подход, при котором сочета­ются указанные способы отбора.

Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты вы­борки правильно ее представляли, т.е. выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки ото­бран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

Пример 3.1. Решено было провести опрос обществен­ного мнения, на что надо в первую очередь направить городские средства – на строительство дешевого жилья или на развитие транспорта. Для этого по телефонной книге случайным порядком была составлена выборка и вошедшие в нее были проинтервьюированы по телефону. Оказалось, что транспорт волнует горожан больше, чем дешевое жилье. Убедительны ли результаты этого иссле­дования?

Решение. Хотя фамилии и выбирались случай­ным порядком, но считать эту выборку случайной никак не приходится. В нее не могли попасть люди, не имею­щие дома телефона, проживающие в общежитиях и т. п. Их мнение заведомо не учитывалось, а возможно, это было мнение очень большой части населения.

Пример 3.2. Фабрика резиновых изделий выиграла тендер на изготовление N = 20 000 армейских противогазов. Для оп­ределения того, сколько противогазов каждого из пяти су­ществующих размеров следует изготовить, были сделаны за­меры у n = 100 случайным образом выбранных солдат местного гарнизона. Распределение размеров X по частотам ni оказалось таким, как показано в таблице на рис. 3.1. Сколько противогазов каждого размера должно изготовить фабрика?

xi          
ni          

Рис. 3.1.

Решение. Будем считать исследуемую выборку объемом n =100 солдат репрезентативной. Тогда в генеральной совокупности (объемом N = 20 000 солдат) количество противогазов каждо­го размера пропорционально количеству противогазов соот­ветствующего размера в выборке и для каждого размера на­ходится по формуле , где ni – частоты выборки, Ni – частоты генеральной совокупности, – относительные частоты. Результаты расчетов запишем в таблицу (см. рис. 3.2).

xi          
ni          
ni / n 0,07 0,19 0,51 0,20 0,03
Ni          

Рис. 3.2

Ответ дан в таблице, представленной на рис. 3.3.

Размер противогаза          
Количество противогазов          

Рис. 3.3


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: