Общие понятия
Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов.
■ Статистические данные – данные, полученные в результате обследования (наблюдения) большого числа объектов или явлений.
■ Совокупность – множество варьирующих объектов, явлений, объединенных какими-либо общими свойствами и подвергающихся статистическому исследованию. Например, совокупность промышленных предприятий региона, совокупность оценок за контрольную работу и т.д.
■ Генеральная (основная) совокупность - исходная совокупность объектов, из которых производится выборка.
■ Выборочная совокупность (выборка) – совокупность объектов исследования, отобранная определенным образом.
■ Объем совокупности (выборочной или генеральной) – число объектов этой совокупности. Обозначение: n и N соответственно. Так, если из 200 текстов контрольных работ отобрано для обследования 15 работ, то объем генеральной совокупности N =200, а объем выборки n =15. Относительно объема генеральной совокупности, как правило, делается предположение, что он бесконечно велик, т.е. выборка получается как бы из бесконечной генеральной совокупности.
|
|
На практике методы математической статистики используются в тех случаях, когда требуется изучить распределение большой совокупности объектов по некоторому признаку. Например, распределение множества школьников по возрасту, результатов тестирования по баллам и т.д.
■ Признак – отличительная черта, свойство, качество присущие единице совокупности, и учитываемое при статистическом исследовании.
Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и др. Предметом аналитической статистики (теории статистических выводов) является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности.
Теория вероятностей по вероятностной модели процесса предсказывает его поведение, а математическая статистика по результатам наблюдений за процессом строит его вероятностную модель. В этом состоит тесная взаимосвязь между данными науками.
■ Сплошное обследование – обследование, когда обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике сплошное обследование применяют сравнительно редко, а пользуются обычно бесповторным случайным отбором.
|
|
■ Бесповторная выборка – выборка, при которой отобранный объект не возвращается в генеральную совокупность.
■ Повторная выборка – выборка, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Способы отбора подразделяются на два вида.
Первый вид отбора. Отбор, не требующий расчленения генеральной совокупности на части: простой случайный бесповторный отбор; простой случайный повторный отбор.
■ Простой случайный отбор – отбор, при котором объекты извлекаются по одному из всей генеральной совокупности. Осуществить простой отбор можно различными способами. Например, для извлечения n объектов из генеральной совокупности объема N поступают так. Выписываются номера от 1 до N на карточках, которые тщательно перемешивают и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию; затем карточка возвращается в пачку и процесс повторяется. Так поступаю n раз; в итоге получают простую случайную повторную выборку. Если извлеченные карточки не возвращать в пачку, то выборка будет простой случайной бесповторной.
Второй вид отбора. Отбор, при котором генеральная совокупность разбивается на части: типический отбор; механический отбор; серийный отбор.
■ Типический отбор – отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Так, если учащихся отбирают из некоторой школы, то отбор производят не из всей совокупности учащихся школы, а из каждого класса в отдельности.
■ Механический отбор – отбор, при котором генеральная совокупность «механически» делится на несколько групп, сколько объектов должно войти в выборку, и из каждой группы отбирается один объект. Так, если нужно отобрать 20% контрольных работ, то отбирают каждую пятую контрольную работу; если требуется отобрать 5% контрольных работ, то отбирают каждую двадцатую контрольную работу и т.д.
■ Серийный отбор – отбор, при котором объекты отбираются из генеральной совокупности не по одному, а «сериями», которые подвергают сплошному обследованию. Так, если имеются данные о состоянии здоровья школьников нескольких классов, то подвергают сплошному обследованию данные только нескольких классов. Серийный отбор пользуют тогда, когда обследуемый признак колеблется в различных сериях незначительно.
На практике часто применяется комбинированный подход, при котором сочетаются указанные способы отбора.
Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно ее представляли, т.е. выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
Пример 3.1. Решено было провести опрос общественного мнения, на что надо в первую очередь направить городские средства – на строительство дешевого жилья или на развитие транспорта. Для этого по телефонной книге случайным порядком была составлена выборка и вошедшие в нее были проинтервьюированы по телефону. Оказалось, что транспорт волнует горожан больше, чем дешевое жилье. Убедительны ли результаты этого исследования?
Решение. Хотя фамилии и выбирались случайным порядком, но считать эту выборку случайной никак не приходится. В нее не могли попасть люди, не имеющие дома телефона, проживающие в общежитиях и т. п. Их мнение заведомо не учитывалось, а возможно, это было мнение очень большой части населения.
|
|
Пример 3.2. Фабрика резиновых изделий выиграла тендер на изготовление N = 20 000 армейских противогазов. Для определения того, сколько противогазов каждого из пяти существующих размеров следует изготовить, были сделаны замеры у n = 100 случайным образом выбранных солдат местного гарнизона. Распределение размеров X по частотам ni оказалось таким, как показано в таблице на рис. 3.1. Сколько противогазов каждого размера должно изготовить фабрика?
xi | |||||
ni |
Рис. 3.1.
Решение. Будем считать исследуемую выборку объемом n =100 солдат репрезентативной. Тогда в генеральной совокупности (объемом N = 20 000 солдат) количество противогазов каждого размера пропорционально количеству противогазов соответствующего размера в выборке и для каждого размера находится по формуле , где ni – частоты выборки, Ni – частоты генеральной совокупности, – относительные частоты. Результаты расчетов запишем в таблицу (см. рис. 3.2).
xi | |||||
ni | |||||
ni / n | 0,07 | 0,19 | 0,51 | 0,20 | 0,03 |
Ni |
Рис. 3.2
Ответ дан в таблице, представленной на рис. 3.3.
Размер противогаза | |||||
Количество противогазов |
Рис. 3.3