Основные понятия математической статистики
Математическая статистика
Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются:
1. определение способов сбора и группировки этих статистических данных;
2. разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.;
б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения.
Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов.
|
|
Генеральная совокупность – все множество имеющихся объектов.
Выборка – набор объектов, случайно отобранных из генеральной совокупности.
Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.
Выборка из генеральной совокупности должна обладать свойствами:
1) каждый элемент выбран случайно;
2) все имеют одинаковую вероятность попасть в выборку;
3) n должно быть настолько велико, насколько позволяет решать задачу с требуемым качеством, т.е. выборка должна быть репрезентативной.
Принято считать, что при п > 60 выборка большая, или репрезентативная, а при п < 60 - малая. Такое деление выборки на большую и малую условно. Разные авторы используют разное пограничное л, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи.
Понятие репрезентативная выборка не всегда можно связать с ее объемом п. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоемкости и стоимости получения наблюдений или измерений для формирования выборки..
Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое количество его экземпляров. Доступного для исследования оборудования может быть еще меньше. Поэтому выборка объемом n, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно малой (п < 60).
|
|
Пример. Количество зарегистрированных малых предприятий торговли продуктами питания в городе Новосибирске равно 2436. Для исследования предприятий по объему товарооборота взято 136 предприятий. В данном случае N =2436 - объем генеральной совокупности (все мыслимые предприятия данной категории), п =136 - объем выборки из генеральной совокупности.
Виды выборки:
Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;
Бесповторная – отобранный объект в генеральную совокупность не возвращается.
Пусть интересующая нас случайная величина Х принимает в выборке значение х 1 п 1 раз, х 2 – п 2 раз, …, хк – пк раз, причем , где п – объем выборки. Тогда наблюдаемые значения случайной величины х 1, х 2,…, хк называют вариантами, а п 1, п 2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты (частости)
Очевидно, что сумма частот равна объему выборки (выборочной совокупности) n, а сумма относительных частот (частостей) равна единице:
.
Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом:
xi | x 1 | x 2 | … | xk |
ni | n 1 | n 2 | … | nk |
wi | w 1 | w 2 | … | wk |