Математическая статистика (МС) – прикладной раздел теории вероятностей (ТВ). Поэтому предмет изучения у них общий. ТВ и МС изучают закономерности в случайных явлениях (процессах). Вместе с тем ТВ изучает непосредственно не сами реальные случайные явления окружающего мира, а их абстрактные математические модели. При этом в задачах ТВ предполагается, что вероятностное пространство заранее задано. Однако в практических задачах в большинстве своем положение совершенно иное: как правило, априори законы распределения неизвестны. Единственное, что мы можем сделать при изучении случайных явлений – это ставить эксперименты (опыты) и производить наблюдения за случайными явлениями. Именно МС работает с экспериментальными данными и помогает восстановить строение вероятностного пространства, на основе чего строится вероятностная модель, адекватная реальному случайному явлению. Итак, в узком смысле МС изучает методы обработки экспериментальных данных с целью получения достоверной информации об интересующем исследователя случайном явлении (процессе). МС обеспечивает ТВ необходимой информацией для построения адекватной реальному процессу вероятностной модели, с помощью которой ТВ не только выявляет объективные закономерности, но и помогает осуществлять научный прогноз в своеобразной области случайных явлений.
|
|
Перечислим основные задачи МС:
1) первичная обработка результатов наблюдений (эксперимента);
2) проверка статистических гипотез;
3) статистические оценки параметров распределения;
4) исследование статистических зависимостей (связей).
Генеральная совокупность – множество всех объектов (субъектов), подлежащих изучению.
Выборочная совокупность (выборка) – ограниченное подмножество объектов, отобранных из генеральной совокупности.
Примем следующие обозачения:
N – объем генеральной совокупности (т.е. число объектов этой совокупности);
n – объем выборки.
Понятно, что объем выборки значительно меньше объема генеральной совокупности (n N).
Суть выборочного метода статистического исследования некоторого признака C генеральной совокупности состоит в том, что по результатам обследования объектов выборки требуется сделать объективное заключение о признаке C всей генеральной совокупности. Но для этого выборка должна правильно представлять генеральную совокупность. Поэтому к выборке должны быть предъявлены определенные требования (они будут проясняться по мере развития необходимого аппарата). Здесь же мы отметим только основной принцип формирования выборки – принцип случайного отбора: выборка должна быть организована таким образом, чтобы каждый объект генеральной совокупности имел одинаковые шансы попасть в эту выборку.
|
|
Пусть из генеральной совокупности объема N для изучения некоторого признака (случайной величины) Cизвлечена выборка объема n и в результате проведенного обследования объектов выборки обнаружилось, что значение признака Cнаблюдалось , – ,…, – раз. Очевидно, . Расположим все наблюдаемые значения признака C в неубывающем порядке:
.
Вариационным рядом называется последовательность наблюдаемых значений признака C, расположенных в неубывающем порядке:
.
Каждое значение вариационного ряда называется вариантой.
Числа наблюдений различных вариант называются частотами этих вариант, а отношения (где n – объем выборки) называются относительными частотами соответствующих вариант и обозначаются через . Итак, .
Заметим, что , т.е. сумма относительных частот вариант равна 1.
Статистическим рядом называется таблица следующего вида:
… | |||||
… |
В первой строке таблицы записываются различные варианты, а во второй – соответствующие им частоты. Здесь (наименьшая варианта), (наибольшая варианта). Разность обычно обозначают через R и называют размахом выборки: .
Выборочный ряд распределения задается с помощью следующей таблицы:
… | |||||
… |
В ней указывается соответствие между наблюдаемыми вариантами и их относительными частотами . Отметим, что выборочный ряд распределения является аналогом ряда распределения дискретной случайной величины.
Полигоном частот называется графическое изображение статистического ряда (рис.1).
Рисунок 1 – Полигон частот
По оси абсцисс откладываются различные варианты , а по оси ординат соответствующие им частоты . Ломаная линия, соединяющая точки , является полигоном частот.
Полигон относительных частот – графическое представление выборочного ряда распределения (рис.2).
Рисунок 2 - Полигон относительных частот
Заметим, что полигон относительных частот является аналогом многоугольника распределения дискретной случайной величины.
Эмпирическая функция распределения
Эмпирической функцией распределения признака Cназывается функция , значением которой при каждом фиксированном значении аргумента x является относительная частота события , т.е. функция вида
,
где – число вариант, меньших рассматриваемого значения аргумента x (причем здесь каждая варианта считается столько раз, сколько она наблюдалась);
n – объем выборки.
Свойства аналогичны свойствам теоретической функции распределения и вытекают непосредственно из определения :
1. Значения эмпирической функции распределения заключены между 0 и 1: ;
2. есть неубывающая функция;
3. =0 при ( – наименьшая варианта),
=1 при ( – наибольшая варианта).
Общий вид графика эмпирической функции распределения приведен на рис.3.
Рисунок 3 - Общий вид графика эмпирической фукции распределеия
Заметим, что эмпирическая функция распределения служит в качестве подходящего приближенного описания теоретической функции распределения изучаемого признака C генеральной совокупности.