Пусть из генеральной совокупности извлечена выборка, причём наблюдалось раз, - раз, и т.д. раз и - объём выборки.
Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в возрастающем порядке, - вариационным рядом. Числа наблюдений называют частотами, а их отношения к объёму выборки - относительными частотами.
Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот. Следует отметить, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике – соответствие между наблюдаемыми вариантами и их частотами.
Пусть - число наблюдений, при которых наблюдалось значение признака, меньшее - объём выборки. Относительная частота события равна. Если изменяется, то, вообще говоря, изменяется и относительная частота, т.е. относительная частота есть функция от. Так как эта функция находится опытным путём, то её называют эмпирической.
|
|
Эмпирической функцией распределения называется функция, определяющая для каждого значения относительную частоту события. Итак
.
В отличие от эмпирической функции распределения выборки функцию распределения генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция определяет вероятность события, а эмпирическая функция определяет относительную частоту этого же события.
Функция обладает следующими свойствами:
• значения функции принадлежат отрезку;
• - неубывающая функция;
• если - наименьшая варианта, то при; если - наибольшая варианта, то при.
Пример 1. Найти эмпирическую функцию по данному распределению выборки:
1 4 6
10 15 25
Р е ш е н и е.. Наименьшая варианта равна 1, поэтому при. Значение, а именно, наблюдалось 10 раз, значит, при. Значение, а именно: и, наблюдалось 10+15=25 раз; следовательно, при. Так как - наибольшая варианта, то при.
Для наглядности строят различные графики статистического распределения и, в частности, полигон и гистограмму.
Полигоном частот называют ломаную линию, отрезки которой соединяют
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки,,...,.
При непрерывном распределении признака весь интервал, в котором заключены все наблюдаемые значения признака, разбивают на ряд частичных интервалов длиной и находят - сумму частот вариант, попавших в i-ый интервал.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины, а высоты равны отношению. Площадь частичного -го прямоугольника равна - сумме частот вариант, попавших в -ый интервал. Площадь гистограммы частот равна сумме всех частот, т.е. объёму выборки. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною (плотность относительной частоты).
|
|
На рис. 3 изображена гистограмма частот по данному распределению выборки объёма.
Частичный интервал | Сумма частот вариант интервала | Плотность частоты |
1 – 5 | 2,5 | |
5 – 9 | ||
9 – 13 | 12,5 | |
13 – 17 | ||
17 – 21 |