Пусть имеется набор (выборка) экспериментальных данных х 1, х 2,..., хN. Обработку этих данных для получения эмпирических характеристик одномерной случайной величины производят обычно в такой последовательности.
2.1 Построение вариационного ряда. Вариационный ряд z 1, z 2,..., zN получают из исходных данных путем расположения xm (m = 1, 2,..., N) в порядке возрастания от x min до x max так, чтобы x min = z 1 Ј z 2 Ј... Ј zN = x max.
Пусть, например, имеется 5 наблюдений: х1 = 5; x2 = 2; х3 = 4; х4 = 5; х5 = 7. Тогда им соответствует вариационный ряд z1 = 2; z2 = 4; z3 = 5; z4 = 5; z5 = 7.
2.2 Построение диаграммы накопленных частот , являющейся эмпирическим аналогом интегрального закона распределения. Диаграмму строят в соответствии с формулой
, (1.16)
где m N (х) — число элементов в выборке, для которых значение хj < х. Практически это делается так. На оси абсцисс указывают значения наблюдений xт (или zi). Значение по оси ординат равно нулю левее точки xmin; в точке xmin и далее во всех других точках xт диаграмма имеет скачок, равный 1/ N. Если существует несколько совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный l/ N, где l - число совпадающих точек. Ясно, что для величин х > х max значение диаграммы накопленных частот равно 1. Отметим, что если N ® Ґ, то ® F (x).
|
|
2.3 Построение гистограммы выборки. Гистограмма является эмпирическим аналогом функции плотности распределения f (x). Обычно ее строят следующим образом:
1. Находят предварительное количество квантов (интервалов), на которое должна быть разбита ось 0 х. Это количество К определяют с помощью оценочной формулы
K = 1 + 3,2 lg N, (1.17)
где найденное значение округляют до ближайшего целого числа.
2. Определяют длину интервала:
. (1.18)
Величину D х можно несколько округлить для удобства вычислений.
3. Середину области изменения выборки (центр распределения) (х max + х min)/2 принимают за центр некоторого интервала, после чего легко находят границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от х min до x mах.
4. Подсчитывают количество наблюдений Nm, попавшее в каждый квант: Nm равно числу членов вариационного рада, для которых справедливо неравенство
xm Ј zl < xm + D x. (1.19)
Здесь xm и xm + D x — границы m -го интервала. Отметим, что при использовании формулы (1.19) значения zl, попавшие на границу между (m —1)-м и m -м интервалами, относят к m -му интервалу.
5. Подсчитывают относительное количество (относительную частоту) наблюдений Nm/N, попавших в данный квант.
6. Строят гистограмму, представляющую собой ступенчатую кривую, значение которой на m -м интервале (хт, хm + D х)(т = 1, 2,..., К) постоянно и равно Nm/N, или с учетом условия равно Nm/N) D x.
|
|
2.4 Определение оценок математического ожидания , дисперсии и среднего квадратического отклонения sx производят по формулам
, (1.20)
, (1.21)
. (1.22)
Отметим, что множитель 1 / (N — 1) (вместо 1 /N)в формуле (1.21) вводится для получения несмещенной оценки дисперсии.