Экспериментальный анализ одномерной случайной величины

Пусть имеется набор (выборка) экспериментальных данных х 1, х 2,..., хN. Обработку этих данных для получения эмпирических характеристик одномерной случайной величины производят обычно в такой последовательности.

2.1 Построение вариационного ряда. Вариационный ряд z 1, z 2,..., zN получают из исходных данных путем расположения xm (m = 1, 2,..., N) в порядке возрастания от x min до x max так, чтобы x min = z 1 Ј z 2 Ј... Ј zN = x max.

Пусть, например, имеется 5 наблюдений: х1 = 5; x2 = 2; х3 = 4; х4 = 5; х5 = 7. Тогда им соответствует вариационный ряд z1 = 2; z2 = 4; z3 = 5; z4 = 5; z5 = 7.

2.2 Построение диаграммы накопленных частот , являющейся эмпирическим аналогом интегрального закона распределения. Диаграмму строят в соответствии с формулой

, (1.16)

где m N (х) — число элементов в выборке, для которых значение хj < х. Практически это делается так. На оси абсцисс указывают значения наблюдений xт (или zi). Значение по оси ординат равно нулю левее точки xmin; в точке xmin и далее во всех других точках xт диаграмма имеет скачок, равный 1/ N. Если существует несколько совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный l/ N, где l - число совпадающих точек. Ясно, что для величин х > х max значение диаграммы накопленных частот равно 1. Отметим, что если N ® Ґ, то ® F (x).

2.3 Построение гистограммы выборки. Гистограмма является эмпирическим аналогом функции плотности распределения f (x). Обычно ее строят следующим образом:

1. Находят предварительное количество квантов (интервалов), на которое должна быть разбита ось 0 х. Это количество К определяют с помощью оценочной формулы

K = 1 + 3,2 lg N, (1.17)

где найденное значение округляют до ближайшего целого числа.

2. Определяют длину интервала:

. (1.18)

Величину D х можно несколько округлить для удобства вычислений.

3. Середину области изменения выборки (центр распределения) (х max + х min)/2 принимают за центр некоторого интервала, после чего легко находят границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от х min до x mах.

4. Подсчитывают количество наблюдений Nm, попавшее в каждый квант: Nm равно числу членов вариационного рада, для которых справедливо неравенство

xm Ј zl < xm + D x. (1.19)

Здесь xm и xm + D x — границы m -го интервала. Отметим, что при использовании формулы (1.19) значения zl, попавшие на границу между (m —1)-м и m -м интервалами, относят к m -му интервалу.

5. Подсчитывают относительное количество (относительную частоту) наблюдений Nm/N, попавших в данный квант.

6. Строят гистограмму, представляющую собой ступенчатую кривую, значение которой на m -м интервале (хт, хm + D х)(т = 1, 2,..., К) постоянно и равно Nm/N, или с учетом условия равно Nm/N) D x.

2.4 Определение оценок математического ожидания , дисперсии и среднего квадратического отклонения sx производят по формулам

, (1.20)

, (1.21)

. (1.22)

Отметим, что множитель 1 / (N — 1) (вместо 1 /N)в формуле (1.21) вводится для получения несмещенной оценки дисперсии.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: