Характеристики распределения случайных величин

Для изучения распределений случайных величин в математической статистике пользуются рядом числовых характеристик, определяющих положение центра группирования случайной величины и ее рассеивание около этого центра.

Числовые характеристики положения центра группирования носят общее название мер положения, а числовые характеристики рассеивания — мер рассеивания.

В качестве статистических оценок мер положения используются при теоретическом распределении: математическое ожидание E(Х); при эмпирическом распределении: среднее арифметическое значение , среднее арифметическое взвешенное , среднее гармоническое , среднее геометрическое , среднее геометрическое взвешенное , среднее квадратическое , среднее квадратическое взвешенное , середина размаха, медиана и мода .

В качестве статистических оценок мер рассеивания используются при теоретическом распределении: дисперсия, коэффициент вариации, квантиль; при эмпирическом распределении: стандартное отклонение и размах.

Математическим ожиданием E(Х) дискретной случайной величины Х называется сумма произведений возможных ее значений на соответствующие вероятности:

,

где n — число возможных значений случайной величины Х.

Математическое ожидание E(Х) непрерывной случайной величины Х, имеющей плотность вероятности f(Х), рассчитывается как

,

если интеграл сходится абсолютно.

Пример. Случайная величина имеет следующее распределение

Таблица. Распределение случайной величины

X          
р(X) 0,1 0,2 0,5 0,2

Математическое ожидание E(X) равно

E(X) = 0∙0,1 + 1∙0,2 + 2∙0,5 + 3∙0,2 = 1,8

Математическое ожидание непрерывной случайной величины определяется значительно сложнее с использованием интегрального исчисления.

Cреднее арифметическое значение , среднее гармоническое , среднее геометрическое , и среднее квадратическое можно рассчитать по формуле среднего степенного

,

где z – показатель степени, позволяющий определить вид среднего;

n — общее число значений Xi.

Cреднее арифметическое взвешенное , среднее геометрическое взвешенное , среднее квадратическое взвешенное можно рассчитать по формуле среднего взвешенного

,

где z – показатель степени, позволяющий определить вид среднего;

fi — частота значений Xi;

n — общее число значений Xi.

Средним арифметическим значением случайной величины называется отношение суммы всех значений случайной величины, полученных в результате конечного числа испытаний, к числу испытаний (согласно СТБ ГОСТ Р 50779.10 среднее арифметическое – сумма значений, деленная на их число):

Среднее арифметическое получают путем подстановки в формулу среднего степенного показателя степени z, равного 1.

Вышеприведенные формулы справедливы при контроле показателей по количественному признаку.

При контроле показателя по альтернативному признаку оцениваемый показатель может принимать только два взаимоисключающих значения, которым сопоставляются два количественных значения: 1 и 0.Частостью варианта 1 (как правило, обозначается p) является доля единиц, обладающих данным признаком в общей статистической совокупности. Разность 1 – p = q является частостью варианта 0. Таким образом, среднее арифметическое при контроле по альтернативному признаку вычисляется как:

.

Среднимарифметическим взвешенным значением случайной величины называется сумма произведений значений случайной величины на их частости (согласно СТБ ГОСТ Р 50779.10 взвешенноесреднее арифметическое – сумма произведений каждого значения на его вес, деленная на сумму весов, где веса – неотрицательные коэффициенты, связанные с каждым значением):

,

где fi — частота значений Xi;

n — общее число значений Xi.

m — число дискретных значений Xi.

Для непрерывных случайных величин в качестве Хi принимают середину равных интервалов, на которые разбивается ряд значений Х.

Среднее арифметическое взвешенное получают путем подстановки в формулу среднего взвешенного показателя степени z, равного 1.

Довольно часто под средним арифметическим подразумевают среднее арифметическое взвешенное значение.

Среднее гармоническое рассчитывают как

Среднее гармоническое получают путем подстановки в формулу среднего степенного показателя степени z, равного -1.

Средним геометрическим называют корень n-ой степени из произведения значений случайной величины:

Среднее геометрическое получают путем подстановки в формулу среднего степенного показателя степени z, равного 0.

Среднее геометрическоевзвешенное рассчитывают как

Среднее геометрическое используется для анализа динамики явлений и позволяет определить средний коэффициент роста. При расчете среднего геометрического индивидуальные значения случайной величины представляют собой относительные показатели динамики, полученные как отношения каждого уровня ряда к предыдущему уровню.

Среднее геометрическое взвешенное получают путем подстановки в формулу среднего взвешенного показателя степени z, равного 0.

Средним квадратическим называют корень n-ой степени из произведения значений случайной величины:

Среднее квадратическое получают путем подстановки в формулу среднего степенного показателя степени z, равного 2.

Среднее квадратическое взвешенное рассчитывают как

Среднее квадратическое и среднее квадратическое взвешенное применяются при изучении вариации наблюдаемой величины.

Среднее квадратическое взвешенное получают путем подстановки в формулу среднего взвешенного показателя степени z, равного 2.

Согласно правилу мажорантности средних А.Я.Боярского для единой статистической совокупности среднее арифметическое , среднее гармоническое , среднее геометрическое , и среднее квадратическое связаны между собой следующей зависимостью:

< < <

Таким образом, численные значения средних возрастают с ростом показателя степени z.

Серединой размаха называют полусумму наибольшего и наименьшего значений (согласно СТБ ГОСТ Р 50779.10 середина размаха – это среднее арифметическое между наибольшим и наименьшим наблюденными значениями количественного признака).

Если n значений измеряемой величины расположить в порядке их возрастания, то значение, находящееся в самом центре, называют медианой (согласно СТБ ГОСТ Р 50779.10 медиана – это квантиль порядка р = 0,5). Если n является нечетным числом, медианой будет значение, которое находится на 1/2(n +1) месте.

Пример. Со станка взято 5 деталей с размерами, в мм: 32,10; 32,05; 31,98; 32,08; 32,03. Расположим полученные размеры в порядке возрастания, в мм: 31,98; 32,03; 32,05; 32,08; 32,10. Так как n = 5, то в качестве медианы берут число, занимающее 1/2(5+1) = 3 место, = 32,05 мм.

Если n является четным числом, то медианой будет значение, являющееся средним арифметическим из двух соседних значений, находящихся в центре последовательности и занимающих соответственно серединное положение.

Например, если взять 4 детали с размерами, в мм: 32,10; 32,05; 31,98; 32,08 и расположить в порядке возрастания, в мм: 31,98; 32,05; 32,08; 32,10, то

= (Х2 + Х3)/2 = (32,05 + 32,08)/2 = 32,065 мм

Модой называется наиболее часто встречающееся значение в статистической совокупности (согласно СТБ ГОСТ Р 50779.10 мода – это значение случайной величины, при котором функция распределения вероятностей масс или плотность распределения вероятностей имеет максимум).

Для эмпирических распределений дискретной случайной величины мода находится непосредственно по классическому определению. Для эмпирических распределений непрерывной случайной величины сначала определяют модальный интервал hk = xk – xk-1, которому соответствует максимальная частота fk. Значение моды внутри модального интервала определяют по интерполяционной формуле Р.М.Орженцкого:

,

где xk-1 – нижняя граница модального интервала;

hk – длина модального интервала;

- частота интервала, соответственно предшествующего модальному, модальному и следующему за модальным.

Математическое ожидание обычно используется в качестве меры положения для теоретических распределений, в которых возможные значения Х оцениваются при помощи вероятностей. В эмпирических распределениях, где наблюдаемые значения Х оцениваются при помощи частот или частостей, в качестве меры положения используется среднее арифметическое, среднее арифметическое взвешенное, среднее гармоническое, среднее геометрическое, среднее геометрическое взвешенное, среднее квадратическое, среднее квадратическое взвешенное, середина размаха, медиана и мода.

Дисперсией дискретной случайной величины называется сумма произведений квадратов отклонений случайной величины Х от ее математического ожидания на соответствующие вероятности

Дисперсия непрерывной случайной величины, имеющей плотность вероятности p(Х), рассчитывается как

,

если этот интеграл сходится.

Эта величина применяется в качестве меры рассеивания теоретического распределения, а для эмпирического распределения используется аналогичная величина σ2, которая определяется как сумма произведений квадратов отклонений значений случайной величины Хi от ее среднего арифметического значения Х на соответствующее частости fi/(n- 1 ). Тогда σ2 при различных случаях определяется из следующих зависимостей

Вышеприведенные формулы справедливы при контроле показателей по количественному признаку.

При контроле показателя по альтернативному признаку оцениваемый показатель может принимать только два взаимоисключающих значения, которым сопоставляются два количественных значения: 1 и 0.Частостью варианта 1 (как правило, обозначается p) является доля единиц, обладающих данным признаком в общей статистической совокупности. Разность 1 – p = q является частостью варианта 0. Таким образом, дисперсия эмпирического распределения при контроле по альтернативному признаку вычисляется как:

.

Таким образом, дисперсия эмпирического распределения случайной величины, контролируемой по альтернативному признаку, равна произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих этим признаком.

Дисперсия эмпирического распределения случайной величины, контролируемой по альтернативному признаку, принимает наибольшее значение pq = 0,25 при условии равнозначности p и q, то есть когда p = q = 0,5.

На практике используют не саму дисперсию, а квадратный корень из нее, называемый стандартнымотклонением (средним квадратическим отклонением).

Размерность σ совпадает с размерностью самой случайной величины Х.

Коэффициентом вариации называют отношение стандартного отклонения случайной величины к ее математическому ожиданию

Квантилем z случайной величины Х называется такое значение случайной величины, которому соответствует значение интегральной функции распределения, равное z. (согласно СТБ ГОСТ Р 50779.10 квантиль – это значение случайной величины Хр, для которого функция распреде­ления принимает значение р (0 < р < 1) или ее значение изменяется скачком от меньшего р до превышающего р).

Размахом называется разность между наибольшим и наименьшим наблюдаемыми значениями случайной величины.

R = Xmax - Xmin

Размахом пользуются как мерой рассеивания в эмпирических распределениях при малом числе наблюдений (когда n ≤ 10).

Дл более подробного описания особенностей распределения П.Л.Чебышевым были предложены начальный и центральный моменты n-го порядка.

Начальный момент n-го порядка определяется как

Центральный момент n-го порядка определяется как


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: