Описательная статистика. Основы математической статистики

Основы математической статистики

Гипергеометрическое распределение

Распределение Фишера

Распределение Стьюдента

Пусть Х – случайная величина, имеющая стандартное нормальное распределение N(0, 1), а Y - случайная величина, распределенная по закону хи – квадрат с k степенями свободы. Распределение величины

называется распределением Стьюдента с k степенями свободы. График кривой распределения Стьюдента показан на рисунке.

Рисунок – Кривые распределения Стьюдента

Квантили распределения Стьюдента tp(k) табулированы. Например, t0,99(12) = 2, 681. Кривая распределения Стьюдента, как и кривая стандартного нормального распределения, симметрична относительно оси ординат

t1-p(k) = - tp(k)

Пусть Y1 – случайная величина, распределенная по закону хи – квадрат с k1 степенями свободы, а Y2 – случайная величина, также распределенная по закону хи – квадрат, но с k2 степенями свободы. Тогда распределение величины

Называется распределением Фишера с k1 степенью свободы в числителе и с k2 - в знаменателе. График кривых распределения Фишера показан на рисунке. Квантили распределения Фишера Fp(k1 , k2) табулированы. Например, F0,95(5,10) = 3,33.

Рисунок – Кривая распределения Фишера

Определение. Дискретная случайная величина X имеет гипергеометрическое распределение с параметрами п, М, N, если она принимает значения 0, 1, 2, m,..., min (n, М) с вероятно­стями

где M N, n≤N; п, М, N — натуральные числа.

Гипергеометрическое распределение имеет случайная вели­чина Х=т — число объектов, обладающих заданным свойством, среди п объектов, случайно извлеченных (без возврата) из сово­купности N объектов, М из которых обладают этим свойством.

Теорема. Математическое ожидание случайной величины Х, имеющей гипергеометрическое распределение с параметрами п, М, N, есть

а ее дисперсия

Случайную величину Х=m, распределенную по биномиаль­ному закону, можно интерпретировать как число т объек­тов, обладающих данным свойством, из общего числа п объек­тов, случайно извлеченных из некоторой воображаемой бес­конечной совокупности, доля р объектов которой облада­ет этим свойством. Поэтому гипергеометрическое распределение можно рассматривать как модификацию биномиального распреде­ления для случая конечной совокупности, состоящей из N объектов, М из которых обладают этим свойством.

Предположим, что имеется большая партия деталей, и надо дать заключение о том, соответствует ли контролируемый размер X техническим требованиям. Можно провести сплошное обследование – проверить размер каждой детали. Такой подход требует слишком больших материальных затрат. Другой, альтернативный подход к решению задачи – отобрать из всей партии сравнительно небольшое число деталей и изучить их характеристики.

Совокупность отобранных объектов называется выборкой, а количество отобранных объектов – объемом выборки. Все множество объектов, из которых производится выборка, называется генеральной совокупностью. Контролируемая случайная величина X на генеральной совокупности имеет некоторую функцию распределения F(x), плотность распределения f(x), математическое ожидание m, дисперсию σ2 и другие характеристики, значения которых неизвестны.

Основная задача статистики – по результатам исследования выборки дать заключение о характеристиках генеральной совокупности.

Для получения достоверных результатов выборка должна правильно отражать пропорции генеральной совокупности, т.е. быть репрезентативной. Очевидно, если партия деталей изготовлена рабочими разной квалификации, а в выборку попали лишь детали, изготовленные рабочими с более высокой квалификацией, вряд ли можно ожидать правильные данные для всей партии деталей. Можно показать, что выборка репрезентативна, если она отобрана из генеральной совокупности случайным образом. На практике такой отбор не всегда легко осуществим, поэтому используют различные способы отбора, обеспечивающие случайность в большей или меньшей степени.

В описательной статистике рассматриваются методы представления выборочных данных, в первую очередь, в табличной и графической форме. Часть из рассмотренных выше простых инструментов качества, такие, как контрольные листки, гистограмма качества, диаграмма рассеяния, представляют собой именно такие методы. Ниже рассматриваются некоторые методы описательной статистики, наиболее важные с точки зрения теоретических основ статистических методов.

Результаты наблюдений контролируемого параметра в выборке записываются в порядке их регистрации x1, x2, …, xn; n – объем выборки. Вариационным называется ряд, составленный из элементов выборки в порядке их возрастания: x(1) ≤ x(2) ≤ … ≤ x(n). При этом минимальный элемент выборки xmin = x(1), максимальный элемент xmax = x(n). Разность между максимальным и минимальным элементами выборки называется размахом:

R = xmax - xmin

При достаточно большом объеме выборки данные группируют – разбивают на интервалы, как правило, одинаковой длины. Количество интервалов k выбирается в зависимости от объема выборки, обычно от 8 до 20 интервалов. Иногда используется эмпирическая формула

k = 1 + 3,32 lg n.

Длина интервала

ω = R / k.

Количество ni элементов выборки, попавших в i – интервал (i = 1, 2, …, k), называется частотой. Результаты расчета сводят в таблицу частот, в которой показывают границы интервалов, середины zi каждого интервала, частоты, относительные частоты ni / n, накопленные относительные частоты ∑ ni / n, деленные на длину интервала ni ω/ n. Эти данные используются для графического представления выборки.

Выборочным распределением называется распределение дискретной случайной величины, принимающей значения x1, x2, …, xn с вероятностями 1 / n. График выборочной функции распределения F(x) строится по значениям накопленных относительных частот. Можно показать, что при большом объеме выборки выборочная функция распределения является приближенной оценкой функции распределения F(x) генеральной совокупности.

Рисунок – График выборочной функции распределения

Числовые характеристики выборочного распределения определяются по аналогии с числовыми характеристиками дискретной случайной величины с учетом того, что вероятности pi = 1/n. Выборочное среднее (математическое ожидание выборки)

выборочная мода Mo* - элемент выборки, встречающийся с наибольшей частотой;выборочная медиана Me* - число, которое делит вариационный ряд на две части, содержащие одинаковое количество элементов; если объем выборки нечетен n = 2t + 1, то Me* = x(t+1); при n = 2t Me* = 0,5(x(t) + x(t+1) );

выборочная дисперсия

выборочное стандартное отклонение

выборочный коэффициент асимметрии

здесь

выборочный центральный момент k – го порядка;

выборочный коэффициент эксцесса

Пример

По результатам контроля выборки из партии штампованных деталей получены следующие значения длины в мм: 200, 198, 201, 203, 203, 204, 196, 200, 203, 198, 199, 197, 197, 199, 199, 196, 199, 200, 201, 200, 200, 200, 203, 200, 200, 199, 204, 202, 205, 199. Построить таблицу частот, разбив данные на 6 интервалов, график выборочной функции распределения и гистограмму частот. Вычислить выборочное среднее, медиану, дисперсию и стандартное отклонение.

Строим вариационный ряд: 196, 196, 197, 197, 198, 198, 199, 199, 199, 199, 199, 199, 200, 200, 200, 200, 200, 200, 200, 200, 201, 201, 202, 203, 203, 203, 203, 204, 204, 205.

Минимальное значение ряда 196, максимальное 205, размах выборки R = 205 - 196 = 9, длина интервала ω = 9/6 = 1,5.

При построении таблицы частот в качестве нижней границы первого интервала принято минимальное значение выборки. При подсчете частот в случае совпадения элемента выборки с верхней границей соответствующий элемент учитывался в данном интервале.

Таблица – Таблица частот

№ п/п Границы zi ni ni/n ∑ ni/n ni/ωn
  196-197,5 196,75   0,133 0,133 0,089
  197,5-199 198,25   0,267 0,400 0,178
  199-200,5 199,75   0,267 0,667 0,178
  200,5-202 201,75   0,100 0,767 0,067
  202-203,5 202,75   0,133 0,900 0,089
  203,5-205 204,25   0,100   0,067

Находим числовые характеристики. Выборочное среднее:

выборочная медиана:

Me* = 200 (средняя между 15-м и 16-м элементами вариационного ряда);

выборочная дисперсия:

выборочное стандартное отклонение:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: