Лекция 2. Теория оценивания параметров и выборочные распределения

Как было отмечено ранее, в реальных выборках оценка параметров распределения проводится на основе имеющейся совокупности. Необходимым условием является условие массовости, т.е. выборка не менее 100 значений (в реальных выборках бывает достаточно обычно 60 значений, а если меньше то и меньше достоверность). Для нормального закона основными точечными характеристиками функции распределения являются:

1. Центр распределения называемый математическим ожиданием, которыйсоответствует среднему арифметическому выборки

limx®¥åxi/n = Xcp ®Mx (2.1) - условие закона больших чисел)

2. Д исперсия s2, которойсоответствует ее оценка - выборочная дисперсия

S2=(xi - Xcp)2 /n (2.2).

Для реальных выборок малого объема параметры распределения неустойчивы и большое значение приобретает такой параметр, как объем выборки.

Известно, что средние значения для выборок одинаковой длины (из n. - значений) взятые из одной совокупности распределены нормально (при n® ¥ F(t) ® N (Mx, s). Это условие сходимости называется центральной предельной теоремой. Это распределение выборочного среднего (t - распределение) или Стьюдента имеет параметры: первый - степень свободы n=n-1, второй параметр - t

t =(xcp i - Xcp)/s/Ön, (2.3)

где Хср - среднее значение совокупности /объединенная выборка по значениям n - где n =(n1 +n2 +...+ ni +), s - дисперсия совокупности/. Значения t – распределенияразличной вероятности табулированы для разного объема выборок и приведены в справочниках.

Отсюда доверительный интервал изменения среднего значения выборки объема n - (l) может быть определен как

l=Хср ± ta S/Ön (2.4) - где a - уровень значимости соответствует вероятности ошибки попадания среднего значения в заданный интервал.

Например, для 95% вероятности соответственно a= 0.025 и 0.975, что составляет - 5% вероятность ошибки попадания среднего Хср в интервал для выборки объема n, с оцененным выборочным параметром дисперсии - S2. При n = 30 - ta=0.025, 0.975= 2.04; n® ¥ - ta=0.025, 0.975= 1.96 ( см. таблицу распределения Стьюдента). Распределение Стьюдента может быть использовано для определения интервала группировки при построении гистограмм для выборки заданного объема. В то же время, можно определить объем выборки при заданном интервале группировки относительно среднего значения, при этом за величину ta берется теоретическое значение распределения Стьюдента при n® ¥ (условие, когда распределение Стьюдента стремится к нормальному распределению) с 95% вероятностью (с ошибкой 5% - ta=0.025, 0.975= 1.96): D= ta S/Ön;, где D - интервал разбиения

Аналогично рассматривается распределение выборочной дисперсии. Для нормально распределенной совокупности с известным средним значением оцениваются выборочные дисперсии для выборок разного объема. Распределение выборочной оценки Si2 для дисперсии совокупности S2 соответствует распределению c2 (распределение Пирсона)с n-1 степенями свободы: (n-1)Si2 / S2 = c2.

Отсюда доверительный интервал для дисперсии совокупности S2 исходя из распределения c2 при уровне значимости a: - (n-1)Si2 / c21- a (n-1) < S2 <= (n-1)Si2 / c2 a (n-1). (2.4);

Табличные значения распределения Пирсона - c2 a для заданной вероятности ошибки a, и объема выборки n-1) приведены в справочниках. по статистике. Распределение Пирсона очень чувствительно к условию нормальности и применяется при проверке выборочного распределения на нормальность.

Таким образом, для любой выборки с нормальным распределением (это условие проверяется, прежде всего, при предварительном анализе данных), можно оценить основные выборочные параметры по формулам (2.1 – 2.4): среднее, дисперсия и доверительные интервалы среднего и дисперсии.

Другие выборочные параметры нормального распределения мода и медиана находятся на основе построения и анализа гистограммы. Если выборочная медиана (серединное значение ранжированной по значениям выборки) и выборочная мода (наиболее распространенное значение) совпадают со средним значением, или достаточно мало отличаются, то это условие может служить предварительной оценкой гипотезы нормального распределения исследуемой выборки.

Выборные оценки асимметрии и эксцесса также могут рассматриваться в качестве предварительных оценок нормальности распределения выборки. Выборочный коэффициент асимметрии определяется как: Cs=å(xi - Хср)3 /s 3»0 ипри нормальном распределении выборки должен примерно соответствовать 0. Выборочная характеристика эксцесса: Е = å(xi - Хср)4 /s 4» 3 и не должна превышать значения 3 при нормальном распределении выборки.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: