Оценка дисперсии и исключение выскакивающих значений

Оценка дисперсии (S2) и средне-квадратичного отклонения (S) производится по формулам:

 

S2 =

 

где Ci - фактическое значение случайной величины (стоимости 1 м2 в выборке);

Сср - среднее значение случайной величины.

После определения дисперсии необходимо исключить из выборки крайние (слева и справа) «выскакивающие» значения и заново рассчитать параметры выборки. При этом используется «правило трех сигм»: исключаются значения, лежащие за пределами доверительного интервала в +/- 3 средне-квадратичных отклонения (доверительная вероятность 0,98) или более жесткое «правило двух сигм» (доверительная вероятность 0,95).

Оценка погрешности в определении средних

Среднее значение случайной величины по данным репрезентативной выборки всегда рассчитывается с погрешностью, величина которой зависит от двух факторов: собственного разброса значений в выборке и объема выборки. При доверительной вероятности 0,95 (две сигмы) погрешность равна:

 

D = +/- (2S / √n)

Наличие данных о погрешности в определении средних цен позволяет при сравнении двух выборок (например по двум различным районам или за два месяца) использовать следующее правило: выборки считаются различающимися незначимо если разность их средних меньше суммы половины погрешностей.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: