Оценка дисперсии (S2) и средне-квадратичного отклонения (S) производится по формулам:
S2 =
где Ci - фактическое значение случайной величины (стоимости 1 м2 в выборке);
Сср - среднее значение случайной величины.
После определения дисперсии необходимо исключить из выборки крайние (слева и справа) «выскакивающие» значения и заново рассчитать параметры выборки. При этом используется «правило трех сигм»: исключаются значения, лежащие за пределами доверительного интервала в +/- 3 средне-квадратичных отклонения (доверительная вероятность 0,98) или более жесткое «правило двух сигм» (доверительная вероятность 0,95).
Оценка погрешности в определении средних
Среднее значение случайной величины по данным репрезентативной выборки всегда рассчитывается с погрешностью, величина которой зависит от двух факторов: собственного разброса значений в выборке и объема выборки. При доверительной вероятности 0,95 (две сигмы) погрешность равна:
D = +/- (2S / √n)
Наличие данных о погрешности в определении средних цен позволяет при сравнении двух выборок (например по двум различным районам или за два месяца) использовать следующее правило: выборки считаются различающимися незначимо если разность их средних меньше суммы половины погрешностей.