Пример выявления аномальных значений

Таблица 2.6

Номер пробы n Значения х Квантиль t Номер пробы n Значения х Квантиль t
  0,06 -2,07   0,49 0,05
  0,15 -1,57   0,50 0,15
  0,21 -1,30   0,52 0,24
  0,25 -1,10   0,53 0,34
  0,28 -0,94   0,57 0,45
  0,29 -0,80   0,60 0,56
  0,32 -0,67   0,64 0,67
  0,35 -0,56   0,67 0,80
  0,38 -0,45   0,73 0,94
  0,39 -0,34   0,75 1,10
  0,42 -0,24   0,80  
  0,45 -0,15   1,14 1,57
  0,47 -0,05   1,19 2,07

Вначале найдем среднее и дисперсию из всех 26 значений: = 0,502; s2 = 0,06478; s = 0,2545. Далее вычислим среднее и дисперсию из 24 значений, исключив максимальные значения.

Получим смещенные оценки = 0,451; = 0,03577; s = 0,1891. Вычислим нормированные значения исключенных значений: t 25 = (1,14 – 0,451)/0,1891 = 3,64; t 26 = (1,19 – 0,451)/0,1891 = 3,91. Поскольку нормированные значения t 25 > 3 и t 26 > 3, по правилу «трех сигм» оба исключенных значения являются аномальными.

Однако полученный вывод является некорректным, так как он построен на смещенных оценках.

Оценим размер смещения, обусловленный исключением двух максимальных значений. Имеем p = 1 – n / N = 0,923. Вероятности p соответствует квантиль

t = F –1(p) = 1,426. По формуле найдем f (t) = 0,1443, по формуле (2.25) определим нормированное смещение у = 26/24×0,1443 = 0,1563.

Из формулы (2.24) следует (1 – ty –y 2) = 0,03577/(1 – 1,426×0,1563 – 0,15632) = 0,04752; s = 0,218.

Из формулы (2.23) получаем = х смещ + s у = 0,451 + 0,218×0,1563 = 0,485. Полученные оценки приведены в табл.2.7.

Таблица 2.7


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: