Выявление промахов. Q-тест

 

     В обрабатываемой серии данных должны отсутствовать промахи (с. 8). Поэтому прежде, чем проводить любую обработку данных (начиная с вычисления среднего), следует выяснить, содержит ли она промахи, и если да, то исключить их из рассмотрения. Для выявления промахов служит еще один статистический тест, называемый Q-тестом.

     Алгоритм Q-теста состоит в следующем. Серию данных упорядочивают по возрастанию: x 1 £ x 2 £... £ xn -1 £ xn. В качестве возможного промаха рассматривают одно из крайних значений x 1 или xn - то, которое дальше отстоит от соседнего значения, т.е. для которого больше разность x 2- x 1 либо, соответственно, xn - xn -1. Обозначим эту разность как W 1. Размах всей серии, т.е. разность между максимальным и минимальным значением xn - x 1, обозначим W 0. Тестовой статистикой является отношение

 

 .                                        (26)

 

Эта величина заключена в пределах от 0 до 1. Чем дальше отстоит "подозрительное" значение от основной массы данных, тем выше вероятность того, что это промах - и тем больше, в свою очередь, величина x. Критической величиной служит табличное значение Q-коэффициента Q (P, n) (табл. 3, приложение), зависящее от доверительной вероятности и общего числа данных в серии. Если тестовая статистика превышает критическую величину (x > Q), соответствующее значение считают промахом и из серии данных исключают. После этого следует проверить на наличие промахов оставшиеся данные (с другим значением Q), поскольку промах в серии может быть не один.

     При применении Q-теста вместо стандартной доверительной вероятности, равной 0.95, обычно используют значение P =0.90. Наиболее достоверные результаты получаются при n =5-7. Для серий большего или меньшего размера Q-тест недостаточно надежен.

Пример 5. При спектрофотометрическом анализе раствора органического красителя получены значения оптической плотности, равные 0.376, 0.398, 0.371, 0.366, 0.372 и 0.379. Содержит ли эта серия промахи? Чему равно среднее значение оптической плотности? Охарактеризуйте воспроизводимость измерения оптической плотности данного раствора.

Решение. Располагаем полученные результаты в порядке возрастания:

 

     0.366     0.371     0.372     0.376     0.379     0.398

 

Разность 0.371-0.366 равна 0.005, а 0.398-0.379 – 0.019, поэтому кандидат в промахи - значение 0.398, а W 1=0.019. Размах выборки W 0=0.398-0.366=0.032. Тестовая статистика равна x = 0.019/0.032 = 0.59. Критическая величина Q (P =0.90, n =6) равна 0.56. Таким образом, x > Q, значение 0.398 - промах, его следует исключить.

     Проверяем оставшуюся серию значений: 0.371-0.366=0.005, 0.379-0.376=0.003, поэтому следующий кандидат в промахи - 0.366. Имеем: W 1=0.005, W 0=0.379-0.366=0.013, x = 0.005/0.013 = 0.38, Q (P =0.90, n =5)=0.64; x < Q, значение 0.366 промахом не является.

     Среднее значение оптической плотности составляет

 

     ,

 

а его стандартное отклонение - s (x) = 0.005. Воспроизводимость охарактеризуем относительным стандартным отклонением (с. 9) sr (x)= s (x)/  = 0.005/0.373 = 0.013.

     Обработка серии данных вместе с промахом была бы в этом случае грубой ошибкой и привела бы к серьезному искажению значений  и s (x).

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: