Методы исключения грубых погрешностей

Грубая погрешность, или промах – это погрешность резуль­тата отдельного измерения, входящего в ряд измерений, которая для данных условий резко отличается от остальных результатов этого ряда. Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные опе­ратором.

К ним можно отнести:

• неправильный отсчет по шкале измерительного прибора, про­исходящий из-за неверного учета цены малых делений шкалы;

• неправильная запись результата наблюдений, значений от­дельных мер использованного набора, например гирь;

• хаотические изменения параметров питающего СИ напряже­ния, например его амплитуды или частоты.

Корректная статистическая обработка выборки возможна только при ее однородности, т.е. в том случае, когда все ее члены принадлежат к одной и той же генеральной совокупно­сти. В противном случае обработка данных бессмысленна. "Чу­жие" отсчеты по своим значениям могут существенно не отли­чаться от "своих" отсчетов. Их можно обнаружить только по виду гистограмм или дифференциальных законов распределе­ния. Наличие таких аномальных отсчетов принято называть загрязнениями выборки, однако выделить члены выборки, при­надлежащие каждой из генеральных совокупностей, практиче­ски невозможно.

Если «свои» и «чужие» отсчеты различаются по значениям, то их исключают из выборки (рис.6.1,а). Особую неприятность дос­тавляют отсчеты, которые хотя и не входят в компактную группу основной массы отсчетов выборки, но и не удалены от нее на зна­чительное расстояние, – так называемые предполагаемые промахи (рис. 6.1,6).

Рисунок 6.1 – Проявление промахов на дифференциальном законе распределения вероятности

Отбрасывание «слишком» удаленных от центра вы­борки отсчетов называется цензурированием выборки. Это осуще­ствляется с помощью специальных критериев.

При однократных измерениях обнаружить промах не представ­ляется возможным. Для уменьшения вероятности появления про­махов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистиче­ские критерии, предварительно определив, какому виду распреде­ления соответствует результат измерений.

Вопрос о том, содержит ли результат наблюдений грубую погрешность, решается общими методами проверки статистиче­ских гипотез. Проверяемая гипотеза состоит в утверждении, что результат наблюдения хi не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опро­вергнуть выдвинутую гипотезу. Если это удается, то результат наблюдений рассматривают как содержащий грубую погреш­ность и его исключают.

Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.

Критерий «трех сигм» применяется для результатов измере­ний, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q 0,003, маловероятен и его можно считать промахом, если , где Sx – оценка СКО измерений. Величины и Sx вычисляют без учета экстремальных значений хi. Данный критерий надежен при числе измерений n > 20-50.

Это правило обычно считается слишком жестким, поэтому ре­комендуется назначать границу цензурирования в зависимости от объема выборки: при 6 < n 100 она равна 4Sx; при 100 < n 1000 —4,5Sx; при 1000 < n < 10000 — 5Sx. Данное правило также применимо только для нормального закона.

В общем случае границы цензурирования tгр, Sх выборки зави­сят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, при­надлежащих обрабатываемой выборке.

Выра­жение для приближенного расчета коэффициента tгр при уровне значимости q < 1/(n + 1)

где ε – эксцесс распределения.

Данные выражения применимы для:

• кругловершинных двухмодальных распределений с ε = 1,5, 3, являющихся композицией дискретного двузначного и нормального распределений;

• островершинных двухмодальных распределений с ε = 1,5, 6, являющихся композицией дискретного двузначного распределе­ния и распределения Лапласа;

• композиций равномерного и экспоненциальных распределе­ний с показателем степени α = 1/2 при ε = 1,8, 6;

• экспоненциальных распределений с ε = 1,5, 6.

Критерий Романовского применяется, если число измерений n < 20. При этом вычисляется отношение  и срав­нивается с критерием βτ, выбранным по табл. 6.1. Если β > βт, то результат xi считается промахом и отбрасывается.

Пример 6.3. При диагностировании топливной системы автомобиля ре­зультаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по крите­рию Романовского, не является ли он промахом.

Таблица № 6.1

Значения критерия Романовского β = f(n)

q n = 4 n = 6 n = 8 n = 10 n = 12 n = 15 n = 20
0,01 0,02 0,05 0,10 1,73 1,72 1,71 1,69 2,16 2,13 2,10 2,00 2,43 2,37 2,27 2,17 2,62 2,54 2,41 2,29 22,75 2,66 2,52 2,39 2,90 2,80 2,64 2,49 3,08 2,96 2,78 2,62

Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерения. Они соответственно равны 25 и 2,6 л на 100 км.

Поскольку n < 20, то по критерию Романовского при уровне значимо­сти 0,01 и n = 4 табличный коэффициент =1,73. Вычисленное для по­следнего, пятого измерения β = |(25 – 30)|/2,6 = 1,92 > 1,73.

Критерий Романовского свидетельствует о необходимости отбрасыва­ния последнего результата измерения.

Вариационный критерий Диксона удобный и достаточно мощ­ный (с малыми вероятностями ошибок). При его применении получен­ные результаты наблюдений записывают в вариационный возрастаю­щий ряд x1, х2, хn1 < х2 < хn). Критерий Диксона опреде­ляется как . Критическая область для этого критерия Р Д > Zp) = q. Значения Zp приведены в табл. 6.2.

Пример 6.4. Было проведено пять измерений напряжения в электросети. Получены следую­щие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) от­личается от остальных. Прове­рить, не является ля он промахом.

Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона

Таблица 6.2

Значения критерия Диксона

n Zq при q, равном
0,10 0,05 0,02 0,01
  0,68 0,48 0,40 0,35 0,29 0,28 0,26 0,26 0,22 0,76 0,56 0,47 0,41 0,35 0,33 0,31 0,30 0,26 0,85 0,64 0,54 0,48 0,41 0,39 0,37 0,36 0,31 0,89 0,70 0,59 0,53 0,45 0,43 0,41 0,39 0,34

Как следует из табл.6.2, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q = 0,10.

Применение рассмотренных критериев требует осмотрительности и учета объективных условий измерений. Конечно, оператор должен ис­ключить результат наблюдения с явной грубой погрешностью и выпол­нить новое измерение. Но он не имеет права отбрасывать более или менее резко отличающиеся от других результаты наблюдений. В сомни­тельных случаях лучше сделать дополнительные измерения (не взамен сомнительных, а кроме них) и затем привлекать на помощь рассмотрен­ные выше статистические критерии. Кроме рассмотренных критериев, существуют и другие, например критерии Граббса и Шовенэ.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: