Предварительная обработка статистических данных

Для ускорения расчетов и предупреждения ошибки необходима предварительная обработка данных, полученных в результате измерений.

Если варианты выборки представлены дробными числами, то целесообразно умножить их на какую-то постоянную величину, чтобы оперировать далее только с целыми числами. Если варианты являются числами и различаются лишь в нескольких последних знаках, то следует отбросить постоянную часть вариант После завершения расчетов необходимо провести с результатом обратные операции Если объем выборки невелик, следует расположить варианты в виде вариационного ряда и пронумеровать их.

Выборочные данные иногда могут содержать резко отклоняющиеся результаты так называемые выскакивающие варианты. Они являются, как правило следствием грубой ошибки в проведении эксперимента или измерения, оставшейся незамеченной. Здесь рассматривается очень быстрый способ выявления выскакивающих вариант, основанный на оценке различий крайних вариант вариационного ряда, который позволяет с достаточной строгостью решить эту задачу.

Пусть имеем выборку объема п, данные которой представлены в виде вариационного ряда x ,x ,…,x ,…,x . Для проверки вариант, относительно которых можно предположить, что они являются выскакивающими, следует вычислить отношения, представленные в табл. П1.

Отношение вычисляется, когда резко отклоняющейся является наибольшая варианта. Отношение вычисляется, когда «подозреваемой»

является наименьшая варианта.

Отношения, представленные во втором и третьем столбцах табл. П1, могут

использоваться в некоторых случаях для повышения эффективности проверки

выскакивающих вариант. Так, отношение позволяет эффективнее

выявлять выскакивающую варианту, когда предполагаются выскакивающими сразу две варианты - наибольшая и наименьшая. Отношение используется дляпроверки наименьшей варианты, когда подозреваемыми являются наибольшая и наименьшая варианты. Отношение служит для проверки наибольшей варианты, когда предполагаются выскакивающими сразу две наибольшие варианты. Отношение вычисляется для проверки наименьшей варианты, когда."подозреваемыми", являются две наименьшие варианты.

Затем нужно сравнить вычисленные значения отношений с соответствующими табличками для данного объема выборки n и уровней значимости α = 0,05;0,01. В общем случае, под уровнем значимости в математической статистике понимают вероятность принятия ошибочного решения. Здесь это вероятность того, что мы ошибочно исключим проверяемую варианту, хотя в действительности она не является грубой ошибкой эксперимента, т. е. фактически эта варианта характерна для изучаемой генеральной совокупности.

Если хотя бы одно из трех вычислительных отношений превышает соответствующее табличное значение, это yже дает право, на безоговорочное исключение крайней варианты. Если каждое из трех вычисленных значений меньше

соответствующего табличного, то проверяемая крайняя варианта не может быть исключена.

Возможно, что вычисленное значение окажется между табличными для уровней значимости 0,05 и 0, 01. В таком случае нет оснований для безоговорочного вывода об исключении крайней варианты. Можно лишь отметить, что велика вероятность грубой ошибки, при получении этой варианты.

Выскакивающую варианту не обходимо исключить из всех последующих операций по статистической обработке.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: