double arrow

Выборочный метод, теоретические основы. Понятие о вероятности, репрезентативности, ошибке репрезентативности

Статистическим наблюдением можно охватить все члены изучаемой совокупности или ограничиться обследованием лишь некоторой их части. В первом случае наблюдение будет сплошным, во втором – частичным или выборочным. Несмотря на получение исчерпывающей информации в результате проведения сплошных исследований, к ним прибегают редко, так как эта работа может быть сопряжена с большими материальными, временными и трудовыми затратами, а также с практической невозможностью и нецелесообразностью.

Любое подмножество объектов генеральной совокупности называют выборочной совокупностью или выборкой - вариационным рядом, если все элементы упорядочены по возрастанию. Элементы вариационного ряда называют вариантами. Суть выборки состоит в том, что она, являясь частью генеральной совокупности, в определенной мере может характеризовать саму генеральную совокупность, т.е., обследуя часть объектов, можно сделать выводы обо всем их множестве.

Как правило, генеральная совокупность имеет достаточно большое, а в идеале и бесконечное количество элементов. Чем больше объем выборки, тем более полно она представляет генеральную совокупность.

В статистике под репрезентативностью понимают главное свойство выборочной совокупности, состоящее в близости ее характеристик к соответствующим характеристикам генеральной совокупности.

Различают качественную и количественную репрезентативность.

Качественная репрезентативность - обозначает структурное соответствие выборочной и генеральной совокупностей.

Количественная репрезентативность определяется числом наблюдений, гарантирующих получение статистически достоверных данных. Чем больше наблюдений, тем результаты достоверней.

Элементы выборки обычно распределяются в совокупности в соответствии с каким-то частотным законом (биноминальное, пуассоновское, нормальное распределение и др.).

Нормальное распределение (распределение Гаусса) – используется для приближённого описания явлений, которые носят вероятностный, случайный характер, когда на исследуемый процесс оказывает влияние большое количество независимых факторов, среди которых нет доминирующего. В связи с тем, что это справедливо для большинства медико-биологических явлений, они часто характеризуются нормальным частотным распределением признака, которое имеет вид кривой Гаусса (рис. 3.1).

Рис. 3.1 Распределение Гаусса

Теоретическое обоснование выборочному методу дает математическая теория вероятности.

Вероятностью (р) называют меру возможности возникновения каких-либо случайных событий в данных конкретных условиях.

Вероятность наступления в выборочной совокупности какого-либо события (р) определяется отношением наступивших событий (m) к числу всех возможных случаев (N):

р = m
N

В противоположность вероятности наступившего события различают вероятность отсутствия события (q):

q = N - m = 1 – m = 1 – р   или q = 1 – р; р + q = 1
N N

Таким образом, вероятность наступления события находится в границах от 0 до 1. Чем ближе вероятность события к единице, тем событие вероятнее, и, наоборот, чем ближе р к нулю, тем наступление события менее вероятно.

Теория вероятности обосновывает закон больших чисел, который имеет следующие важнейшие положения для выборочного исследования:

1. По мере увеличения числа наблюдений результаты исследования, полученные на выборочной совокупности, стремятся воспроизвести данные генеральной совокупности;

2. При достижении определенного числа наблюдений в выборочной совокупности результаты исследования будут максимально приближаться к данным генеральной совокупности;

3. При большом количестве наблюдений законы частотного распределения количественных признаков стремятся к нормальному частотному распределению Гаусса.

Последнее положение называют предельной теоремой вселенной.

Основные характеристики выборки, подчиняющейся нормальному закону частотного распределения: среднее арифметическое ( `x выб), дисперсия (D), среднее квадратическое отклонение – стандартное отклонение (S).

Величину отклонения исследуемых свойств выборки от их фактических значений в генеральной совокупности называют статистической ошибкой, стандартной ошибкой или ошибкой репрезентативности (µ). Для измерения ошибки репрезентативности используют значение стандартного отклонения(среднего квадратического отклонения выборки) (S) – которое характеризует степень разброса признака от среднего в изучаемой выборочной совокупности. Стандартное отклонение для генеральной совокупности обозначают символом σ,а для выборки – символом S, и вычисляют по формуле:

S = D ,

где D – дисперсия – параметр, так же как и стандартное отклонение, характеризующий степень разброса элементов выборки относительно среднего значения.

при N≤ 30,   D = N ∑ di2 i=1
N-1

где di – является разностью между i-той вариантой ряда (хi) и средним арифметическим (`x): di = хi – `x,

N – общее количество вариант.

Геометрическая интерпретация σ (S – для выборки) представлена на рисунке 3.1. Точка`x – это среднее. Интервал (`x -σ;`x +σ) включает варианты, отклоняющиеся от среднего не более чем на σ. В этом интервале при нормальном распределении оказывается 68,3% значений признака.

Таким образом, 68,3% всех вариант отклоняется от среднего значения не более чем на величину σ. Впределах от -2σ до +2σ лежат 95,5% всех вариант. В пределах от -3 σ до +3σ находится 99,7% - всех вариант («правило трёх сигм»). Один из методов определения нормального частотного распределения элементов выборки (метод Колмогорова-Смирнова) базируется на описанных выше соотношениях.

Из «правила трех сигм» ясно, что нормально распределенная

случайная величина х в единичном испытании попадает в интервал (`x -3σ; `x +3σ). Вероятность этого события приближенно равна 0,9973:

р (`x - 3σ <`x <`x + 3σ) ≈ 0,9973.

Другим способом определения соответствия частотного распределения выборки нормальному закону является следующий приблизительный критерий: значения среднего, медианы и моды выборки должны быть примерно равными.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: