Описательная статистика и статистическая оценка

Обычно популяционное значение параметра (среднее значение, медиану, долю и т.д.) узнать невозможно, но его можно оценить по выборке. Точность такой оценки зависит от метода измерения (ошибки измерения), объема и репрезентативности выборки (ошибки выборки). Описание распределения признака в выборке производится путем оценки значений ее параметров, характеризующих центральную тенденцию и рассеяние наблюдений по области значений признака. Распределение признака в выборке есть совокупность частот наблюдений (объектов исследования) для каждого интервала значений признака в конкретной выборке.

Основными типами и видами распределений признаков являются следующие:

1. Дискретные (для дискретных признаков):

- биномиальное (когда объектов исследования не более 10);

- распределение Пуассона (для анализа редко встречающихся объектов или признаков);

- распределение Бернулли (когда вероятность проявления признака постоянна).

2. Непрерывные (для непрерывных признаков):

- нормальное (гауссово, или распределение Гаусса);

- логнормальное;

- постоянное;

- экспоненциальное;

- «хи»-квадрат (c2)

С позиции классической математической статистики признаки обязательно должны быть случайным величинами. Только тогда для изучения закономерностей изменений таких величин могут использоваться законы распределения вероятностей.

Наиболее важным законом распределения является нормальный закон (закон Гаусса). Закон «работает» в любых ситуациях, где оперируют большим количеством разнородных и независимых факторов.

На практике значение нормального закона в медицине следующее: если полученные данные подчиняются нормальному закону, то для их обработки можно применять широкий спектр статистических методов (описательная, конструктивная статистика, методы параметрические, непараметрические, методы проверки гипотез и планирования эксперимента и т.д.). В противном случае класс допустимых математических методов существенно сужается, и риск получения некорректного вывода вырастает в методологическую проблему.

Очевидно, что если из одной и той же совокупности будут независимо набраны несколько выборок, то значения их параметров (например, средние) будут различаться. Исследователю важно знать, насколько рассчитанное им по выборке значение (оценка) близко к популяционному. Вариабельность значений параметра в разных выборках из одной генеральной совокупности тем ниже, чем больше объем выборки.

Значение вариации признака может быть выражено с помощью доверительного интервала (ДИ). ДИ – это интервал значений признака, рассчитанный для какого-либо параметра (например, среднего) по выборке с определенной вероятностью (чаще всего 95%) включающий истинное значение этого параметра во всей генеральной совокупности. ДИ всегда связан с каким-либо уровнем доверия (уверенности, значимости). В большинстве медико-биологических исследованиях в качестве минимально допустимого уровня используют 95%, 99% иногда 99,9% доверительный интервал (0,05, 0,001 или 0,001 уровень значимости). Представление результатов исследования с использованием ДИ стало обязательным требованием. Это обусловлено следующим:

1. ДИ позволяет наглядно представить спектр возможных значений параметра, которые могут быть рассчитаны по другим выборкам из той же генеральной совокупности.

2. ДИ может использоваться для сравнения выборок (способ, аналогичный проверке статистических гипотез – см. ниже).

3. При указании ДИ нет необходимости следить за видом распределения количественного признака, т.к. такое описание спектра популяционных значений подходить как для нормально распределенных, так и распределенных по другим законам данных.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: