Типы данных

Типы данных (рис. 1.) необходимо учитывать на этапе планирования при определении необходимых объемов выборок. Принято выделять в качестве основных типов данных: количественные и качественные. Количественные данные подразделяются на непрерывные и дискретные. Непрерывные данные – это данные, которые получают при измерении по непрерывной шкале (т.е. они могут иметь дробную часть). Это масса тела, рост, артериальное давление. Измеряемый параметр находится в определенном интервале. Непрерывные данные бывают интервальными и относительными. Интервальные данные – вид непрерывных данных, которые измеряются в абсолютных величинах, имеющих физический смысл. Относительные данные – вид непрерывных данных, отражающих долю измерения значения признака по отношению к исходному значению признака. Являются безразмерными данными или выражаются в процентах.

Дискретные данные – это количественные данные, которые не могут иметь дробную часть (количество детей, испытуемых).

Качественные данные подразделяются на номинальные и порядковые. Номинальные (номинативные) данные – вид качественных данных, которые отражают условные коды измеряемых категорий (код диагноза). Порядковые данные – вид качественных данных, которые отражают условную степень выраженности какого-либо признака (стадии онкологического заболевания, степень сердечной недостаточности). Их основное отличие от дискретных количественных данных в отсутствии пропорциональной шкалы для измерения степени выраженности признака.

Бинарные (дихотомические) данные – особо выделяемый вид качественных данных. Признак такого типа имеет лишь два возможных значения (пол, наличие или отсутствие какого-либо заболевания).

Для номинальных и порядковых дискретных данных не могут быть определены «расстояния» между значениями, так как для них не существуют интервальные измерительные шкалы.

Иногда вызывает затруднение дифференциация количественных дискретных и качественных порядковых данных. В этой ситуации принципиальное значение имеет природа шкалы измерений: если «расстояния» между значениями на шкале равны, то это количественные дискретные данные (количество беременностей). Если «расстояния» между значениями не равны, то такие данные являются качественными порядковыми (число баллов для оценки интенсивности головной боли).

Рис.1.

Необходимо также определять, является ли количественный признак дискретным или непрерывным. Здесь граница может быть достаточно условна. На практике реализуют разные подходы. Один из них состоит в следующем: при значительном (превышающем 20) числе значений дискретного признака его можно приближенно считать непрерывным, и использовать соответствующие способы описания распределения и методы анализа, адекватные виду распределения на выборке.

В отношении качественного признака стоит вопрос о том, является ли этот признак порядковым или номинальным. Порядковые признаки с большим количеством различных значений (больше 20) на практике принять считать приближенно непрерывными (сумма баллов какой-либо шкалы для оценки неврологического дефицита, качества жизни и пр.) Для номинальных признаков такой подход исключен.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: