Классификация переменных в соответствии с методами статистического анализа

Численные характеристики факторов риска и показателей здоровья могут иметь различный тип — принимать конечное или бесконечное число значений, иметь дискретный или непрерывный характер. Для инализа данных разных типов используются различные статистические методы. В соответствии с методами анализа переменные подразделя ются на три типа.

Количественные (непрерывные) переменные — это переменные, которые могут принимать любые числовые значения в некотором диапазоне, например, температура воздуха или систолическое давление. Так, если температура изменяется от —3°С ночью до +5°С днем, то для любого значения в интервале от —3 до +5 найдется такой момент времени когда температура принимает именно это значение.

Главная особенность количественных переменных заключается в возможности выполнять над ними любые математические преобразования: складывать, вычитать, перемножать, возводить в целочисленную степень, извлекать квадратный корень (для величин, принимающих только неотрицательные значения), логарифмировать (только положительные величины) и т.д. Количественным переменным соответствуют непрерывные случайные величины.

Порядковые (ординальные, полуколичественные) переменные — это величины, которые могут принимать дискретное (как правило, конечное, но в некоторых случаях и счетное) множество численных значений. При этом для различных значений порядковой переменной не определено расстояние (или разность) между ними, а определено лишь отношение порядка (соотношение больше/меньше или лучше/хуже). Простейший пример порядковой переменной — степень тяжести заболеваний и повреждений. Любая балльная шкала, используемая при субъективном оценивании, также порождает порядковую переменную. Над порядковыми переменными нельзя выполнять арифметических или иных математических операций, но возможно выполнить операцию сравнения. Порядковым переменным соответствуют дискретные случайные величины.

Качественные (номинальные) переменные характеризуются тем, что могут принимать значения лишь из конечного набора качественно определенных категорий (пол, группа крови, диагноз). Различным категориям можно поставить в соответствие некоторые числа (как правило, для этого используют целые числа). Числовые коды значений номинальной переменной можно произвольным образом переобозначить — это не приведет к изменению представления об исследуемой переменной (безразлично, например, какой номер присвоен каждой из 4-х групп крови). Качественным переменным соответствуют дис­кретные случайные величины, значения которых являются числовыми кодами значений таких переменных.

Следует иметь в виду, что в англоязычной статистической литературе, в том числе и в документации к статистическим пакетам, используется несколько иная классификация переменных: к количественным относятся как непрерывные, так и порядковые переменные; непрерывные переменные подразделяются на 2 класса — интервальные переменные (interval variables) и переменные отношения (ratio variables), объединение этих классов обозначается термином interval/ratio variables. Различие межцу этими классами заключается в том, что интервальные переменные изменяются по шкале, начало отсчета которой выбрано достаточно произвольно и в принципе может быть изменено. Переменные же отношения измеряются по шкале с однозначно определенным началом отсчета и не могут принимать отрицательных значений (длина, масса, концентрация, заболеваемость). Поэтому, например, температура, измеренная по шкале Цельсия, относится к интервальным переменным, а температура по абсолютной шкале Кельвина — к переменным отношениям.

Между количественными, порядковыми и качественными переменными, вообще говоря, нет непроходимой границы. Например, возраст является непрерывной переменной, но иногда, в соответствии с целями исследования, с этим показателем обращаются как с порядковым: при исследовании здоровья взрослых все население часто разделяют на 10-летние возрастные интервалы (в этом случае сохраняется и равенство расстояний между соседними группами), а для детского населения выделяют неравномерные возрастные интервалы (грудные дети, дети ясельного, дошкольного и школьного возраста). И наоборот, по мере накопления данных некоторые переменные могут перейти из разряда качественных в разряд порядковых или даже количественных. К примеру, при изучении влияния загрязнения окружающей среды на здоровье в качестве характеристики территории на начальном этапе могут быть выделены две качественных категории: «чистая» и «загрязненная» территория. В ходе дальнейших исследований могут быть определены более детальные градации этого показателя: «умеренное загрязнение», «сильное загрязнение» — вводящие уже отношение порядка. Если на следующих этапах удается детализировать характеристику степени загрязнения либо путем создания балльной шкалы с большим (в несколько десятков) числом градаций и с равнозначными различиями между любыми соседними градациями, или же путем определения некоторого интегрального показателя загрязнения в виде функции (например, взвешенной суммы) от частных количественных показателей загрязнения (например, концентраций отдельных загрязнителей в различных средах), то появляется возможность преобразовать показатель загрязнения в количественный.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: