Данные о семейном положении респондентов

Таблица 1

Семейное положение Частоты Доли Проценты
Женат/замужем   0,53 53,3 (55,2)
Холост/не замужем   0,13 13,3 (13,8)
Разведен/разведена   0,23 23,3 (24,1)
Вдова/вдовец   0,07 6,7 (6,9)
Данные отсутствуют   0,03 3,3
Всего   1,0 99,9 (100)

Из таблицы видно, что большая часть респондентов (более половины) женаты или замужем. Отметим, что если какие-то отсутствуют, их следует выделить в самостоятельную категорию. Анализ таких пропущенных значений часто выделяют в самостоятельную задачу.

Анализируя таблицу, мы сравниваем между собой категории и видим, как они представлены в нашей выборке. Нас чаще всего интересуют не абсолютные значения, а относительные. И тогда мы переводим частоты в доли относительно общего числа наблюдений, которое мы принимаем за единицу. Для этого мы делим каждое значение на общее число наблюдений (в нашем случае — на 30). Полученные дроби можно внести в таблицу отдельным столбцом. Тогда хорошо видно, что в нашей выборке немногим более половины рес­пондентов находятся в браке, а около четверти — в разводе. Относительные значения удобны еще и тем, что позволяют легко сопоставлять данные по двум выборкам разного объема. Допустим, у нас есть данные о семейном положении другой группы людей, и мы хотим сравнить их с данными первой группы. Если во второй группе тоже тридцать человек, то можно прямо сравнивать частоты. Если же выборки различаются размерами, то мы предварительно вычисляем относительные значения путем деления абсолютной величины на объем выборки. Последний показатель принято обозначать латинской буквой N. В разобранном только что примере N =30.

Помимо долей, относительными единицами являются также проценты. Если в первом случае целое принимается за единицу, то во втором случае — за сто процентов. От долей легко перейти к процентам: каждое значение просто умножается на сто. Процентное выражение предпочтительно тем, что с целыми числами работать удобнее, чем с дробями. Но по существу проценты и доли — это эквивалентные единицы наподобие рубля и копейки. Относительные единицы позволяют сравнивать не только аналогичные показатели, полученные на разных выборках, но и качественно различные показатели между собой. Например, для характеристики имущественного расслоения в обществе используют следующий прием: подсчитывают, какой процент всей собственности сосредоточен в руках десяти процентов самых богатых людей. Понятно, что в случае полного имущественного равенства этот показатель будет равен десяти процентам. Чем он больше отличается от этого значения, тем выше степень имущественного неравенства в обществе. (Децильный коэффициент).

Последний столбец в Таблице 1 представляет данные в процентах. Обратим внимание, что итог у нас оказался несколько меньше ста процентов из-за округлений при вычислениях. Поскольку данные по одному индивиду отсутствуют, можно пересчитать проценты без этой пустой категории, полагая теперь N = 29. Скорректированные данные представлены в скобках. При сравнении с другой выборкой мы будем использовать именно их.

До сих пор мы разбирали случай, когда исходные данные были качественными, то есть образовывали шкалу наименований.

Но мы можем строить распределение частот и для шкал порядка или отношений. Правда, в последнем случае обычно данные представляют в сгруппированном виде, так как иначе образуется очень много классов. Например, мы исследуем возрастной состав той же группы из тридцати человек. Если она не однородна в этом отношении, данные окажутся «размазанными». Тогда мы их группируем, выбирая определенный шаг (например, пять или десять лет), и вносим в таблицу обобщенные данные. Шаг выбирается с учетом характера данных и задач анализа. Снова отметим, что группировка данных приводит к потере части информации. Но зато мы добиваемся ее лучшей обозримости. Таб­лица, которая в результате получится, может выглядеть так:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: