Проблемы в социологии

Для непрерывного распределения получить неломанную кривую можно только при исследовании всей генеральной совокупности. Но ведь чаще у нас есть выборка, а она конечна! Поэтому мы получим не «купол», а соединённые отрезки – полигон, - или гистограмму.

А большая дробность значений мешает восприятию информации: например, выяснение закономерностей относительно возраста респондентов – нам не важно знать значения всех возрастов, а только определённые возрастные интервалы. Итак, если мы хотим получить новое знание с помощью анализа сравнительно небольшого количества наблюденных значений рассматриваемого признака, мы должны “сжать” исходные данные путем разбиения диапазона изменения значений этого признака на интервалы. За счет потери одной информации, мы приобретаем другую. Здесь тоже хотелось бы сделать определенное обобщение – вычленение какой-либо закономерности из массива “сырых” данных всегда сопряжено с потерей информации. Теряем “сырую” информацию, приобретаем ту, которая содержится в найденной закономерности.

Выбор способа разбиения диапазона изменения признака на интервалы представляет собой проблему, далеко не всегда просто решающуюся. К какому интервалу относить объект, для которого значение рассматриваемого признака лежит на “стыке” двух интервалов? Как строить гистограмму с неравными интервалами?

Проблема пропущенных значений – если какой-то, вопрос в анкете не заполнен, не обязательно ее выбрасывать. Здесь есть другие методы – к примеру, заполнение пропуска средним значением рассматриваемого признака, или проанализировать распределение признака для тех респондентов, которые ответили на соответствующий вопрос, и заполнять пропуски таким образом, чтобы получающееся в результате распределение имело тот же характер.

Вопрос 97. Коэффициенты парной связи, основанные на критерии "хи-квадрат"

Критерий хи-квадрат один из наиболее часто использующихся в социологии, т.к. он позволяет решать большое число разных задач, и кроме того исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.

Критерий хи-квадрат используется в двух вариантах:

1. Как расчёт согласия эмпирического распределения и предполагаемого теоретического. В этом случае проверяется гипотеза Н₀об отсутствии различий (о сходстве) между теоретическим и эмпирическим распределениями.

2. Как расчёт однородности двух независимых экспериментальных выборок. В этом случае проверяется гипотеза Н₀об отсутствии различий (о сходстве) между двумя эмпирическими распределениями.

Критерий построен так, что при полном совпадении экспериментального и теоретического или двух экспериментальных распределений величина хи-квадрат эмпирическое равен 0 (χ²_эмп.= 0). И чем больше расхождение между сопоставляемыми распределениями, тем больше величина эмпирического значения хи-квадрат.

Основная расчётная формула: χ²_эмп.= ∑ ((f_э– f_т) / f_т), где f_э– эмпирическая частота, f_т– теоретическая частота.

Затем, узнав из таблицы значения уровней значимости в 5% и 1%, проверяем гипотезу Н₀. На оси ОХ откладываем значения уровней значимости в 5% и 1%, отделяем там зону незначимости и зону значимости соответственно. Выясняем в какой зоне лежит наш χ²_эмп. Если в зоне незначимости – принимается гипотеза Н₀об отсутствии различий (о сходстве) между теоретическим и эмпирическим распределениями.

Если в зоне значимости - принимается гипотеза Н₁– о наличии отличий.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: