используется для изучения связей между переменными - анализируется несколько переменных, которые могут быть сопряжены, связаны.
Как правило, переменные необходимо разделять на зависимые и независимые (гипотезы аналитика о причинах и следствиях).
Чаще всего, предполагается, что зависимая переменная является следствием изменения независимых переменных. Это предположение, даже если оно потом и не подтверждается, тем не менее, влияет на выбор метода анализа и процедуру его применения.
1. ПОСТРОЕНИЕ таблицы сопряженности
1) общее правило:
- столбцы соответствуют уровням независимой переменной;
- строки соответствуют уровням зависимой переменной.
Пример: семейный доход можно описать в трех категориях: высокий, средний, низкий. Если в перекрестном табулировании, помимо «дохода» с 3-мя категориями учавствует, например, переменная «уровень образования» с двумя категориями (есть высшее образование или нет), то мы анализируем таблицу сопряженности 3x2.
доход | в.обр. |
В | + |
Н | - |
С | - |
С | - |
В | + |
Н | + |
Н | - |
• • • |
Высшее образование | |||
+ | - | ||
доход | В | ||
С | |||
Н |
2) расчет процентов: проценты должны рассчитываться в направлении независимой переменной и поперек зависимой переменной.
Сумму ячеек каждого столбца необходимо принимать за 100%, а ячейки этого столбца выражать в процентах по отношению к этой сумме.
3) Количество категорий не должно быть слишком большим, иначе целесообразнее применять другие статистические методы.
2. АНАЛИЗ таблицы сопряженности
1) Основные закономерности, содержащиеся в данных, видны уже после просмотра процентных долей, рассчитанных для различных категорий:
- таблица сопряженности;
- гистограмма.
2) Математически корректным заявление о выявленных закономерностях будет только лишь в том случае, если подтверждена статистическая значимость этих закономерностей.
Статистические пакеты предоставляют большой выбор критериев, позволяющих проверить статистическую значимость связей, анализируемых с помощью перекрестного табулирования. Все эти критерии, с одной стороны, в некоторой степени дублируют друг друга, с другой стороны, отражают ту или иную специфику в данных. Чтобы сделать предварительные выводы, можно применять, например:
- Хи-квадрат Пирсона;
- фи-коэффициент;
- коэффициент сопряженности признаков;
- V-коэффициент Крамера.
ПРОВЕРКА ЗНАЧИМОСТИ (связи исследуемых переменных)
а) В результате расчета каждого из этих критериев Вы получаете уро
вень значимости ошибки для связи переменных, наблюдающейся в эмпирических данных.
б) Выводы о статистической значимости Вы делаете на основе правила: если расчетный уровень значимости меньше допустимого (как правило: 0,01 или 0,05), то связь между переменными значима.