Взаимосвязь между атрибутивными признаками анализируется посредством таблиц взаимной сопряженности.
При наличии статистической связи оценка тесноты связи базируется на отклонениях фактических частот от пропорциональным итоговым частотам:
, (5.38)
где - суммарные частоты по - той строке;
- суммарные частоты по j - тому столбцу;
- объем совокупности.
Абсолютную величину отклонений фактических частот от характеризуют критерием («хи»-квадрат):
, (5.39)
где – соответственно количество групп по признакам и .
При отсутствии статистической связи .
Для вывода о тесноте связи рассчитанное значение сравнивается с табличным значением , которое выбирается из таблиц распределения «хи»-квадрат в зависимости от принятого уровня значимости α и степеней свободы делают вывод о наличии тесной связи между признаками и .
Относительной мерой тесноты статистической связи между признаками служат:
· коэффициент взаимной сопряженности Чупрова
; (5.40)
· коэффициент взаимной сопряженности Крамера
|
|
V , (5.41)
где – минимальное количество групп ( или ).
Значение коэффициентов изменяется от 0 до 1, и теснота связи тем сильнее, чем ближе к 1.
Пример 5.7.По результатам опроса 48 абитуриентов получены следующие данные о выборе специальности
Необходимо определить: влияет ли пол на выбор специальности? Для этого воспользуемся критерием «хи»-квадрат. Построим таблицу распределения частот:
Теоретически, мы ожидаем, что частоты распределятся равномерно, т.е. частота распределится пропорционально между юношами и девушками. Построим таблицу теоретических частот. Для этого умножим сумму по строке на сумму по столбцу и разделим получившееся число на общую сумму (n).
Итоговая таблица для вычислений будет выглядеть так:
; число степеней свободы . Из таблицы распределения для уровня значимости и найдем . Т.к. делаем вывод, что пол определяет выбор специальности. Коэффициент взаимной сопряженности Чупрова (5.40): ; коэффициент взаимной сопряженности Крамера (5.41):
V . |