Коэффициент контингенции

в нашем случае равен

.

Очень маленький коэффициент. Показывает, что связь между рациональным предложением и уменьшением числа простоев очень мала. Конечно, простои уменьшились, но не на столько эффективно, как бы этого хотелось.

Биссериальный коэффициент корреляции позволяет изучить связь качественным альтернативным и количественным варьирующим признаками и определяется по формуле

,

где – средние значения признака в группах; – среднее квадратическое отклонение фактических значений признака от среднего уровня; – доля первой группы в совокупности; – доля второй группы; – табличные значения -распределения в зависимости от . Величина коэффициента варьирует в пределах от 0 до 1.

При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков рассчитываются следующие коэффициенты:

· коэффициент Пирсона;

· коэффициент Крамера;

· коэффициент Чупрова.

Оценка плотности стохастичной связи базируется на отклонениях частот условного и безусловного распределений, то есть на отклонениях фактических частот от теоретических , пропорциональных итоговым:

,

где - итоговые частоты по признаку ; - итоговые частоты по признаку ; - объём совокупности: .

Абсолютную величину отклонений фактических частот от пропорциональных характеризует коэффициент взаимной сопряжённости Пирсона :

.

При отсутствии стохастичной связи =0. На основе распределения вероятностей проверяется существенность связи. Если в конкретном опыте величина оказывается чрезмерно большой, то приходится признать, что ожидаемые частоты слишком сильно отличаются от наблюдаемых. Ответ на естественный вопрос, о том, какие значения статистики следует считать чрезмерно большими, дает теорема К. Пирсона – Р. Фишера, из которой следует:

· для независимых признаков при неограниченном росте числа наблюдений распределение случайной величины стремится к распределению “хи-квадрат”;

· гипотезу о независимости можно принять, если не превосходит критического для заданного уровня табличного значения с степенями свободы;

· для зависимых признаков неограниченно возрастает с увеличением .

Как всегда в статистике, интерес исследователя не ограничивается принятием гипотезы, оценивающей величину риска предположения о существовании связи. Если признаки оказались взаимосвязаны (т.е. гипотеза об их независимости была проверена и отвергнута) представляет интерес оценка силы связи, которую хочется видеть в некотором привычном интервале величин, например, от –1 до +1 с нулевым значением при отсутствии связи. Сама по себе такая постановка проблемы определенным образом дискуссионна. Достаточно сказать, что некоторые считают приоритетным при оценке силы связи коэффициент корреляции Пирсона (суть – долю факториальной вариации), а другие – статистики Фишера или (то же, но только с учетом степеней свободы), напрямую связанные с фундаментальными для статистики уровнями значимости.

В случае таблиц сопряженности для измерения силы связи предложены десятки формул [Миркин, Розенберг, 1979; Миркин и др., 1989], которые можно свести к трем основным группам:

· традиционные коэффициенты связи, основанные на ;

· меры и статистики, основанные на рангах;

· коэффициенты, измеряющие информационную связь между факторами.

Коэффициенты связи, основанные на , исходят из предпосылки о том, что, чем больше объем выборки , тем легче получить статистически значимую величину критерия даже при очень слабой взаимосвязи переменных (т.е. при больших объемах выборки даже слабые связи будут статистически значимыми).

Чтобы элиминировать влияние объема выборки , К. Пирсон предложил в качестве меры связи среднеквадратическую сопряженност ь (он же – редуцированный коэффициент корреляции)

,

который изменяется в диапазоне от 0 до .

Стремясь нормировать меру связи к единому диапазону, С. Крамер ввел коэффициент Крамера:

,

верхний предел которого единица.

А.А. Чупров нашел для похожей формулы более звучное название – полихорический коэффициент сопряженности (коэффициент Чупрова):

,

где - число групп по признаку ; - число групп по признаку .

Нетрудно заметить, что и эквивалентны, когда число столбцов равно числу строк, в иных случаях всегда больше, чем . Для таблицы 2х2 обе меры равны . Наконец, можно упомянуть еще один коэффициент, связанный с именем К. Пирсона – коэффициент контингенции Пирсона:

,

где – число наблюдений.

Коэффициент изменяется от 0 до 1. Чем ближе к единице, тем теснее связь между атрибутивными признаками.

Перечисленные коэффициенты, основанные на , остаются неизменными при перестановке местами строк или столбцов таблицы и всегда выражаются положительными числами, поэтому уяснение направления зависимости должно производиться только по виду таблицы сопряженности.

Следует отметить, что методы анализа таблиц взаимной сопряжённости можно использовать и для количественных признаков. Какие-либо технические преграды отсутствуют. Но следует помнить, что коэффициент сопряжённости оценивает лишь согласованность фактического распределения с пропорциональным. В целом выбор метода измерения связи и характеристики его плотности должен базироваться на предварительном теоретическом анализе сути явлений, характера взаимосвязи, имеющейся информации


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: