Вопрос 98. Коэффициенты парной связи Гуттмана. Модель модального прогноза

Меры l (лямбда) Л. Гуттмана. Таких мер три, две из них направленные, а одна представляет собой усреднение первых двух. Мы приведем только одну lу/х. Этот коэффициент характеризует в случае нашей задачи вли­яние будущей профессии (X) на удовлетворенность учебой (У). Отвечает на вопрос, насколько изменяется предсказание (У) при зна­нии (X). Ниже приводится формула:

ni шах ¾ максимальная частота в i-й строке; nо mах¾ максимальная частота среди маргинальных частот по столбцам.

Для того чтобы пояснить содержательный смысл этого коэффициента, ниже приводится та же таблица сопряженно­сти, с которой мы постоянно работаем для изучения взаимосвязи между «будущей профессией студента» (признак X) и «удовлетво­ренностью учебой» (признак У). Таблица 3.5.1 содержит те же час­тоты, что и таблица 3.3.1, за исключением обозначений самих час­тот. В нее добавлен новый столбец ¾ последний с максимальными частотами по всем строкам, включая строку с маргинальными час­тотами по столбцам. Они нам необходимы для вычисления коэф­фициента lу/х Гуттмана.

 

Коэффициент в нашем случае рассчитыва­ется очень просто. Даже по тому, как вычисляется коэффициент, видно, что он позволяет определять, существуют ли в строках модальные группы, т. е. есть ли в каждой профессиональной группе ярко выраженная, часто встречаемая «степень удовлетворенности учебой». Судя по нашей таблице, таких групп практически нет, что и подтверждается маленьким значением коэффициента.

Представляется важным отметить, что в реальных исследовани­ях значения коэффициента Гуттмана очень малы и использовать их нужно так же, как и многие другие коэффициенты в сравнительном контексте, например, для ранжирования как бы независимых меж­ду собой признаков по степени их влияния на некоторый особенно важный для исследователя признак, обозначаемый как целевой, за­висимый. Если такого нет, то направленные коэффициенты «лям­бда» использовать не имеет особого смысла.

Формализуем понятие прогноза следующим образом. Выбирая произвольный объект и зная распределение рассматриваемого признака (условное или безусловное), считаем, что для выбранного объекта этот признак принимает то значение, которое имеет максимальную вероятность, встречается с максимальной частотой (т.е. модальное значение). Такой прогноз называется модальным. Приведем несколько утрированный пример. Рассмотрим, как может измеряться связь между национальностью (Х) и цветом волос (Y). Предположим, что Вы являетесь продавцом косметики и Вам для того, чтобы заранее подготовиться к общению с покупателем, желательно заранее знать цвет его волос. Представим себе, что вы арендовали помещение в вузе и к вам в комнату по очереди (в случайном порядке) входят за покупкой студенты. Допустим также, что Вы знаете безусловное распределение всех студентов рассматриваемого вуза по цвету волос, и в соответствии с этим распределением количество блондинов, брюнетов и шатенов примерно одинаково, но шатенов несколько больше, чем остальных. Вы пользуетесь правилом: перед входом покупателя приготавливаете товар, рассчитанный на модальное значение признака “цвет волос” (в нашем случае – на шатенов).

Теперь представим себе две ситуации. В первой Вы ничего не знаете о национальности входящего к вам студента. Наверное, в таком случае, приготовив товар для шатенов, Вы в почти двух третях возможных случаев совершите ошибку: к Вам с одинаково вероятностью в любой момент может войти и блондин, и брюнет, и шатен. Торговля заведомо будет неэффективной.

А во второй ситуации Вы сумели организовать дело так, что сначала к Вам по очереди (снова в случайном порядке) входят учащиеся в вузе китайцы, затем - финны, потом - русские. Очевидно, эффективность Вашей торговли возрастет: зная, что сегодня к Вам придут китайцы, Вы готовите товар, рассчитанный только на брюнетов, если придут финны - на блондинов, если русские - на шатенов. Конечно, Вы и тут будете ошибаться, но уже в гораздо меньшей степени, чем раньше. Другими словами, Ваш прогноз улучшится. А это и означает наличие связи между национальностью и цветом волос. Чем в большей мере прогноз улучшился, тем сильнее связь. Описанный прогноз называют модальным, или оптимальным. Коэффициенты чаще всего называют коэффициентами Гуттмана

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: