Модели с латентными переменными
Модели с латентными переменными являются важным классом вероятностных моделей. Они основаны на предположении о том, что наблюдаемые, измеряемые тестами переменные могут быть объяснены с помощью так называемых латентных, более глубинных переменных, которые невозможно измерить непосредственно, однако можно оценить их значение косвенно. К методам латентных переменных относятся конфирматорный и эксплора-торный факторный анализ, регрессионный анализ, однофакторный анализ, методы латентных структур. МакДоналд предложил обобщенную модель латентных структур.
Цель создания моделей с латентными переменными — объяснение наблюдаемых переменных и взаимосвязей между ними с помощью латентных переменных. При заданном значении наблюдаемых переменных требуется сконструировать множество латентных переменных и функцию, которая достаточно хорошо аппроксимировала бы наблюдаемые переменные, а в конечном счете — плотность вероятности наблюдаемой переменной.
|
|
В факторном анализе основной акцент делается на моделировании значений наблюдаемых переменных, их корреляциях, ковариациях, а в методах латентно-структурного анализа — на моделировании распределения вероятности наблюдаемых переменных.
Модели факторного анализа (ФА)
Работа Пирсона (1901) — первая, которая была посвящена методу главных компонент. Большой вклад при разработке теста на интеллект внесли К. Спирмен (1927, 1946), Л. Терстон (1947, 1951), а при разработке теории личности — Р. Кеттел (1947, 1951) и Г. Айзенк.
Входные данные, обрабатываемые методом ФА, — это корреляционная или ко-
7. ОСНОВНЫЕ ОТРАСЛИ ПСИХОЛОГИИ
вариационная матрицы. Основная цель методов — выявление интегральных латентных факторов по наблюдаемым переменным, что означает построение для данной корреляционной матрицы К соответствующей матрицы нагрузок А. Матрица А определяется численными методами, при этом количество факторов не должно превышать количество наблюдаемых переменных. То есть соотношения между п наблюдаемыми переменными должны объясняться возможно меньшим числом латентных факторов. Первый принцип, лежащий в основе классической модели ФА, — постулат о линейной независимости между латентными характеристиками; второй — наблюдаемые переменные могут быть представлены как линейная комбинация некоторых латентных факторов. Ряд этих факторов является общим для нескольких переменных, другие — специфические, связанные в основном только с одной переменной.
В 60-е гг, в связи с быстрым развитием методов ФА появилось огромное число различных методов. В дальнейшем проявляется тенденция к обобщениям: возникает нелинейный ФА, построение обобщающей модели с латентными переменными, возникновение и развитие конфирматерного ФА.
|
|
Обобщенная математическая модель ФА в матричном виде — это К = AFAT + L2, где А — матрица нагрузок, К — корреляционная матрица, L — матрица ошибок, F — единичная матрица факторов.
Основные этапы ФА: 1) сбор эмпирических данных и подготовка корреляционной (ковариационной) матрицы; 2) выделение первоначальных (ортогональных) факторов; 3) вращение факторной структуры и содержательная интерпретация результатов ФА,
Второй этап — это прежде всего выбор метода ФА. Назовем наиболее используемые из них в психологии.
Метод главных компонент. Его модель имеет вид
К - V = AAJ = VCV:,
где V — матрица собственных векторов, С — диагональная матрица собственных значений.То есть в данном методе поиск
решения идет в направлении вычисления собственных векторов (факторов), а собственные значения характеризуют дисперсию (разброс) по факторам.
Метод главных факторов. Дня определения числа факторов используются различные статистические критерии, при помощи которых проверяется гипотеза о незначительности матрицы корреляционных остатков.
Метод максимального правдоподобия (Д. Лоли), в отличие от предыдущего, основывается не на предварительной оценке общностей, а на априорном определении числа общих факторов и в случае большой выборки позволяет получить статистический критерий значимости полученного факторного решения.
Метод минимальных остатков (Г. Харман) основан на минимизации внедиаго-нальных элементов остаточной корреляционной матрицы; проводится предварительный выбор числа факторов.
Альфа-факторный анализ был разработан специально для изучения психологических данных; выводы носят в основном психометрический, а не статистический характер; минимальное количество общих факторов оценивается по собственным значениям и коэффициентам общности. Факторизация образов, в отличие от классического ФА, предполагает, что обшность каждой переменной определяется как линейная регрессия всех остальных переменных.
Перечисленные методы отличаются по способу поиска решения основного уравнения ФА. Выбор метода требует большого опыта работы. Однако некоторые исследователи используют сразу несколько методов, выделенные же во всех методах факторы считают наиболее устойчивыми.
Третий этап — это «поворот» факторов в пространстве для достижения простой структуры, в которой каждая переменная характеризуется преобладающим влиянием какого-то одного фактора. Выделяются два класса вращения: ортогональное и косоугольное. К ортогональным методам относятся методы «Vary max» (Kaiser, I958) — максимизируется разброс квадратов факторных нагрузок по каждому фактору в отдельности, что приводит к увеличению больших нагрузок и уменьшению — ма-
7.2. Математическая психолог
леньких. «Quartymax» — простая структура; в отличие от предыдущего метода формируется для всех факторов одновременно. В некоторых случаях важнее получить простую структуру, чем сохранить ортогональность факторов. Для достижения этого используются аналогичные методы косоугольного поворота: «Oblymin» и «Oblymax».
Все описанные выше модели ФА относятся к эксплораторному (поисковому) ФА. Настоящим переворотом в ФА было изобретение копфирматорного (подтверждающего) КФА. Основной принцип КФА. в качестве гипотезы формируется структура ожидаемой матрицы факторных нагрузок (весов), которая затем накладывается на заданную корреляционную матрицу. Гипотеза подвергается статистической проверке, и постепенно исследователь приходит к соответствующей экспериментальным данным матрице нагрузок, не прибегая к вращению факторов. Однако гипотеза должна основываться на серьезном анализе природы изучаемых переменных и лежащих в их основе факторов. Часто для этого проводится предварительно эксплораторный ФА. В качестве математического аппарата в данной модели используется моделирование с помощью линейных структурных уравнений.
|
|
Данный подход предполагает априорное формулирование гипотез относительно количества латентных и измеряемых переменных, а также их взаимосвязи. Можно выделить следующие этапы:
составляется диаграмма путей, представляющая собой графы, в которых присутствуют измеряемые и латентные переменные, соединенные стрелками (направлены в сторону влияний);
строятся системы уравнений множест-веной регрессии; их количество соответствует количеству зависимых переменных;
проверяется соответствие предложенной модели (системы уравнений) эмпирическим данным;
осуществляется перебор моделей на данных одной выборки.
Метод КФА позволяет оценить валид-ность тестов (конструктную, дискрими-нантную, конвергентную). Использование множества индикаторов для каждого латентного конструкта дает возможность представить степень, с которой каждая переменная объясняет латентную переменную. Остаточная дисперсия обусловлена случайными флуктуациями. С помощью параметров измерительной модели определяется внутренняя согласованность теста, по которой можно говорить об уровне надежности измерения. В программе LISREL надежность измеряемых переменных представляется в виде множественных корреляций этих переменных с латентными конструктами (P. Bentler. 1982, 1992; D. Cole, 1987). Моделирование с помощью латентно-структурных уравнений позволяет также проводить анализ данных лонгитюд-ного исследования с множественными индикаторами (К. Joreskog, 1979, 1988).
Модель латентных классов
Все модели латентных структур предполагают локальную независимость характеристик. То есть для данной латентной характеристики наблюдаемые переменные независимы в смысле теории вероятностей.
|
|
В основе модели лежит формула Бэйеса, которая связывает априорную вероятность с апостериорной.
Общая методология сводится к введению в модель (в качестве исходных данных) априорной плотности распределения параметров и последующему нахождению по формуле Бэйеса (с учетом экспериментальных данных) их апостериорной плотности распределения. Априорно задаются две латентные характеристики: количество классов (К) и соответствующее им относительное число испытуемых в классе — P(k), а также параметр, позволяющий устанавливать степень вероятности опреде-леного ответа на i-й вопрос при условии, что испытуемый относится к k-му классу — r(k). Априорное задание этих латентных характеристик соответствует гипотезе исследователя либо задается стандартными способами.
Вероятность появления 1-го профиля
Pi=I(P(k)r,(k).
По формуле Бэйеса вычисляется апостериорная (с учетом реальных профилей