Модели факторного анализа

При построении модели факторного анализа предполагается, что признаки линейно зависят от факторов.

Существует два подхода:

1) метод главных компонент (МГК), в котором наблюдаемые значения каждого из признаков представляются в виде линейных комбинаций факторных нагрузок и факторов , где , причем

, (5)

где - число факторов.

Например, в случае, изображенном на рис.1, имеем

,

где , - коэффициенты, называемые факторными нагрузками.

Факторные нагрузки показывают тесноту взаимосвязи фактора и признака.

Метод главных компонент основан на попытке объяснить общую дисперсию в заданном наборе переменных при помощи латентных факторов. Основной объект анализа в МГК – это дисперсии. Метод главных компонент ориентирован на выделение малого набора ортогональных компонент таким образом, чтобы они объясняли максимум дисперсии для анализируемого набора данных.

2) модель собственно факторного анализа (ФА), когда наблюдаемые значения определяются не только факторами, но и действием локальных случайных причин

, (6)

где - общие факторы, - специфические или характерные факторы, - факторные нагрузки. Общности представляют несколько исходных переменных, а каждая характерность относится только к одной исходной переменной. Предполагается, что общие факторы и характерные факторы не коррелированны.

Метод ФА пытается объяснить корреляции между переменными. Основной объект анализа в факторном анализе – ковариации (корреляции).

В ФА для каждой переменной анализируется только общая дисперсия, присущая сразу нескольким наблюдаемым переменным и не включаются дисперсия ошибки измерения и специфическая дисперсия какой-то отдельной переменной. Общая дисперсия оценивается общностями, стоящими на главной диагонали матрицы взаимосвязей и принимающими значения от 0 до 1. Факторное решение выбирается на основе переменных с высокими общностями. Сумма общностей - это дисперсия взаимодействия факторов, которая не может превысить общую дисперсию наблюдаемых переменных, поскольку специфичная и ошибочная дисперсия опускаются.

Таким образом, можно сказать, что основной объект анализа в методе главных компонент – это дисперсии, а в факторном анализе – ковариации (общности).

МГК ориентирован на выделение малого набора ортогональных компонент таким образом, чтобы они объясняли максимум дисперсии для анализируемого набора данных. Решение является единственным и если сохранить все компоненты, то можно точно воспроизвести наблюдаемую матрицу взаимосвязей. Если необходимо в первую очередь сократить число переменных, то есть уменьшить размерность, то МГК даст возможность определиться как с количеством, так и с природой факторов. Обычно именно МГК используют на этапе разведочного анализа.

Цель факторного анализа – при помощи малого набора факторов воспроизвести матрицу взаимосвязей. С математической точки зрения метод главных компонент дает единственное решение. Это объясняется тем, что теоретически в МГК количество выделенных компонент равно количеству наблюдаемых переменных и общая дисперсия учитывается полностью. В то же время разные виды факторного анализа дают разные решения для одного и того же набора данных.

Оба метода направлены на аппроксимацию корреляционной матрицы определенным числом факторов — меньшим, чем количество переменных, но способами аппроксимации они отличаются. Разумеется, методы дают схожие результаты: если главные компоненты объясняют большую часть дисперсии наблюдаемых переменных, они объясняют и почти всю корреляцию; в том случае, если факторы объясняют корреляцию между наблюдаемыми переменными, они также должны объяснять их дисперсию (пусть и не полностью).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: