Многомерный статистический анализ. Задачи классификации объектов: кластерный анализ, дискриминантный анализ

МСА – одно из направлений развития одномерной статистики. В наст. вр. в условиях рыночной экономики методы многомерного анализа актуальны, т.к. соответствуют многовариантному подходу. В МСА выделяют 3 группы методов: 1. факторный анализ, 2. кластерный анализ, 3. дискриминантный анализ. Факторный анализ предназначен для выявления в данной совокупности латентных (неявных) признаков, характеризующих систему. Экономическая система описывается большим числом показателей, что неудобно для анализа. За счет вращения этих показателей (опр. линейных комбинаций) исходная совокупность данных сокращается за счет замены ее главными факторами. Задачи: 1. отыскание скрытых, но объективно существующих закономерностей; 2. сжатие информации; 3. выделение главных факторов; 4. построение регрессионных моделей.

Кластерный анализ — это совокупность методов, позволяю­щих классифицировать многомерные наблюдения, каждое из которых описывается набором признаков (параметров) Х{9 Х2,..., Л^. Целью кластерного анализа является образование групп схо­жих между собой объектов, которые принято называть кластера­ми (класс, таксон, сгущение).

Кластерный анализ — одно из направлений статистического исследования. Особо важное место он занимает в тех отраслях на­уки, которые связаны с изучением массовых явлений и процессов. Необходимость развития методов кластерного анализа и их исполь­зования продиктована тем, что они помогают построить научно обоснованные классификации, выявить внутренние связи между единицами наблюдаемой совокупности. Кроме того, методы клас­терного анализа могут использоваться в целях сжатия информации, что является важным фактором в условиях постоянного увеличе­ния и усложнения потоков статистических данных.

Методы кластерного анализа позволяют решать следующие задачи [2]:

• проведение классификации объектов с учетом признаков, от­ражающих сущность, природу объектов. Решение такой задачи, как правило, приводит к углублению знаний о совокупности классифицируемых объектов;

• проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов, т.е. поиск суще­ствующей структуры;

Дискриминантный анализ является разделом многомерного статистического анализа, который включает в себя методы клас­сификации многомерных наблюдений по принципу максималь­ного сходства при наличии обучающих признаков.

Напомним, что в кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискрими-нантном анализе новые кластеры не образуются, а формулиру­ется правило, по которому объекты подмножества подлежащего классификации относятся к одному из уже существующих (обу­чающих) подмножеств (классов), на основе сравнения величины дискриминантной функции классифицируемого объекта, рассчи­танной по дискриминантным переменным, с некоторой констан­той дискриминации.

Наиболее часто используется линейная форма дискрими­нантной функции, которая представляется в виде скалярного произведения векторов А=(а12,...,аp дискриминантных множи­телей и вектора Хi=(хi1i2,…,хip) дискриминантных переменных:

или

Здесь Xi – транспонированный вектор дискриминантных переменных; хij — значений j-х признаков у i-го объекта наблю­дения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: