В такой высокотехнологической отрасли как телекоммуникации, методы и подходы Data Mining получили широкое применение. Решаемые задачи, прежде всего, связаны с программами лояльности и удержанием существующей клиентской базы, а также с привлечением новых потребительских услуг.
В биллинговых системах телекоммуникационных компаний накапливаются большие объемы данных. В первую очередь это информация об абонентах и статистика использованных услуг. Анализ такой информации ручными и полуручными методами малоэффективны.
Постановка задачи
Руководство филиала региональной телекоммуникационной компании, представляющей услуги мобильной связи, поставило задачу сегментации абонентской базы. Ее целями являются:
– построение профилей абонента путем выявления их схожего поведения в плане частоты, длительности и времени звонков, а также ежемесячных расходов;
– оценка наиболее и наименее доходных сегментов.
Эта информация в дальнейшем может использоваться для разработки маркетинговых акций, направленных на определенные группы клиентов, на разработку новых тарифных планов, предотвращения оттока клиентов в другие компании.
|
|
В качестве исходных данных используются данные, взятые из биллинговой системы за последние несколько месяцев.
Решение задачи
Решение задачи следует разбить на два этапа:
1. Кластеризация объектов алгоритмом Кохонена.
2. Построение и интерпретация карты Кохонена.
В программе Deductor сети и карты Кохонена реализованы в обработчике Карта Кохонена, где содержится сам алгоритм Кохонена и специальный визуализатор карт Кохонена.
Алгоритм Кохонена применяется к сети Кохонена, состоящей из ячеек, упорядоченных на плоскости. В выходном наборе данных алгоритм Кохонена формирует поля Номер ячейки и Расстояние до центра ячейки.
Далее ячейки объединяются в кластеры при помощи алгоритма k-means или g-means. При этом, каждый входной признак имеет весовой коэффициент в диапазоне от 0 до 100 %, который влияет на расчет евклидового расстояния между векторами.