Квантование

Квантование предназначено для преобразования непрерывных данных в дискретные. Преобразование может проходить как по интервалам (данные разбиваются на заданное количество интервалов одинаковой длины), так и по квантилям (данные разбиваются на интервалы разной длины так, чтобы в каждом интервале находилось одинаковое количество записей). В качестве значений результирующего набора данных могут выступать номер интервала, нижняя или верхняя граница интервала, середина интервала либо метка интервала (значения определяемые аналитиком).

Примером использования данного инструмента может служить разбиение данных о возрасте кредиторов на 5 интервалов (до 30 лет, от 30 до 40, от 40 до 50, от 50 до 60, старше 60 лет). Исходные данные распределятся по пяти интервалам именно так, поскольку согласно статистике минимальное значение возраста кредитора 19, а максимальное – 69 лет. Это необходимо аналитику для оценки кредиторской активности разных возрастных групп с целью принятия решения о стимулировании кредиторов в группах с низкой активностью (например, уменьшение стоимости кредита для этих групп), и, быть может, увеличение прибыли в возрастных группах кредиторов с


высоким риском (путем предложения дополнительных платных услуг). Причем аналитик желает видеть данные в разрезе по неделям.

1) Воспользуемся данными, полученными при разбиении даты файла Credit.txt (ветка сценария Иванов. Преобразование даты из файла L2_1.ded).

Определить какие суммы кредитов берут кредиторы определенных возрастных групп по неделям.

2) Для обработки данных воспользуемся Мастером квантования

(рис. 2.15).

Рисунок 2.15 – Мастер обработки Квантование

3) В нем выберем назначение поля Возрастиспользуемым, укажем способ разбиения – По интервалам, зададим количество интервалов равное 5, в качестве значения выберем Метка интервала (рис. 2.16).

4) На следующем шаге Мастера определим сами метки соответственно возраста кредиторов: до 30 лет, от 30 до 40 лет и т.д. (рис. 2.17).

5) После обработки выберем в качестве способа отображения Куб. В Мастере укажем Сумма кредита в качестве факта, поля Возраст и Дата кредитования (Год + Неделя) в качестве измерения, остальные поля укажем неиспользуемыми.


Рисунок 2.16 – Настройка параметров квантования

Рисунок 2.17 – Выбор границ и меток интервалов квантования

Далее перенесем Возраст из доступных измерений в Измерения в строках, a Дата кредитования (Год + Неделя) в Измерения в столбцах (рис. 2.18).


Рисунок 2.18 – Результат обработчика Куб

На кросс-диаграмме теперь видна информация о том, какие суммы кредитов берут кредиторы определенных возрастных групп по неделям.

Результат сохранить в том же файле L2_1.ded.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: