2. Отсортируйте этот набор данных по следующим полям в порядке возрастания: Срок ссуды, Размер ссуды, Количество иждивенцев (рис. 2.26).
3. Сделайте следующую замену (после предыдущего узла Замена данных) в поле Давать кредит: значение Истина – на 1, Ложь – 0 (рис. 2.27).
Рисунок 2.26 – Таблица сортировки | Рисунок 2.27 – Замена данных |
Старое поле Давать кредит удалите (в настройке данных сделайте это поле неиспользуемым) из набора данных, а новое поле Давать кредит_REPLACE переименуйте в Давать кредит (рис. 2.28).
Рисунок 2.28 – Переименование Кредит_REPLACE в Давать кредит
4. Измените тип поля Количество иждивенцев на строковый (в узле импорта данных). Сделайте следующую замену (после предыдущего узла
Замена данных) в поле Количество иждивенцев: значение 0 – на Нет, 1 – Без изменений, 2 и 3 – 2 и более.
Старое поле Количество иждивенцев удалите (в настройке данных сделайте это поле неиспользуемым) из набора данных, а новое поле Количество иждивенцев_REPLACE переименуйте в Иждивенцы (рис. 2.29).
|
|
5. Отфильтруйте набор данных, полученный в п. 4 по полю Иждивенцы так, чтобы в выходной набор попали только строки, у которых значение в поле Иждивенцы не равно Нет (рис. 2.30).
Рисунок 2.29 – Переименование поля | Рисунок 2.30 – Применение фильтра |
6. Продолжите фильтровать набор данных, полученный в п. 5. Наложите следующий фильтр, в который попадают все записи, удовлетворяющие условиям:
Размер ссуды – от 2 000 до 5 000, Цель ссуды – Покупка товара
(рис. 2.31).
7. Отсортируйте последний набор данных по полю Код (рис. 2.32).
Рисунок 2.31 – Наложение дополнительного фильтра | Рисунок 2.32 – Сортировка по полю Код |
Сохраните результаты в файле L2_2_дополнительно.ded.
9. Кросс-таблица
Обработчик Кросс-таблица предназначен для изменения структуры таблицы, а именно, перенесения значений полей в заголовки столбцов. Напоминает операцию транспонирования измерений в OLAP-кубе.
1) Продемонстрируем применение Кросс-таблицы, используя данные о стоимости продуктов, входящих в потребительскую корзину за четыре месяца.
Исходные данные находятся в файле basket_of_goods.txt, который необходимо импортировать в новом проекте.
Необходимо оценить индексы роста цен на продукты питания (рис. 2.33).
Рисунок 2.33 – Исходные данные
Вид исходной таблицы мало пригоден для вычислений индексов. Данную таблицу необходимо отредактировать, чтобы в ней появились дополнительные поля, в которых содержалась бы информация о цене рассматриваемых продуктов питания за каждый месяц в отдельности. Применим обработчик Кросс-таблица.
2) Преобразование исходной таблицы данных
Вызовем Мастер обработки и в появившемся окне выберем обработчик
|
|
Кросс- таблица.
Следующим шагом будет настройка используемых полей для формирования таблицы (рис. 2.34). Используемые поля для построения должны находится либо в колонках, либо в строках. В колонки помещают
поля на основе значений которых будут создаваться новые, их значениями будут выбранные факты. В строки помещаются поля, которые не нуждаются в изменении.
Рисунок 2.34 – Настройка полей обработки
Настроим данное окно:
– переместим Месяц в колонки;
– Наименование – в строки;
– Средняя цена в факты.
Новая таблица будет содержать поля:
– Наименование – название продуктов входящих в потребительскую корзину;
– Сентябрь – средняя цена, данных продуктов за сентябрь,.... Декабрь –
средняя цена, продуктов за декабрь.
Следующим шагом необходимо настроить параметры агрегации выбранных фактов. В нашем случае выберем среднюю агрегацию (рис. 2.35).
3) После нажатия кнопки Далее открывается следующее окно Мастера обработки, в котором выбирается настройка параметров измерений в колонках. В нем резервируются дополнительные поля для возможного внесения изменений в значения исходного поля таблицы, а также для измерений, в названии которых содержатся пропуски (рис. 2.36).
Рисунок 2.35 – Настройка параметров агрегации
Рисунок 2.36 – Настройка параметров в колонках
Так как у нас нет данных о цене товара, с неопределенным месяцем, то галочку рядом с Пропущенными значениями ставить не будем. Прочие значения отметим флажком, так как в дальнейшем мы рассчитываем пополнить исходную таблицу еще одним месяцем, данные которого запишутся в данный столбец (рис. 2.37).
Рисунок 2.37 – Результат обработки визуализатора Таблица
Все настройки заданы, запустим процесс на выполнение.
4) Из множества предлагаемых визуализаторов выберем Таблицу.
Результаты сохранить в файле L2_5.ded.