CreditSample.txt

2. Отсортируйте этот набор данных по следующим полям в порядке возрастания: Срок ссуды, Размер ссуды, Количество иждивенцев (рис. 2.26).


3. Сделайте следующую замену (после предыдущего узла Замена данных) в поле Давать кредит: значение Истина – на 1, Ложь – 0 (рис. 2.27).

Рисунок 2.26 – Таблица сортировки Рисунок 2.27 – Замена данных

Старое поле Давать кредит удалите (в настройке данных сделайте это поле неиспользуемым) из набора данных, а новое поле Давать кредит_REPLACE переименуйте в Давать кредит (рис. 2.28).

Рисунок 2.28 – Переименование Кредит_REPLACE в Давать кредит

4. Измените тип поля Количество иждивенцев на строковый (в узле импорта данных). Сделайте следующую замену (после предыдущего узла


Замена данных) в поле Количество иждивенцев: значение 0 – на Нет, 1 – Без изменений, 2 и 3 – 2 и более.

Старое поле Количество иждивенцев удалите (в настройке данных сделайте это поле неиспользуемым) из набора данных, а новое поле Количество иждивенцев_REPLACE переименуйте в Иждивенцы (рис. 2.29).

5. Отфильтруйте набор данных, полученный в п. 4 по полю Иждивенцы так, чтобы в выходной набор попали только строки, у которых значение в поле Иждивенцы не равно Нет (рис. 2.30).

Рисунок 2.29 – Переименование поля Рисунок 2.30 – Применение фильтра

6. Продолжите фильтровать набор данных, полученный в п. 5. Наложите следующий фильтр, в который попадают все записи, удовлетворяющие условиям:

Размер ссуды – от 2 000 до 5 000, Цель ссудыПокупка товара

(рис. 2.31).

7. Отсортируйте последний набор данных по полю Код (рис. 2.32).

Рисунок 2.31 – Наложение дополнительного фильтра Рисунок 2.32 – Сортировка по полю Код

Сохраните результаты в файле L2_2_дополнительно.ded.


9. Кросс-таблица

Обработчик Кросс-таблица предназначен для изменения структуры таблицы, а именно, перенесения значений полей в заголовки столбцов. Напоминает операцию транспонирования измерений в OLAP-кубе.

1) Продемонстрируем применение Кросс-таблицы, используя данные о стоимости продуктов, входящих в потребительскую корзину за четыре месяца.

Исходные данные находятся в файле basket_of_goods.txt, который необходимо импортировать в новом проекте.

Необходимо оценить индексы роста цен на продукты питания (рис. 2.33).

Рисунок 2.33 – Исходные данные

Вид исходной таблицы мало пригоден для вычислений индексов. Данную таблицу необходимо отредактировать, чтобы в ней появились дополнительные поля, в которых содержалась бы информация о цене рассматриваемых продуктов питания за каждый месяц в отдельности. Применим обработчик Кросс-таблица.

2) Преобразование исходной таблицы данных

Вызовем Мастер обработки и в появившемся окне выберем обработчик

Кросс- таблица.

Следующим шагом будет настройка используемых полей для формирования таблицы (рис. 2.34). Используемые поля для построения должны находится либо в колонках, либо в строках. В колонки помещают


поля на основе значений которых будут создаваться новые, их значениями будут выбранные факты. В строки помещаются поля, которые не нуждаются в изменении.

Рисунок 2.34 – Настройка полей обработки

Настроим данное окно:

– переместим Месяц в колонки;

Наименование – в строки;

Средняя цена в факты.

Новая таблица будет содержать поля:

Наименование – название продуктов входящих в потребительскую корзину;

Сентябрь – средняя цена, данных продуктов за сентябрь,.... Декабрь

средняя цена, продуктов за декабрь.

Следующим шагом необходимо настроить параметры агрегации выбранных фактов. В нашем случае выберем среднюю агрегацию (рис. 2.35).

3) После нажатия кнопки Далее открывается следующее окно Мастера обработки, в котором выбирается настройка параметров измерений в колонках. В нем резервируются дополнительные поля для возможного внесения изменений в значения исходного поля таблицы, а также для измерений, в названии которых содержатся пропуски (рис. 2.36).


Рисунок 2.35 – Настройка параметров агрегации

Рисунок 2.36 – Настройка параметров в колонках

Так как у нас нет данных о цене товара, с неопределенным месяцем, то галочку рядом с Пропущенными значениями ставить не будем. Прочие значения отметим флажком, так как в дальнейшем мы рассчитываем пополнить исходную таблицу еще одним месяцем, данные которого запишутся в данный столбец (рис. 2.37).


Рисунок 2.37 – Результат обработки визуализатора Таблица

Все настройки заданы, запустим процесс на выполнение.

4) Из множества предлагаемых визуализаторов выберем Таблицу.

Результаты сохранить в файле L2_5.ded.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: