double arrow

Редактирование аномальных значений

Аномалии – это отклонения от нормального (ожидаемого) поведения чего-либо. Это может быть, например, резкое отклонение величины от ее ожидаемого значения.

Для применения алгоритма удаления аномалий необходимо указать поле таблицы, к которому его нужно применить (которое содержит аномалии), и указать степень подавления аномальных данных – малую, среднюю или большую. Пример с аномалиями (рис. 1.27).

1) В качестве примера возьмем данные о продажах за некоторый период из файла Trade.txt, проект находится в файле L1_3.ded.

Как видно из диаграммы, выбросы ухудшают статистическую картину распределения данных. Воспользуемся Мастером обработки (рис. 1.28) и выберем Парциальную обработку.

2) На втором и четвертом шагах – Восстановление пропущенных данных

и Спектральный анализ выбираем опцию Отключить для обоих столбцов.


до обработки после обработки

Рисунок 1.27 – Редактирование аномальных значений

Рисунок 1.28 – Мастер обработки

3) На третьем шаге выбираем поле Количество и указываем ему тип обработки Редактирование аномальных значений, степень подавления Большая. Так как больше никаких действий над данными не планировалось, то переходим на шаг запуска процесса обработки и нажимаем Пуск (рис. 1.29).

4) После выполнения процесса обработки на диаграмме видно, что выбросы уменьшились, и стала проясняться реальная картина продаж (рис. 1.30).


Рисунок 1.29 – Настройка параметров Парциальной обработки

до обработки после обработки

Рисунок 1.30 – Результат Парциальной обработки


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: