Аномалии – это отклонения от нормального (ожидаемого) поведения чего-либо. Это может быть, например, резкое отклонение величины от ее ожидаемого значения.
Для применения алгоритма удаления аномалий необходимо указать поле таблицы, к которому его нужно применить (которое содержит аномалии), и указать степень подавления аномальных данных – малую, среднюю или большую. Пример с аномалиями (рис. 1.27).
1) В качестве примера возьмем данные о продажах за некоторый период из файла Trade.txt, проект находится в файле L1_3.ded.
Как видно из диаграммы, выбросы ухудшают статистическую картину распределения данных. Воспользуемся Мастером обработки (рис. 1.28) и выберем Парциальную обработку.
2) На втором и четвертом шагах – Восстановление пропущенных данных
и Спектральный анализ выбираем опцию Отключить для обоих столбцов.
до обработки | после обработки |
Рисунок 1.27 – Редактирование аномальных значений
Рисунок 1.28 – Мастер обработки
3) На третьем шаге выбираем поле Количество и указываем ему тип обработки Редактирование аномальных значений, степень подавления Большая. Так как больше никаких действий над данными не планировалось, то переходим на шаг запуска процесса обработки и нажимаем Пуск (рис. 1.29).
|
|
4) После выполнения процесса обработки на диаграмме видно, что выбросы уменьшились, и стала проясняться реальная картина продаж (рис. 1.30).
Рисунок 1.29 – Настройка параметров Парциальной обработки
до обработки | после обработки |
Рисунок 1.30 – Результат Парциальной обработки