ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ
Лабораторный практикум
для студентов специальности: 6.05010104 «Системы искусственного интеллекта»
5.05010101 «Обслуживание программных систем и комплексов»
Утверждено
редакционно-издательским советом университета, протокол № 2 от 24.12.2014
Харьков Издательство «Точка»
УДК 004.032.2(072)
ББК 32.973.26я7
К28
Рецензенты:
Г. И. Чурюмов, докт. физ.-мат. наук, проф., профессор ХНУРЭ
О.М. Борисенко, канд. техн. наук, доцент кафедры ПГС, НТУ «ХПИ»
Касилов О.В., Компаниец В.А.
К28 | Интеллектуальный анализ данных: Лабораторный практикум для студентов специальности: 6.05010104 «Системы искусственного интеллекта», 5.05010101 «Обслуживание программных систем и комплексов» / О.В. Касилов, В.А. Компаниец. – Х.: Издательство «Точка», 2015. – 268 с. |
ISBN 978-617-669-169-3
В лабораторном практикуме «Интеллектуальный анализ данных» рассматривается методы, задачи, применение, а также инструментальные средства Data Mining. Лабораторный практикум состоит из девяти тематических разделов и позволяет познакомиться с различными методами и решениями для интеллектуального анализа данных. Ориентирован на студентов высших учебных заведений, обучающихся по специальностям в области информационных технологий.
У лабораторному практикумі «Інтелектуальний аналіз даних» розглядаються методи, завдання, застосування, а також інструментальні засоби Data Mining. Лабораторний практикум складається з дев'яти тематичних розділів і дозволяє познайомитися з різними методами і рішеннями для інтелектуального аналізу даних. Орієнтований на студентів вищих навчальних закладів, які навчаються за спеціальностями в галузі інформаційних технологій.
УДК 004.032.2(072)
ББК 32.973.26я7
ISBN 978-617-669-169-3 | © Касилов О.В., Компаниец В.А., 2015 © Издательство «Точка», 2015 |
СОДЕРЖАНИЕ
Вступление.................................................................................................................. 4
Лабораторная работа № 1. Базовые навыки работы в Deductor................ 5
Лабораторная работа № 2. Трансформация данных................................... 44
Лабораторная работа № 3. Работа с хранилищем данных........................ 79
Лабораторная работа № 4. Механизмы многомерного хранения и визуализации. OLAP-отчеты 110
Лабораторная работа № 5. OLAP-анализ. Аналитическая отчетность аптечной сети 128
Лабораторная работа № 6. Логистическая регрессия и деревья
решений в задаче кредитного скоринга......................................................... 169
Лабораторная работа № 7. Искусственные нейронные сети................... 204
Лабораторная работа № 8. Алгоритмы анализа данных. Кластеризация 219
Лабораторная работа № 9. Ассоциативные правила................................ 250
Список литературы.............................................................................................. 267
ВСТУПЛЕНИЕ
Интеллектуальный анализ данных — это обработка информации и выявление в ней моделей и тенденций, которые помогают принимать решения. Появлением больших данных повлияло на еще более широкое распространение интеллектуальных методов анализа данных. В первую очередь в бизнесе. Эти бизнес-требования привели от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных. Для решения бизнес-задач требуется такой анализ данных, который позволяет построить модель для описания информации и в конечном итоге приводит к созданию результирующего отчета.
Существует множество различных методов интеллектуального анализа данных, моделирования запросов, обработки и сбора информации. Какие из них применить для анализа своих данных, и какие можно использовать в сочетании с уже имеющимся программным обеспечением и инфраструктурой? Лабораторный практикум позволяет познакомиться с различными методами и решениями для интеллектуального анализа данных и научиться создавать такие решения с помощью существующего программного обеспечения и систем.
Лабораторный практикум состоит из 9 тематических разделов: базовые навыки работы в Deductor; трансформация данных; работа с хранилищем данных; механизмы многомерного хранения и визуализации. OLAP-отчеты; OLAP-анализ; логистическая регрессия и деревья решений; искусственные нейронные сети; кластеризация; ассоциативные правила.