Введемо основні поняття з теорії дерев рішень, які будуть вживатися далі:
Назва | Опис |
Об'єкт | Приклад; шаблон; спостереження |
Атрибут | Ознака; незалежна змінна; властивість |
Мітка классу | Залежна змінна; цільова змінна; ознака, що визначає клас об'єкта |
Вузол | Внутрішній вузол дерева; вузол перевірки |
Листок | Кінцевий вузол дерева; вузол рішення |
Перевірка (test) | Умова на вузлі |
Дерева рішень – це один із методів автоматичного аналізу даних, що дозволяє представляти правила в ієрархічній, послідовній структурі, де кожному об'єкту відповідає єдиний вузол-рішення. Під правилом розуміємо логічну конструкцію виду «якщо..., то...» (рис. 1.1).
Рисунок 1.1 – Приклад фрагменту дерева рішень
Область застосувань дерев рішень нині є душе широкою, проте всі задачі, що розв’язуються за допомогою цього апарату можна умовно об’єднати в такі три класи:
- Опис даних: дерева рішень дозволяють зберігати інформацію про дані в компактній формі – замість самих даних можна зберігати дерево рішень, що містить точний опис об'єктів.
|
|
- Класифікація: дерева рішень чудово підходять для задач класифікації, тобто віднесення об'єктів до одного із заздалегідь відомих класів. При цьому цільова змінна може приймати тільки дискретні значення.
- Регресія: якщо цільова змінна приймає неперервні значення, то дерева рішень дозволяють встановити залежність цільової змінної від незалежних (вхідних) змінних; до цього класу відносять завдання чисельного прогнозування (прогнозування цільової змінної).