Изучение модели упрощенного алгоритма Байеса

Упрощенный алгоритм Байеса (Майкрософт) предоставляет несколько способов отображения взаимосвязи между покупкой велосипедов и входными атрибутами.

 

Сеть зависимостей (Dependency Network)

Выберите модель «TM_NaiveBayes» в списке «Модель интеллектуального анализа данных (Mining Model)» в верхней части вкладки «Средство просмотра моделей интеллектуального анализа данных (Mining Model Viewer)».

Используйте список «Средство просмотра (Viewer), чтобы переключиться в «Средство просмотра упрощенного алгоритма Байеса (Майкрософт) (Microsoft Generic Content Tree Viewer)».

Щелкните узел «Покупатель велосипеда (Bike buyer)» для определения его зависимостей.

Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.

Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.

По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Покупатель велосипеда]. Перемещая ползунок, можно узнать, что несколькими атрибутами, оказывающими наибольшее влияние, являются число имеющихся в распоряжении автомобилей, расстояние до работы и общее количество детей.

 

Профили атрибутов (Attribute Profiles)

На вкладке «Профили атрибутов (Attribute profiles)» показано, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.

 

Убедитесь, что в поле «Прогнозируемый» выбрано «Покупатель велосипеда».

Если «Обозначения интеллектуального анализа данных (Mining legend) закрывает собой «Профили атрибутов (Attribute profiles)», переместите его в другое место.

В поле «Столбцы гистограммы (Histogram bars)» выберите значение 5.

В рассматриваемой модели значение 5 — это максимальное количество состояний для любой переменной.

Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.

В столбце «Атрибуты (Attributes)» найдите пункт «Число машин во владении». Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.

Дважды щелкните ячейку «Число машин во владении» в столбце покупателя велосипеда (столбец с меткой 1).

«Обозначения интеллектуального анализа данных (mining legend)» отображает более подробное представление.

 

Характеристики атрибута (Attribute Characteristics)

На вкладке «Характеристики атрибута» можно выбрать атрибут и значение, чтобы узнать частоту появления значений других атрибутов во вхождениях выбранного значения.

 

Убедитесь, что в списке «Атрибут (Attribute)» выбрано «Покупатель велосипеда (bike buyer)».

В поле «Значение (Value)» выберите 1.

В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.

Сравнение атрибутов (Attribute Discrimination)

На вкладке «Сравнение атрибутов» можно изучать связь между двумя дискретными значениями покупателей велосипеда и другими значениями атрибутов. Поскольку в модели «TM_NaiveBayes» предусмотрено только два состояния, 1 и 0, не требуется вносить изменения в средство просмотра.

В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.

 

Повышение производительности менеджера с использованием личной информационной системы


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: