Еще в 80-г. прошлого века для выполнения научных исследований неотъемлемой частью самого исследования была разработка компьютерных программ, когда ученый сам ставил себе задачу, выполнял ее и был в большинстве случаев единственным пользователем созданного приложения. В настоящее время существует широкий спектр профессиональных решений, обеспечивающих поддержку выполнения научных исследований. Особое место в широком спектре аналитических систем занимают средства бизнес-анализа. Это объясняется, с одной стороны, острой потребностью в исследованиях под воздействием возросшего уровня конкуренции, внешних и внутренних изменений в бизнесе, высокими требованиями к оперативности и обоснованности принимаемых решений. С другой стороны ─ наличие громадных объемов данных, накопленных в государственных, региональных, корпоративных базах данных позволяет выявить новые знания для повышения эффективности бизнеса.
Современные технологии, применяемые в системах бизнес-анализа, ориентированы исследовательские процессы, обеспечивающие принятие обоснованных решений в управлении экономическими объектами. Предварительный анализ, как правило, выполняется средствами OLAP-технологий - технологий оперативной аналитической обработки данных, которые просты в применении, снабжены инструментами визуализации данных и возможностью выполнения необходимых расчетов. Для выполнения глубоких исследований необходимо применение более гибких методов интеллектуального анализа данных. В этом случае предпочтение отдается методам Data Mining.
|
|
Data Mining - процесс выявления скрытых закономерностей и взаимозависимостей в больших наборах данных для поддержки принятия решений [7]. Основная особенность Data Mining - это сочетание широкого математического инструментария (от классического статистического анализа до новых кибернетических методов) и последних достижений в сфере информационных технологий. В технологии Data Mining гармонично объединились строго формализованные методы и методы неформального анализа, т.е. количественный и качественный анализ данных.
К методам и алгоритмам Data Mining относятся следующие: искусственные нейронные сети, деревья решений, символьные правила, методы ближайшего соседа и k-ближайшего соседа, метод опорных векторов, байесовские сети, линейная регрессия, корреляционно-регрессионный анализ; иерархические методы кластерного анализа, неиерархические методы кластерного анализа, в том числе алгоритмы k-средних и k-медианы; методы поиска ассоциативных правил, в том числе алгоритм Apriori; метод ограниченного перебора, эволюционное программирование и генетические алгоритмы, разнообразные методы визуализации данных и множество других методов.
|
|
Большинство аналитических методов, используемые в технологии Data Mining – это известные математические алгоритмы и методы. Новым является возможность их использования не только в теоретических исследованиях, но и для решения практических задач, что обусловлено возможностями современных информационных систем и технологий.
Выбор инструментальных средств анализа экономической информации определяется видом научного исследования, его целями и задачами, объектом и предметом исследования. Рассмотрим отдельные, наиболее распространенные решения.