OLAP- анализ
Репозиторий
----- потоки данных
потоки метаданных
Рис. 3.21. Структура хранилища данных
OLAP- хранилище |
Оперативные данные собираются из различных источников, очищаются, интегрируются и складываются в реляционное хранилище. При этом они уже доступны для анализа при помощи различных средств построения отчетов. Затем данные (полностью или частично) подготавливаются для OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в реляционном хранилище. Важнейшим его элементом являются метаданные, т.е. информация о структуре, размещении и трансформации данных.
Благодаря им обеспечивается эффективное взаимодействие различных компонентов хранилища.
Таким образом, задача хранилища — предоставить «сырье» для анализа в одном месте и в простой, понятной структуре.
Есть и еще одна причина, оправдывающая появление отдельного хранилища. Сложные аналитические запросы к оперативной информации тормозят текущую работу компании, надолго блокируя таблицы и захватывая ресурсы сервера.
|
|
Основными причинами, побуждающими организации внедрять хранилища данных, являются:
• необходимость выполнения аналитических запросов и генерации отчетов на не задействованных основными ИС вычислительных ресурсах;
• необходимость использования моделей данных и технологий, ускоряющих процесс выполнения запросов и подготовки отчетности, но не предназначенных для обработки транзакций;
• создание среды, в которой даже относительно небольших знаний основ СУБД достаточно для создания запросов и подготовки отчетов, что означает сокращение времени, требуемого от персонала ИТ-отдела для сопровождения системы;
• создание источника с предварительно очищенной информацией;
• упрощение процесса подготовки отчетов на основе информации из нескольких транзакционных систем и/или внешних источников данных и/или данных, используемых исключительно для генерации отчетов;
• создание выделенного источника в тех случаях, когда возможности операционной системы не соответствует требуемому бизнесом сроку хранения данных и/или необходимо иметь возможность подготовки отчетов на определенные моменты времени в прошлом;
• защита конечных пользователей от необходимости в какой бы то ни было степени вникать в структуру и логику работы БД регистрирующей системы.
Переход от данных к знаниям — логическое следствие развития и усложнения информационно-логических структур, обрабатываемых с помощью компьютера. Активно развивающейся областью использования современных компьютеров является создание баз знаний (БЗ) и их применение в различных областях науки и техники.
|
|
Знания — это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.
Знания можно рассматривать как стратегическую информацию, необходимую для формирования цели и построения кинематической траектории, а информацию — как оперативные знания, используемые системой в динамическом процессе.
Под базой знаний (БЗ) понимают совокупность знаний, накопленных человеком в определенной предметной области, выраженную с помощью некоторого языка представления знаний.
Для создания БЗ разрабатываются соответствующие программные средства. Они позволяют обеспечивать загрузку, актуализацию, поддержание в достоверном состоянии, расширение БЗ, формирование, обработку и включение новых знаний, соответствующих текущей ситуации. Базы знаний составляют основу экспертных систем при подготовке управленческих решений.
Экспертные системы (ЭС) — прикладные системы искусственного интеллекта, в которых база знаний представляет собой формализованные эмпирические знания высококвалифицированных специалистов (экспертов) в какой-либо узкой предметной области, а также может содержать результатную информацию, полученную при решении экономических задач.
Структура экспертной системы и ее компоненты представлены на рис. 3.22.
Рис. 3.22. Структура экспертной системы |
• База знаний предназначена для хранения экспертных знаний о предметной области, которые используются при решении задач экспертной системой. База знаний состоит из набора фреймов и правил-продукций. Фрейм — это структура данных, состоящая из слотов (полей). Фреймы используются в базе знаний для описания объектов, событий, ситуаций, прочих понятий и взаимосвязей между ними. Правила используются в базе знаний для описания отношений между объектами, событиями, ситуациями и прочими понятиями. На основе отношений, задаваемых в правилах, выполняется логический вывод. В условиях и заключениях правил присутствуют ссылки на фреймы и их слоты.
• База данных предназначена для временного хранения фактов или гипотез, являющихся промежуточными решениями или результатом общения системы с внешней средой, в качестве которой обычно выступает человек, ведущий диалог с экспертной системой.
• Машина логического вывода — механизм рассуждений, оперирующий знаниями и данными с целью получения новых данных из знаний и других данных, имеющихся в рабочей памяти. Для этого обычно используется программно реализованный механизм дедуктивного логического вывода (какая-либо его разновидность) или механизм поиска решения в сети фреймов или семантической сети. Машина логического вывода может реализовывать рассуждения в виде дедуктивного вывода (прямого, обратного, смешанного), нечеткого вывода, вероятностного вывода, поиска решения с разбиением на последовательность подзадач, поиска решения с использованием стратегии разбиения пространства, поиска с учетом уровней абстрагирования решения или понятий, с ними связанных, монотонного или немонотонного рассуждения, рассуждений с использованием механизма аргументации, ассоциативного поиска с использованием нейронных сетей и др.
• Подсистема общения служит для ведения диалога с пользователем, в ходе которого ЭС запрашивает у пользователя необходимые факты для процесса рассуждения, а также дает возможность пользователю в какой-то степени контролировать и корректировать ход рассуждений экспертной системы.
• Подсистема объяснений необходима для того, чтобы дать возможность пользователю контролировать ход рассуждений и, может быть, учиться у ЭС. Если нет этой подсистемы, ЭС выглядит для пользователя как «вещь в себе», решениям которой можно либо верить, либо нет. Пользователь выбирает последнее, и такая ЭС не имеет перспектив для применения.
|
|
• Подсистема приобретения знаний служит для корректировки и пополнения базы знаний. В простейшем случае это — интеллектуальный редактор базы знаний, в более сложных экспертных системах — средства для извлечения знаний из баз данных, неструктурированного текста, графической информации и т.д.
Среди специализированных систем, основанных на знаниях, наиболее значимы экспертные системы реального времени, или динамические экспертные системы. На их долю приходится 70% этого рынка.
Классы задач, решаемых экспертными системами реального времени, таковы: мониторинг в реальном масштабе времени, системы управления верхнего уровня, системы обнаружения неисправностей, диагностика, составление расписаний, планирование, оптимизация, системы — советчики оператора, системы проектирования.
Выводы
Информационное обеспечение (ИО) предназначено для отражения информации, характеризующей состояние управляемого объекта; служит основой для принятия управленческих решений. Основой ИО является экономическая информация, структура которой достаточно сложна и включает различные комбинации информационных элементов, имеющих различную сложность построения.
Структура ИО включает систему показателей предметной области, потоки информации, системы классификаций и кодирования, унифицированную систему документации и информационные массивы (файлы), хранящиеся на машинных носителях. Классификаторы и коды предназначены для формирования сводных данных на ПК и группировки информации по каким-либо признакам. Используются различные виды классификаторов, входящие в Единую систему классификации и кодирования (ЕСКК). Классификаторы служат для ведения в ПК различных справочников.
Применение штрихового кодирования обеспечивает автоматизированный ввод первичной информации в ПК. С этой целью в различных сферах деятельности используется информационная технология, основанная на применении штрихкодов. Документы являются основными носителями информации при компьютерной обработке. Современные информационные технологии позволили по-новому подойти к созданию документа в компьютере, который можно назвать «электронным документом». Обработка экономических задач характеризуется сложным документооборотом. Автоматизация документооборота обеспечивается специальными машинными программами электронного документооборота.
|
|
Совокупность данных, организованная в соответствии с определенными правилами и поддерживаемая в памяти компьютера, называется базой данных (БД). БД характеризует актуальное состояние некоторой предметной области и используется Для удовлетворения информационных потребностей пользователей. СУБД — это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. Хранилище данных (ХД) представляет собой систему, содержащую непротиворечивую интегрированную предметно-ориентированную совокупность исторических данных крупной корпорации или иной организации для поддержки принятия стратегических решений. ХД используют технологии БД, OLAP, визуализации данных и др. Совокупность знаний, выраженная с помощью некоторого языка представления знаний, называют базой знаний (БЗ). БЗ является составной частью экспертных систем. В этих системах аккумулируются знания специалистов в конкретных предметных областях
и тиражируется их опыт для консультаций менее квалифицированных пользователей.
Вопросы для самоконтроля
1. Сформулируйте понятие информационного обеспечения, его цели и задачи; перечислите состав ИО.
2. Приведите структуру экономической информации.
3. Дайте определение классификаторов и кодов, состава ЕСКК. Какова роль экономистов-пользователей в их создании?
4. Охарактеризуйте общероссийские, отраслевые и локальные классификаторы.
5. Отметьте особенности различных систем кодирования.
6. В чем состоит технология применения кодов при обработке экономических задач?
7. Рассмотрите технологию создания в машине справочников как элемента базы данных нормативно-справочной информации.
8. В чем суть штрихового кодирования и каково его применение?
9. Дайте определение документа; приведите классификацию документов.
10. Приведите понятие унифицированной системы документации (УСД). Каковы требования УСД к документам?
11. Что представляет собой стандартная форма построения документа? Как происходит ее приспособление к автоматизированной обработке?
12. Приведите примеры форм ввода данных документа в ПК.
13. Как происходит формирование электронного документа компьютером?
14. Рассмотрите автоматическое формирование в ПК различных документов на основании введенных в базу данных первичных документов.
15. Назовите варианты организации внутримашинного информационного обеспечения.
16. Что представляют собой базы данных и для чего они предназначены?
17. Какие функции выполняет система управления базами данных (СУБД)?
18. Для чего предназначено хранилище данных (ХД)?
19. Для решения каких задач создаются базы знаний (БЗ)?
Тесты к гл. 3
1. Определите последовательность работ, выполняемых при составлении локальных кодов:
а) выбор системы кодирования;
б) составление списка номенклатур;
в) выделение группировочных признаков;
г) определение состава номенклатур, подлежащих кодированию;
д) присвоение кодов каждой позиции номенклатуры;
е) загрузка классификатора в базу данных;
ж) составление классификатора.
2. Определите отношение перечисленных кодов к общероссийским и локальным: классификаторы предприятий и организаций; подразделений предприятия; работающих; единиц измерения; валют; организационно-правовой формы; унифицированной документации; материальных ценностей.
Общероссийские | Локальные |
1. | 1. |
2. | 2. |
3. | 3. |
4. | 4. |
3. Каким системам кодирования присущи перечисленные характерные черты: не обеспечивается автоматическое составление итогов по всем выделенным признакам; выделение серии номеров старшим признаком; отсутствие резерва свободных номеров; четкое выделение всех группировочных признаков; автоматическое получение итогов по всем группировочным признакам; учитывается однопризначная номенклатура; учитывается многопризначная номенклатура?
Порядковая | |
Серийная | |
Позиционная |
4. В рабочем плане счета «60» (поставщики и подрядчики) выделены два субсчета: рублевые поставщики и валютные. В аналитическом счете выделить три признака: регион (два знака), поставщик (два знака), товар (три знака).
Определите количество выделяемых признаков в РПС; определите значность кода РПС; выберите систему кодирования; закодируйте РПС и приведите примеры; представьте структуру РПС графически.
5. Определите, какие из приведенных ниже реквизитов размещаются в заголовочной, содержательной и оформляющей частях документа: наименование организации, цена, единица измерения, наименование продукции и ее код, адрес организации, количество, код по ОКПО, подпись, дата, сумма, банковские реквизиты предприятия.
Заголовочная | |
Содержательная | |
Оформляющая |
6. Что проставляется в содержательной части документа?
а) подписи ответственных лиц;
б) переменные реквизиты-признаки и их коды;
в) переменные реквизиты-признаки, их коды и основания;
г) постоянные реквизиты-признаки и их коды;
д) постоянные реквизиты-признаки, их коды и основания.
7. Отметьте характерные черты электронного документа:
а) формируется на основе ввода данных в компьютер;
б) хранится в реестре документов;
в) является языком программирования;
г) служит основанием для формирования других документов с одинаковым содержанием;
д) входит в ЕСКК.
8. Отметьте особенности технологии заполнения макета электронного документа:
а) справочные данные вводятся автоматически;
б) возможность печати унифицированного документа;
в) автоматическое кодирование номенклатуры;
г) возможность модификации макета;
д) отсутствие машинного контроля вводимых данных.
9. Какие виды организации информации относятся к внутримашин- ному информационному обеспечению?
а) документы;
б) система классификации и кодирования;
в) информационные файлы;
г) базы данных;
д) система показателей.
10. База данных позволяет осуществлять:
а) жесткую привязку данных к программам;
б) быстрый доступ к информации;
в) удобное манипулирование данными;
г) системное хранение информации.
11. Управление базой данных обеспечивается:
а) техническими средствами;
б) персоналом;
в) СУБД.
12. Что представляют собой:
База данных | Хранилище данных | База знаний |
а) систематизированную совокупность знаний предметной области, описанную с использованием выбранной формы их представления;
б) проблемно-ориентированный, интегрированный, пополняемый со временем, но неизменный после фиксации набор данных, формируемых для поддержки принятия решений;
в) именованную совокупность структурированных данных, отражающую состояние объектов и их отношений в рассматриваемой предметной области.
Глава4