Управление жизненным циклом информации

ILM (управление жизненным циклом информации) — это на сегодня одна из самых «горячих» концепций хранения данных, которая начала складываться всего лишь несколько лет тому назад и не привязана к какому-то одному продукту, категории или семейству продуктов. Скорее, это подход к управлению хранимыми данными на более эффективной и экономичной основе при помощи определенной стратегии, гарантирующей, что инфраструктура хранения в организации согласована с задачами.

Управление жизненным циклом информации начинается с оценки и классификации имеющейся информации и ресурсов для ее хранения с точки зрения их бизнес-ценности. Первые два шага должна сделать любая организация, которая решила управлять своей информацией на основе ее жизненного цикла, а именно: определить цели управления информацией и классифицировать свою информацию на основе ее ценности для бизнеса.

Необходимость в управлении жизненным циклом информации связана не только с управлением контентом (управление записями, управление документами и другие подобные задачи); она обусловлена и требованием управления все возрастающими объемами данных, и обеспечением соответствия нормативам, отражающим изменившуюся роль машинных форм представления данных в современном мире.

Функции ILM не ограничиваются только управлением хранением данных на определенных носителях. Требуется еще решать задачи интеллектуального управления потоками работ и бизнес-процессами, которые задействуют на эти данные. ILM управляет информацией на основе изменяющихся с течением времени критериев ее значимости для бизнес-процессов и потребностей приложений. Жизненный цикл данных начинается с момента их создания в различных системах, таких как электронная почта, ERP, СУБД, финансовые приложения, системы обработки изображений и др. Затем под управлением ILM реализуются процессы доступа, распределения, защиты, хранения и ликвидации данных. ILM позволяет задавать политики для такого управления, в которых специфицируются параметры качества сервиса данных: доступность, защищенность, скорость восстановления, производительность, местонахождение носителя и стоимость хранения.

Для того чтобы реализовать перечисленные задачи, ILM следует базировать на инфраструктуре хранения, включающей устройства разных классов, использовать программный инструментарий управления хранением и увязывать между собой задачи управления инфраструктурой хранения и потребности бизнес-приложений по размещению, использованию, хранению и миграции данных. Требуется отслеживать время нахождения конкретного информационного объекта на определенном уровне, частоту его использования, объем, возраст, легальность доступа и т.п., одновременно соизмеряя полученные данные с требуемыми параметрами стоимости, целесообразности хранения на том или ином уровне и адекватности SLA. Процессы миграции инициируются после анализа текущего состояния информационного объекта, либо по событию извне, например, в соответствии с политиками, задающими пороговые значения параметров.

Содержание политик определяют внешние критерии, формируемые бизнесом:

  • необходимый объем информации, требуемый для принятия решения;
  • состав SLA;
  • разграничение прав доступа и т.п.

Первый критерий определяется бизнес-логикой и часто не поддается формализации, а получается, например, на основе рекомендаций консультантов. Как только определен объем информации, определяются требования по ее защите. Показатель RPO (Recovery Point Objectives) специфицирует критическую массу информации, которая может быть утеряна при фатальных событиях без нарушения бизнеса (как много транзакций может быть потеряно). В некоторых случаях (для банков) это значение равно нулю, но для промышленности потери нескольких транзакций могут быть не столь критичны. Показатель RTO (Recovery Time Objectives) определяет время простоя системы от момента возникновения нарушения до восстановления работоспособности. Обычно это время, необходимое для перезагрузки и отката на предыдущее состояние. Ясно, что когда речь идет о нескольких терабайтах данных, то на их восстановление могут уйти часы и даже дни. Применительно к ILM соглашения об уровне обслуживания могут означать, например, гарантированное время доступа к информационному объекту. Права доступа зависят от требований к управлению и целостности данных. Например, требуется обеспечить доступ только внутри компании, или необходимо обеспечить возможность обращения к документации со стороны внешних партнеров. При каждой миграции данных с одного уровня на другой средства ILM должны согласовывать свои действия с этими требованиями, например, сохранив возможность доступа к редко используемому в последнее время документу из офиса, после его перемещения в архив. Согласно практике работы с информацией, в ILM выделяют три уровня организации информационных объектов.

Том. Это базовый уровень, своего рода контейнер с данными, над которым система хранения осуществляет те или иные операции. Том имеет свой идентификатор — LUN (Logical Unit Number), позволяющий параллельно обрабатывать данные независимо от их физического размещения, создавать копии, хранить информацию о виртуальных носителях, осуществлять мониторинг текущего состояния информационного объекта и т.п. С точки зрения приложения любые перемещения LUN с одного носителя на другой должны быть прозрачны — логический адрес объекта остается неизменным.

Файловая система. Информационными объектами файловой системы или базы данных являются файлы, каталоги, узлы, таблицы, метаданные. Как и для базового уровня, объекты файловой системы с точки зрения приложений должны быть нейтральны к конкретной физической реализации. Для этого служит пул метаинформации, позволяющей виртуализировать файловую систему, однако сегодня еще невозможно прямое обращение к классам хранения (логическая структуризация) и осуществляется непрямая табличная адресация. Поэтому, в частности, атрибуты процессов в ILM вычисляются через таблицу указателей.

Приложения. Реальные проблемы в ILM кроются не в процессах создания или размещения данных на хранение, а при обеспечении приложениям доступа к информационным объектам с соблюдением нормативов по срокам хранения, SLA, целостности и безопасности. К примеру, сообщения электронной почты могут содержать конфиденциальную информацию о начислении налогов, которые согласно определенным нормам должны иметь как свой конкретный срок хранения, так и степень защищенности. Приложения, отвечающие за архивирование и удаление данных должны учитывать эти моменты.

Все три уровня информационной структуры могут жить только вместе, что требует специального сервиса по интеграции. Скажем, физическая файловая система связана с виртуальными томами, задействованными в LUN — любое расширение файловой системы влечет за собой череду логических шагов по изменению метаданных. Другой пример — электронная почта. Конкретное послание может быть удалено с почтового сервера, однако если согласно политикам срок действия соответствующей информации еще не закончился, система архивирования сохранит это сообщение в своей базе — данный процесс выполняется на уровне приложений, но сама база перемещается на более медленный физический носитель — уровень файловой системы

26.08.2017 г.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: