Остальные виды рисков будут учтены в Плане восстановления

Метод «Неприступной крепости» является самой дорогой превентивной мерой. Он позволяет устранить большинство видов уязвимости, например, путем строительства бункера с собственным энерго- и водоснабжением.

Подход «Неприступной крепости» пригоден для крупных вычислительных центров, которые слишком сложны для разработки для них Плана восстановления.

Выбор способов восстановления [3]

Способы восстановления должны включать в себя:

Персонал и размещение — помещение, мебель, транспорт, способ перемещения и т. д.

ИТ-системы и сети — способы.1 восстановления будут обсуждаться ниже.

Вспомогательные службы — электро- и водоснабжение, телефон, почта и курьерская

связь.

Архивы — дела, документы, архив на бумажный носителях и справочные материалыы

Услуги сторонних организаций — таких, как поставщиков услуг электронной почты и Интернета.

Способы быстрого восстановления ИТ-услуг:

• Возврат к ручной (на основе бумажных носителей) системе — этот способ обычно не подходит для услуг, критически важных для бизнеса, поскольку трудно найти достаточное количество персонала, имеющего опыт работы с традиционными системами. Более того, бумажные системы, существовавшие в прошлом, теперь могут уже не существовать. Тем не менее такие системы можно использовать для менее важных, второстепенных услуг.

• Взаимные соглашения — этот способ можно использовать в том случае, когда две организации используют одинаковое аппаратное обеспечение и между ними существует договоренность о предоставлении друг другу необходимых устройств в случае возникновения чрезвычайных обстоятельств. Для данного способа две бизнес-структуры должны заключить соглашение и координировать все изменения, с тем чтобы сохранить взаимозаменяемость двух сред. СЛОЖНО!!.

• Поэтапное восстановление («холодный» резервный центр[4]) — этот способ можно использовать в тех сферах бизнеса, где можно обойтись без ИТ-услуг в течение определенного периода времени, например, 72-х часов. При использовании данного способа заказчику предоставляется:

свободный компьютерный зал на заранее оговоренной территории, стационарный центр [5] или

• мобильная компьютерная комната, доставляемая на место расположения компании, — мобильный центр [6] .

Такой компьютерный центр должен быть снабжен электропитанием, кондиционером, сетевыми коммуникациями и телефонной связью.

Данный способ может бытъ предоставлен по договору с внешним поставщиком. Кроме того, необходимо отдельное соглашение с поставщиком, гарантирующее быструю доставку ИТ- компонент. Общее преимущество такого подхода состоит в том, что эти средства восстановления доступны всегда. Недостатки способа определяются следующими факторами:

- Расстояние до центра — обычно существует ограниченное количество поставщиков, предоставляющих услуги стационарного центра, и он может находиться на некотором расстоянии от заказчика. Этот недостаток может быть компенсирован использованием мобильной станции.

- Время — стационарные залы доступны лишь на определенное время.

- Задержкав любом случае доставка необходимого компьютерного оборудования занимает определенное время.

- Сеть — часто возникают трудности с предоставлением нужных телекоммуникационных средств. Оборудование передвижной станции можно подсоединить к сети в основном используемом здании.

• Промежуточное восстановление («теплый» резерв[7]) — данный способ обеспечивает доступ к аналогичной операционной среде, в которой можно восстановить обычное предоставление услуг в течение короткого промежутка времени (от 24 до 72 часов). Существует три варианта этого способа:

- Внутренний (совместное устранение неисправности): применим в тех случаях, когда бизнес располагается на нескольких площадках или имеет выделенную среду тестирования, которую можно использовать в качестве рабочей среды.Данный способ обеспечивает полное восстановление при минимальных затратах времени на переключение.

- Внешний: некоторые поставщики услуг предлагают этот способ как коммерческую услугу. При этом затраты распределяются между несколькими заказчиками. Часто этот способ помогает сохранить работоспособность на период времени, в течение которого активируется «холодный» резервный центр..

- Мобильный: в данном варианте готовая к работе инфраструктура размещается в трейлере, который используется как компьютерный зал и оборудован устройствами контроля за окружающей средой, такими как кондиционеры. У ИТ-организации должно быть место для парковки такого трейлера. В специально выделенных пунктах на некотором расстоянии от основного здания должны быть предусмотрены источники электропитания, телекоммуникационные каналы и хранилище данных..

• Немедленное восстановление (««горячий»» старт, ««горячее»» восстановление) - данный способ обеспечивает немедленное или очень быстрое восстановление работы менее чем за 24 часа путем предоставления идентичной рабочей среды и зеркального отображения данных, а возможно, и рабочих процессов..

• Комбинации способов — часто План на случай чрезвычайных обстоятельств[8] включает в себя более дорогой способ восстановления, который используется до активизации более дешевого варианта. Например, трейлер, оборудованный как передвижной вычислительный центр может служить временным решением до тех пор, пока не приедет мобильный центр.

f. Организация процесса и планирование внедрения

Должен быть разработан общий план, охватывающий следующие вопросы:

План экстренного реагирования;

План оценки повреждений;

План восстановления работа;

План работа с важными данными (что делать с данными, включая записи на бумажный носителях);

g. Применение превентивныых мер и способов восстановления

Превентивные меры по уменьшению степени воздействия включают:

■ Использование бесперебойный источников питания и резервный источников электропитания;

Использование отказоустойчивых систем [9] ;

Использование удаленных систем хранения данных и RAID-массивов и т. д.

Также должен быть объявлен стартовый срок для активизации резервных соглашений, включающих персонал, здания и телекоммуникации.

Рамочные неактивированные («дремлющие»») договоры на такой случай могут быть заключены с поставщиками заранее.

В этом случае уже будут подписаны заказы на поставку компонентов по согласованной ранее цене. В случае чрезвычайной ситуации поставщик будет исполнять заказ без необходимости обсуждения его цены.

Такие неактивированные («дремлющие») договоры следует пересматривать каждый год, т. к. цены и модели технических средств могут изменяться.

h. Разработка планов и процедур восстановления

Планы должны быть разработаны в деталях, и стать официальными документами.

Планы восстановления требуют поддержки, и все изменения в них должны согласовываться заинтересованными сторонами.

Основные проблемы связаны с изменениями в инфраструктуре и Изменениями Уровней Сервиса. Например, переход на новую платформу среднего класса2 может привести к тому, что не будет э квивалентного оборудования в резервном центре «теплого»», внешнего старта.

План восстановления

План восстановления должен включать все виды деятельности по восстановлению бизнес- активности и ИТ-услуг:

■ Введение — описание структуры плана и предполагаемых средств восстановления.

■ Обновление — описание процедур и соглашений по поддержке актуальности плана и отслеживанию изменений в инфраструктуре.

■ Маршрутный лист — план делится на разделы, каждый из которых определяет действия, выполняемые конкретной группой специалистов. Маршрутный лист показывает, какие разделы плана должны быть направлены в каждую группу.

■ Начало восстановления — описание времени и условий начала действия плана.

■ Классификация чрезвычайных обстоятельств — если в плане дается описание процедур на случай различных чрезвычайных обстоятельств, то они должны быть описаны с точки зрения их:

v серьезности (незначительные, среднего уровня серьезности, серьезные),

v длительности (день, неделя, месяцы) и

v уровня повреждений (незначительные, ограниченные, серьезные).

■ Разделы для участвующих групп специалистов — план должен бытъ разделен на шесть разделов — по количеству областей действия и закрепленных на за ними групп специалистов:

- Администрация — как и когда вводить план в действие, какие руководители и специалисты участвуют в нем, где находиться центр управления?

- ИТ-инфраструктура — аппаратное и программное обеспечение, телекоммуникационные средства, включенные в систему восстановления и соответствующие процедуры, а также неактивированные («дремлющие») договоры на закупку новых ИТ-компонентов.

- Персонал — персонал, необходимым для работы в резервном центре, возможно, средства транспортировки и размещение персонала, если резервный центр расположен удалено от основного месторасположения.

- Безопасность — и нструкции по защите от краж, пожаров и взрывов, как в основном здании, так и на удаленной площадке, а также информация о внешних хранилищах, таких как склады и подвалы.

- Площадки восстановления — информация о договорах, персонале с указанием конкретных функций, системе безопасности и транспор те.

- Возврат к нормальным условиям — процедуры восстановления нормальной инфраструктуры (например, здания), условия, при которых начинают действовать эти процедуры и соответствующие неактивированныы («дремлющие»») контракта.

i. Начальное тестирование

Начальное тестирование — критически важный аспект процесса ITSCM. Теста следует проводить в начале работы, потом после проведения значительных изменений и затем, как минимум, один раз год. Тесты могут проводиться с предварительным объявлением или без него.

j. Обучение и осведомление

Обучение персонала ИТ-подразделения и других отделов компании и осведомленность всего персонала организации являются важными условиями успешной реализации Процесса Управления Непрерывностью ИТ-сервисов.

k. Анализ и аудит

Следует регулярно проводить аудит и проверять актуальность всех планов. В области ИТ такой аудит должен проводиться при каждом значительном изменении ИТ-инфраструктуры, например, при вводе в операционную среду новых систем и сетей и появлении новых поставщиков.

l. Тестирование

Необходимо проводить регулярное тестирование Плана восстановления, подобно объявлению учебных тревог на борту корабля.

В некоторых случаях можно проводить тестирование изменений на средствах восстановления прежде, чем вводить их в действующую ИТ- инфраструктуру.

4.Учебный вопрос 4. Критические факторы успеха, ключевые показатели эффективности и проблемы процесса Управления Мощностями

a. Критические факторы успеха Процесса Управления Непрерывностью

наличие эффективного Процесса Управления Конфигурациями;

проведение специального обучения для всех участников данного процесса;

регулярное тестирование плана восстановления без предварительного уведомления.

b. Ключевыми показателями качества являются:

количество выявленных ошибок в планах восстановления;

потеря дохода компании в результате чрезвычайной ситуации;

m. стоимость процесса управления непрерывностью.

c. Проблемы

• Ресурсы — организация должна предоставить дополнительные мощности проектной команде для разработки и тестирования плана.

• Серьезность намерений (обязательства) — ежегодные расходы на процесс должны быть включены в бюджеты организаци и, для чего требуется твердое намерение руководства поддерживать Процесс Управления Непрерывностью ИТ-сервисов.

• Оценка потерь — некоторые потери, такие как потеря репутации, нельзя измерить в денежном выражении.

• Постоянное откладывание — это бывает в тех случаях, когда отсутствует большинство составляющих процесса и, как следствие этого, реализация процесса постоянно откладывается. «Да. Мы встречается по этому вопросу на следующей неделе», «Мы собирается создать комиссию специально по данному вопросу» и тому подобное.

• Отсутствие осведомленности в компании — необходимо, чтобы вся организация знала о значимости процесса ITSCM. Б ез информирования персонала и его поддержки процесс обречен на неудачу.


Заключение — до 5 мин.

Содержание и методические рекомендации:

- обобщить наиболее важные, существенные вопросы лекции.

- сформулировать общие выводы.

- поставить задачи для самостоятельной работы.

- ответить на вопросы студентов.

Лекция разработана «___»________2011 г.

_______________________(Ежов С.М.)

(подпись, фамилия и инициалы автора)


[1] Scope

[2] Business Impact Analysis

[3] Recovery options.

[4] Cold stand-by.

[5] Fixed facility.

[6] Mobile facility.

[7] Warm stand-by.

[8] Continsency plan.

[9] Fault-tolerant systems.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: