Надежность информационно-вычислительных систем

Надежность – свойство системы сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения.

Надежность – комплексное свойство системы. Оно включает в себя более простые свойства, такие как безотказность, ремонтопригодность, долговечность

и т. д.

Безотказность – свойство системы сохранять работоспособное состояние в течение некоторого времени или наработки (наработка – продолжительность или объем работы системы).

Ремонтопригодность – свойство системы, заключающееся в приспособленности и обнаружению причин возникновения отказов, повреждений и восстановлению работоспособного состояния путем проведения технического обслуживания и ремонтов.

Долговечность – свойство системы сохранять при установленной системе технического обслуживания и ремонта работоспособное состояние до наступления предельного состояния, т.е. такого момента, когда дальнейшее использование системы по назначению недопустимо или нецелесообразно.

В качестве наиболее эффективных мер комплексного обеспечения надежности информационно-вычислительных систем можно назвать кластеризацию компьютеров и использование отказоустойчивых компьютеров.

Кластер –это несколько компьютеров (узлов кластера), соединенных коммуникационными каналами и разделяющих общие ресурсы. Кластер имеет общую файловую систему и воспринимается пользователем как единый компонент. Надежность работы кластера обеспечивается программами, регулирующими скоординированное использование общекластерных ресурсов, обмен информацией между узлами кластера и осуществляющими взаимный контроль работоспособностью этих узлов. Отличительной особенностью кластера является то, что каждый его работающий компьютер может взять на себя дополнительную нагрузку отказавшего узла.

Кластерные системы используют специальные программы, осуществляющие оптимальное распределение ресурсов и удобное администрирование.

Все большее распространение находят однопроцессорные или многопроцессорные компьютеры (чаще всего серверы) с отказоустойчивыми аппаратными компонентами. В отличие от кластерных отказоустойчивые системы (fault tolerant) упор делают на аппаратное обеспечение надежности и гарантируют не просто сокращение времени простоя (увеличение коэффициента готовности), а вообще предотвращение и исключение возможности таких простоев. В основу архитектуры отказоустойчивых систем заложено дублирование, в том числе и многократное, технических компонентов.

В отказоустойчивых компьютерах, любая команда выполняется одновременно на всех дублированных компонентах, и результаты выполнения команд сравниваются. Окончательное решение принимается по принципу мажорирования (по большинству одинаковых результатов). Каждый из продублированных компонентов продолжает работу и в случае отказа одного из его дублей таким образом, что система не замечает этого отказа и на ее функционировании это не отражается. Но отказавший компонент идентифицируется и замещается в режиме “горячей системы”, т.е. без отключения системы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: