RAID-массивы

Одним из способов повышения производительности ввода/вывода является использование параллелизма путем объединения нескольких физических дисков в матрицу (группу) с организацией их работы аналогично одному логическому диску. Такая архитектура получила название Redundant Array of Independent Disks — избыточный массив независимых дисков.

Принцип функционирования RAID-системы заключается в следующем: из набора дисковых накопителей создается массив, который управляется специальным контроллером и определяется компьютером как единый логический диск большой емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается высокое быстродействие системы, а повышенная надежность хранения информации достигается дублированием данных или вычислением контрольных сумм. Следует отметить, что применение RAID-массивов защищает от потерь данных только в случае физического отказа жестких дисков.

Повышение производительности дисковой подсистемы в RAID достигается за счет следующего приема. Дисковое пространство разбивается на сегменты (strip - полосы). Полосы распределяются по различным дискам в массивы, в соответствии с определенной системой, что позволяет производить параллельное считывание или запись сразу на несколько полос.

Повышение отказоустойчивости достигается за счет избыточного дискового пространства, которое задействуется для хранения дополнительной информации, позволяющей восстанавливать потерянные или искаженные данные.

Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 4, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п.

RAID 0 – Дисковый массив без избыточного хранения данных. Информация разбивается на блоки, которые одновременно записываются на отдельные диски по циклической схеме, что обеспечивает повышение производительности за счет параллельной обработки данных. Такой способ хранения информации прост в реализации, но ненадежен, поскольку поломка одного диска приводит к потере всей информации, поэтому уровнем RAID как таковым не является.

RAID 1 – Дисковый массив с дублированием информации (зеркалированием данных). Исходные данные и копии могут размещаться по дисковому массиву произвольно, но на разных физических дисках. В простейшем случае два накопителя содержат одинаковую информацию и являются одним логическим диском. При выходе из строя одного диска его функции выполняет другой. Для реализации массива требуется не меньше двух накопителей. Для управления может использоваться один контролер (последовательно на один диск, потом на другой), но лучше для каждого диска свой для одновременной записи на оба диска. Запрос на чтение выполняет диск с меньшим временем поиска и задержкой.

Преимущества: простота реализации и простота восстановления массива в случае отказа (копирование). Недостатки: высокая стоимость — 100-% избыточность и невысокая скорость передачи данных.

RAID 2 - Отказоустойчивый дисковый массив с использованием кода Хемминга (Hamming Code ECC) для коррекции ошибок. Поток данных разбивается на слова — причем размер слова в битах соответствует количеству дисков для записи данных.

Для каждого слова вычисляется код коррекции ошибок, который записывается на диски, выделенные для хранения контрольной информации. Их число равно количеству бит в слове контрольной суммы. Если слово состоит из четырех бит, то под контрольную информацию отводится три диска. RAID 2 — один из немногих уровней, позволяющих обнаруживать двойные ошибки и исправлять "на лету" одиночные. При этом он является самым избыточным среди всех уровней с контролем четности. Эта схема хранения данных не получила коммерческого применения, поскольку плохо справляется с большим количеством запросов.

RAID 3 – Отказоустойчивый массив с параллельным вводом/выводом данных и диском контроля четности. Поток данных разбивается на полосы длиной в бит или байт и записывается одновременно на все диски массива, кроме одного. Один диск предназначен для хранения контрольных сумм, вычисляемых при записи данных. В случае отказа диска производится обращение к контрольной сумме для исправления ошибки. Поломка любого из дисков массива не приведет к потере информации. В отличии от RAID2 параллельный доступ к данным и всего 1 диск для контроля. Этот уровень имеет намного меньшую избыточность, чем RAID 2. За счет разбиения данных на порции RAID 3 имеет высокую производительность. Поскольку при каждой операции ввода/вывода производится обращение практически ко всем дискам массива, то одновременная обработка нескольких запросов невозможна. Этот уровень подходит для приложений с файлами большого объема и малой частотой обращений (в основном это сфера мультимедиа). Использование только одного диска для хранения контрольной информации объясняет тот факт, что коэффициент использования дискового пространства достаточно высок (как следствие этого — относительно низкая стоимость).

RAID 4 Отказоустойчивый массив независимых дисков с общим диском четности. Этот массив очень похож на уровень RAID 3. Поток данных разделяется не на уровне байтов, а на уровне блоков информации, каждый из которых записывается на отдельный диск. После записи группы блоков вычисляется контрольная сумма, которая записывается на выделенный для этого диск. Используется особая техника независимого доступа к дискам, позволяющая удовлетворять запросы на ввод/вывод параллельно. В отличии от RAID 3 размер полос значительно больше (1-2 физических блока на диске) и у RAID 4 возможно одновременное выполнение нескольких операций чтения. Этот массив повышает производительность передачи файлов малого объема (за счет распараллеливания операции считывания). Но поскольку при записи должна изменяться контрольная сумма на выделенном диске, одновременное выполнение операций невозможно (налицо асимметричность операций ввода и вывода). Этот уровень имеет почти все недостатки RAID 3 и не обеспечивает преимущества в скорости при передаче данных большого объема. Схема хранения разрабатывалась для приложений, в которых данные изначально разбиты на небольшие блоки, поэтому нет необходимости разбивать их дополнительно. Эта схема хранения данных имеет невысокую стоимость, но ее реализация достаточно сложна, как и восстановление данных при сбое.

Массивы RAID могут быть реализованы программно, аппаратно или программно-аппаратно. При программной реализации работа дисков в соответствии с алгоритмами различных уровней RAID обеспечивается средствами ОС, при аппаратной все функции возлагаются на специализированный контроллер. В общем случае, если доминируют короткие записи и считывания и стоимость емкости памяти не является определяющей, наилучшую производительность демонстрируют системы RAID уровня 1. RAID уровня 5 могут обеспечить очень высокую производительность, особенно в терминах отношения стоимость/производительность.

Вопросы для самоконтроля

1. Назовите основные виды памяти ЭВМ.

2. Какой вид операции в памяти имеют в виду, когда используют команду CLR («очистка памяти» или «обнуление»)?

3. Какой метод доступа реализован к регистрам процессора, оперативной памяти, НЖМД, CD, BRD?

4. Какая цель использования иерархии ЗУ в ЭВМ?

5. Каким образом при иерархической организации памяти обеспечивается высокой быстродействие при обращении в низлежащим уровням?

6. Какие виды ЗУ могут составлять основную память?

7. Что общего и чем различаются RAM и ROM?

8. С какой целью создают RAID-массивы?

9. Сравните уровни RAID по избыточности хранения данных и быстродействию.

Вопросы для самостоятельной работы

1. Принципы хранения информации в различных ЗУ.

2. Физическая реализация ROM-ЗУ: PROM, EPROM, EEPROM.

3. Носители информации в ЭВМ: оптические диски, твердотельная полупроводниковая память.

Рекомендуемая литература: публикации в журналах «Компьютер-пресс», «Железо ПК», сайт ixbit.com, xard.ru.

Литература

1. Цилькер Б.Я. Орлов С.А. Организация ЭВМ и систем: Учебник для вузов.- СПб.:Питер, 2006.

Тема 6. Организация ввода-вывода
Лекция № 3 (3 ч)

Цель лекции: представить механизм, обеспечивающий взаимодействие между собой всех компонентов компьютера и три базовых подхода к операции пересылки входных и выходных данных в ЭВМ, рассмотреть структуру и функционирование шин, дать представление об интерфейсах ЭВМ как стандартном средстве передачи данных между устройствами разного типа.

Изучаемые вопросы:

1. Назначение подсистемы ввода-вывода в ЭВМ.

2. Программно-управляемый ввод-вывод.

3. Ввод/вывод по прерыванию.

4. Прямой доступ к памяти.

5. Понятие канала ввода-вывода и интерфейса.

6. Назначение и структура шин.

7. Системные и локальные шины.

8. Функциональные характеристики конструкции шин.

9. Обзор стандартных интерфейсов ЭВМ.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: