Системная шина и шина памяти

Кэширование.

Количество операций за такт.

Производительность процессора равна тактовой частоте, умноженной на количество выполняемых за такт операций (IPC — Instructions Per Cycle).

Упомянутая выше конвейеризация представляет собой по сути распараллеливание выполнения инструкций по времени (с наложением). Теоретически, с помощью нее число выполняемых за такт операций доводится до единицы (на практике среднее значение IPC остается меньше единицы из-за неизбежных остановов конвейера).

Динамическая оперативная память по своему быстродействию очень сильно отстает от процессоров, почти на порядок (тактовые частоты процессоров — 2 ГГц, памяти — 200 МГц). Применение такой памяти без уменьшения производительности системы возможно только при иерархическом построении подсистемы памяти с использованием дополнительной быстродействующей памяти в качестве кэша. Для эффективного кэширования быстродействие кэша должно находиться на уровне процессора, а частота попаданий должна приближаться к 100%.

Эффективность кэширования (частота попаданий) возрастает с ростом объема кэша; однако, чем больше объем кэша, тем больше проблем с получением необходимого уровня его быстродействия — можно получить быстродействующий кэш малого объема либо более медленный большого объема. Поэтому и для построения кэша применяется иерархическая структура, состоящая из кэша первого уровня (L1) с максимальным быстродействием и относительно небольшим объемом (8—128 Кбайт), кэша второго уровня (L2) с меньшим быстродействием, но большим объемом (обычно 256 или 512 Кбайт, иногда до нескольких мегабайт) и иногда кэша третьего уровня L3 (512 Кбайт и выше). Увеличение объема кэшей L2 и L3 является одним из основных способов повышения производительности процессоров (в формуле производительности вклад КЭШа учитывается в IPC).

Рассмотренные выше параметры определяют внутреннюю производительность процессора, то есть его способность обрабатывать за единицу времени какое-то количество информации. Внешняя производительность процессора, то есть скорость обмена данными с другими устройствами через внешнюю шину данных, должна соответствовать внутренней. Оценка сверху задается тактовой частотой и разрядностью процессора. Для процессора Pentium 4 с частотой 2 ГГц это 8 Гбайт/с. На практике, в силу технических проблем, связанных с невозможностью обеспечения устойчивой работы внешней параллельной шины на столь высоких частотах, ограничиваются меньшими значениями. Достаточно высокая скорость обмена достигается за счет использования более широкой внешней шины (64 разряда) и передачи нескольких порций информации за один такт работы шины. Физическая тактовая частота шины составляет 100 или 133 МГц. В процессоре Pentium 4 данные передаются 4 раза за такт, эффективная частота передачи составляет 400 или 533 МГц, а пропускная способность — 3,2 или 4,3 Гбайт/с. В процессоре Athlon XP данные передаются 2 раза за такт (по обоим фронтам). Эффективная скорость передачи составляет 200 или 266 МГц, а полоса пропускания — 1,6 или 2,1 Гбайт/с. С ростом частоты процессоров шина рано или поздно становится узким местом систем, поэтому необходимо периодически поднимать ее пропускную способность на новый уровень.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: