Ускорительная плата М2

Многопроцессорный модуль М2 цифровой обработки сигналов выполнен на цифровых сигнальных процессорах TMS320C40 фирмы Texas Instruments и представляет собой одноплатную многопроцессорную вычислительную машину. Модуль предназначен как для автономной работы, так и для функционирования в составе ПЭВМ с системной шиной VMEbus, в том числе состоящей из нескольких таких же модулей. Конструктивно блок выполнен в соответствии с механическим стандартом VMEbus IEEE 1014 (6U).

Модуль М2 содержит:

· VME-bus контроллер;

· master/slave интерфейс;

· до шести TMS320C40 с частотой 50 МГц;

· до 2 Мб SRAM на процессор;

· до 64 Мб DRAM на плате;

· FLASH EEPROM до 0,5 Мб;

· 6 внешних связей (скорость — 20 Мб/с);

· JTAG-интерфейс;

· RS-232-интерфейс;

· общая производительность — до 300 MFLOPS.

Структурная схема ускорителя М2 приведена на рис.

 

Нейроускорители на базе нейрочипов

Кроме нейроускорителей на базе
ПЛИС и DSP, в последнее время всё большее распространение находят нейроускорители на базе специализированных нейросигнальных и нейросетевых процессоров. Проанализируем особенности их реализации на конкретных примерах.


Двухпроцессорный встраиваемый модуль МЦ4.01 (NM1)

Встраиваемый модуль цифровой обработки сигналов МЦ4.01 (NM1) производства НТЦ “Модуль” [4] предназначен для решения различных задач нейронными и нейроподобными алгоритмами, а также задач цифровой обработки сигналов и ускорения векторно-матричных вычислений (рис. 7). Модуль выполнен на спроектированных и разработанных в НТЦ цифровых сигнальных процессорах NeuroMatrix® NM6403 и представляет собой одноплатный нейроускоритель. Конструктивно выполнен в виде платы, вставляемой в стандартный слот шины PCI.

 

Нейроускоритель содержит:

· 2 нейропроцессора NM6403;

· от 2 до 8 Мбайт статической памяти (SRAM);

· 64 Мбайт динамической памяти (EDO DRAM);

· 4 внешних ком. порта с темпом обмена 20 Мбайт/с каждый.

Производительность:

· векторные операции — 1,9 млрд. операций с байтовыми операндами в секунду;

· скалярные операции — до 320 млн. операций в секунду.

Конструктивное выполнение: стандарт PCI (версия 2-1) с темпом обмена до 132 Мбайт/с.

Нейроускоритель МЦ4.02 содержит один процессор NM6403 и обладает масштабируемой производительностью от 40 до 11500 ММАС, обеспечивает обработку данных переменной разрядности от 1 до 64 бит. Модуль предназначен для работы в составе комплекса с системной шиной PCI, блок статической памяти модуля доступен для записи и чтения как со стороны процессора, так и со стороны шины PCI. На внешние разъёмы модуля выведены два комуникационных порта, аппаратно совестимых с портами TMS320C4x. Соединение коммуникационных портов нескольких модулей позволяет создавать мультипроцессорные системы различной конфигурации. Сейчас ведутся разработки по созданию модулей на базе процессора NM6404.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: