Как вы знаете, корпоративный университет АстроСофт подключился к самой большой в мире базе данных научных и научно-популярных трудов Института инженеров электротехники и электроники, IEEE (подробнее об этом мы рассказывали здесь), а одна из компетенций нашей компании — ПО радиолокационных комплексов, поэтому мы активно следим за развитием данной области. Представляем перевод статьи из сборника IEEE, которую подготовили наши специалисты.
С развитием технологии радиолокационного синтезирования апертуры (РСА) возможности и вычислительная сложность обработки данных при получении изображений РСА значительно возросли, что положило начало разработке нового метода виртуальной одноузловой параллельной обработки (Virtual Single Node, VSN), который использует восемь цифровых сигнальных процессоров (ЦСП) TMS320C6678 в качестве одного мощного процессора для реализации высоко производительной распределенной системы хранения данных и обработки полученных РСА-изображений с минимальным временем задержки. Предложенный метод определяет время дистанционного считывания и записи по дальности и по азимуту в распределенном DDR (устройство прямой записи на диск) для повышения пропускной способности при удаленном взаимодействии ЦСП, а также вариант оптимизации размещения данных на локальном DDR для получения сбалансированной пропускной способности локальной памяти для данных в виде матрицы. В статье представлена реализация алгоритма получения изображения РСА на основе применения метода VSN с использованием восьми процессоров С6678. Статья будет опубликована в двух частях. Первая часть — теоретическая, в ней так же описывается принцип организации аппаратной части эксперимента.
Авторы: Jin Ye, Hu Shanqing, Zhao Jiayun, Long Teng (Основная пекинская лаборатория интегрируемых информационных технологий реального времени. Пекин, Китай).
1. Введение
РСА — двумерная система получения изображений с высоким разрешением, обладающая следующими преимуществами:
Данные преимущества играют важную роль в применении в океанографии, изучении климата, окружающей среды и др. Механизм получения изображений способом РСА совершенствуется в направлении увеличения разрешения, расширения полосы обзора, снижения затрат, уменьшения размера, в возможности построения изображения множества целей при облучении разными длинами волн, поэтому уже сегодня устанавливает высокий уровень требований к возможностям обработки, хранения и передачи [1]. Основной процесс в алгоритме получения изображений РСА — сжатие импульсов, а основная проблема — возможность обработки двумерного массива «сырых» корреляционных данных с минимальной задержкой и высокой частотой дискретизации [2].
В статье изучается метод распределения и планирования задач по получению изображений РСА на восемь высокопроизводительных ЦСП, которые можно рассматривать как один большой виртуальный узел обработки, способный получать до 64 Гб данных с плавающей запятой (размер массива — 128k*64k), обеспечивать распределенное хранение и их совместную обработку, а временная задержка составит всего 1/7 от времени обработки, необходимого одному ЦСП. Идея метода заключается в построении симметричной сети передачи данных между несколькими процессорами, имеющими равноправный параллельный и одновременный доступ к глобальной памяти, а затем обеспечивается синхронизация для достижения точного управления обработкой и передачей данных по времени и виртуализация нескольких независимых процессоров в один, чтобы повысить вычислительную мощность, емкость и пропускную способность памяти, и, наконец, достигается минимальная задержка и высокая частота дискретизации при обработке двумерной корреляционной матрицы.
2. Аппаратная часть и топология вычислительной сети
Для разрабатываемой платы в качестве основного чипа был выбран высоко производительный для вычислений с плавающей запятой ЦСП TMS320C6678 [4] производства компании TI. Одна плата содержит четыре ЦСП, к каждому из которых подключено 8 ГБ памяти DDR3. ЦСП соединены попарно посредством высокоскоростной шины гиперсвязи, формирующей узел. Четыре ЦСП взаимодействуют друг с другом по четырехпортовой шине RapidIO через коммутатор RapidIO, поддерживающий взаимодействие ЦСП на системной плате [5-6].
Рисунок 1. Взаимодействие на плате
3. Технология параллельной виртуальной одноузловой обработки
А. Схема матричного сегментирования
До использования восьми ЦСП для обработки «сырые» данные РСА должны быть равномерно распределены для хранения в каждом локальном DDR при ЦСП. Существует множество различных схем сегментации, - выбор схемы основывается на размере двумерного массива данных и пропускной способности доступа к удаленным данным между ЦСП. Для матрицы данных размерностью 128К*64К мы используем следующую схему сегментации: данные по дальности делятся на четыре равных сегмента, таким образом, ЦСП имеет доступ к целой строке данных по дальности через RapidIO шины; данные по азимуту делятся на два одинаковых сегмента, следовательно, ЦСП имеет доступ ко всей строке данных за счет гиперсвязи.
Рисунок 2. Матричная сегментация
Рисунок 3. Схематичное представление виртуального одиночного узла
Рисунок 4. Построчное распределение задач
Список литературы
[1] Zheng Bao, Mengtao Xing, Tong Wang, Radar imaging technology [M], Beijing: Electronic Industry Press, 2005.4: 124-227.
[2] Ian G. Cumming, Frank H. Wong. Digital Processing of Synthetic Aperture Radar Data: Algorithms and Implementation[M]. Boston, MA:Artech House, 2005:.ch12.
[3] Zhang Y., G. Chen. Models of parallel computation: a survey and classification[J]. Frontiers of Computer Science in China. 2007, 1(2): 156-165.
[4] TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor[DB], Texas Instruments, 2010.11.
[5] KeyStone Architecture Serial RapidIO(SRIO) User Guide[DB]. Texas Instruments, 2011.
[6] KeyStone Architecture Hyperlink(Hyperlink) User Guide[DB]. Texas Instruments, 2012.
[7] Tan Qingqing, real-time signal processing based on DSP technology research [D]. Beijing: Beijing institute of technology, 2013.
[8] TMS320C66x DSP CPU and Instruction Set Reference Guide[DB].Texas Instruments Incorporated,2011.
[9] OSEcK Kernel Reference Manual.Enea Embedded Technology.