+7 (812) 670-9095
Обратная связьEnglish
Главная → Статьи → Радиолокация → Виртуальная одноузловая обработка для получения изображений РСА на основе многопроцессорной системы
Версия для печати

Виртуальная одноузловая обработка для получения изображений РСА на основе многопроцессорной системы

13 апреля 2017

Как вы знаете, корпоративный университет АстроСофт подключился к самой большой в мире базе данных научных и научно-популярных трудов Института инженеров электротехники и электроники, IEEE (подробнее об этом мы рассказывали здесь), а одна из компетенций нашей компании — ПО радиолокационных комплексов, поэтому мы активно следим за развитием данной области. Представляем перевод статьи из сборника IEEE, которую подготовили наши специалисты.



С развитием технологии радиолокационного синтезирования апертуры (РСА) возможности и вычислительная сложность обработки данных при получении изображений РСА значительно возросли, что положило начало разработке нового метода виртуальной одноузловой параллельной обработки (Virtual Single Node, VSN), который использует восемь цифровых сигнальных процессоров (ЦСП) TMS320C6678 в качестве одного мощного процессора для реализации высоко производительной распределенной системы хранения данных и обработки полученных РСА-изображений с минимальным временем задержки. Предложенный метод определяет время дистанционного считывания и записи по дальности и по азимуту в распределенном DDR (устройство прямой записи на диск) для повышения пропускной способности при удаленном взаимодействии ЦСП, а также вариант оптимизации размещения данных на локальном DDR для получения сбалансированной пропускной способности локальной памяти для данных в виде матрицы. В статье представлена реализация алгоритма получения изображения РСА на основе применения метода VSN с использованием восьми процессоров С6678. Статья будет опубликована в двух частях. Первая часть — теоретическая, в ней так же описывается принцип организации аппаратной части эксперимента.

Авторы: Jin Ye, Hu Shanqing, Zhao Jiayun, Long Teng (Основная пекинская лаборатория интегрируемых информационных технологий реального времени. Пекин, Китай).

Часть 1. Предпосылки. Начало эксперимента


1. Введение

РСА — двумерная система получения изображений с высоким разрешением, обладающая следующими преимуществами:

  • хорошая проникающая способность,
  • сильная помехоустойчивость,
  • способность работать круглосуточно, в любую погоду.

Данные преимущества играют важную роль в применении в океанографии, изучении климата, окружающей среды и др. Механизм получения изображений способом РСА совершенствуется в направлении увеличения разрешения, расширения полосы обзора, снижения затрат, уменьшения размера, в возможности построения изображения множества целей при облучении разными длинами волн, поэтому уже сегодня устанавливает высокий уровень требований к возможностям обработки, хранения и передачи [1]. Основной процесс в алгоритме получения изображений РСА — сжатие импульсов, а основная проблема — возможность обработки двумерного массива «сырых» корреляционных данных с минимальной задержкой и высокой частотой дискретизации [2].

В статье изучается метод распределения и планирования задач по получению изображений РСА на восемь высокопроизводительных ЦСП, которые можно рассматривать как один большой виртуальный узел обработки, способный получать до 64 Гб данных с плавающей запятой (размер массива — 128k*64k), обеспечивать распределенное хранение и их совместную обработку, а временная задержка составит всего 1/7 от времени обработки, необходимого одному ЦСП. Идея метода заключается в построении симметричной сети передачи данных между несколькими процессорами, имеющими равноправный параллельный и одновременный доступ к глобальной памяти, а затем обеспечивается синхронизация для достижения точного управления обработкой и передачей данных по времени и виртуализация нескольких независимых процессоров в один, чтобы повысить вычислительную мощность, емкость и пропускную способность памяти, и, наконец, достигается минимальная задержка и высокая частота дискретизации при обработке двумерной корреляционной матрицы.


2. Аппаратная часть и топология вычислительной сети
Для разрабатываемой платы в качестве основного чипа был выбран высоко производительный для вычислений с плавающей запятой ЦСП TMS320C6678 [4] производства компании TI. Одна плата содержит четыре ЦСП, к каждому из которых подключено 8 ГБ памяти DDR3. ЦСП соединены попарно посредством высокоскоростной шины гиперсвязи, формирующей узел. Четыре ЦСП взаимодействуют друг с другом по четырехпортовой шине RapidIO через коммутатор RapidIO, поддерживающий взаимодействие ЦСП на системной плате [5-6].

Взаимодействие на плате
Рисунок 1. Взаимодействие на плате


3. Технология параллельной виртуальной одноузловой обработки
А. Схема матричного сегментирования
До использования восьми ЦСП для обработки «сырые» данные РСА должны быть равномерно распределены для хранения в каждом локальном DDR при ЦСП. Существует множество различных схем сегментации, - выбор схемы основывается на размере двумерного массива данных и пропускной способности доступа к удаленным данным между ЦСП. Для матрицы данных размерностью 128К*64К мы используем следующую схему сегментации: данные по дальности делятся на четыре равных сегмента, таким образом, ЦСП имеет доступ к целой строке данных по дальности через RapidIO шины; данные по азимуту делятся на два одинаковых сегмента, следовательно, ЦСП имеет доступ ко всей строке данных за счет гиперсвязи.

Матричная сегментация
Рисунок 2. Матричная сегментация


B. Схема виртуального одиночного узла
Для обеспечения производительности системы метод VSN учитывает полное совмещение параллельной обработки и аппаратной архитектуры системы. Алгоритм обработки представляет собой параллельную систему, представленную на рисунке 3.

Схематичное представление виртуального одиночного узла
Рисунок 3. Схематичное представление виртуального одиночного узла


Метод параллельной обработки VSN заключается в следующем:

  1. Данные двумерного массива делятся равномерно между процессорами C6678, и каждая часть отправляется на хранение в DDR отдельного процессора.
  2. Обеспечивается обмен данными «точно в срок» по азимуту, по гиперсвязи и при обмене по RapidIO данными по дальности для соответствующих процессоров, таким образом, каждый процессор имеет доступ к памяти любого другого С6678.
  3. Все процессоры работают параллельно, а затем данные бесконфликтно записываются в соответствующие DDR каждого ЦСП. С помощью синхронизации VSN удается избежать конфликтов доступа, образующихся при мультипроцессорном доступе к другим ЦСП и достичь равноправного взаимодействия между процессорами.

Описанный выше метод сегментации данных и метод VSN определяют способ параллельного выполнения задач каждым ЦСП. Так, метод VSN использует восемь процессоров C6678 для параллельной обработки РСА-изображений. Реализация параллельного выполнения задач заключается в следующем: для обработки строки по дальности ЦСП 1, 3, 5, 7 осуществляют доступ к данным на DDR 1, 3, 5, 7 соответственно, и обрабатывают первую половину строки по дальности, а ЦСП 2, 4, 6, 8 обращаются соответственно, к данным на DDR 2, 4, 6, 8 и обрабатывают оставшуюся половину строки. Каждый ЦСП работает с 1/8 строки по дальности матрицы данных РСА, а каждое ядро — с 1/64 матрицы данных РСА. Для обработки по азимуту ЦСП 1, 2 одновременно обращаются к данным DDR 1, 2, а ЦСП 3, 4 — к данным DDR 3, 4. ЦСП 5, 6 — к данным DDR 5, 6, а ЦСП 7, 8 — к данным DDR 7, 8. Каждый ЦСП обрабатывает собственную 1/8 часть строки по азимуту матрицы данных РСА. Построчное разделение задач для каждого ЦСП представлено на рисунке 4.

Построчное распределение задач
Рисунок 4. Построчное распределение задач



Источник: http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=7753660&contentType=Conference+Publicatio...



Список литературы

[1] Zheng Bao, Mengtao Xing, Tong Wang, Radar imaging technology [M], Beijing: Electronic Industry Press, 2005.4: 124-227.
[2] Ian G. Cumming, Frank H. Wong. Digital Processing of Synthetic Aperture Radar Data: Algorithms and Implementation[M]. Boston, MA:Artech House, 2005:.ch12.
[3] Zhang Y., G. Chen. Models of parallel computation: a survey and classification[J]. Frontiers of Computer Science in China. 2007, 1(2): 156-165.
[4] TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor[DB], Texas Instruments, 2010.11.
[5] KeyStone Architecture Serial RapidIO(SRIO) User Guide[DB]. Texas Instruments, 2011.
[6] KeyStone Architecture Hyperlink(Hyperlink) User Guide[DB]. Texas Instruments, 2012.
[7] Tan Qingqing, real-time signal processing based on DSP technology research [D]. Beijing: Beijing institute of technology, 2013.
[8] TMS320C66x DSP CPU and Instruction Set Reference Guide[DB].Texas Instruments Incorporated,2011.
[9] OSEcK Kernel Reference Manual.Enea Embedded Technology.


Теги: ieee, рса изображения, технология радиолокационного синтезирования апертуры