+7 (812) 670-9095
Обратная связьEnglish
Главная → Статьи → Алгоритмическое обеспечение → Рандомизированные стратегии управления при произвольных внешних помехах
Полезный совет
Office Lens - сканер в кармане, который будет всегда под рукой! Сканируйте документы, фото и надписи независимо от угла обзора!Подробнее
Версия для печати

Рандомизированные стратегии управления при произвольных внешних помехах

25 июля 2018

Представляем статью профессора матмеха СПбГУ, доктора физико-математических наук Олега Николаевича Граничина. На этот раз речь пойдет о новом подходе к идентификации линейных динамических объектов, основанному на использовании пробного рандомизированного возмущения с известными стохастическими свойствами.


Авторы:

Константин Амелин, Санкт-Петербургский государственный университет, Россия
Олег Граничин, Санкт-Петербургский государственный университет, Россия

Источник: http://www.math.spbu.ru/user/gran/oleg_gr.html




Аннотация.

Статья посвящена задаче идентификации линейного динамического объекта, который характеризуется моделью авторегрессии скользящего среднего с аддитивными внешними помехами (внешними возмущениями). Мы используем подход, который основан на рандомизации стратегий управления и позволяет делать минимальные предположения о помехах: рандомизированные пробные возмущения в управлении и внешние помехи должны быть стохастически независимыми. В частности, примером таких помех является любая неизвестная, но ограниченная детерминированная действительная последовательность. Для конечного набора наблюдений мы предлагаем две процедуры вычисления доверительных областей на основе данных при неизвестных параметрах объекта. Они могут использоваться в схемах адаптивного управления. Первая процедура относится к типу стохастической аппроксимации, вторая процедура разработана в рамках общей схемы «исключение областей знакодоминирующих корреляций» (LSCR, Leave-out Sign-dominant Correlation Regions). Эта процедура возвращает доверительные области, гарантированно содержащие истинные параметры с выбранной пользователем вероятностью. Если число наблюдений бесконечно возрастает, мы предлагаем комбинированную процедуру для вычисления доверительных областей, которые асимптотически сжимаются до истинных параметров. Результаты теоретических исследований проиллюстрированы с помощью имитационной модели неминимально-фазового объекта управления второго порядка.



I. ВВЕДЕНИЕ

Идентификационный подход часто используется для синтеза адаптивного управления. В рамках этого подхода для описания поведения объекта берется модель с неизвестным вектором параметров θ*. Оценки Рандомизированные стратегии управления при произвольных внешних помехах возможных значений θ* вычисляются на основании последовательностей наблюдений. Эти оценки используются в параметризованном контуре обратной связи, качество которой удовлетворяет пользователя, если параметры подобраны надлежащим образом. Если модель искажается помехами, то при разработке алгоритмов оптимизации или оценивания некоторые полезные статистические характеристики обычно приписываются помехам. Это позволяет продемонстрировать обоснованность алгоритма (см., например, [1]). Например, помехи считаются случайными и центрированными. В этом случае алгоритмы, основанные на усреднении данных наблюдений (стандартный метод наименьших квадратов), широко используются в инженерной практике. Если предположение о центрированности помехи сделано без достаточного обоснования, то такие алгоритмы дают неправильные оценочные показатели. Мы часто с этим сталкиваемся при анализе и моделировании социальных процессов или при возможном противодействии «противника». В частности, если помеха определяется детерминированной неизвестной функцией (противник подавляет сигналы), или помеха является статистически зависимой последовательностью, усреднение результатов наблюдений не несет никакой полезной информации. Другая связанная с этим проблема при применении многих рекуррентных алгоритмов оценивания — отсутствие достаточной вариативности в наблюдениях. Стандартные алгоритмы оценивания обычно используют условие постоянного возбуждения данных. Однако это условие трудно обеспечить в задачах, где онлайн-идентификация используется для управления, потому что любое управляющее устройство вводит дополнительные ограничения на данные. Это часто приводит к вырожденным данным наблюдений и проблемам идентификации. Известный подход к идентификации, который заключается в принадлежности множеству, не использует статистические свойства помех, а вместо этого задаёт некоторые известные верхние оценки для неопределенных компонентов системы. Как правило целью подхода является вычисление верхних или нижних расчетных оценок на наборе параметров в соответствии с данными, но без каких-либо дополнительных предположений о системе управления невозможно достичь конвергенции этих заданных оценок к истинному неизвестному вектору параметров (см., например, [2] - [5]).

Наш новый подход основан на использовании пробного рандомизированного возмущения с известными статистическими свойствами, которые подаются в систему через канал управления (или представлены в системе) вместе с адаптивным замкнутым контуром управления («собственное управление»). Это позволяет нам «обогащать» информацию в канале наблюдения для решения многих проблем при «плохих» статистических условиях (например, вырожденные наблюдения). Этот подход следует концепции Фельдбаума о дуальном управлении [6]: «...управляющие воздействия должны быть в известной мере изучающими, но в известной мере направляющими». Восстановление неизвестных параметров обеспечивается свойствами рандомизированных пробных сигналов. Одной из замечательных особенностей нашего подхода является согласованность оценок при произвольных внешних помехах. Применимость нашего подхода ограничивается тем, что пробное рандомизированное возмущение и внешние помехи предположительно должны быть независимыми. Это ограничение отпадает, когда в качестве помехи выступает неизвестная, но ограниченная детерминированная функция, или случайное внешнее возмущение, самостоятельно генерируемое на нашем пробном рандомизированном возмущении. Адаптивный замкнутый контур управления (собственное управление) используется для стабилизации поведения системы.

Метод идентификации с пробными сигналами использовался в [7] и далее был расширен в [8] для замкнутого контура систем управления. В этих исследованиях стабильность объектов управления задавалась заранее, а случайные помехи принимались за «белый шум». В [9] этот подход был распространен на неминимально-фазовые объекты с ограниченным нестатистическим внешним (или экзогенным) возмущением. Результат позволил решить задачу адаптивного асимптотически-оптимального управления по минимаксному критерию с использованием стабилизированной оптимальной обратной связи из [10] с регулируемыми параметрами.

Асимптотические теории обеспечивают согласованность оценок в случае достаточно большого объема данных. Однако по практическим соображениям мы хотели бы получить «хорошие» оценки на основе данных ограниченного объема. Новые процедуры LSCR, предложенные в [11] и [12], обеспечивают строго гарантированные неасимптотические доверительные области для неизвестных параметров θ* линейного динамического объекта управления при установленной малой выборке. Они используют стратегию управления, аналогичную рандомизированной стратегии в [9]. Но проблема адаптивного управления не рассматривалась в [11] и [12] для неминимально-фазовых объектов, нестабильных к входным сигналам. Благодаря примеру в [13] видим, что процедура, предложенная в [12], неприменима для адаптивного управления неминимально-фазовыми объектами управления второго порядка. Модификации процедуры LSCR из [12] были рассмотрены в [13] и [14]. В частности, в [13] показано, что модифицированная процедура LSCR может использоваться при адаптивном управлении неминимально-фазовыми объектами. Стабилизация входов и выходов достигается с помощью «собственного управления», создаваемого адаптивной стабилизированной обратной связью замкнутого контура на основе модифицированного «Strip-алгоритма», описанного в [9]. Исследование модифицированных процедур при произвольных внешних помехах в работах [13] и [14] не было полностью завершено. Чтобы избежать возникающих трудностей, в [11] была предложена расширенная версия процедуры LSCR в случае присутствия немодулированной динамики. В этой технической записке мы модифицируем ее аналогично модификации процедуры LSCR в [13] и [14]. Другой возможный подход к идентификации при условии небольшого набора данных рассмотрен в [15].

Основной вклад этой технической записки заключается в описании конструктивных рандомизированных методов обеспечения как асимптотических, так и неасимптотических доверительных областей для неизвестных параметров объекта управления. Если число наблюдений бесконечно возрастает, то полученные доверительные области обладают хорошими асимптотическими свойствами, то есть сжатием к истинному вектору при некоторых общих условиях.

Обширный обзор рандомизированных методов в системах управления, которые выходят за пределы тем данной технической записки, приведен в [16].

Статья организована следующим образом. В разделе II вводится формальная постановка задачи. Раздел III описывает управляющие входные сигналы (синтез управления). В разделе IV приводятся основные гипотезы и описывается специальный метод репараметризации модели линейного объекта управления. Алгоритм стохастической аппроксимации рассмотрен в разделе V. В разделе VI представлен модифицированный вариант метода LSCR для случая конечного числа наблюдений. Комбинированная процедура и ее свойства приведены в разделе VII. Раздел VIII служит заключением.



СПИСОК ЛИТЕРАТУРЫ

[1] L. Ljung, System Identification: Theory for the User.Englewood Cliffs, NJ, USA: Prentice-Hall, 1999.

[2] E.-W. Bai, K. M. Nagpal, and R. Tempo, «Bounded-error parameter estimation: Noise models and recursive algorithms», Automatica, vol. 32, no. 7, pp. 985–999, 1996.

[3] Соколов В. Ф. «Оценка качества робастной системы управления при неизвестных верхних границах возмущений и помехи измерений», Автоматика и телемеханика. 2010. 71:9, С. 1741-1756.

[4] F. Blanchini and M. Sznaier, «A convex optimization approach to synthesizing bounded complexity inffilters», IEEE Trans. Autom. Control, vol. 57, no. 1, pp. 219–224, Jan. 2012.

[5] Поляк Б. Т., Хлебников М. В., Щербаков П. С. «Управление линейными системами при внешних возмущениях: техника линейных матричных неравенств». М.: Ленанд, 2014.

[6] Фельдбаум А. А. «Теория дуального управления». Автоматика и телемеханика. 1960. 21:9, С. 874-1039.

[7] G. SaridisandG. Stein, «Anew algorithm for linear system identification», IEEE Trans. Autom. Control, vol. AC-13, no. 5, pp. 592–594, 1968.

[8] G. Saridis and R. Lobbia, «Parameter identification and control of linear discrete-time systems», IEEE Trans. Autom. Control, vol. AC-17, no. 1, pp. 52–60, 1972.

[9] Граничин О. H., Фомин В. H. «Адаптивное управление с использованием пробных сигналов в каналах обратной связи», Автоматика и телемеханика. 1986. № 2. C. 238-348.

[10] Барабанов А. Е., ГраничинО. Н. «Оптимальный регулятор линейного объекта с ограниченной помехой», Автоматика и телемеханика. 1984, 45:5, С. 578–584.

[11] M. C. Campi, K. Sangho, and E. Weyer, «Non-asymptotic confidence regions for model parameters in the presence of unmodelled dynamics», Automatica, vol. 45, no. 10, pp. 2175–2186, Oct. 2009.

[12] M. C. Campi and E. Weyer, «Non-asymptotic confidence sets for the parameters of linear transfer functions», IEEE Trans. Autom. Control, vol. 55, no. 12, pp. 2708–2720, Dec. 2010.

[13] K. Amelin and O. Granichin, “Randomized controls for linear plants and confidence regions for parameters under external arbitrary noise,” in Proc. AmericanControlConf. (ACC), 2012, pp. 743–1619.

[14] Граничин О. H. «Неасимптотическое доверительное множество для параметров линейного объекта управления при почти произвольных помехах», Автоматика и телемеханика. 2012. 23:1, С. 20-30.

[15] J. C. Spall, «Uncertainty bounds for parameter identification with small sample sizes», in Proc. 34th IEEE Conf. Decision Control, 1995, vol. 4, pp. 3504–3515.

[16] R. Tempo, G. Calafiore, and F. Dabbene, «Randomized Algorithms for Analysis and Control of Uncertain Systems, with Applications. London, U.K.: Springer-Verlag, 2012.

[17] Граничин О. Н., Поляк Б. Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. М.: Наука, 2003.


Теги: адаптивное управление, внешние произвольные помехи, идентификация, метод исключения областей знакодоминирующих корреляций (LSCR), рандомизированное управление, стохастическая аппроксимация