Журнал вычислительной математики и математической физики, 2023, T. 63, № 5, стр. 731-738
Синтез оптимальной системы с устойчивыми режимами скольжения
1 ДВФУ
690922 Владивосток, о. Русский, п. Аякс, 10, Россия
* E-mail: ashchepkov@yahoo.com
Поступила в редакцию 09.09.2022
После доработки 09.09.2022
Принята к публикации 15.12.2022
- EDN: GFFXOS
- DOI: 10.31857/S0044466923050058
Аннотация
Предложен метод синтеза оптимального управления, обеспечивающего существование и устойчивость режимов скольжения системы нелинейных обыкновенных дифференциальных уравнений. В методе используется вспомогательная задача оптимального управления. Решение задачи дает искомое управление в аналитической форме. Установлена устойчивость по Ляпунову тривиального решения замкнутой и доопределенной систем. Показано применение метода к линейным и квазилинейным системам уравнений. Приведен иллюстративный пример. Библ. 11. Фиг. 1.
1. ВВЕДЕНИЕ
Проблема устойчивости систем автоматического регулирования возникла в XVIII веке с развитием промышленной революции и не утратила актуальности в настоящее время. Многочисленные исследования привели к созданию ряда новых научных методов и направлений. Не останавливаясь на них подробно, отметим близкую теме статьи теорию систем с переменной структурой. В ее основе лежит идея использования порождающих устойчивые режимы скольжения разрывных обратных связей (далее – специальных управлений). Историю развития, результаты, методологию и библиографию можно найти в публикациях [1–3]. Отдавая должное достигнутым в теории успехам, отметим, что вопрос об общем формализованном способе построения специальных управлений остается пока открытым.
В данной статье предложен метод синтеза специального оптимального управления для нелинейной системы определенного типа, использующий аналитическое решение оригинальной вспомогательной задачи оптимального управления. Построенное этим методом управление определено и непрерывно на всем фазовом пространстве системы, за исключением некоторого многообразия. Благодаря этому процедура доопределения системы на многообразии [4] упрощается и позволяет выписать уравнения скольжения в явном виде [1]. Итоговый фазовый портрет синтезированной системы состоит из участков оптимальных траекторий, попавших из начальных точек на подмножество многообразия (область скольжения), и участков траекторий, лежащих в области скольжения и притягивающихся к началу координат. За счет появления в решении задачи режимов скольжения достигается еще и важная в техническом отношении малая чувствительность траекторий синтезированной системы к возмущениям [1].
Приведенные в статье результаты легко обобщаются на случай эллипсоидальной области управления. Вместе с тем их распространение на области управления с негладкими границами, например, многогранники, наталкивается на серьезные технические трудности, связанные с возможным появлением режимов скольжения на пересечениях поверхностей разрыва управления. Заметим также, что вспомогательная задача оптимального управления является обратной по отношению к “единичному” управлению [5], веденному в качестве векторного аналога релейного скалярного управления.
2. ПОСТАНОВКА ЗАДАЧИ
Рассмотрим систему обыкновенных дифференциальных уравнений в координатной форме
(2)
$\begin{gathered} f(x){\kern 1pt} '{\kern 1pt} {{w}_{x}}(x) + c(x) = 0, \\ c(x) \geqslant \alpha w(x),\quad w(x) \geqslant \beta {{\left\| x \right\|}^{2}},\quad x \in {{{\text{R}}}^{n}}. \\ \end{gathered} $В предположениях (2) по второй теореме Ляпунова (см., например, [6, с. 17]) тривиальное решение уравнения $\dot {x} = f(x)$ равномерно асимптотически устойчиво. Непротиворечивость условий (2) в частном случае показана в разд. 5.
Требуется обеспечить устойчивость тривиального решения системы (1) с помощью специальных ограниченных управлений.
3. ВСПОМОГАТЕЛЬНАЯ ЗАДАЧА
В связи со сказанным сформулируем задачу оптимального управления
(3)
$\begin{gathered} J = \int\limits_0^\infty {\left( {c(x(t)) + \left\| {s(x(t))} \right\|} \right)dt \to \min ,} \\ \dot {x} = f(x) + B(x)u,\quad x(0) = {{x}_{0}},\quad x(\infty ) = 0,\quad \left\| u \right\| \leqslant 1,\quad t \geqslant 0, \\ \end{gathered} $Непрерывную кусочно-гладкую траекторию $x(t),\;t \geqslant 0$, и кусочно-непрерывное управление $u(t),\;t \geqslant 0$, назовем процессом, если пара $x(t),\;u(t)$ отвечает условиям (3), за возможным исключением целевого требования, и соответствующее значение функционала J конечно. Вспомогательная задача состоит в нахождении оптимального процесса с наименьшим значением целевого функционала.
Как видно из постановки задачи, близость траекторий $x(t)$ к началу координат и множеству R оценивается суммой неотрицательных несобственных интегралов
Минимизация функционала J предполагает уменьшение интегралов, т.е. влечет асимптотическое приближение траекторий к началу координат и множеству R (устойчивость) или приближение к началу координат по множеству R (скольжение), что отвечает требуемой цели управления системой (1).Обсудим корректность постановки задачи (3). Если ${{x}_{0}} = 0$, то решение $x = 0,\;u = 0$ задачи очевидно. Следовательно, множество оптимальных процессов, отвечающих начальным точкам ${{x}_{0}} \in {{{\text{R}}}^{n}}$, не пусто.
Принятые предположения гарантируют также существование и единственность множества R. Действительно, если $m = n$, то R по определению состоит из единственной точки $x = 0.$ При $m < n$ из свойств функций w, s следует ${{w}_{x}}(0) = 0$, $s(0) = 0$. Поскольку ранг матрицы ${{s}_{x}}(0)$ равен m, то без потери общности можно считать последние m столбцов этой матрицы линейно независимыми. Положим $y = ({{x}_{1}},...,{{x}_{{n - m}}}),\;z = ({{x}_{{n - m + 1}}},...,{{x}_{n}})$ и представим уравнение $s(x) = 0$ в виде $s(y,z) = 0.$ По предположению, функция $s(y,z)$ гладкая по совокупности аргументов и при $y = 0,\;z = 0$ удовлетворяет условиям $s(0,0) = 0,$ $\operatorname{rank} {{s}_{z}}(0,0) = m$. Согласно теореме о неявной функции (см., например, [7, с. 299]) последние условия гарантируют существование в некоторой окрестности точки $(0,0)$ единственной гладкой функции $z = {{\varphi }}(y)$ со свойствами $0 = {{\varphi }}(0),\;s(y,{{\varphi }}(y)) = 0$. В силу единственности график функции $z = {{\varphi }}(y)$ и множество R в окрестности точки $(0,0)$ совпадают. Следовательно, при $m < n$ в окрестности начала координат существует единственное множество R, представляющее собой гладкое многообразие.
4. РЕШЕНИЕ ВСПОМОГАТЕЛЬНОЙ ЗАДАЧИ
Решение задачи (3) проведем в четыре этапа.
4.1. Нижняя оценка функционала
Следуя [8], представим целевой функционал на произвольном фиксированном процессе $x(t)$, $u(t)$ в виде
4.2. Структура многообразия R
Формула (5) задает непрерывное управление $u(x)$ на всем пространстве ${{{\text{R}}}^{n}}$, кроме многообразия R. Следуя [4], доопределим на R уравнения замкнутой системы
Введем обозначения для производной функции $s(x)$ в силу системы (1), $U$ – для шара $\left\| u \right\| \leqslant 1$ и $\dot {s}(x,U)$ – для области значений производной $\dot {s}(x,u)$ на шаре U при фиксированном x. Выделим, далее, на R множества S, P, полагаяСогласно (9) включение $x \in S$ равносильно существованию решения $v = v(x)$ уравнения ${{s}_{x}}(x)\left( {f(x) + B(x){v}} \right) = 0$ и выполнению условий ${v}(x) \in U$, $x \in R.$ Учитывая обратимость матрицы ${{s}_{x}}(x)B(x)$, представим эти условия в эквивалентной форме:
(11)
${v}(x) = - {{\left( {{{s}_{x}}(x)B(x)} \right)}^{{ - 1}}}{{s}_{x}}(x)f(x),\quad \left\| {{v}(x)} \right\| \leqslant 1,\quad s(x) = 0.$Установим свойства множества $P$. В произвольной фиксированной точке $\xi \in P$ множество $\dot {s}(\xi ,U) = {{s}_{x}}(\xi )\left( {f(\xi ) + B(\xi )U} \right)$ выпуклое, замкнутое, ограниченное в ${{{\text{R}}}^{m}}$ и по определению (10) не содержит 0. Согласно теореме отделимости (см., например, [9, с. 25]) для множеств $\dot {s}(\xi ,U)$ и 0 найдется такой зависящий от $\xi $ ненулевой вектор $a \in {{{\text{R}}}^{m}}$, что справедливо строгое неравенство $a{\kern 1pt} '{\kern 1pt} \dot {s}(\xi ,U) > a{\kern 1pt} '0 = 0$. В подробной записи в обозначении (8) имеем
(13)
$a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi )\left( {f(\xi ) + B(\xi )u} \right) > 0,\quad u \in U.$Итак, многообразие R состоит из двух взаимно дополняющих областей скольжения S и прошивания $P,$заданных соответственно условиями
4.3. Оптимальный процесс
Вернемся к вопросу о точности нижней оценки (6). Обозначим через $x(t)$ определенную на полуоси $t \geqslant 0$ непрерывную траекторию замкнутой системы (7), (12) с начальным условием $x(0) = {{x}_{0}}$. Выделим на полуоси $t \geqslant 0$ множества ${{T}_{1}},\,\,{{T}_{2}},\,\,{{T}_{3}}$, полагая
(15)
${{\left( {w(x(\tau ))} \right)}^{ \bullet }} \leqslant - \alpha w(x(\tau )){\text{,}}\quad \tau \geqslant {\text{0,}}$Покажем, что на этом процессе нижняя оценка (6) целевого функционала достигается. Действительно, подынтегральная функция в неравенстве (6) равна нулю, во-первых, в силу определений (17) и (5) управления $u(t)$ при $t \in {{T}_{1}}$ и, во-вторых, в силу равенства $s\left( {x(t)} \right) = 0$ при $t \in {{T}_{2}} \cup {{T}_{3}}$. По построению, множества ${{T}_{1}},\,\,{{T}_{2}},\,\,{{T}_{3}}$ не пересекаются и в объединении составляют всю полуось $t \geqslant 0$, поэтому несобственный интеграл в неравенстве (6) равен нулю. В результате соотношение (6) выполняется как точное равенство и тогда процесс $x(t),\,\,u(t)$ – оптимальный.
4.4. Устойчивость синтезированной системы
Как показано в п. 4.3, каждая определенная при $t \geqslant 0$ оптимальная траектория $x(t)$ замкнутой системы (7), (12), исходящая в момент $t = 0$ из произвольной точки ${{x}_{0}} \in {{{\text{R}}}^{n}}$, удовлетворяет оценке (16). При заданном $\beta > 0$ в силу свойств функции w (неотрицательности на ${{{\text{R}}}^{n}}$, непрерывности и нулевом значении в начале координат) по любому $\varepsilon > 0$ найдется такое $\delta > 0$, что выполняется неравенство $0 \leqslant w({{x}_{0}}) < \beta {{\varepsilon }^{2}},$ если только $\left\| {{{x}_{0}}} \right\| < \delta .$ Тогда с использованием (2) и (16) получим
Сформулируем общие выводы.
Теорема. Если условия задачи (3) отвечают принятым в разд. 2, 3 предположениям, то при любом ${{x}_{0}}$ решение задачи существует. Оптимальное управление (5) имеет разрыв на многообразии R, состоящем из областей скольжения S и прошивания P вида (14). Залегающие на S части оптимальных траекторий описываются уравнениями скольжения (12). Управление (11) в области скольжения непрерывное и допустимое по амплитудному ограничению (3). Тривиальное решение замкнутой системы (7), (12) устойчиво по Ляпунову. Минимум целевого функционала равен $w({{x}_{0}})$.
Теорема полностью доказана приведенными выше рассуждениями.
5. ЧАСТНЫЕ СЛУЧАИ ЗАДАЧИ
5.1. Линейные стационарные системы
Рассмотрим задачу (3) с функциями
(18)
$f(x) = Ax,\quad c(x) = x{\kern 1pt} '{\kern 1pt} Cx,\quad w(x) = x{\kern 1pt} 'Wx,\quad x \in {{\operatorname{R} }^{n}},$Для функций (18) с указанными матрицами условия (2) выполняются. Действительно, в силу (19) квадратичная форма $w(x)$ обращает уравнение (2) в тождество на всем пространстве ${{R}^{n}}.$ Неравенства (2) верны при $\alpha = \mathop {\min }\limits_{\left\| x \right\| = 1} {{c(x)} \mathord{\left/ {\vphantom {{c(x)} {w(x)}}} \right. \kern-0em} {w(x)}},\;\beta = \mathop {\min }\limits_{\left\| x \right\| = 1} w(x).$
Считая дополнительно матрицу $B(x) = B$ ранга m постоянной, приходим к стационарной задаче оптимального управления
(20)
$\begin{gathered} J = \int\limits_0^\infty {\left( {x(t){\kern 1pt} '{\kern 1pt} Cx(t) + 2\left\| {B{\kern 1pt} '{\kern 1pt} Wx(t))} \right\|} \right)dt \to \min ,} \\ \dot {x} = Ax + Bu,\quad x(0) = {{x}_{0}},\quad x(\infty ) = 0,\quad \left\| u \right\| \leqslant 1,\quad t \geqslant 0, \\ \end{gathered} $Приведенные результаты полностью совпадают с выводами [11]. Экспоненциальная устойчивость вытекает из оценки (16) и неравенства $x{\kern 1pt} '{\kern 1pt} Wx \leqslant \mu {{\left\| x \right\|}^{2}}$, где $\mu $ – максимум квадратичной формы $x{\kern 1pt} '{\kern 1pt} Wx$ на сфере $\left\| x \right\| = 1$.
5.2. Квазилинейные системы
Пусть в задаче (20) матрицы $A,\;C,\;W$ по-прежнему отвечают предположениям п. 5.1 и переменная матрица ${{s}_{x}}(x)B(x)$ имеет ранг $m$ на многообразии $s(x) = 0$ при $s(x) = B(x){\kern 1pt} 'Wx$. Тогда утверждения теоремы остаются верными.
Проиллюстрируем сказанное на примере билинейной системы. Положим
В соответствии с выводами теоремы находим оптимальное релейное управление $u({{x}_{1}},{{x}_{2}}) = $ $ = - \operatorname{sign} \left( {x_{1}^{2} + {{x}_{2}}} \right)$, область скольжения $x_{1}^{2} + {{x}_{2}} = 0$ и уравнения скольжения
(21)
$\begin{gathered} {{{\dot {x}}}_{1}} = - {{x}_{1}}\left( {1 - {v}({{x}_{2}})} \right),\quad {{{\dot {x}}}_{2}} = - 2{{x}_{2}}\left( {1 - {v}({{x}_{2}})} \right), \\ {v}({{x}_{2}}) = {{{{x}_{2}}} \mathord{\left/ {\vphantom {{{{x}_{2}}} {(1 - 2{{x}_{2}})}}} \right. \kern-0em} {(1 - 2{{x}_{2}})}},\quad x_{1}^{2} + {{x}_{2}} = 0. \\ \end{gathered} $Выберем малое $\varepsilon > 0$ и зафиксируем произвольную точку $\xi (\tau ) = \left( {\left| \tau \right|, - {{\tau }^{2}}} \right)$, $\left| \tau \right| > \varepsilon $, области скольжения. Рассмотрим две траектории, исходящие в момент $t = 0$ из точки $\xi (\tau )$: пробную траекторию $y(t) = ({{y}_{1}}(t),{{y}_{2}}(t))$, $t \geqslant 0$, исходной системы уравнений при $u = 0$ и оптимальную траекторию $x(t) = ({{x}_{1}}(t),{{x}_{2}}(t))$, $t \geqslant 0$, описываемую уравнениями скольжения (21).
Фиг. 1.
Фазовый портрет оптимальной синтезированной системы в примере. Движение фазовой точки к началу координат происходит по оси ординат или по параболе в режиме скольжения.

Сравним траектории $x(t),y(t)$ по переходным периодам ${{t}_{1}},\,\,{{t}_{2}}$ $ - $ соответствующим моментам первого попадания на границу квадрата $[ - \varepsilon ,\varepsilon ] \times [ - \varepsilon ,\varepsilon ]$, $\varepsilon < \left| \tau \right|$. Для пробной траектории верны тождества
(22)
${{{{{\dot {y}}}_{1}}(t)} \mathord{\left/ {\vphantom {{{{{\dot {y}}}_{1}}(t)} {{{y}_{1}}(t)}}} \right. \kern-0em} {{{y}_{1}}(t)}} \equiv - 1,\quad {{{{{\dot {y}}}_{2}}(t)} \mathord{\left/ {\vphantom {{{{{\dot {y}}}_{2}}(t)} {{{y}_{2}}(t)}}} \right. \kern-0em} {{{y}_{2}}(t)}} \equiv - 3,\quad t \geqslant 0,$(23)
$\left| {{{y}_{1}}({{\theta }_{1}})} \right| = \varepsilon ,\quad {{y}_{2}}({{\theta }_{2}}) = - \varepsilon $Из полученной формулы вытекает, что для любых $\tau ,\,\,\left| \tau \right| > \varepsilon $, оптимальная траектория имеет меньший переходный период, чем пробная траектория, и разность ${{t}_{2}} - {{t}_{1}}$ неограниченно возрастает с увеличением $\left| \tau \right|$. Кроме того, в силу точной нижней оценки (6) оптимальная траектория оказывается лучше пробной еще и по целевому функционалу.
В общем случае пробная траектория системы (1) (при управлении $u = 0$) оптимальна во вспомогательной задаче (3) в том и только в том случае, если полностью лежит в области скольжения. Этот вывод непосредственно следует из точной нижней оценки (6) целевого функционала.
Список литературы
Уткин В.И. Системы с переменной структурой: состояние, проблемы, перспективы // Автоматика и телемехан. 1983. № 9. С. 5–25. Utkin V. I. Variable structure systems: present and future //Automat. Remote Control. 1983. V. 44. № 9. P. 1105–1120.
Ferrara A., Incremona G.P., Cucuzzella M. Advanced and optimization based sliding mode control. Philadelphia: SIAM, 2019.
Steinberger M., Horn M., Fridman L.M. Variable-structure systems and sliding-mode control. Berlin: Springer, 2020.
Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью // Матем. сб. 1960. Т. 51 (93). № 1. С. 99–128.
Уткин В.И., Орлов Ю.В. Системы управления с векторным реле // Автоматика и телемехан. 2019. № 9. С. 143–155. Utkin V.I., Orlov Yu.V. Control systems with vector relays // Automat. Remote Control. 2019. V. 80. № 9. P. 1671–1680.
Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высш. шк., 2003.
Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1965.
Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. M.: Машиностр., 1969.
Карманов В.Г. Математическое программирование. М.: Наука, 1986.
Параев Ю.И. Уравнения Ляпунова и Риккати. Томск: Томский ун-т, 1989.
Ащепков Л.Т. Аналитическое конструирование регулятора с амплитудным ограничением // Автоматика и телемехан. 2022. № 7. С. 49–58. Ashchepkov L.T. Analytical synthesis of an amplitude-constrained controller // Automat. Remote Control. 2022. V. 83. № 7. P. 1050–1058.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики


